NVIDIA、Computex 2026 で Nemotron 3 Ultra 550B を発表―オープンウェイトの推論特化大規模モデル

NVIDIAがComputex 2026で公開したNemotron 3 Ultra 550Bは、550億パラメータのオープンウェイトLLMで、推論・エージェント用途に最適化。GPT-4.5を複数ベンチマークで上回ると主張し、オープンモデル最前線の競争が激化している。

概要

※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。

NVIDIA は2026年6月1日、台湾・台北で開催中の Computex 2026 において、大規模言語モデル「Nemotron 3 Ultra 550B」を発表した。パラメータ数 550B（5,500億）のオープンウェイトモデルで、推論精度とエージェント用途に特化して設計されている。NVIDIA は複数のベンチマーク（MMLU・GPQA・HumanEval 等）で GPT-4.5 を上回るスコアを達成したと主張しており、商用・研究利用どちらにも対応するライセンスで公開する方針を示した。

事実のポイント

パラメータ数: 550B（オープンウェイト）
特徴: 推論（CoT / ReAct）・マルチステップエージェントに最適化した学習設計
ベンチマーク: GPQA・MMLU・HumanEval 等で GPT-4.5 比優位と NVIDIA が主張
ライセンス: 商用・研究ともに利用可能なオープンライセンス予定
発表日: 2026年6月1日（Computex 2026 基調講演）
Llama 4・Gemma 4 系との比較でも競争力ある性能を示す独立評価が複数公開予定

用語・背景の補足

オープンウェイト（Open Weights）: モデルの学習済みパラメータを公開し、ダウンロード・ローカル実行・派生モデル作成を許可する公開形式。API 経由のみでモデルを提供するクローズドモデル（OpenAI GPT-5 等）と対比される。

Nemotron シリーズ: NVIDIA が開発する大規模言語モデルファミリー。Nemotron-4 15B / 340B に続く第3世代となる Ultra が今回の 550B。NVIDIA はモデル自体の販売より、モデルを動かすための GPU・NIM（NVIDIA Inference Microservice）エコシステムでマネタイズする戦略をとっている。

注意点

NVIDIA 自身の発表ベンチマークのため、第三者機関による独立検証を待つ必要がある
550B のフル推論には複数の最新世代 GPU（H200 または Blackwell）が必要で、中小規模での運用コストが高い
量子化（AWQ / GPTQ 等）版を使えば単一 H100 でも動作可能だが、性能劣化は要確認

編集部見解

（追記予定）

info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。

NVIDIA、Computex 2026 で Nemotron 3 Ultra 550B を発表―オープンウェイトの推論特化大規模モデル

概要

事実のポイント

用語・背景の補足

注意点

編集部見解

出典

5つのご相談入口

無料オンライン相談

コンサルティング

セミナー

講演

調査

NVIDIA、Computex 2026 で Nemotron 3 Ultra 550B を発表―オープンウェイトの推論特化大規模モデル

概要

事実のポイント

用語・背景の補足

注意点

編集部見解

出典

NVIDIA、Computex で「RTX Spark」PC 向け AI チップ発表―コンシューマ機でローカル LLM 推論を実現

NVIDIAがCES 2026でフィジカルAI基盤を発表——CosmosとGR00Tのオープンモデルと産業用ロボティクス向けフレームワーク

NVIDIA、FY27 Q1決算で四半期売上816億ドルを達成——配当25倍増・800億ドル自社株買いを発表

TensorRT-LLM で自社ホストAIの推論コストを30〜40%削減する設計

CUDA エコシステムを踏まえた AI ベンダー選定チェックリスト

NVIDIA NIM を AWS Bedrock 経由でプライベート運用する手順

5つのご相談入口

無料オンライン相談

コンサルティング

セミナー

講演

調査