articleニュース
NVIDIA、Computex 2026 で Nemotron 3 Ultra 550B を発表―オープンウェイトの推論特化大規模モデル
NVIDIAがComputex 2026で公開したNemotron 3 Ultra 550Bは、550億パラメータのオープンウェイトLLMで、推論・エージェント用途に最適化。GPT-4.5を複数ベンチマークで上回ると主張し、オープンモデル最前線の競争が激化している。
概要
※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。
NVIDIA は2026年6月1日、台湾・台北で開催中の Computex 2026 において、大規模言語モデル「Nemotron 3 Ultra 550B」を発表した。パラメータ数 550B(5,500億)のオープンウェイトモデルで、推論精度とエージェント用途に特化して設計されている。NVIDIA は複数のベンチマーク(MMLU・GPQA・HumanEval 等)で GPT-4.5 を上回るスコアを達成したと主張しており、商用・研究利用どちらにも対応するライセンスで公開する方針を示した。
事実のポイント
- パラメータ数: 550B(オープンウェイト)
- 特徴: 推論(CoT / ReAct)・マルチステップエージェントに最適化した学習設計
- ベンチマーク: GPQA・MMLU・HumanEval 等で GPT-4.5 比優位と NVIDIA が主張
- ライセンス: 商用・研究ともに利用可能なオープンライセンス予定
- 発表日: 2026年6月1日(Computex 2026 基調講演)
- Llama 4・Gemma 4 系との比較でも競争力ある性能を示す独立評価が複数公開予定
用語・背景の補足
オープンウェイト(Open Weights): モデルの学習済みパラメータを公開し、ダウンロード・ローカル実行・派生モデル作成を許可する公開形式。API 経由のみでモデルを提供するクローズドモデル(OpenAI GPT-5 等)と対比される。
Nemotron シリーズ: NVIDIA が開発する大規模言語モデルファミリー。Nemotron-4 15B / 340B に続く第3世代となる Ultra が今回の 550B。NVIDIA はモデル自体の販売より、モデルを動かすための GPU・NIM(NVIDIA Inference Microservice)エコシステムでマネタイズする戦略をとっている。
注意点
- NVIDIA 自身の発表ベンチマークのため、第三者機関による独立検証を待つ必要がある
- 550B のフル推論には複数の最新世代 GPU(H200 または Blackwell)が必要で、中小規模での運用コストが高い
- 量子化(AWQ / GPTQ 等)版を使えば単一 H100 でも動作可能だが、性能劣化は要確認
編集部見解
(追記予定)
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。