articleニュース
Gemini 3 DeepThink 公開——Gemini 2.5 Pro 比50%超の性能向上で科学・工学分野に対応
Google DeepMindが Gemini 3 の Deep Think モードを公開。前世代比50%超の性能向上を達成し、数学・科学・工学領域の高難度タスクに対応する。Deep Research Max でも MCP 連携と高度な分析機能を提供開始した。
概要
※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。
Google DeepMind が Gemini 3 の Deep Think モードを正式公開した。同社の発表によると、Gemini 3 Pro は前世代の Gemini 2.5 Pro に比べてベンチマークタスクの解決スコアが50%超向上しており、数学・科学・工学・コーディング分野の高難度問題に対して、より深い推論プロセスを用いて対応する。同時に、調査エージェント機能「Deep Research Max」も強化され、MCP(Model Context Protocol)のネイティブ対応と可視化機能が追加されている。
事実のポイント
- Gemini 3 Pro は Gemini 2.5 Pro 比でベンチマーク正解率が50%以上向上したとされる
- Deep Think モードは「リゴロスな思考とクリエイティビティを必要とする現実問題」に向けた設計とされている
- Deep Research Max は Gemini 3.1 Pro を基盤とし、参照ソース数を大幅に増加させ重要なニュアンスの特定精度が向上
- Deep Research Max では MCP ネイティブ対応とネイティブ可視化・分析機能が追加されている
- AlphaEvolve という Gemini 搭載のコーディングエージェントも公開されており、数学・コンピュータサイエンスの未解決問題への応用と Google 内部アルゴリズムの最適化に使用されている
- Google の Gemini in Chrome 向けに「Magic Pointer」機能が開発中(ポインタが指す画面要素を AI が文脈理解する機能)
用語・背景の補足
Deep Think モード: 大規模言語モデルが回答を生成する前に「思考ステップ」を内部的に実行し、複数の推論経路を評価してから最終回答を出力するモード。数学証明・科学的推論など、単純なパターンマッチングでは解けない問題に向いている。
MCP(Model Context Protocol): Anthropic が提唱したオープンプロトコル。AI モデルが外部ツールやデータソースとやり取りする標準インターフェースとして、業界横断で採用が広がっている。Deep Research が MCP に対応することで、カスタムデータソースへの接続が可能になる。
ベンチマーク: AI モデルの能力を測定するための標準的なテスト群。MATH・GPQA・SWE-bench などが代表例。ただし、ベンチマーク上のスコアと実務での有用性は必ずしも一致しない点に留意が必要。
注意点
- 「50%超向上」はベンチマーク上のスコア比較であり、特定業務での実際のパフォーマンスは使用ケースによって異なる
- Deep Think モードは高精度な推論を要する反面、通常モードより応答時間が長くなる場合がある
- Deep Research Max の参照先拡大は情報の多様性を高める一方、誤情報も拾うリスクがある。人間のレビューは引き続き必要
- 機能の提供形態(API / 製品埋め込み)や料金体系の詳細は公式ドキュメントを参照のこと
編集部見解
(追記予定)
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。