articleニュース
SubQ、1,200 万トークンコンテキスト・フロンティアの 1/5 コストの新 AI モデルを公開
SubQ が 1,200 万トークンのコンテキストウィンドウを持ち、Claude 3.7/GPT-4o 等のフロンティアモデルと比較して約 1/5 のコストで利用できる新 AI モデルを公開。Subquadratic Attention アーキテクチャで長文処理の計算コストを大幅に削減した。
概要
※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。
AI スタートアップ SubQ は、1,200 万トークン(約 900 万ワード相当)のコンテキストウィンドウを持つ新しい言語モデルを公開した。Subquadratic Attention(サブ二乗アテンション)アーキテクチャにより、標準的なトランスフォーマーモデルで発生する「長文処理コストの二乗増加問題」を解決し、フロンティアモデル(Claude 3.7 Sonnet / GPT-4o 等)と比較して 1/5 のコストを実現。長文書類・大規模リポジトリ・長期ログデータの処理に特化したユースケースを想定する。
事実のポイント
- SubQ が 1,200 万トークンコンテキスト・1/5 コストの新 AI モデルを公開(2026 年 5 月)
- 主要スペック:
- コンテキストウィンドウ: 1,200 万トークン(Claude 3.7 の 20 万トークンの約 60 倍)
- コスト: フロンティアモデルの約 1/5(入出力トークン単価の比較)
- 処理速度: 標準的なアテンション機構の 52 倍高速(長文処理時の比較)
- 技術: Subquadratic Attention(サブ二乗アテンション)アーキテクチャ。通常の Transformer の O(n²) から計算複雑度を低減
- 想定ユースケース: 大規模コードベース解析・長期ドキュメント比較・法律文書のフルテキスト分析・データベースログの横断分析
- API として提供。各社 AI モデルの補完的な「超長文処理専門モデル」としての位置づけ
用語・背景の補足
コンテキストウィンドウ: AI モデルが一度に処理できるテキストの量。1 トークンは日本語で概ね 1〜2 文字、英語で約 0.75 単語。1,200 万トークンは文庫本換算で数千冊相当。通常のフロンティアモデルのコンテキストが 10〜20 万トークン程度であるのに対し、桁違いに長い。
Subquadratic Attention: 通常の Self-Attention の計算コストはシーケンス長の二乗(O(n²))で増加する。Subquadratic(二乗より低い)アーキテクチャは、長文処理のコスト増加を抑制するための研究領域。Mamba(State Space Model)や Linear Attention 等の手法が提案されている。
超長文モデルの競合動向: Gemini 1.5 Pro が 100 万トークン(2024 年)、MagicLM が 100 万以上を達成している。1,200 万トークンは公開モデルとして最大規模の一つ。ただし長文の処理品質(情報の見落とし率)はコンテキスト長とは別の評価軸として重要。
注意点
- 1,200 万トークンというコンテキスト長は現時点で未検証のベンチマーク・サードパーティ評価がまだ少ない
- 長文を処理しても「Lost in the Middle」問題(文書中間部の情報が見落とされやすい)は他のモデルでも報告されており、SubQ での検証も必要
- スタートアップのモデルのため、可用性・SLA・エンタープライズ対応の成熟度は大手ベンダーより低い可能性がある
編集部見解
(追記予定)
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。