articleニュース

SubQ、1,200 万トークンコンテキスト・フロンティアの 1/5 コストの新 AI モデルを公開

SubQ が 1,200 万を持ち、 3.7/o 等のフロンティアと比較して約 1/5 のコストで利用できる新 AI モデルを公開。Subquadratic Attention アーキテクチャで長文処理の計算コストを大幅に削減した。

概要

※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。

AI SubQ は、1,200 万(約 900 万ワード相当)のを持つ新しい言語を公開した。Subquadratic Attention(サブ二乗アテンション)アーキテクチャにより、標準的なモデルで発生する「長文処理コストの二乗増加問題」を解決し、フロンティアモデル( 3.7 Sonnet / o 等)と比較して 1/5 のコストを実現。長文書類・大規模リポジトリ・長期ログデータの処理に特化したユースケースを想定する。

事実のポイント

  • SubQ が 1,200 万トークンコンテキスト・1/5 コストの新 AI モデルを公開(2026 年 5 月)
  • 主要スペック:
    • コンテキストウィンドウ: 1,200 万トークン(Claude 3.7 の 20 万トークンの約 60 倍)
    • コスト: フロンティアモデルの約 1/5(入出力トークン単価の比較)
    • 処理速度: 標準的なアテンション機構の 52 倍高速(長文処理時の比較)
  • 技術: Subquadratic Attention(サブ二乗アテンション)アーキテクチャ。通常の Transformer の O(n²) から計算複雑度を低減
  • 想定ユースケース: 大規模コードベース解析・長期ドキュメント比較・法律文書のフルテキスト分析・ログの横断分析
  • として提供。各社 AI モデルの補完的な「超長文処理専門モデル」としての位置づけ

用語・背景の補足

コンテキストウィンドウ: AI モデルが一度に処理できるテキストの量。1 トークンは日本語で概ね 1〜2 文字、英語で約 0.75 単語。1,200 万トークンは文庫本換算で数千冊相当。通常のフロンティアモデルのコンテキストが 10〜20 万トークン程度であるのに対し、桁違いに長い。

Subquadratic Attention: 通常の Self-Attention の計算コストはシーケンス長の二乗(O(n²))で増加する。Subquadratic(二乗より低い)アーキテクチャは、長文処理のコスト増加を抑制するための研究領域。Mamba(State Space Model)や Linear Attention 等の手法が提案されている。

超長文モデルの競合動向: 1.5 Pro が 100 万トークン(2024 年)、MagicLM が 100 万以上を達成している。1,200 万トークンは公開モデルとして最大規模の一つ。ただし長文の処理品質(情報の見落とし率)はコンテキスト長とは別の評価軸として重要。

注意点

  • 1,200 万トークンというコンテキスト長は現時点で未検証の・サードパーティ評価がまだ少ない
  • 長文を処理しても「Lost in the Middle」問題(文書中間部の情報が見落とされやすい)は他のモデルでも報告されており、SubQ での検証も必要
  • スタートアップのモデルのため、可用性・SLA・対応の成熟度は大手ベンダーより低い可能性がある

編集部見解

(追記予定)

info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。

出典

arrow_backニュース・トピックス一覧へ Autais

5つのご相談入口

目的に合った入口からお気軽にどうぞ。すべてカジュアル相談OKです。