articleニュース
Google DeepMind、フロンティア安全フレームワークを改訂——「追跡能力レベル(TCL)」を新設し段階的リスク評価体制へ
Google DeepMind が 2026 年 4 月にフロンティア安全フレームワーク(FSF)を改訂。新たに「追跡能力レベル(TCL)」を導入し、従来の二値的な危険閾値判定から段階的な能力モニタリング体制へ移行した。先進 AI モデルの安全評価手法の国際標準形成に影響を与える改訂として注目される。
概要
※本記事は公開情報をもとに編集部が再構成したサマリです。一次情報は出典欄をご参照ください。
Google DeepMind は 2026 年 4 月 17 日、自社の「フロンティア安全フレームワーク(Frontier Safety Framework, FSF)」を大幅改訂し、新たに「追跡能力レベル(Tracked Capability Levels, TCL)」の概念を導入した。従来の FSF は「危険な能力が閾値を超えたかどうか」という二値判定を採用していたが、改訂版では段階的な能力の発達を継続的にモニタリングし、閾値到達前から対応措置を講じる仕組みへと体制を刷新した。
事実のポイント
- TCL(追跡能力レベル)の概念: 問題のある AI 能力(大量破壊兵器の設計補助・高度なサイバー攻撃・自律的な自己増殖等)を 4 段階の TCL で評価し、各段階に応じた対応措置を事前に定義
- 従来との変更点:
- 旧版: 危険能力閾値に達したら対策を講じる(二値的)
- 改訂版: TCL1〜4 の段階的な能力発達を継続追跡し、閾値到達前に予防的対応を実施
- 評価対象の能力カテゴリー(改訂版で明示化):
- CBRN(化学・生物・放射線・核)兵器関連の情報提供能力
- 高度なサイバー攻撃・脆弱性発見能力
- 人間の監督を回避・無効化する能力
- 社会基盤への大規模影響を及ぼす能力
- 外部評価(Red Team)との連携強化: 各 TCL の判定に、内部評価に加えて外部独立レッドチームによる能力試験結果を必須要件に追加
- 改訂版 FSF は DeepMind の全ての「フロンティアモデル」(Gemini シリーズ等)の訓練・デプロイに適用
用語・背景の補足
フロンティア安全フレームワーク(FSF): Google DeepMind が 2024 年に公開した、先進 AI モデルの「危険な能力」を体系的に評価・管理するためのフレームワーク。訓練前・訓練中・デプロイ前の各フェーズで安全評価を実施し、一定の危険能力水準に達した場合の対処方針(デプロイ制限・追加緩和措置・開発停止等)を事前に定めたもの。
追跡能力レベル(TCL): 今回新設された概念。AI が特定の危険能力をどの程度保有しているかを 4 段階(TCL1: 初期的兆候、TCL2: 限定的能力、TCL3: 有意な能力、TCL4: 高度な能力)に分類し、TCL3 以上で重大な制約・対応措置が発動するよう設計されている。
AI 安全評価の国際標準化動向: AI Safety Institute(英国・米国)・NIST・ISO 等が参加する AI 安全評価の国際標準形成が進んでいる。主要 AI 企業のフレームワーク改訂は、これら標準化議論に大きな影響を与える。
注意点
- 本フレームワークは DeepMind 自身の自主規制であり、法的拘束力を持つ外部規制とは性質が異なる
- TCL の具体的な評価手法・閾値設定の詳細は完全には公開されておらず、外部からの検証可能性に限界がある
- 他の主要 AI 企業(Anthropic・OpenAI・Meta)との評価手法の比較・調和については、引き続き業界内議論が必要
編集部見解
(追記予定)
info 公開情報をもとに編集部が再構成したサマリです。一次情報・追加情報は出典欄をご参照ください。