GoogleがAIエージェントのコスト最適化フレームワークを発表

Budget TrackerとBATSの概要

GoogleとUC Santa Barbaraによる共同研究論文
LLMエージェントのツール使用予算を自律管理する新技術
シンプルなプラグイン型モジュール「Budget Tracker」の提案
予算残量を継続的にシグナルとして与え、戦略を動的調整
追加学習不要のプロンプトレベル実装
BrowseCompおよびHLE-Searchで複数モデルを用いて検証

BATSがもたらすコスト削減と性能向上

Budget Trackerだけで全体コストを31.3%削減検索呼び出し40.4%減
包括的フレームワーク「BATS」が計画・検証モジュールを統合
Gemini 2.5 ProでBrowseCompの精度が12.6%→24.6%に向上
HLE-SearchでもReActの20.5%から27.0%へ大幅改善
BATSは同等精度を約23セントで達成、並列スケーリング比較の50セントを大幅下回る
デッドエンドへの無駄なツール呼び出しを事前に回避する仕組み
長期・大規模エンタープライズ用途(コードベース管理・デューデリジェンス等)への展開に期待
詳細を読む

GoogleとUC Santa Barbaraの研究者は、AIエージェントがツール呼び出しと計算リソースを効率的に使えるようにする新フレームワークを発表しました。

AIエージェントがウェブ閲覧などの外部ツールを呼び出す際、トークン消費・コンテキスト長・API費用が急増する問題が指摘されていました。

研究チームは、予算を意識させる信号がなければエージェントが行き詰まりのパスに多数のツール呼び出しを費やしてしまうと説明しています。

Budget Trackerはプロンプトレベルのプラグインとして動作し、追加学習なしでエージェントに残リソースを継続的に通知します。

実験の結果、Budget Trackerの導入だけで検索呼び出しが40.4%、ブラウズ呼び出しが19.9%、総コストが31.3%削減されました。

BATSはBudget Trackerに計画モジュールと検証モジュールを加えた包括的フレームワークで、予算に応じて掘り下げるか方針転換するかを動的に判断します。

BrowseComp벤치마ークでは、Gemini 2.5 Proを用いてReActの12.6%から24.6%へと精度が約2倍向上しました。

コスト面でも、BATSは23セント程度で従来の並列スケーリング手法(50セント超)と同等以上の精度を達成しています。

研究者らは「推論と経済性は不可分になる」と述べており、将来のモデルは価値を考慮した推論が求められると展望しています。

本技術は複雑なコードベース管理・競合調査・コンプライアンス監査など、長期にわたるエンタープライズ用途の実用化を加速させると期待されています。