AIエージェント自己進化フレームワークが相次ぎ登場
詳細を読む
AIエージェントが過去の経験から自律的に学習し、モデルの再訓練なしに能力を向上させるフレームワークが相次いで発表されました。IBM Research等が開発したALTK-Evolveと、複数大学の研究者によるMemento-Skillsは、いずれもエージェントの「永遠のインターン問題」に取り組んでいます。
ALTK-Evolveは、エージェントの実行履歴から再利用可能なガイドラインを抽出し、品質スコアリングで精査したうえで必要な場面でのみ注入する仕組みです。AppWorldベンチマークでは、困難なタスクで14.2ポイントの改善を達成しました。Claude CodeやCodexへのプラグイン統合にも対応しています。
一方のMemento-Skillsは、スキルをマークダウン形式で保存し、実行結果に基づいて自動的に書き換える「読み書き反省学習」を採用しています。GAIAベンチマークで13.7ポイント、HLEベンチマークでは17.9%から38.7%へと倍増する成果を示しました。意味的類似度ではなく強化学習ベースのスキル選択により、タスク成功率を80%に引き上げています。
両フレームワークに共通するのは、大規模言語モデルのパラメータを固定したまま、外部メモリを通じて継続的に学習する設計思想です。従来の手動スキル設計やファインチューニングに伴う運用負担を大幅に軽減できる可能性があります。
ただし、企業導入には構造化されたワークフローが前提条件となります。Memento-Skillsの共同著者Jun Wang氏は、タスク間の構造的類似性が高い環境でこそ効果を発揮すると指摘しています。物理エージェントや長期的タスクへの適用には、マルチエージェント協調など更なる研究が必要です。安全性の面では自動テストゲートなどの基本的な仕組みはあるものの、企業規模での運用にはより包括的なガバナンス体制が求められます。