カーパシー氏の「autoresearch」が一晩で126実験を自律実行

自律研究ループの仕組み

630行のシンプルなスクリプト
GPU5分の固定計算予算で実験
仮説→実装→検証の自動サイクル
損失値改善時のみ変更を保持

ビジネスへの応用と課題

マーケティング実験を年3万6500回に拡張
ピアツーピアで35エージェントが並列稼働
過学習リスクへの懸念も浮上
人間の役割は「実験設計者」へ転換
詳細を読む

テスラAIリードでOpenAI共同創業者のAndrej Karpathy氏は2026年3月8日、GitHubにオープンソースプロジェクト「autoresearch」を公開した。630行のPythonスクリプトがAIエージェントに科学的手法を自律実行させ、人間が眠っている間に研究を進める仕組みだ。

システムはAIエージェントにトレーニングスクリプトとGPU5分相当の計算予算を与え、自らコードを読んで仮説を立て、実装・実行・評価を繰り返す自律最適化ループとして機能する。一晩の稼働で126実験を完了し、検証損失を0.9979から0.9697へ改善した。

2日間の連続稼働では約700の自律的変更を処理し、大規模モデルにも転用可能な改善を約20件発見。「GPT-2到達時間」指標を2.02時間から1.80時間へ11%短縮し、カーパシー氏自身が20年間の手動作業で見落としていた注意機構のスケーリング欠陥も検出した。

コミュニティへの影響は即座かつ広範で、投稿は2日間で860万回以上閲覧された。Hyperspace AIのCEO Varun Mathur氏はこのループをP2Pネットワークに分散させ、35エージェントが一夜で333実験を実施。Kaiming初期化による損失21%削減をGossipSubプロトコルで共有し、23エージェントが即座に採用した。

広告代理店Single GrainのEric Siu氏はマーケティングへの応用を提唱し、現在年間30件程度の実験を3万6500件以上に拡大できると主張した。一方でGitHub上では検証セットの「汚染」リスクや改善の実質的意義への疑問も提起されており、自動化研究の倫理と手法をめぐる議論が活発化している。