AIエージェントがHugging Face Spacesを連鎖し3Dギャラリーを自動構築

ビルディングブロック経済の実践

agents.mdでSpace APIを標準公開
画像生成3D再構成を自動連鎖
統合コードなしでモデル間を接続

マルチメディア開発の変革

パリ・日本・エジプトのギャラリーを量産
新ギャラリーの限界費用は説明文1行分
人間の介入は審美的判断のみ
詳細を読む

Hugging FaceエンジニアMishig Davaadorj氏が2026年6月9日、AIコーディングエージェントが2つのHugging Face Spacesを連鎖させてパリの名所を3Dガウシアンスプラットで表示するギャラリーサイトを自動構築した事例をブログで公開しました。画像生成にはIdeogram4、単一画像からの3D再構成にはTripoSplatが使われ、エージェント画像生成からファイル圧縮、ビューア構築、デプロイまでを一貫して実行しました。

この事例の技術的な核となるのが、Gradio Spaceが自動公開するagents.mdという仕様ファイルです。agents.mdにはAPIスキーマのURL、エンドポイントの呼び出し方法、ファイルアップロード手順、認証方式がプレーンテキストで記載されており、エージェントはクライアントライブラリやSDKなしでSpaceを操作できます。これにより、異なる組織が開発した最先端モデル同士を統合コードゼロで連鎖させることが可能になります。

Davaadorj氏はMitchell Hashimoto氏が提唱する「ビルディングブロック経済」の概念を引用し、AIがゼロからの構築よりも実績あるコンポーネントの組み合わせに優れている点を強調しています。従来コードライブラリの文脈で語られてきたこの考え方が、画像生成動画音声・3Dなどマルチメディア領域にも波及しつつあるという見解を示しました。

実用性を示す証拠として、パリのギャラリー構築後に同じパイプラインで日本とエジプトのギャラリーも「1文の指示」で量産できたことが報告されています。エッフェル塔やカルナック神殿、姫路城など各国6つの名所が3Dスプラットで再構成され、Three.jsベースのビューアにスクロール切替やドラッグ回転のUIが実装されました。人間が介入したのは「もう少しズームアウトして」「オベリスクを別の建造物に差し替えて」といった審美的な判断のみでした。

この事例は、モデルの統合に伴うSDK管理やGPU確保、入力形式の変換といった障壁がagents.mdによって大幅に低下したことを示しています。「プロンプトから回転する3Dモニュメントを生成する」という作業が、かつてはプロジェクト単位の取り組みだったものが、パイプラインの1ステップに縮小されたとDavaadorj氏は述べています。