AIゲートウェイ(LLM技術)に関するニュース一覧

LiteLLM、不正疑惑のDelveと契約解除しVantaで再認証へ

経緯と背景

資格情報窃取マルウェア被害が発端
Delveに虚偽データ生成疑惑浮上
内部告発者が証拠文書を追加公開
Delve創業者は疑惑を否定

LiteLLMの対応

競合Vantaでの再認証を決定
独立第三者監査人を自社で選定
CTOがX上で公式声明を発表

AIゲートウェイを提供するLiteLLMは、セキュリティコンプライアンス企業Delveとの契約を解除し、競合のVantaを通じて認証を取り直すと発表しました。数百万人の開発者が利用する同社にとって、信頼回復に向けた重要な一歩です。

事の発端は先週、LiteLLMのオープンソース版が資格情報を窃取するマルウェアの被害を受けたことでした。同社はDelveを通じて2つのセキュリティコンプライアンス認証を取得していましたが、その実効性に疑問が生じました。

Delveに対しては、虚偽のデータを生成し、形式的に承認するだけの監査人を利用していたとの内部告発がなされています。こうした認証は本来、インシデントを最小化する手続きが整備されていることを保証するものです。

Delve創業者は疑惑を否定し、全顧客に対して無償の再テストと監査を申し出ました。しかし匿名の内部告発者は週末にかけて追加の証拠文書を公開し、疑惑はさらに深まっています。

LiteLLMのCTOイシャーン・ジャファー氏はXへの投稿で、Vantaを利用して再認証を行い、コンプライアンス管理を検証する独立した第三者監査人を自ら選定すると表明しました。厳しい一週間を経て、同社は行動で意思を示した形です。

Vercel、2026年AIアクセラレーターに世界39チームを採択

プログラム概要

39チームが米欧亜中南米から参加
6週間の集中支援プログラム
800万ドル超のパートナークレジット提供
AWSAnthropicOpenAI等が協賛
VCメンターと毎週セッション実施

注目の参加企業

Carbyn AIがAIグラス活用の製造支援
Kuvia AIががん診断AI開発
Lane社がAIエージェント向け決済基盤構築

Vercelは2026年版AIアクセラレータープログラムに、米国欧州・アジア・中南米から39の初期段階チームを採択したと発表しました。6週間にわたりVercelインフラを活用した集中支援が行われます。

参加チームにはVercelインフラへのアクセスに加え、AWSAnthropicOpenAI、Cartesia、ElevenLabsなどのパートナーから総額800万ドル超のクレジットが提供されます。毎週の創業者・技術リーダーとのセッションや専任VCメンターによる支援も受けられます。

採択チームの事業領域は多岐にわたり、Carbyn AIはAIグラスで製造現場の暗黙知を可視化し、Kuvia AIはデジタル病理学でがんバイオマーカー検出に取り組みます。Lane社はAIエージェントが代理購入できる決済・商取引基盤を構築しています。

セキュリティ分野ではHacktron AIが開発ライフサイクルに統合する脆弱性検出を、Mighty社がAIを悪用した詐欺防止ゲートウェイを開発しています。不動産、建設、獣医学、ゲーム広告など産業横断的なAI活用が目立ちます。

4月16日にサンフランシスコで開催されるデモデーでは、各チームがAIリーダーやVCの前でプレゼンを行い、審査員が上位3チームを選出します。1位チームにはVercel Venturesからの出資を含む10万ドル超の賞品が贈られます。

VercelがLiteLLMサーバーの公式デプロイに対応

LiteLLM連携の概要

Vercel上にワンクリック展開
任意のLLMプロバイダーに接続可能

技術的な特徴

Vercel AI Gateway経由のルーティング
YAML設定でモデル切替が容易
環境変数によるAPIキー管理
既存proxy_serverをそのまま利用

Vercelは、LLMプロキシツール「LiteLLM」のサーバーを同社プラットフォーム上にデプロイできる公式サポートを開始しました。これにより開発者は、複数のLLMプロバイダーへの接続を一元管理できるようになります。

LiteLLMは、OpenAI互換のAPIゲートウェイとして機能し、背後で任意のLLMプロバイダーに接続する仕組みです。開発者はエンドポイントを統一したまま、モデルの切り替えやプロバイダーの変更を柔軟に行えます。

デプロイ方法は非常にシンプルで、litellm.proxyモジュールのproxy_serverアプリをそのまま利用します。基本的なゲートウェイ構成であれば数行のコードで立ち上げることが可能です。

Vercel AI Gatewayを経由してモデルをルーティングする場合は、litellm_config.yamlに設定を記述します。モデル名やAPIキーを環境変数で管理でき、セキュリティと運用性の両立が図られています。

この対応により、Vercelエコシステム内でLLMアプリケーションの構築からデプロイまでを完結させる選択肢が広がりました。マルチプロバイダー戦略を採る企業にとって、ベンダーロックインを避けつつ迅速に開発を進められる環境が整います。

GitHubがエージェント型ワークフローのセキュリティ設計を公開

多層防御の仕組み

3層アーキテクチャで隔離
サブストレート層がVM境界を保証
設定層が権限・接続を制御
計画層が段階実行を管理

エージェントへの制約

シークレット非公開原則を徹底
書き込みは全件バッファ後に検査
全トラストバウンダリで完全ログ取得

GitHubは2026年3月、CI/CD環境でAIエージェントを安全に動作させる「GitHub Agentic Workflows」のセキュリティアーキテクチャを公式ブログで詳細に公開した。同ワークフローGitHub Actions上で動作し、エージェントの非決定性とCI/CDの高権限環境が組み合わさる新たな脅威モデルに対応している。

脅威モデルの核心は、エージェントが信頼できない入力を処理しながらリポジトリ状態を自律的に判断するという特性にある。プロンプトインジェクション攻撃により、悪意あるウェブページやイシューがエージェントを操作し、シークレットの漏洩や不正なコミットを引き起こす可能性があるとGitHubは指摘している。

これに対してGitHubは「多層防御」「エージェントへのシークレット非公開」「全書き込みの段階的検査」「完全ログ記録」の4原則を設計指針とした。エージェントは専用コンテナに隔離され、ファイアウォールでインターネットアクセスを制限し、LLM認証トークンはAPIプロキシが代理保持する構造をとる。

書き込み操作については、エージェントが直接GitHubへ書き込むことを禁止し、Safe Outputs MCPサーバーを経由してバッファリングする仕組みを採用した。バッファされた操作はフィルタリング・コンテンツモデレーション・シークレット除去の3段階検査を経て初めて実行される。許可する操作の種類や上限件数もワークフロー作者が宣言的に指定できる。

ログ記録はファイアウォール層・APIプロキシ・MCPゲートウェイの各トラストバウンダリで徹底される。これによりインシデント後のフォレンジック解析や異常検知が可能となる。GitHubは今後、リポジトリオブジェクトの公開範囲や作者ロールに基づく情報フロー制御を追加する計画も明らかにしている。

米政府Anthropic排除令でAIサプライチェーンの死角が露呈

可視性の欠如

CISOの15%のみが全体把握
49%が未承認AIツールを利用
シャドーAIが侵害の20%を占める
二次・三次依存の把握は困難

強制移行の現実

モデル切替で出力・遅延が変化
国防総省取引企業に波及
依存グラフの即席構築を迫られる

30日で実行すべき対策

実行パスの動的マッピング
主要AIベンダーの停止テスト実施
サブプロセッサー開示の要求

米連邦政府が全省庁に対しAnthropic技術の使用停止を命じる指令を発出しました。6カ月の移行期間が設けられましたが、多くの省庁は自組織のワークフロー内でAnthropicモデルがどこに組み込まれているかを把握できていません。

2026年1月のPanorays調査によると、ソフトウェアサプライチェーンの全体像を把握しているCISOはわずか15%にとどまります。さらにBlackFogの調査では、従業員の49%が雇用主の承認なくAIツールを導入しており、経営幹部の69%がそれを容認していることが判明しました。

Enkrypt AIのCSO、メリット・ベア氏は「AIの依存関係は他のベンダーの機能に埋め込まれ、動的に呼び出され、非決定的で不透明だ」と指摘します。従来のSaaS型シャドーITとは異なり、ログに痕跡が残らないことが対応を困難にしています。

IBMの報告書によるとシャドーAI関連のインシデントは全侵害の20%を占め、平均被害額を67万ドル押し上げています。米大手企業10社中8社がClaudeを利用しているとされ、そのサプライチェーンに属する企業は契約の有無にかかわらず間接的にAnthropicに依存しています。

ベア氏は30日以内に実行可能な4つの対策を提唱しています。ゲートウェイ層での実行パスの動的マッピング、データの入出力制御ポイントの特定、主要AIベンダーの停止シミュレーションによる隠れた依存関係の発見、そしてベンダーへのサブプロセッサー・モデル情報の開示要求です。次の強制移行は6カ月の猶予なく訪れる可能性があります。

Sonnet 4.6が低コストで旗艦性能

モデル性能と価格破壊

Sonnet 4.6、フラッグシップ級の知能
コストは5分の1に削減

Infosysとの戦略提携

Infosysと通信・金融向けAIエージェント開発
規制産業へのエンタープライズ展開

Anthropicは2月17日、Claude Sonnet 4.6を正式リリースしました。フラッグシップモデルに匹敵する性能を約5分の1のコストで提供し、エンタープライズ向けAI導入を大幅に加速させる可能性があります。

新モデルはコーディング、長文推論エージェント計画、コンピューター操作の全領域で前バージョンを上回ります。100万トークンコンテキストウィンドウにより、大規模ドキュメント処理が可能になりました。

同日、AnthropicインドのIT大手Infosysは、通信・金融・製造・ソフトウェア開発分野向けのエンタープライズAIエージェント共同開発を発表しました。InfosysのTopaz AIプラットフォームへのClaude統合が核となります。

AIによる自動化がITサービス業界を再編する中、Infosysはこの提携でAI時代への適応を図っています。インド株式市場ではAI不安からIT株が売られており、提携発表は同社の株価回復を狙う側面もあります。

Vercelも同日、AI GatewaySonnet 4.6の提供を開始。100万トークンのコンテキストウィンドウを活用した高度なエージェントシステム構築が可能になります。

VercelがByteDanceのTRAEにAIゲートウェイとワンクリックデプロイを統合

統合内容の詳細

AI Gatewayで百以上のモデルへアクセス
ワンクリック本番デプロイの実現
月間160万人のTRAE開発者が対象

開発者への意味

モデル切替の簡素化
デプロイまでの時間短縮

ByteDanceコーディングエージェントTRAEが、VercelのAI GatewayとVercelへの直接デプロイ機能を統合しました。月間160万人超の開発者が、コード生成から本番環境デプロイまでを一貫して行えるようになります。

Vercel AI Gatewayにより、TRAEユーザーはOpenAIAnthropicGeminiなど数百のモデルに単一のAPIで接続でき、コスト最適化とモデル切替が容易になります。

ワンクリックでのVercelデプロイ統合は、コードを書いてすぐ世界に公開するというバイブコーディングの流れを加速し、プロトタイプから本番への障壁を大幅に下げます。

ByteDanceによるTRAEの開発は、中国テック企業が西側開発者ツール市場に進出する一例であり、コーディングエージェント競争のグローバル化を示しています。

この統合は、AI開発ツールクラウドプラットフォームの境界が溶け合うフルスタック開発体験の実現に向けた重要な一歩です。

VercelがClaude CodeのAI Gateway経由サポートを追加

Claude CodeとVercel AI Gatewayの統合

Claude CodeリクエストをAI Gateway経由でルーティング
Anthropic互換APIエンドポイントで一元管理
コスト・使用量・レイテンシーの可視化が可能
複数のAIプロバイダーを一つのゲートウェイで管理
チームでのClaude Code利用の集中管理を実現
API Rate Limitの最適化とフォールバック設定

開発者ツールとしての意義

AI GatewayがLLMOpsの中核インフラ
複数モデルの切り替え・ABテストが容易に
コスト最適化のための使用分析が可能
Vercelエコシステムとのシームレス統合
Claude Codeの企業利用拡大を促進

Vercel開発者Claude CodeVercel AI Gatewayを通じて利用できるようになったと発表した。AI GatewayはAnthropicのAPIに互換するエンドポイントを提供し、Claude Codeのリクエストをゲートウェイ経由でルーティングすることで一元管理が可能になる。

主なメリットはAIコーディングツールの使用量・コスト・レイテンシーの可視化だ。チームや企業でClaude Codeを利用する場合、個別のAPIキー管理から解放され、組織全体での利用状況を一カ所で把握できる。

Vercel AI Gatewayはマルチモデル対応で、OpenAIAnthropicGoogle・その他のプロバイダーを統一されたインターフェースで管理できる。これにより、Claude CodeGPT-4o・Geminiなどを同時利用しながらコストと性能を比較することが可能だ。

コンプライアンスセキュリティの面では、すべてのAIリクエストが監査ログに記録され、プロンプトや出力の中身を把握できる。データリテンションポリシーの遵守・機密情報の漏洩防止に対応した設計となっている。

Claude Codeの急速な普及に伴い、エンタープライズでの統制が重要な課題となっている。AI Gatewayのようなインフラ層が整備されることで、個人の生産性ツールから組織全体のAI資産へとClaude Codeの位置づけが変わる。

Vercel AI SDK 6がエージェント対応とMCP統合で開発者体験を刷新

AI SDK 6の主要新機能

エージェント機能とツール実行承認フローを新設
Model Context Protocol(MCP)の完全サポートを実現
DevToolsとリランキング機能を新たに統合
月間2000万ダウンロードを誇るTypeScriptツールキット
画像編集APIとAIプロバイダー統一インターフェース
Fortune 500からスタートアップまで幅広く採用

AIゲートウェイの拡張

GLM-4.7モデルをAI Gatewayから直接利用可能
Z.aiの最新モデルへのアクセスを簡略化
コーディング・ツール使用・多段階推論を強化
Runtime Logsに関数起動タイプの表示機能を追加
プロバイダー登録不要でモデルを呼び出し
会話品質と美的出力の向上を実現

VercelはAI SDK 6をリリースし、エージェントの構築・ツール実行の承認フロー・完全なMCPサポートなど、AIエージェント開発に特化した機能群を一挙追加しました。月間2000万ダウンロードを誇る同ツールキットはFortune 500企業からスタートアップまで採用しています。

AI Gatewayには中国のZ.aiが開発したGLM-4.7モデルが追加されました。コーディング・ツール使用・複雑なエージェントタスクにおける多段階推論を大幅に改善しており、別途プロバイダーアカウントなしで利用できます。

Runtime Logsへの関数起動タイプ表示の追加など、開発者デバッグ体験向上に向けた細かな改善も含まれています。VercelはAIアプリ開発の統合基盤としての地位をさらに強固にしています。

VercelがAIゲートウェイとオブザーバビリティ機能を強化

ClineがVercel AIゲートウェイに移行

オープンソースのAIコーディングエージェント「Cline」がVercel AIゲートウェイを採用
100以上のPoP経由でグローバルに低遅延ルーティングを実現
1週間のA/Bテストでストリーミング遅延(P99)が10〜14%改善
APIエラー率が43.8%減少し、生成の安定性が向上
Grok Code Fast 1のP99遅延が13.7%、Minimax M2のP99遅延が14.4%高速化
マークアップなしの透明な料金体系と詳細なテレメトリを提供

オブザーバビリティとナレッジベースの新機能

Observabilityクエリ結果をCSVまたはJSONでエクスポート可能に
ダウンロードアイコンワンクリックでデータを即時エクスポート
Observability Plusプランの全チームに提供開始
Vercel Knowledge Base」が新設され、ガイドやチュートリアルを集約
セマンティックAI検索・AIチャット・フィルターで目的のガイドを検索可能

VercelはAIコーディングエージェントのClineとのインテグレーションを通じて、AIゲートウェイの活用事例を公開しました。100万人以上の開発者が利用するClineは、Vercelのグローバルインフラを介してリクエストをルーティングすることで、パフォーマンスの大幅な向上を実現しました。

Vercel AIゲートウェイは世界100か所以上のPoP(接続拠点)でTCP接続を終端し、Vercelのプライベートバックボーン経由でリクエストを最寄りのリージョンに転送します。この仕組みにより、モデルへの接続オーバーヘッドを20ms未満に抑えることができます。

1週間の本番A/Bテストでは、P99ストリーミング遅延が最大14%改善し、APIエラー率が43.8%減少しました。特にGrok Code Fast 1ではP99遅延が13.7%、Minimax M2ではP99遅延が14.4%高速化したほかコスト削減効果も確認されました。

料金面ではモデルプロバイダーの定価をそのまま適用し、マークアップなしの透明な価格体系を採用しています。BYOKでも追加料金は発生せず、テレメトリや健全性チェックなど詳細な運用可視性もあわせて提供されます。

また、ObservabilityのクエリデータをCSVまたはJSONとしてエクスポートできる新機能が追加されました。Vercelダッシュボード外でのデータ分析や共有が容易になり、Observability Plusプランの全チームが利用できます。

さらにVercel Knowledge Baseが新たに開設され、ガイド・チュートリアル・ベストプラクティスを一元的に提供します。セマンティックAI検索やAIチャット機能を通じて、開発者が必要なガイドを効率よく見つけられるよう設計されています。

AIセキュリティ新星Runlayer、1100万ドル調達で始動

高まるMCPの需要とリスク

AIエージェントの標準プロトコルMCP
主要モデルメーカーがこぞって採用
プロトコル自体に潜むセキュリティ脆弱性
GitHub等で既にデータ漏洩の事例

Runlayerの包括的解決策

ゲートウェイから脅威検知まで一気通貫
既存ID基盤と連携し権限を管理
MCP開発者もアドバイザーとして参画
既にユニコーン8社が顧客に

AIエージェントセキュリティを手掛ける新興企業Runlayerが、11月17日に1,100万ドル(約16.5億円)のシード資金調達とともに正式ローンチしました。同社は、AIが自律的に動作するための標準プロトコル「MCP」に潜むセキュリティ脆弱性を解決します。ステルス期間中にユニコーン企業8社を含む数十社を顧客に獲得しており、市場の注目を集めています。

AIエージェントが企業のデータやシステムに接続し、自律的にタスクを実行するためには、その「接続方法」の標準化が不可欠です。その役割を担うのが、Anthropic社が開発したMCP(Model Context Protocol)です。OpenAIGoogleなど主要なAIモデル開発企業が軒並み採用し、今や業界のデファクトスタンダードとなっています。

しかし、このMCPの普及には大きな課題が伴います。プロトコル自体に十分なセキュリティ機能が組み込まれていないのです。実際に過去には、GitHubのプライベートリポジトリのデータが不正にアクセスされる脆弱性や、Asanaで顧客データが漏洩しかねない不具合が発見されており、企業がAIエージェントを安全に活用する上での大きな障壁`となっています。

この市場機会を捉え、多くの企業がMCPセキュリティ製品を開発しています。その中でRunlayerは、単なるアクセス制御ゲートウェイに留まらない『オールインワン』セキュリティツールとして差別化を図ります。脅威検知、エージェントの活動を監視する可観測性、さらには企業独自のAI自動化を構築する機能までを包括的に提供する計画です。

創業者Andrew Berman氏は、前職のZapier社でAIディレクターとして初期のMCPサーバー構築に携わった経験を持ちます。その経験からプロトコルの「死角」を痛感したことが創業のきっかけとなりました。MCPの仕様を作成したDavid Soria Parra氏をアドバイザーに迎えるなど、技術的な信頼性も高く評価されています。

Runlayerはステルスで活動していたわずか4ヶ月の間に、GustoやInstacartといったユニコーン企業8社を顧客として獲得するなど、既に力強いスタートを切っています。AIエージェントの本格的な普及期を前に、その安全性を担保する基盤技術として、同社の今後の動向から目が離せません。

AIエージェント群の統制、成否分けるゲートウェイ

AIゲートウェイの役割

コスト増大や複雑化のリスク防止
全社的なガバナンスとセキュリティの徹底
複数AIモデル・ツールを一元管理し最適化

導入の最適タイミング

AI成熟度のステージ2(初期実験期)が最適
ステージ4以降の導入は手戻りが多く困難

導入前の必須準備

本番稼働中のAIユースケース
文書化されたAI戦略と成功基準
明確なガバナンスと承認体制

企業が自律型AI「エージェントワークフォース」の導入を進める中、その大規模展開にはコスト増大やガバナンス欠如のリスクが伴います。この課題を解決する鍵として、AIモデルやツールを一元管理する「AIゲートウェイ」の戦略的導入が不可欠になっています。これは、AI活用を次の段階へ進めるための重要な岐路と言えるでしょう。

エージェントワークフォースとは、単なる自動化ツールではありません。自ら思考し、複雑な業務を遂行する「デジタルの従業員」の集まりです。しかし、個々のAIエージェントが強力でも、組織全体で統制が取れていなければ、その価値は半減してしまいます。真の変革は、単体のエージェントから「群れ」へとスケールさせることで初めて生まれるのです。

そこで重要になるのがAIゲートウェイです。これは、社内で使われる様々なAIモデル、API、データソースへのアクセスを一元的に管理・監視する「関所」のような役割を果たします。ゲートウェイがなければ、各部署がバラバラにAIを導入し、コストの重複、セキュリティリスクの増大、コンプライアンス違反を招きかねません。

では、AIゲートウェイ導入の最適なタイミングはいつでしょうか。専門家は、AI活用の成熟度における「初期実験段階(ステージ2)」をゴールデンウィンドウと指摘します。いくつかのユースケースが本番稼働し始めたこの時期に導入すれば、手戻りなく円滑に規模を拡大できます。ガバナンスが確立した後のステージ4以降では、導入は困難を極めます。

ゲートウェイ導入を成功させるには、事前の準備が欠かせません。具体的には、①本番稼働しているAIユースケース、②文書化されたAI戦略と成功基準、③誰が何を承認するかの明確なガバナンス体制の3点です。これらがなければ、ゲートウェイは宝の持ち腐れとなり、AI活用のスケールを阻害する要因にすらなり得ます。

AIゲートウェイは単なる管理ツールではなく、企業のAI活用を加速させる戦略的投資です。運用負荷の削減やリスク低減はもちろん、新たなAI技術を迅速かつ安全に試せる俊敏性をもたらします。来るべき「エージェントワークフォース時代」の競争優位を築くため、早期の検討が求められています。

AWS、Bedrock AgentCoreの通信をVPC内で完結

セキュリティ強化の要点

VPCエンドポイントでプライベート接続
インターネットを介さない安全な通信
機密データを扱うAIエージェントに最適
AWS PrivateLink技術を活用

導入のメリット

通信遅延の削減とパフォーマンス向上
エンドポイントポリシーで厳格なアクセス制御
企業のコンプライアンス要件に対応
オンプレミスからのハイブリッド接続も可能

アマゾンウェブサービス(AWS)が、生成AIサービス「Amazon Bedrock」のAgentCore Gatewayへのセキュアな接続方法として、VPCインターフェイスエンドポイントを利用する手法を公開しました。これにより、企業はAIエージェントが扱う機密データの通信をインターネットから隔離し、セキュリティコンプライアンスを大幅に強化できます。

企業の自動化を推進するAIエージェントは、機密データや基幹システムにアクセスするため、本番環境での利用には通信経路のセキュリティ確保が不可欠です。パブリックインターネットを経由する通信は、潜在的なリスクを伴い、多くの企業のセキュリティポリシーや規制要件を満たすことが困難でした。

今回公開された手法では、「AWS PrivateLink」技術を活用したVPCインターフェイスエンドポイントを利用します。これにより、VPC(仮想プライベートクラウド)内で稼働するAIエージェントからAgentCore Gatewayへの通信が、AWSのプライベートネットワーク内で完結します。外部のインターネットを経由しないため、極めて安全な通信経路を確立できます。

プライベート接続の利点はセキュリティ強化に留まりません。AWSネットワーク内での直接接続により、通信の遅延が削減され、パフォーマンスが向上します。また、エンドポイントポリシーを設定することで、特定のゲートウェイへのアクセスのみを許可するなど、最小権限の原則に基づいた厳格なアクセス制御も可能です。

このVPCエンドポイントは、AIエージェントがツールを利用する際の「データプレーン」通信にのみ適用される点に注意が必要です。ゲートウェイの作成や管理といった「コントロールプレーン」操作は、引き続き従来のパブリックエンドポイントを経由して行う必要があります。この違いを理解しておくことが重要です。

このアーキテクチャは、オンプレミスのデータセンターからAIエージェントに安全にアクセスするハイブリッドクラウド構成や、複数のVPCをまたいだ大規模なシステムにも応用できます。企業は、自社の環境に合わせて柔軟かつスケーラブルなAI基盤を構築することが可能になります。