Anthropic、Claude Codeデスクトップ版を刷新し自動実行機能Routinesを公開

デスクトップ版の主要機能

並列作業向けに全面再設計
サイドバーで全セッション一覧管理
プレビューペインを統合
差分ビューアを高速化

Routinesの3つの実行形態

定時実行のスケジュール
HTTP経由のAPI型
GitHub連携のWebhook型
クラウド上で自律実行可能

Anthropicは2026年4月14日、AIコーディングツールClaude Codeのデスクトップアプリを全面刷新するとともに、バックグラウンドで自動実行できる新機能「Routines」をリサーチプレビューとして公開しました。今回の更新は、開発者の役割を個別のコード記述者から複数AIエージェントの指揮者へと転換させる設計思想を反映しています。

刷新されたデスクトップアプリの中核は、新たに導入されたサイドバーによる「ミッションコントロール」機能です。開発者はすべてのアクティブなセッションを一画面で管理し、ステータスやプロジェクトでフィルタリングできます。ドラッグ&ドロップでターミナル、プレビューペイン、差分ビューア、チャットをグリッド配置でき、複数リポジトリにまたがる作業の視認性が向上しました。

RoutinesAnthropicクラウドインフラ上で実行される自動化機能で、3種類の形態があります。スケジュールはcronジョブのように定期的なメンテナンスを実行し、API型はDatadogなどの監視ツールやCI/CDパイプラインからHTTPリクエストで起動できます。Webhook型GitHubのリポジトリイベントを検知して自動的にPRコメント対応やCI障害の修正に着手します。

利用上限はプランごとに設定されており、Proユーザーは1日5件、Maxは15件、Team/Enterpriseは25件のRoutinesを実行できます。追加利用分は別途購入が可能です。VentureBeatの実機テストでは、統合ターミナルの遅延やサードパーティプラグインの互換性に課題が見られた一方、Routinesの設定は2分以内で完了し、ローカルマシンを起動せずに自律動作することが確認されました。

企業利用の観点では、デスクトップ版はコードレビューや承認に適した環境を提供する一方、CLIは柔軟性と実行速度に優れるという使い分けが想定されます。ただしデスクトップ版はAnthropicのモデルに限定される「ウォールドガーデン」であり、複数のAIモデルを切り替えて使う開発者にとってはCLIが引き続き主要な選択肢となります。

AI成功率3分の2止まり、透明性も低下

能力向上と信頼性の乖離

構造化ベンチマークで約3分の1が失敗
数学五輪金メダルも時計の読み取りは50%
幻覚率は22%から94%の幅
マルチステップ推論で全モデル71%未満

透明性とベンチマークの課題

透明性指数が17ポイント低下
95モデル中80がコード非公開
ベンチマーク誤差率が最大42%
安全性報告が散発的で不統一

Stanford HAIが第9回年次AI Index報告書を公開し、フロンティアAIモデルが構造化ベンチマークにおいて依然として約3回に1回の割合で失敗していることを明らかにしました。企業でのAI導入率は88%に達し、SWE-bench Verifiedではほぼ100%、GAIAでは74.5%と能力面での進歩が著しい一方、本番環境での信頼性が大きな課題として浮き彫りになっています。

能力と信頼性の乖離は「ジャグドフロンティア」と呼ばれる現象で端的に示されています。Gemini Deep Thinkが国際数学オリンピックで金メダルを獲得する一方、時計を読むテストでは正答率がわずか50.1%にとどまりました。GPT-4.5 Highも50.6%とほぼ同水準です。視覚的推論と単純な算術を組み合わせるタスクで、人間の約90%の正答率に遠く及びません。

幻覚の問題も深刻です。26の主要モデルを対象にしたベンチマークでは、幻覚率が22%から94%の範囲にわたりました。GPT-4oの精度は厳密な検証下で98.2%から64.4%へ低下し、DeepSeek R1は90%超から14.4%まで急落しています。一方、Grok 4.20 Beta、Claude 4.5 Haiku、MiMo-V2-Proは比較的低い幻覚率を示しました。

透明性の面では、Foundation Model Transparency Indexのスコアが平均40点と17ポイント下落しました。OpenAIAnthropicGoogleを含む主要企業がトレーニングコードやパラメータ数、データセットの規模を非開示としており、95モデル中80がトレーニングコードなしでリリースされています。報告書は「最も高性能なシステムが最も不透明になっている」と警告しています。

ベンチマーク自体の信頼性も揺らいでいます。広く使われる評価指標の誤差率が最大42%に達し、ベンチマーク汚染や開発者報告と独立検証の不一致が報告されています。モデルの急速な進歩により、数カ月でベンチマークが飽和してしまう「ベンチマーク飽和」現象が起きており、AI能力の正確な測定がかつてなく困難になっていると報告書は結論づけています。

Meta、コード以外も自己改善するAI「Hyperagents」を発表

自己改善AIの構造的限界

既存手法はコーディング領域に限定
メタエージェントの手動設計が改善速度を制約
非コード領域では評価と改善の能力が乖離

Hyperagentsの仕組みと成果

タスクとメタの両機能を統合した自己参照型設計
論文査読・ロボット制御・数学採点で既存手法を上回る性能
記憶ツールや性能追跡を自律的に開発
未知領域へのメタスキル転移も実証

Metaと複数の大学の研究チームは2026年4月、自己改善型AIシステム「Hyperagents」を発表しました。従来の自己改善AIがソフトウェアエンジニアリングなどコーディング領域に限定されていた課題を克服し、ロボティクスや文書レビューなどコーディング領域でも自律的に問題解決能力を向上させるフレームワークです。論文はarXivで公開され、コードもGitHub上で非商用ライセンスのもと共有されています。

従来の自己改善AIの代表例である坂名AIのDarwin Godel Machine(DGM)は、自身のコードを書き換えることで能力を向上させる仕組みでしたが、改善対象がコーディングタスクである場合にのみ有効でした。論文査読や数学の採点といった非コーディングタスクでは、タスク遂行能力の向上が自己改善能力の向上に直結しないという構造的な問題があったのです。また、新しいドメインへの適用には人手によるプロンプトのカスタマイズが不可欠でした。

Hyperagentsはこの限界を、タスク実行とメタ認知的な自己修正を単一の自己参照型プログラムに統合することで解決します。プログラム全体が書き換え可能なため、改善の仕組みそのものを改善する「メタ認知的自己修正」が可能になります。DGMの探索構造を拡張したDGM-Hでは、成功したエージェントのアーカイブを維持しながら継続的に分岐・変異・評価を繰り返し、人手による固定的な改善指示を排除しています。

実験では、コーディングベンチマークでDGMと同等の性能を達成しつつ、論文査読とロボティクスではオープンソースのベースラインを上回りました。特に注目すべきは、論文査読とロボティクスで最適化したHyperagentを未知の数学採点タスクに適用したところ、50イテレーションで改善指標0.630を記録し、従来手法の0.0を大幅に上回った点です。メタスキルが異なるドメインに転移することが実証されました。

興味深いことに、Hyperagentsは自律的に汎用ツールを開発する行動も示しました。論文評価では当初プロンプトエンジニアリングを試みた後、自らコードを書き換えて多段階評価パイプラインを構築しています。さらに過去の失敗を避けるための記憶ツール、アーキテクチャ変更の効果を追跡する性能トラッカー、残りイテレーション数に応じて戦略を調整する計算予算管理機能なども自発的に実装しました。

一方で研究チームは、自己修正が人間の監査速度を超えて進行するリスクや、評価指標を実質的な改善なしに操作する「評価ゲーミング」の危険性を指摘しています。共著者のJenny Zhang氏は、実験と本番環境の分離、サンドボックス内での探索、検証済みコードのみの本番適用という原則を推奨しています。今後、エンジニアの役割はシステム構築から、その方向性の設計と監査へと変化していくと同氏は述べています。

Adobe、全アプリ横断のAIアシスタントを発表

対話型エージェントの全容

約100種のツールを自動選択
自然言語で複数アプリの操作を指示
ユーザーの好みを学習し個別最適化
PSD等ネイティブ形式で出力

動画画像編集の新機能

Kling 3.0含む30超のモデル搭載
Premiere Proに新色補正モード

収益化と競争環境

既存サブスク+クレジット消費モデル
AI単体ARR1.25億ドルに到達

Adobeは2026年4月15日、Creative Cloudの全アプリを対話形式で横断操作できるFirefly AIアシスタントを発表しました。2025年秋のMAXカンファレンスで「Project Moonlight」として披露された研究プロトタイプを製品化したもので、数週間以内にパブリックベータとして公開される予定です。

このAIアシスタントは、Photoshop、Premiere Pro、Illustrator、Lightroom、Expressなど主要アプリにまたがる約100種のツールとスキルを備えています。ユーザーが自然言語で「この画像をレタッチして」「SNS用にリサイズして」と指示するだけで、エージェントが適切なアプリとツールを自動選択し、複数ステップのワークフローを実行します。出力はPSD、AI、PRPROJなどネイティブ形式のため、いつでもピクセル単位の手動編集に切り替えられるのが特長です。

利便性を高める仕組みも充実しています。ポートレートレタッチやSNSアセット作成など、あらかじめ用意された「Creative Skills」テンプレートをワンプロンプトで実行可能です。さらにアシスタントはユーザーの好みのツールやワークフロー、美的嗜好を時間とともに学習し、提案を個別最適化していきます。AnthropicClaudeなど外部LLMとの連携も予定されています。

同時に発表された新機能も注目に値します。Firefly Video Editorには中国Kuaishou社のKling 3.0および3.0 Omniモデルが追加され、搭載モデル数は30を超えました。Premiere Proには編集者向けに設計されたカラーグレーディング専用モード「Color Mode」がベータ公開されたほか、Frame.io Driveではクラウドメディアをローカルファイルのように扱える仮想ファイルシステムが導入されています。

収益面では、AIアシスタントの利用には対象アプリを含む既存サブスクリプションが必要で、生成機能はクレジットを消費する方式です。Adobeの直近四半期決算では売上高が前年比10%増の64億ドルに達し、AI関連の年間経常収益は1.25億ドルに成長しました。CanvaFigmaRunwayなどAIネイティブの競合が台頭するなか、Adobeはプロ向けツール群の統合力を最大の競争優位と位置づけています。

OpenAI、Agents SDKにサンドボックス実行とハーネスを追加

SDK新機能の全体像

サンドボックスで安全な実行環境を提供
フロンティアモデル向けハーネス搭載
ファイル操作・コード実行を統合管理
長時間タスクのスナップショット復元対応

開発者向けの拡張性

7社のサンドボックスプロバイダと連携
MCPやAGENTS.mdなど標準規格に対応
Python先行、TypeScriptは後日対応
API標準価格で全顧客に提供

OpenAIは2026年4月15日、エージェント構築用のAgents SDKを大幅にアップデートし、サンドボックス実行機能とモデルネイティブのハーネスを新たに搭載したと発表しました。企業がより安全で高性能なAIエージェントを構築・運用できるようにすることが狙いで、APIを通じて全顧客に標準価格で提供されます。

新たに導入されたサンドボックス実行機能により、エージェントはファイルの読み書き、依存関係のインストール、コード実行を隔離された環境内で安全に行えるようになります。Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel7社のサンドボックスプロバイダとの連携が組み込まれており、開発者は自前の環境を持ち込むこともできます。プロンプトインジェクションデータ漏洩リスクを軽減する設計です。

ハーネスエージェントの実行基盤となる仕組みで、構成可能なメモリ、サンドボックス対応のオーケストレーション、ファイルシステムツールなどを備えています。MCP(Model Context Protocol)やAGENTS.md、シェルツール、apply patchなど、エージェントシステムで標準化が進む各種プリミティブに対応しました。フロンティアモデルの能力を最大限に引き出す実行パターンを採用し、複雑なタスクの信頼性を向上させます。

環境の可搬性を高めるManifest抽象化も導入されました。ローカルファイルのマウントや出力ディレクトリの定義に加え、AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2からのデータ取り込みが可能です。エージェントの状態を外部化することでスナップショットと復元が実現し、サンドボックスがダウンしても最後のチェックポイントから再開できます。

OpenAIのプロダクトチームのKaran Sharma氏は、今回のリリースの核心は既存のAgents SDKをあらゆるサンドボックスプロバイダと互換にすることだと説明しています。現時点ではPythonでの提供が先行し、TypeScriptサポートは今後追加予定です。コードモードやサブエージェントなどの追加機能も両言語で開発が進められています。

AIでチップ最適化と設計を自動化、Nvidia支配に挑む2社

コード最適化の自動化

WaferがAIでカーネルコード最適化
AMDやAmazonと連携し効率最大化
Nvidiaのソフトウェア優位性を侵食する狙い

チップ設計へのAI活用

Ricursive評価額40億ドルで3.35億ドル調達
Google技術者がチップ設計の自動化を推進
自然言語でチップ設計を指示する未来像
AIが自らのハードウェアを改善する再帰的進化

AIチップ市場で圧倒的な支配力を持つNvidiaに対し、AIを活用してその優位性を切り崩そうとする2つのスタートアップが注目を集めています。WaferはAIモデルを使ってチップ上で動作するカーネルコードを最適化する技術を開発し、Ricursive IntelligenceはAIによるチップ設計の自動化に取り組んでいます。両社のアプローチは、Nvidiaが築いたソフトウェアエコシステムハードウェア設計の参入障壁をAI自体の力で突破しようとするものです。

Waferは強化学習を用いてオープンソースモデルにカーネルコードの記述を学習させるほか、AnthropicClaudeOpenAIのGPTに「エージェントハーネス」を追加してチップ向けコード生成能力を強化しています。CEOのEmilio Andere氏は、AMDAmazonの最新チップNvidia GPUと同等の理論演算性能を持つと指摘し、「ワットあたりの知能を最大化したい」と述べています。同社はGoogleのJeff Dean氏やOpenAIのWojciech Zaremba氏らから400万ドルのシード資金を調達しました。

一方、Ricursive Intelligenceは元Google技術者のAzalia Mirhoseini氏とAnna Goldie氏が設立しました。両氏はGoogleでAIを活用したチップレイアウト最適化技術を開発した実績があり、この技術は現在業界で広く使われています。Ricursiveではさらに踏み込み、大規模言語モデルチップ設計プロセスに統合することで、自然言語による設計指示を可能にすることを目指しています。

Ricursiveの構想は投資家から高い評価を受け、わずか数カ月で評価額40億ドル、調達額3億3500万ドルに達しました。Goldie氏は、AIがチップとアルゴリズムを同時に最適化する「再帰的改善」が可能になると展望しています。より多くの計算資源を投じてより高速なチップを設計するという、チップ設計のスケーリング則が生まれつつあると同氏は語っています。

Nvidiaの強みはハードウェア性能だけでなく、CUDAをはじめとするソフトウェアツール群にあります。しかしAIによるコード最適化やチップ設計の自動化が進めば、このソフトウェアの堀は薄れる可能性があります。Andere氏は「チッププログラマビリティに存在する堀が本当に強固なのか、再考すべき時期だ」と指摘しており、AI技術がAI半導体の勢力図を塗り替える動きが加速しています。

Copilot Studioの脆弱性、修正後もデータ流出が発生

発見された脆弱性の実態

ShareLeakはCVSS 7.5の深刻度
SharePoint経由で認証不要の攻撃が成立
DLPが正規Outlook操作を素通し
Salesforce側はCVE未割当のまま

エージェントAIの構造的リスク

機密データ・外部入力・通信の三要素が根因
パッチだけでは排除不能な脆弱性クラス
ランタイム監視の不在が本質的課題
Capsule Securityが700万ドル調達し参入

Capsule Securityは2026年4月15日、Microsoft Copilot Studioに存在した間接プロンプトインジェクション脆弱性ShareLeak」(CVE-2026-21520、CVSS 7.5)の詳細を公開しました。同社は2025年11月に脆弱性を発見し、Microsoftが2026年1月15日にパッチを適用しましたが、テストではパッチ後もデータが流出することが確認されています。

ShareLeakの攻撃手法は、SharePointの公開フォームに悪意あるペイロードを投入し、Copilot Studioエージェントのシステム指示を上書きするものです。エージェントは接続先のSharePoint Listsから顧客データを取得し、攻撃者のメールアドレスへOutlook経由で送信します。Microsoftのセーフティ機構は不審な操作として検知したものの、DLP(データ損失防止)は正規のOutlookアクションとして処理したため、流出を阻止できませんでした。

同社はSalesforce Agentforceにも同種の脆弱性PipeLeak」を発見しています。公開リードフォームから認証なしでエージェントを乗っ取り、CRMデータを無制限に流出させることが可能でした。Salesforceは2025年9月に別の脆弱性ForcedLeakをパッチ済みですが、PipeLeakはメール経由という別経路を利用するため、そのパッチを回避します。Salesforceは本件についてCVEを割り当てておらず、公式アドバイザリも出していません。

Capsule SecurityのCEO、Naor Paz氏はこの問題の根本原因を「致命的な三要素」と名付けました。機密データへのアクセス、信頼できないコンテンツへの露出、外部との通信能力の3つが揃う環境は、あらゆるエージェントを攻撃可能にします。CrowdStrikeのCTO、Elia Zaitsev氏は「パッチですべての脆弱性を塞ぐのは不可能だ」と述べ、ランタイムセキュリティの重要性を指摘しています。

Capsule Securityは同日、Lama Partners主導による700万ドルのシードラウンドを発表し、ステルスモードから脱却しました。同社のアーキテクチャは、ベンダー提供のエージェント実行フックに接続し、ファインチューニングされた小規模言語モデルがすべてのツール呼び出しを実行前に評価する「ガーディアンエージェント」方式を採用しています。Microsoftが今回プロンプトインジェクションにCVEを割り当てた判断は業界全体に波及する可能性があり、エージェントAIのセキュリティを従来のパッチ管理ではなく、ランタイム監視を含む多層防御として再構築する必要性を示しています。

Spot、Gemini搭載でゲージ読取精度98%に

Gemini Robotics-ER 1.6の性能

計器読取精度が23%から98%に向上
コード実行による視覚スクラッチパッド機能
マルチビュー推論で環境認識を強化

産業現場への展開

Boston DynamicsGoogle DeepMindが共同開発
工場・倉庫での自律巡回検査に活用
親会社Hyundaiの自動車工場でも試験運用
アナログ計器やサイトグラスの目視検査を代替

Google DeepMindは2026年4月14日、ロボット向けAIモデル「Gemini Robotics-ER 1.6」を発表しました。Boston Dynamicsの四足歩行ロボットSpot」に搭載することで、工場や倉庫内のアナログ温度計や圧力ゲージを高精度に読み取る能力を実現しています。産業施設の自律巡回検査における「身体化推論(embodied reasoning)」の大幅な性能向上を目指した取り組みです。

新モデルの最大の特徴は「エージェンティック・ビジョン」と呼ばれる機能です。視覚的な推論とコード実行を組み合わせ、画像を検査・操作するための「視覚スクラッチパッド」を生成します。この機能により、計器読取の精度は旧モデル(ER 1.5)の23%から98%へと飛躍的に向上しました。比較対象として、Gemini 3.0 Flashでは67%にとどまっています。

エージェンティック・ビジョンを使用しないベースラインの状態でも、ER 1.6は86%の読取精度を達成しています。これは画像内の各要素を指し示しながら処理する「ポインティング」手法によるものです。さらに、複数のカメラストリームを活用するマルチビュー推論機能により、ロボットの環境理解能力も改善されています。

Boston Dynamicsは親会社であるHyundai Motor Groupの自動車工場を含む、幅広い産業施設での四足歩行・ヒューマノイドロボットの活用を進めています。Spotは施設内を巡回し、複雑な目盛り・液面・テキストが混在する計器類の検査を担当します。今回のAIモデルの進化により、これまで人手に頼っていた目視検査業務の自動化が現実的な段階に入りました。

HightouchがARR1億ドル到達、AI広告制作が急成長

AI広告ツールの急成長

AI製品投入後20カ月でARR7000万ドル
デザイナー不要でブランド準拠の広告を自動生成
Domino'sやSpotifyなど大手が採用

ブランド一貫性の技術

FigmaやCMSと直接連携しブランド学習
汎用AIモデルのハルシネーション問題を回避
既存素材とAI生成を組み合わせる手法
企業価値12億ドル、従業員約380人

マーケティングデータ基盤を手がける米Hightouchが、年間経常収益(ARR1億ドルに到達したことを明らかにしました。2024年後半にAIを活用した広告コンテンツ生成ツールを投入してから約20カ月で7000万ドルのARRを積み増しており、AI製品が同社の成長を大きく牽引しています。

同社のAIツールは、マーケティング担当者がデザイナークリエイティブエージェンシーを介さずに、パーソナライズされた広告画像動画を作成できるサービスです。Domino's、Chime、PetSmart、Spotifyといった大手ブランドが顧客として名を連ねています。

汎用的な基盤モデルでは、ブランド固有のカラーやフォント、トーンを再現できず、存在しない商品を生成してしまうハルシネーションの問題がありました。Hightouchはこの課題に対し、顧客企業のFigmaやフォトライブラリ、コンテンツ管理システムに直接接続し、ブランドアイデンティティを学習する仕組みを構築しています。たとえばDomino'sの場合、ピザの画像はAI生成せず既存の写真を使い、背景や周辺要素のみをAIで生成するといった使い分けを行います。

同社は2025年2月にSapphire Ventures主導で8000万ドルのシリーズCを調達し、企業価値は12億ドルに達しました。現在の従業員数は約380人で、共同CEOのKashish Gupta氏とTejas Manohar氏が経営を率いています。Manohar氏はTwilioに32億ドルで買収された顧客データ基盤Segmentの元エンジニアリングマネージャーです。

NVIDIA、トークン単価こそAIインフラ唯一の指標と主張

従来指標の限界

FLOPS単価は実性能を反映せず
計算コストは入力指標に過ぎない
トークン出力量が収益性を左右

Blackwellの実力

Hopper比トークン出力65倍
トークン単価は35分の1に低減
ワットあたり出力50倍を達成

推論経済の全体設計

FP4精度や投機的復号を統合
エコシステム全体の最適化が鍵

NVIDIAは2026年4月15日、AIインフラの経済性を評価する際に最も重要な指標は「トークンあたりのコスト」であると公式ブログで主張しました。従来多くの企業が注目してきたGPU時間単価やFLOPS単価は「入力指標」に過ぎず、実際のビジネス成果を測るには、推論で生成されるトークンの単価を見るべきだと訴えています。

同社はトークン単価の計算式を提示し、分母にあたる「GPUあたりのトークン出力量」を最大化することが鍵だと説明しています。ハードウェア性能だけでなく、ソフトウェア最適化、ネットワーク、メモリ、ストレージまで含めたフルスタックの協調設計が不可欠であり、いずれかが欠けると分母が崩壊すると指摘しました。この考え方を「推論の氷山」と呼び、表面に見えるチップスペックだけでは実力を測れないと強調しています。

具体的なデータとして、DeepSeek-R1モデルでの比較結果を公開しました。最新のBlackwell(GB300 NVL72)はHopper(HGX H200)に対し、GPU時間単価は約2倍ですが、GPUあたりのトークン出力は65倍、ワットあたり出力は50倍に達します。その結果、100万トークンあたりのコストはHopperの4.20ドルに対しBlackwellは0.12ドルと、約35分の1まで低下しています。

NVIDIAはこの優位性の源泉として、計算・ネットワーク・メモリ・ソフトウェアにまたがる「極限の協調設計」を挙げています。vLLM、SGLang、TensorRT-LLMなどのオープンソース推論ソフトウェアの継続的な最適化により、既存インフラでもトークン出力は導入後も向上し続けるとのことです。CoreWeave、Nebius、Together AIなどのクラウドパートナーがすでにBlackwellインフラを展開し、業界最低水準のトークン単価を実現していると述べました。

AI利用量を競う「トークンマキシング」が米テック企業に拡大

トークンマキシングの広がり

Metaが社内ランキング流出後にダッシュボード閉鎖
Reid Hoffmanがトークン使用量の追跡を推奨
使用量だけでなく用途の把握も重要と指摘

推論インフラへの投資加速

Parasailが3200万ドルのシリーズAを調達
1日5000億トークンの推論処理を提供
40拠点のデータセンターでコスト最適化
オープンモデルの普及が推論需要を押し上げ

2026年4月、AIの利用量を社内で競い合う「トークンマキシング」と呼ばれるトレンドが米シリコンバレーで急速に広がっています。Metaが社内のAIトークン使用量ランキングをプレスに流出されたことを受けてダッシュボードを閉鎖する一方、LinkedIn共同創業者Reid Hoffman氏はSemaforのイベントで、従業員のトークン使用量を追跡することに賛意を示しました。トークンとはAIモデルがプロンプトを処理する際のデータ単位であり、AI利用コストの指標にもなっています。

Hoffman氏は、トークン使用量がそのまま生産性を示すわけではないと認めつつも、組織全体でAIの活用度を把握するための有効なダッシュボードだと述べました。重要なのは使用量だけでなく、何にトークンを使っているかを理解することであり、実験の失敗も含めて幅広い社員が同時にAIに取り組む文化が必要だと強調しています。週次のチェックインで学びを共有する仕組みも推奨しました。

こうしたトークン消費の拡大を支えるインフラ側でも動きが活発です。推論特化型のクラウドサービスを提供するParasailは、3200万ドルのシリーズA資金調達を発表しました。同社はGroq出身のMike Henry氏が率い、15カ国40カ所のデータセンターを活用して1日あたり5000億トークン推論処理を行っています。ワークロードの賢い配分とピーク回避により、推論コストの引き下げを実現しています。

Parasailの成長を後押ししているのは、オープンソースモデルとAIエージェントの普及です。科学文献の分析ツールを開発するElicitのCEOは、大量のAPIリクエストを処理する際の課題からオープンモデルへの移行を進めていると語りました。初期スクリーニングにオープンモデルを使い、最終判断にフロンティアモデルを用いるハイブリッド構成が広がりつつあります。投資家のSamir Kumar氏は、将来的にソフトウェア構築コストの少なくとも20%を推論が占めると予測しています。

新規サイトの35%がAI生成、ネット上の文章が過剰に明るく

研究の主要な発見

新規サイトの約35%がAI生成・AI支援
AI文章の肯定的感情スコアが107%高い
意味的類似性が約33%上昇し多様性低下
2022年から2025年のWayback Machineデータで分析

覆された通説

AIによる偽情報増加は未確認
外部リンクの減少も証拠なし
文体の画一化も統計的に未確認
一般の予想と実態に大きな乖離

Imperial College London、Stanford大学Internet Archiveの研究チームは2026年4月15日、2022年から2025年に作成された新規ウェブサイトの約35%がAI生成またはAI支援によるものだとする研究結果を発表しました。この研究はInternet ArchiveのWayback Machineに蓄積されたウェブページのスナップショットを活用し、Pangram LabsのAI検出ツールで分析を行っています。

研究チームが注目したのは、AI生成コンテンツがインターネット全体の文章のトーンに与える影響です。感情分析の結果、AI生成・AI支援サイトの肯定的感情スコアは非AIサイトと比べて107%高いことが判明しました。研究者らはこの傾向を、大規模言語モデルが持つ「おべっか的で過度に楽観的な性質」の副産物と分析しています。

また、AI生成コンテンツは思想の多様性にも影響を及ぼしていることがわかりました。意味的類似性のテストでは、AIサイトが人間作成サイトより約33%高いスコアを記録し、独自のアイデアや多様な視点の幅が狭まっていることが示されています。

一方で、研究チームの予想に反する結果も複数出ています。AIが偽情報の増加につながるという仮説は、データからは支持されませんでした。AI文章が外部ソースへのリンクを減らすという予測や、文体がより画一的になるという予測も、いずれも統計的に確認されていません。Stanford大学の研究者Maty Bohacek氏は「チーム全員がそうなると予想していた」と、文体の画一化が確認されなかったことへの驚きを述べています。

研究チームは事前に一般の人々を対象とした意識調査も実施しており、多くの人がAIによる偽情報増加や外部リンク減少、文体の画一化を予想していたことが判明しました。Bohacek氏は「人々は最悪の結果を予想する傾向がある」と指摘しています。この研究はAIがインターネットに与える影響を定量的に示した先駆的なものであり、今後のより深い調査の出発点になると研究チームは位置づけています。

Google、Mac版Gemini公式アプリを提供開始

Mac版アプリの特徴

Option+Spaceで即座に起動
画面共有で文脈を自動取得
Deep Researchなど全機能搭載
Swift製ネイティブアプリ

競合との差と展望

ChatGPTClaudeに対抗
Windows向け検索アプリも同時展開
App Store非経由でDMG配布
PC操作の自動化は未対応

Googleは2026年4月15日、AIアシスタントGemini」のMac向けネイティブデスクトップアプリを全世界で無料提供開始しました。macOS 15以上に対応し、Option+Spaceのショートカットキーで作業中のどの画面からでもGeminiを呼び出せるフローティングウィンドウ型のインターフェースを採用しています。

最大の特徴は、表示中のウィンドウやローカルファイルをGeminiと共有し、画面の文脈に沿った質問ができる点です。複雑なグラフの要約やスプレッドシートの数式確認など、タブを切り替えることなくAIの支援を受けられます。画像生成Nano Banana動画生成VeoDeep ResearchCanvasなど、Web版Geminiのほぼ全機能がデスクトップで利用可能です。

アプリはSwiftで開発され、GoogleのAntigravityを活用して100日未満で100以上の機能を実装したとCEOのスンダー・ピチャイ氏が述べています。一方、App Storeではなく公式サイトからのDMGダウンロード方式を採用しており、配布方法に懸念を示す声もあります。

競合面では、OpenAIChatGPTAnthropicClaudeが先行してMacアプリを提供しており、Googleは後発となります。ただし、ChatGPTClaudeがPC操作の自動化機能を備えているのに対し、Geminiアプリは現時点ではそうした機能を持っていません。Googleはこれを「最初のリリースに過ぎない」とし、今後数か月でさらなる機能拡充を予告しています。

また、Googleは前日にWindows向けの検索アプリも正式リリースしています。Alt+Spaceでウェブ検索やローカルファイル検索が可能で、AIオーバービューやLensによる画面内検索にも対応しています。MacではAI、WindowsではSearchと、プラットフォームごとに異なるアプローチでデスクトップ市場への本格参入を進めています。

IBM、AIエージェント評価基盤VAKRAを公開

VAKRAの設計と特徴

62ドメイン・8000超のAPIで構成
3〜7ステップの推論チェーンを評価
実行トレース全体で正確性を判定

4つの評価能力と課題

API連鎖・ツール選択・多段推論を測定
文書検索との複合推論も対象
ポリシー制約下で全モデルが性能低下
既存モデルの実用信頼性に課題を露呈

主要モデルの比較結果

GPT-OSS-120BがAPI連鎖で最高精度
Gemini-3-flashがツール選択で優位

IBM Researchは2026年4月15日、AIエージェントの実務的な推論能力とツール使用を評価するベンチマークVAKRAHugging Faceで公開しました。従来のベンチマークが個別スキルを測定するのに対し、VAKRAは62ドメインにまたがる8000以上のAPIと文書コレクションを用い、エージェントが複数ステップのワークフローを確実に遂行できるかを実行トレース全体で評価します。

VAKRAは4つの能力を段階的に測定します。第1にビジネスインテリジェンスAPIの連鎖、第2にダッシュボードAPIからの正確なツール選択、第3に複数の論理ステップを要する多段推論、第4にAPI呼び出しと文書検索を組み合わせた複合推論です。第4段階ではさらにマルチターン対話やツール使用ポリシーへの準拠も求められます。

評価はウォーターフォール型パイプラインで実施されます。まずポリシー準拠を検証し、次に予測されたツール呼び出しの系列を正解と比較し、最後に最終回答の正確性を判定します。厳密なステップ一致ではなく、ツール応答の情報的等価性を基準とすることで、正当な代替パスも評価できる設計です。

主要モデルの比較では、GPT-OSS-120BがAPI連鎖タスクで他モデルを大差で上回りました。ツールスキーマの理解とパラメータ選択に優れていたことが要因です。一方、ツール選択タスクではGemini-3-flash-previewが全エラーカテゴリで最良の結果を示しました。多段推論ではホップ数の増加に伴い全モデルで性能が低下しています。

特に注目すべきは、ツール使用ポリシーを課した場合の結果です。情報源へのアクセスを制限するポリシーが存在すると、ほぼ全モデルで明確な性能低下が見られました。モデルは制約を理解しつつも推論に組み込めないケースが多く、企業環境での信頼性確保にはまだ課題があることが示されています。

靴ブランドAllbirdsがGPU事業に転身、株価6倍に

事業転換の経緯

Allbirdsブランドを3900万ドルで売却
新社名NewBird AIGPU事業へ
5000万ドルの転換社債で資金調達
株主総会5月18日に承認予定

GPU事業の展望と市場の反応

GPUaaS提供を長期ビジョンに掲げる
発表直後に株価が約600%急騰
データセンター空室率が過去最低水準
具体的な差別化戦略は不透明

かつてシリコンバレーで愛されたサステナブルシューズブランドAllbirdsが、靴事業を売却し、AI計算基盤企業への転身を発表しました。同社は2021年のIPO時に約40億ドルの評価額を記録しましたが、その後の業績低迷が続き、2026年3月30日にブランドと靴事業をAmerican Exchange Groupへ3900万ドルで売却していました。新社名はNewBird AIとなります。

NewBird AIは非公開の機関投資家から5000万ドルの転換社債による資金調達を実施し、高性能GPU資産の取得に充てる計画です。長期的にはGPU-as-a-Service(GPUaaS)とAIネイティブなクラウドソリューションの統合プロバイダーを目指すとしています。同社はNasdaq上場企業としての上場維持枠を活用し、AI分野への参入を図ります。

発表を受けてAllbirdsの株価は約600%急騰しました。背景には、北米データセンターの空室率が過去最低水準に達し、2026年半ばまでの計算能力がすでに予約済みという市場環境があります。企業やAI開発者GPUを確保できない需給ギャップをNewBird AIが埋めるという構想です。

ただし、複数のメディアはこの転身に懐疑的な見方を示しています。Wired誌は「GPUを買う資金以外に何をもたらすのか不明」と指摘し、Ars Technicaは同社のSEC提出書類に「計算基盤市場の機会を調査中」との表現があることから、計画の具体性に疑問を呈しました。2017年にLong Island Iced Tea社がブロックチェーン企業に転身して株価急騰後に上場廃止となった前例との類似性も指摘されています。

なお、ブランド売却と事業転換はいずれも5月18日の株主総会での承認が条件となっており、承認後の第3四半期に株主への配当が予定されています。靴事業を引き継ぐAmerican Exchange Groupは、既存顧客向けの製品提供を継続する方針です。

LinkedIn幹部、採用減少はAIでなく金利が原因と指摘

採用市場の現状分析

2022年以降採用約20%減少
金利上昇が主因との見解
AI影響は現時点で未確認
業種別でもAI影響なし

今後の労働市場展望

2030年までに職務スキル70%変化予測
職を変えなくても仕事内容が変化
若年層の採用減も他世代と同水準

LinkedInの最高グローバル法務責任者Blake Lawit氏は、Semafor World Economyサミットにおいて、同社が持つ10億人超の会員データを分析した結果、2022年以降の約20%の採用減少にAIは関与していないとの見解を示しました。採用減少の主因は金利上昇にあるとしています。

Lawit氏は、カスタマーサポートや管理業務、マーケティングなど、AIによる影響が懸念されている業種においても、特段の雇用減少は確認されていないと説明しました。「採用は減っているが、これらの分野でより大きく減っているわけではない」と同氏は強調しています。

新卒など若年層の採用動向についても、キャリア中盤や後半の人材と比較して特に大きな落ち込みは見られないとのことです。AIが若者の就職機会を奪っているという懸念については、現時点のデータでは裏付けられていません。

一方で同氏は、将来的な影響を否定はしませんでした。過去数年間で平均的な職務に求められるスキルは25%変化しており、AIの普及により2030年までにその変化率は70%に達するとの見通しを示しています。「職を変えなくても、仕事そのものが変わっていく」とLawit氏は警鐘を鳴らしました。

AIディープフェイクヌード被害が世界の学校に拡大、28か国90校以上で確認

学校での被害拡大

28か国90校以上で被害確認
被害者は600人以上の生徒
加害者の大半は高校生男子
UNICEFは年間120万人の児童被害を推計

プラットフォームの対応

AppleGrokApp Store削除を警告
Grokは改善後も容易に生成可能
Take It Down法で48時間以内の削除義務化
英国・EUはヌード化アプリの禁止を推進

AIを使った性的ディープフェイク画像の生成が世界各地の学校で深刻な問題となっています。WIREDとIndicatorの共同調査によると、2023年以降、少なくとも28か国約90校ディープフェイクによる性的虐待が報告され、600人以上の生徒が被害を受けました。UNICEFは昨年だけで120万人の児童が性的ディープフェイクの対象になったと推計しています。

被害の構図はほぼ共通しています。高校生の男子生徒がInstagramやSnapchatから女子生徒の写真を取得し、ヌード化アプリで偽のヌード画像を生成してSNSで共有します。技術的な知識がなくても数クリックで作成できるため、被害が急速に拡大しました。被害者は精神的苦痛を受け、登校できなくなるケースも報告されています。

プラットフォーム側の対応も問われています。NBCニュースの報道によると、Appleは2026年1月、Elon Musk氏のAIアプリGrokが性的ディープフェイクを放置していたことを受け、App Storeからの削除を警告しました。Grok側はコンテンツ管理の改善を行い、Appleは最終的に承認しましたが、セキュリティ研究者の検証では現在も比較的容易に性的画像を生成できる状態が続いています。

法整備学校の対応も進みつつあります。米国ではTake It Down法が成立し、プラットフォームに48時間以内画像削除を義務づけました。英国とEUはヌード化アプリそのものの禁止を進めています。一方、学校現場では対応にばらつきがあり、事件発覚から警察への通報に3日かかった例や、加害者に即座の処分がなかった例も報告されています。専門家は、学校における啓発教育と危機対応体制の整備が急務だと指摘しています。

Google、動的検索広告を9月にAI Maxへ自動移行

AI Maxの機能と成果

AI Maxがベータ終了し正式提供
フル機能利用でコンバージョン平均7%向上
検索語マッチング・テキスト最適化・URL拡張の3機能
リアルタイム意図シグナルによる広告配信

移行スケジュールと対応

即日から自主移行ツールの提供開始
9月にDSA・ACA・broad matchの自動移行
新規DSAキャンペーン作成は9月以降不可
既存設定は自動移行時に引き継ぎ

Googleは2026年4月15日、検索広告の従来機能である動的検索広告(DSA)を、AIを活用した新機能AI Maxへ自動移行すると発表しました。対象にはDSAのほか、自動作成アセット(ACA)やキャンペーンレベルのブロードマッチ設定も含まれます。自動移行は2026年9月に開始され、同月末までに完了する予定です。

AI Maxはベータ版を終了し、正式版として提供されます。検索語マッチング、テキストカスタマイズ、最終URL拡張の3機能をすべて利用した場合、検索語マッチング単独と比較してコンバージョンが平均7%向上するとGoogleは説明しています。従来のDSAがウェブサイトコンテンツに基づいて広告を生成していたのに対し、AI Maxはより広範なリアルタイムの意図シグナルを活用します。

移行は2段階で進められます。第1段階として、広告主は即日から自主的にAI Maxへ移行できるアップグレードツールが提供されます。第2段階の9月には、未移行のキャンペーンが自動的にアップグレードされ、Google Ads、Google Ads Editor、Google Ads APIでの新規DSA作成が停止されます。

自動移行時には、既存の設定やデータがAI Maxに引き継がれるよう構成されます。DSAユーザーの場合、動的広告グループが標準広告グループに変換され、3つのAI Max機能すべてが有効化されます。ACAユーザーには検索語マッチングとテキストカスタマイズが、ブロードマッチユーザーには検索語マッチングがそれぞれ有効化されます。Googleは、自動移行を待たず早期の移行を推奨しています。

Google、音声合成Gemini 3.1 Flash TTSを公開

モデル性能と提供形態

Eloスコア1,211でTTS首位級
70以上の言語に対応
Gemini API・Vertex AI・Google Vidsで提供開始
高品質と低コストを両立

開発者向け制御機能

オーディオタグで声質・速度を制御
シーン指示による対話演出が可能
話者ごとの音声プロファイル設定
SynthID透かしで生成音声を識別

Googleは2026年4月15日、次世代テキスト音声合成モデルGemini 3.1 Flash TTSを発表しました。開発者向けにはGemini APIGoogle AI Studioでプレビュー提供を開始し、企業向けにはVertex AI、一般ユーザー向けにはGoogle Vidsを通じて利用可能となっています。70以上の言語をサポートし、自然で表現力のある音声生成を実現するモデルです。

音声品質の面では、人間のブラインド評価を集約するArtificial Analysis TTSリーダーボードでEloスコア1,211を達成しました。同ベンチマークでは高品質と低コストを兼ね備えた「最も魅力的な象限」に位置づけられており、品質とコストの両立が大きな特徴です。

新機能として導入されたオーディオタグは、テキスト入力にインラインで自然言語の指示を埋め込むことで、声のスタイル・ペース・抑揚を細かく制御できる仕組みです。シーン全体の方向性を設定する「シーン指示」、話者ごとに音声プロファイルやアクセントを指定する「話者レベル設定」、調整結果をAPIコードとしてエクスポートする「シームレスエクスポート」の3段階で構成されています。

安全性の観点では、生成されたすべての音声SynthIDの電子透かしが自動的に付与されます。人間の耳には聞こえない形で音声に織り込まれ、AI生成コンテンツの検出を可能にすることで、偽情報の拡散防止に寄与します。複数の早期テスターからは、オーディオタグによる制御精度の高さと表現力について好意的な評価が寄せられています。

HCompany、ブラウザ操作AIをChrome拡張で無料公開

HoloTabの機能と特徴

Chrome拡張で即利用可能
Webサイトを人間同様に自動操作
技術知識やセットアップ不要
タスクを自然言語で指示

ルーティン機能の仕組み

操作を録画しルーティン
録画後は自動で繰り返し実行
スケジュール設定にも対応
競合調査や求人収集に活用

フランスのAIスタートアップHCompanyは2026年4月15日、ブラウザ上でAIエージェントを動作させるChrome拡張機能「HoloTab」を無料で公開しました。同社が3月31日にリリースした最新のコンピュータ操作モデル「Holo3」を基盤としており、ユーザーが自然言語でタスクを指示するだけで、AIがWebサイトを人間と同じように操作します。

HoloTabの中核機能は「ルーティン」です。ユーザーがブラウザ上で一度操作を実演すると、HoloTabがその操作を録画し、画面の内容やクリック操作、音声による説明を統合してタスクの目的を理解します。録画が完了するとルーティンが自動生成され、以降は任意のタイミングやスケジュールで繰り返し実行できます。

想定される活用例としては、複数のECサイトから競合の価格情報を収集してスプレッドシートに転記する作業や、複数の求人サイトを巡回して新着求人を管理ドキュメントにまとめる作業などが挙げられています。こうした反復的で時間のかかるブラウザ作業を、技術的な知識がなくても自動化できる点が特徴です。

HCompanyは、コンピュータ操作AIの恩恵をエンジニアだけでなくすべての人に届けることを目指しています。HoloTabはChrome Web Storeから無料でインストールでき、セットアップなしですぐに利用を開始できます。ビジョンモデルやアクション計画、インターフェース理解といった技術はすべてバックグラウンドで動作し、ユーザーは結果だけを受け取る設計です。

Thiel出資の新興企業、AIで報道の正確性を審査

Objectionの仕組みと狙い

1件2,000ドルで報道への異議申立
複数LLMの陪審方式で証拠を評価
記者ごとのHonor Indexで信頼度を数値化

報道の自由への懸念

匿名情報源の証拠価値を低く評価
内部告発の萎縮効果専門家が警告
富裕層向けの「有料攻撃ツール」との批判
調査中でも警告を表示するFire Blanket機能

Peter Thiel氏とBalaji Srinivasan氏が出資するスタートアップObjectionが、AIを使って報道記事の正確性を審査するプラットフォームをローンチしました。創業者のAron D'Souza氏はGawker訴訟を主導した人物で、2,000ドルの料金を支払えば誰でも特定の記事に対して異議を申し立て、公開調査を開始できる仕組みです。シード資金として「数百万ドル」を調達しています。

ObjectionはOpenAIAnthropicxAIMistralGoogleの各社LLMを陪審員のように使い、証拠を一つずつ評価します。元法執行機関や調査報道記者のフリーランスチームが証拠を収集し、最終的に記者の正確性と実績を数値化した「Honor Index」を算出します。規制文書や公式メールなどの一次資料が最も高く評価される一方、匿名の内部告発者の証言は最低ランクに位置づけられます。

メディア法の専門家からは強い懸念の声が上がっています。ミネソタ大学のJane Kirtley教授は「報道機関が嘘をついているという主張をさらに一つ積み重ねるもの」と批判し、有料制である点が一般市民のためではなく権力者に有利に働くと指摘しました。名誉毀損訴訟の専門弁護士Chris Mattei氏も「富裕層と権力者のための高度な保護収奪だ」と断じています。

記者にとっては事実上の二重拘束が生じます。情報源の詳細をObjectionの暗号ハッシュシステムに提出するか、保護を選んで低い評価を受け入れるかの二択を迫られるためです。参加しなければ「判定不能」の結果が返され、正確な報道であっても疑念を生む可能性があります。さらに、X上で係争中の記事に警告を表示する「Fire Blanket」機能も、審査完了前から報道の信頼性を損なうおそれがあります。

D'Souza氏はObjectionを「Xのコミュニティノートと同様の事実検証の仕組み」と位置づけ、内部告発者を黙らせる意図はないと主張しています。しかし、AI自体がバイアスやハルシネーションの問題を抱えるなか、LLMを真実の裁定者として使うことへの疑問は根強く、Kirtley教授は「なぜAIが取材した記者より信頼できると思うのか」と問いかけています。

GitHub技術者がCopilot CLIで個人用統合ダッシュボードを1日で構築

プロジェクトの概要と背景

複数アプリの情報分散を一元化
Electron+React+Tailwindで構築
Copilot CLIの計画・実装支援を活用
v1を通常業務と並行し1日で完成

AI活用の開発手法

計画段階でCopilotに要件を対話的に整理させる手法
VS Code Agent ModeとCloud Agentの非同期併用
AIはコード追加は得意だが削除は苦手と指摘
未経験のElectronもエージェント主導で開発可能

GitHubのスタッフソフトウェアエンジニアであるBrittany Ellich氏が、GitHub Copilot CLIを活用して個人用の統合コマンドセンターを構築した事例が、2026年4月15日にGitHub公式ブログで公開されました。このツールは、カレンダーやタスク管理など複数のアプリに分散した情報を1つのデスクトップアプリに集約するもので、通常業務と並行しながらわずか1日で初版を完成させています。

Ellich氏の開発手法は「計画してから実装する」というアプローチです。まずCopilotに質問を投げかけてもらい、要件を対話形式で整理します。十分な計画ができた段階でCopilotに実装を任せることで、手戻りを最小限に抑えています。同期的な開発にはVS CodeのAgent Modeを、バグ修正や技術的負債の解消といった非同期タスクにはCopilot Cloud Agentを使い分けています。

技術スタックはElectron、React、Vite、Tailwind CSS、そしてMicrosoft 365のデータにアクセスするためのWorkIQ MCPサーバーです。Ellich氏はElectronアプリの開発経験がほぼなかったものの、Agent Modeによってフレームワークの詳細を学ぶ必要なく構築できたと述べています。一方で、公開リポジトリ化のためにコードを簡素化する作業ではAIの限界も感じたといいます。

Ellich氏は「AIエージェントはコードを追加するのは得意だが、コードを削除することにはあまり積極的ではない」と指摘しています。リポジトリの整理には人間の手作業が必要だったものの、Electronに不慣れでもコードを読んで修正する程度には十分理解できたとのことです。プロジェクトはオープンソースとして公開されており、Node.js v18以上とMicrosoft 365アカウントがあれば誰でも試すことができます。

Cisco幹部が提唱する「認知のインターネット」、AIエージェント間の共有思考を実現する3つの新プロトコル

共有認知の基盤構想

エージェント間の意味的整合性が欠如
接続ではなく認知の共有が必要
人類の認知革命をシリコンで再現する構想

3つの新プロトコル

SSTPで意味レベルの通信を解析
LSTPでKVキャッシュごと潜在空間を転送
CSTPでエッジ向けに状態を圧縮転送

Ciscoでの実践成果

SREチームの展開時間が数時間から数秒に短縮
Kubernetesの問題を80%削減

CiscoのOutshift部門でSVP兼GMを務めるVijoy Pandey氏が、AIエージェントの次の課題は「共に考える」能力だと提唱しました。同氏はVentureBeatのポッドキャストで、現在のAIエージェントワークフローで接続できても意味的な整合性や共有コンテキストを持たず、毎回ゼロから作業していると指摘。この課題を解決する「認知のインターネット」という構想を発表しています。

Pandey氏のチームは3つの新プロトコルを開発しています。Semantic State Transfer Protocol(SSTP)は言語レベルで意味的な通信を解析し、適切なツールやタスクを推論します。MITとの共同研究「Ripple Effect Protocol」も関連成果として発表されています。Latent Space Transfer Protocol(LSTP)は、トークン化のオーバーヘッドを回避し、KVキャッシュごと潜在空間を直接転送する仕組みです。

Compressed State Transfer Protocol(CSTP)は、対象となる情報のみを選別し残りを圧縮する方式で、大量の状態情報を正確に送る必要があるエッジ環境に適しています。これら3つのプロトコルに加え、認知状態を同期する「ファブリック」とガードレールを提供する「認知エンジン」の3層構造で分散型超知能の実現を目指しています。

一方、Ciscoでは既存のAI技術で具体的な成果も出ています。サイト信頼性エンジニアリング(SRE)チームでは、CI/CDパイプラインやKubernetesクラスタのデプロイなど10以上のワークフローを自動化しました。20以上のエージェントMCPを介して100以上のツールにアクセスし、デプロイ時間を数時間から数秒に短縮しています。

Pandey氏は、大規模ネットワークにおけるエラー検出能力を10%から100%に引き上げた事例も紹介しました。同時に「AIは道具であり、新しいハンマーを手にしたからといって釘を探し回るべきではない」と述べ、決定論的なコードとAIの適切な組み合わせが重要だと強調しています。また、この「認知のインターネット」はオープンで相互運用可能な取り組みであるべきだとし、オープンソースプロジェクトAgntcyエージェントの発見やアクセス管理、監視、評価の機能を公開しています。

Gemini APIにプリペイド課金を導入、予算管理を簡素化

プリペイド課金の仕組み

クレジット購入で利用開始
残高からAPI呼び出し分を消費
自動リチャージ機能を搭載
月末の想定外請求を防止

段階的な移行設計

まず米国の新規アカウントで提供
数週間内にグローバル展開予定
利用実績に応じ後払いへ移行可能
上位ティアでレート制限緩和

Googleは2026年4月15日、Gemini APIの新たな課金方式として「Prepay Billing」をGoogle AI Studio上で提供開始しました。開発者はあらかじめクレジットを購入し、その残高からAPI利用料を差し引く仕組みで、月末に予想外の請求が届くリスクを排除できます。まず米国の新規Google Cloud Billing Accountが対象で、数週間以内にグローバルへ展開する予定です。

利用方法はシンプルで、AI Studio内でクレジットをチャージし、API呼び出しごとに残高から消費されます。残高が少なくなった際には自動リチャージを設定でき、手動での追加操作を省けます。支出状況と残高はAI Studioの課金画面で一元的に確認できます。

Googleは今年すでにプロジェクト単位のSpend Caps機能や、透明性を高めたUsage Tiersの刷新を実施しています。Prepay Billingはこれらに続く施策で、開発者が予算を超過せずにプロトタイピングからスケーリングまで一貫して利用できる環境を整えるものです。

支払い実績を積み上位のUsage Tierに到達すると、従来の後払い方式への切り替えも可能です。後払いに移行すればGoogle Cloudの他サービスと課金を統合でき、さらに高いレート制限が適用されます。なお、請求書払い(Invoiced / Offline)アカウントはPrepay Billingの対象外となっています。

AI生成コード検証のGitar、900万ドル調達しステルス脱却

Gitarの事業概要

コード検証に特化したAIエージェント
レビューやCI管理を自動化するプラットフォーム
Venrockリード、Sierra Venturesも参加

バイブコーディング」時代の課題

AI生成コードの品質問題が企業で深刻化
シニアエンジニアの修正負担が増大
将来は人間のレビューを最小限に
生成後の検証で差別化を図る

コードセキュリティスタートアップGitarが、Venrockがリードする900万ドルの資金調達を完了し、ステルスモードから正式に姿を現しました。同社はIntel Labs、Google、Uberで経験を積んだAli-Reza Adl-Tabatabai氏が設立した企業で、AIエージェントを活用してコード品質を検証するプラットフォームを提供しています。

バイブコーディング」の普及により、AI生成コードが企業に大量に流入する一方、バグやセキュリティ上の問題が深刻化しています。Adl-Tabatabai氏はこの状況を「コードオーバーロード」と表現し、生成ではなく検証こそが市場の本質的な課題だと主張しています。

Gitarのプラットフォームは、コードレビューやCI(継続的インテグレーション)ワークフローの管理など、幅広いコード品質管理をAIエージェントで自動化します。エンジニアリングチームが独自のエージェントを作成し、セキュリティやメンテナンス業務を委任できる点も特徴です。サブスクリプション型で提供されています。

同社の将来ビジョンは、人間によるコードレビューを例外的なケースに限定し、出荷前の検証プロセスを全自動化することです。「コードが安全に出荷できることを自動的に保証する検証エージェントがあり、人間は例外的な場合にのみ関与する」とAdl-Tabatabai氏は語っています。

調達資金はエンジニアリングおよびプロダクトチームの採用に充てられる予定です。サンマテオに拠点を置く同社は、大規模なサービス提供を支えるシステム開発に注力する方針を示しています。

Adobe Premiere新カラーグレーディング機能、NVIDIA GPU加速で32bit処理実現

Color Modeの主要機能

Premiere内蔵のカラーグレーディング環境
32bit色深度で初の高精度処理
6ゾーンの輝度調整に対応
文脈対応スコープとHUDオーバーレイ搭載

GPU活用と関連発表

GeForce RTX・RTX PRO系で高速化
Project G-Assist v0.2.1も同時更新
NAB Show 2026で正式発表
Filmora等他社ツールもNVIDIA連携強化

NVIDIAは2026年4月18日から22日にラスベガスで開催されるNAB Show 2026に合わせ、AdobePremiereの新機能「Color Mode」をベータ版として発表することを明らかにしました。この機能はNVIDIA RTX GPUによるアクセラレーションを活用し、映像制作者がPremiere内で直接カラーグレーディングを行える専用環境を提供します。6万人以上のコンテンツプロフェッショナルが集まる同イベントで披露されます。

Color Modeは、Premiere内にネストされた専用グレーディング環境として設計されています。大型のプログラムモニターが中心に配置され、調整結果を即座に視覚的にフィードバックすることで、迅速な判断と精密な操作を可能にします。クリップグリッドビューにより、シーケンス内のショット間の一貫性を維持しやすくなっています。

技術面では、32bit色深度での処理に初めて対応し、最大限の色再現性を実現しています。従来のハイライト・ミッドトーン・シャドウの3ゾーンモデルを超え、最大6つの輝度調整ゾーンを利用できます。双方向コントロールやマルチゾーントーナルシェーピング、スタック型カラー操作など、すべての処理がNVIDIA GPU上で実行されます。

NVIDIAはあわせて、デバイス上で動作するAIアシスタントProject G-Assist」のv0.2.1アップデートも発表しました。ゲーム設定の高度な検出システムと知識システムの強化により、eスポーツやAAAタイトルの設定調整でより高精度な助言が可能になっています。DLSS Overrides、Smooth Motion、RTX HDRなどNVIDIA Appの高度な機能も制御対象に加わりました。

そのほかNAB関連の動向として、WondershareのFilmoraがNVIDIA Broadcast技術を活用したアイコンタクト補正機能を追加したほか、UnslothとNVIDIAの協力によりファインチューニング性能が15%向上したことも報告されています。GoogleGemma 4モデルファミリーもNVIDIA GPU向けに最適化され、RTX搭載PCからJetson Orin Nanoまで幅広いデバイスで効率的に動作します。

インドEmergent、AIエージェントWingman公開

Wingmanの特徴

WhatsApp等で操作可能
バックグラウンドでタスク実行
重要操作時にユーザー承認要求
信頼境界による安全設計

Emergentの事業展開

月間150万人の利用者基盤
SoftBank等から7000万ドル調達済
評価額3億ドルで成長中

インドスタートアップEmergentが、メッセージングアプリを通じて操作できる自律型AIエージェントWingman」を発表しました。同社はバイブコーディングプラットフォームで知られ、技術的背景のないユーザーでも自然言語でフルスタックアプリケーションを構築できるサービスを提供しています。今回のWingman投入により、ソフトウェアの「構築」から「運用」へと事業領域を拡大します。

Wingmanの最大の特徴は、WhatsAppやTelegram、iMessageといった既存のメッセージングプラットフォーム上で動作する点です。ユーザーはチャットを通じてタスクの指示や進捗確認を行い、エージェントはメール、カレンダー、業務ソフトなどに接続してバックグラウンドで処理を実行します。日常的な操作は自律的に行いつつ、重要な判断が必要な場面ではユーザーの承認を求める「信頼境界」の仕組みを導入しています。

共同創業者兼CEOのMukund Jha氏は、メッセージングプラットフォームを採用した理由について「実際の仕事の多くはすでにチャットや音声、メールで行われている」と説明しています。OpenClawAnthropicClaudeなど先行するAIエージェントとの差別化として、新たなインターフェースの導入ではなく、既存の通信手段に溶け込む設計を選択しました。

Emergentのバイブコーディングプラットフォームはこれまでに800万人以上のビルダーに利用され、月間アクティブユーザーは150万人を超えています。2025年創業の同社は、SoftBankやKhosla Ventures、Lightspeed Venture Partnersから7000万ドルを調達し、評価額は3億ドルに達しています。Wingmanは限定的な無料トライアルで提供を開始し、その後は有料に移行する予定です。

GitHub、著作権と透明性に関する開発者向けポリシーを更新

著作権責任の明確化

米最高裁が二次的著作権責任の基準を明確化
意図の証拠なしにプラットフォームは自動的に責任を負わないと判示
DMCA第1201条の3年ごとの見直しが2027年に予定

透明性と今後の課題

2025年通年の透明性データを公開
DMCA回避申立て件数が過去最多を記録
年齢確認法がオープンソースに波及する懸念を表明

GitHubは2026年4月15日、開発者向けポリシーに関する最新の動向を公式ブログで発表しました。米連邦最高裁判所のCox対Sony判決、DMCA第1201条の次回見直し、そして2025年通年の透明性レポートの公開という3つのテーマを取り上げ、開発者の権利保護と著作権のバランスについて見解を示しています。

最高裁のCox対Sony判決では、オンラインサービス提供者がユーザーの著作権侵害に対して自動的に責任を負うものではないとの基準が示されました。GitHubは業界のアミカスブリーフ(意見書)に参加し、開発者プラットフォームに対する過度な責任追及が技術革新を阻害すると主張していました。この判決により、中立的なインフラを提供するプラットフォームの法的安定性が高まるとGitHubは評価しています。

DMCA第1201条については、2027年に予定される次回の3年ごとの免除見直しに向けた準備を進めています。同条項はデジタルアクセス制御の回避を制限するもので、セキュリティ研究やAI安全性研究、相互運用性に関わる開発者に直接影響します。2024年のサイクルではAI関連のセキュリティ研究に関する免除申請が採用されなかったことから、GitHubは今後の議論に向けて開発者からのフィードバックを求めています。

透明性レポートでは、2025年のDMCA回避申立て件数が透明性報告開始以来の最多を記録したことが明らかになりました。これは少数の大規模なテイクダウンに起因するものの、著作権法の均衡あるアプローチの重要性を浮き彫りにしています。また、米国各州やブラジル欧州で広がる年齢確認法がオープンソースのOSやパッケージマネージャーに意図せず適用される可能性についても懸念を表明し、5月のMaintainer Monthでこのテーマを取り上げる予定です。

Google、中南米政府とAI推進3施策を発表

経済効果と政策提言

AI導入GDP最大6.7%押し上げ試算
年間2420億ドルの経済効果の可能性
人材・インフラ・技術革新・政策の4本柱提示
中小企業のAI移行支援も重点項目

人材育成とデジタル基盤

IDBと連携し公務員向けAI Academy開設
スペイン語・ポルトガル語で無料研修提供
Google.orgが500万ドルをDPI基盤に拠出
12か国横断のデジタルIDシステム整備

Googleは2026年4月15日、世界銀行と米州開発銀行(IDB)の春季会合に合わせ、中南米地域のAI導入とデジタル変革を推進する3つの新施策をIDBとの提携で発表しました。中南米はAIへの期待が世界的に高く、メキシコ69%、ブラジル61%、アルゼンチン58%と北半球を大きく上回っています。

第1の施策は、調査会社Foresightと共同で作成した報告書「AI Works for Spanish Speaking Latin America」の公表です。同報告書によると、AIの戦略的かつ責任ある導入により、中南米地域のGDPを3.6%から6.7%押し上げる可能性があり、年間最大2420億ドルの経済効果が見込まれます。これは同地域のインフラ投資不足額を補える規模です。

第2の施策は、IDBとApoliticalが連携して立ち上げる公務員向けのAI Academyです。GoogleのGovernment AI Campusのコンテンツを活用し、スペイン語・ポルトガル語・英語で無料のAI研修を提供します。公務員がAIを活用して市民サービスを向上させることを目指しています。

第3の施策は、Google.orgから非営利ファンドCo-Developへの500万ドルの拠出です。各国政府がデジタルID や決済システムなど共通のデジタル公共インフラ(DPI)を導入できるよう支援します。IDBとの連携で中南米・カリブ海の12か国にまたがる安全なデジタルIDシステム「IdLAC」の展開も進めます。

中南米ではすでにAIの実用化が進んでおり、ブラジルでは連邦税務当局がGeminiを使って空港の手荷物検査を自動化し、メキシコでは会計検査院がGoogleのAIツールで監査期間を10か月から数分に短縮しています。今回の3施策は、こうした実績を地域全体に広げるための枠組みとなります。

AI学習アプリGizmo、ユーザー1300万人突破でシリーズA約33億円調達

急成長の背景

120カ国以上で1300万人が利用
2023年の30万人から約43倍に急増
ゲーミフィケーションで学習継続を促進
TikTok世代の学習習慣転換を狙う

資金調達と今後の展開

Shine Capital主導で2200万ドル調達
従業員7人から約30人へ拡大予定
米国の大学市場への本格参入
エンジニアリングとAIチームを強化

AI搭載の学習プラットフォームを提供するGizmoが、シリーズAラウンドで2200万ドル(約33億円)の資金調達を実施しました。2021年のサービス開始以来、120カ国以上でユーザー数が1300万人を超え、2023年時点の約30万人から大幅に成長しています。調達資金はエンジニアリング・AIチームの拡充と米国大学市場への展開に充てられます。

Gizmoは学生のノートをインタラクティブな学習教材に変換するサービスです。リーダーボード、連続学習記録(ストリーク)、不正解時のライフ制限、友人への挑戦機能など、ゲーム的な仕組みを取り入れることで学習への継続的な関与を実現しています。10代から若年層をターゲットにしており、TikTokYouTubeに慣れた世代の学習行動を変えることを目指しています。

米国では2025年の全国学力調査(NAEP)で学力が過去最低水準を記録しており、スクリーンタイムの過多や集中力の低下が要因として指摘されています。こうした環境のなかで、edtech分野ではAnki、Quizlet、Nibbleといった既存サービスに加え、YunoやKnowtなど新興プレイヤーも台頭しています。Gizmoの1300万ユーザーは競合のKnowt(700万人超)やYuno(100万ダウンロード)を上回る規模です。

今回のラウンドはShine Capitalが主導し、Ada Ventures、Seek Investments、GSV、NFXが参加しました。NFXは以前のシードラウンド(350万ドル)でもリード投資家を務めています。調達を機に、現在7名の従業員を約30名に増やす計画で、CEOのPetros Christodoulou氏はTechCrunchの取材に対し、米国の大学市場を重点的に開拓する方針を示しています。

調達業務を自律AIで自動化するTraza、210万ドル調達

Trazaの事業概要

Base10 Partners主導で210万ドル調達
製造・建設業の調達業務を自律AIで代行
人的作業時間を70%削減と主張
200以上の企業ツールとAPI連携

市場環境と競合優位

調達ソフト市場は80億ドル超規模
契約後に価値の11%が漏失する業界課題
物理産業特化で汎用ツールと差別化
スペイン出身の3人が米国で創業

米ニューヨーク拠点のスタートアップTrazaは2026年4月15日、Base10 Partners主導で210万ドル(約3億円)のプレシード資金調達を完了したと発表しました。同社は製造業や建設業の調達業務に特化した自律型AIエージェントを開発しており、見積依頼の作成・送信からサプライヤーとのやり取り、請求書処理まで、人間の継続的な監視なしに一連のワークフローを実行します。

調達ソフトウェア市場は80億ドルを超え年率約10%で成長していますが、実際の業務の大半はいまだにメール、スプレッドシート、電話に依存しています。業界調査によると、企業は契約締結後に契約価値の平均11%を失っており、年間5億ドルの契約支出がある企業では5,500万ドルが非効率な運用から消失している計算になります。Trazaはこの「契約後の価値漏失」を自動化で解消する立ち位置を狙っています。

既存の調達ソフト大手であるSAP AribaやCoupaがレコメンデーション機能の追加にとどまるのに対し、Trazaは業務そのものを代行する点が特徴です。一方で、購買承認やコンプライアンス確認など重要な判断では必ず人間が介在する設計としており、監査可能性を維持しています。初期導入企業では調達業務の人的作業時間が70%減少し、調達サイクルが3倍速くなったとしています。

共同創業者3人はスペイン出身で、Exponential Fellowshipを通じて渡米しました。CEOのSilvestre Jara Montes氏はAmazonや世界有数の海運グループCMA CGMでサプライチェーン戦略に携わった経験を持ちます。同社は欧州の技術人材を活用した資本効率の高い運営を強みとしており、今後3年で米欧の大手産業企業20〜30社への導入と、10億ドル超の調達支出をプラットフォーム経由で処理する目標を掲げています。

歌手Aloe Blaccが膵臓がん新薬開発に自己資金で参入

バイオテック参入の経緯

グラミー賞候補歌手が創薬に挑戦
COVID罹患を機に医療研究への関心
膵臓がんの致死率90%に着目
慈善活動だけでは創薬が進まない現実

AIと創薬音楽の交差点

ヒューストン大学の分子発見基盤を活用
開発期間の大幅短縮を目指す構想
査読論文の裏付けまで資金調達を保留
AI音楽の経済的主導権はレーベルに

グラミー賞ノミネート歌手のAloe Blacc氏が、膵臓がん治療薬の開発プラットフォームを自己資金で立ち上げていることが明らかになりました。膵臓がんは患者の90%が死亡する難治性疾患であり、同氏はワクチン接種済みにもかかわらずCOVIDに感染した経験を機に、医療研究への本格的な関与を決意しました。TechCrunchのポッドキャスト番組で、創業の経緯とAIがバイオテック・音楽業界に与える影響について語っています。

Blacc氏がバイオテックに踏み込んだきっかけは、研究資金を提供しようとした際に直面した制度上の壁でした。規制当局は商業化計画を求め、慈善寄付だけでは臨床試験を進めることも大学の知的財産ライセンスを取得することもできません。そこで同氏は自ら事業体を設立し、創薬プラットフォームの構築に着手しました。

ヒューストン大学が開発した分子発見プラットフォームを活用することで、従来数年かかっていた薬剤開発のタイムラインを大幅に短縮できる可能性があります。同氏は著名人としてのネットワークを活用した資金調達が可能な立場にありますが、査読付き論文でデータの裏付けを得るまであえて外部調達を行わない方針を取っています。知名度ではなく科学的根拠で信頼を獲得する姿勢です。

音楽業界におけるAIの影響についても、Blacc氏は独自の見解を示しています。AI音楽生成サービスのSunoをプロトタイピングに活用した経験がある一方、次のアルバムは生演奏で録音する予定です。AI生成音楽の経済的な主導権は、アーティストやAI企業ではなく、最終的にはレコードレーベルが握るとの見方を示しており、クリエイターとテクノロジーの関係性について示唆に富む視点を提供しています。

トランプ氏がAI生成のキリスト風画像を連続投稿

AI画像の拡散経緯

Truth Socialにキリスト風画像を投稿
MAGA系インフルエンサーの画像が変容して拡散
画像内に悪魔的な翼の存在が出現
投稿は削除後も別のAI画像を再投稿

保守派からの批判

保守論客が「反キリストの精神」と批判
教皇レオ14世への攻撃直後の投稿
ホワイトハウス側近も投稿を止められず

トランプ前大統領が2026年4月、自身をキリストに見立てたAI生成画像をTruth Socialに相次いで投稿し、保守派内部からも強い批判を受けています。最初の画像は病人を癒やし天使に囲まれるトランプ氏を描いたもので、教皇レオ14世を攻撃した直後のタイミングでした。トランプ氏本人は記者団に対し「医者としての自分の画像だと思った」と釈明しています。

問題の画像は、2月にMAGA系インフルエンサーのニック・アダムズ氏が最初に投稿したものが原型とされます。しかしXユーザーの調査により、トランプ氏に届くまでの間に画像が変質していたことが判明しました。雲の中の兵士が顔のない棘状の翼を持つ存在に変わり、SNS上では「悪魔」と受け止められました。国旗の星の数や背景の建物、人物の表情にも変化が見られています。

保守派論客のロッド・ドレハー氏はウォール・ストリート・ジャーナル紙に対し「トランプ氏が反キリストだとは言わないが、反キリストの精神を放っていることは間違いない」と述べました。JD・バンス副大統領のカトリック洗礼にも立ち会った人物による発言として注目を集めています。

最初の画像は削除されたものの、トランプ氏はその後もAI生成画像の投稿を継続しています。水曜日にはフォロワーから送られた、アメリカ国旗の前でキリストと抱擁するトランプ氏の画像を投稿し、「急進左派はこれを嫌がるだろうが、とても素敵だと思う」とコメントしました。ホワイトハウス内部で投稿を制止しようとする動きがあるとされますが、トランプ氏のSNS投稿を側近が止められない構図は第一期政権から繰り返されています。