Codex(プロダクト)に関するニュース一覧

OpenAI、Codexを従量課金制で提供開始

料金体系の刷新

従量課金Codex専用席を新設
トークン消費ベースで課金
レートリミットなしで利用可能
ChatGPT Business年額を25→20ドルに値下げ

導入支援と実績

新規メンバーに最大500ドルのクレジット付与
週間アクティブ開発者200万人突破
企業向けCodex利用者が1月比6倍に成長
Notion・Rampなど大手が採用済み

OpenAIは2026年4月2日、AIコーディングツール「Codex」をChatGPT BusinessおよびEnterprise向けに従量課金制で提供開始すると発表しました。固定のシート料金なしで利用でき、チーム単位での試験導入が容易になります。

新たに導入されたCodex専用シートは、レートリミットが撤廃され、トークン消費量に基づいて課金される仕組みです。これにより、予算やワークフローごとのコスト可視化が格段に向上し、企業の支出管理が容易になります。

従来のChatGPT Businessシートも引き続き利用可能ですが、年間料金が1シートあたり25ドルから20ドルに引き下げられました。また、macOSWindows向けのCodexアプリやプラグイン、自動化機能が新たに追加されています。

導入促進策として、対象のChatGPT Businessワークスペースには、新規Codex専用メンバー1人あたり100ドル、チームあたり最大500ドルのクレジットが期間限定で付与されます。小規模チームでも低リスクで導入を開始できます。

現在、ChatGPTの有料ビジネスユーザーは900万人を超え、Codexの週間利用者は200万人以上に達しています。NotionやRamp、Braintrustなどの企業がすでにCodexを活用しており、エンジニアリングワークフローの高速化と再現性の向上を実現しています。

Cursorが新エージェント型開発環境を発表、Claude CodeやCodexに対抗

Cursor 3の全容

自然言語でタスク指示が可能
複数エージェントの同時実行に対応
クラウド生成コードをローカルで確認

AI大手との競争激化

月200ドルで1000ドル超の利用価値提供
Cursor従量課金へ転換済み
独自モデルComposer 2を投入

Cursorは2026年4月、AIコーディングエージェントを中心とした新製品「Cursor 3」を発表しました。コード名Glassで開発された本製品は、AnthropicClaude CodeOpenAICodexに対抗するエージェント型開発体験を提供します。

Cursor 3は既存のデスクトップアプリ内に新しいインターフェースとして統合されます。中央のテキストボックスに自然言語でタスクを入力すると、AIエージェントがコードを自動生成します。サイドバーで複数のエージェントを同時に管理できる設計です。

競合製品との最大の差別化は、IDEエージェント型製品の統合にあります。クラウド上でエージェントが生成したコードをローカル環境で即座に確認・編集できるため、開発者は従来のワークフローを維持しつつエージェントを活用できます。

一方で経営面の課題は深刻です。複数の開発者Claude CodeCodexへ移行したと証言しており、主な理由は月額200ドルの定額プランで1000ドル超相当の利用が可能な補助金付き価格設定です。Cursorは2025年6月に従量課金へ移行し、一部の開発者の不満を招きました。

Cursorは対抗策として独自AIモデル「Composer 2」の提供を開始しました。中国のMoonshot AIのオープンソースモデルをベースに追加学習を施したもので、性能・価格・速度の面で競争力があると主張しています。現在約500億ドル評価額資金調達を進めており、AI大手との消耗戦に備えています。

OpenAI、1220億ドル調達 評価額8520億ドルでIPOへ布石

史上最大の資金調達

評価額8520億ドルで完了
SoftBanka16zら共同主導
個人投資家から30億ドル調達

急成長する事業規模

月間売上20億ドルに到達
週間ユーザー9億人超え
法人比率が売上の40%に拡大

インフラと今後の戦略

AIスーパーアプリ構想を発表
複数チップ基盤に分散投資

OpenAIは2026年3月、1220億ドル(約18兆円)の資金調達を完了したと発表しました。評価額8520億ドルに達し、同社史上最大の調達ラウンドとなります。年内に予定されるIPOに向けた布石とみられています。

ラウンドはSoftBankAndreessen Horowitzが共同主導し、D.E. Shaw Ventures、MGX、TPGなどが参加しました。AmazonNVIDIAMicrosoftも戦略的パートナーとして出資しています。初めて銀行チャネルを通じた個人投資家にも門戸を開き、30億ドル以上を集めました。

事業面では月間売上が20億ドルに達し、AlphabetやMetaの同時期と比べ4倍の成長速度だと同社は主張しています。ChatGPTの週間アクティブユーザーは9億人を超え、有料会員は5000万人以上です。検索利用は1年で約3倍に伸びています。

法人向け事業は売上全体の40%を占めるまでに成長し、2026年末までにコンシューマーと同等になる見通しです。最新モデルGPT-5.4エージェントワークフローの需要を牽引し、APIは毎分150億トークン以上を処理しています。広告事業も開始からわずか6週間でARR1億ドルを突破しました。

同社はAIスーパーアプリ構想を掲げ、ChatGPTCodex、ブラウジング機能などを単一のエージェント体験に統合する方針です。インフラ面ではNVIDIA、AMD、AWS Trainiumなど複数のチップ基盤に拡大し、回転信用枠も約47億ドルに増額しました。調達資金はAIチップデータセンターの拡充に充てられます。

OllamaがApple MLX対応、Macでのローカル推論を大幅高速化

MLX対応の概要

Apple MLXフレームワーク対応開始
Ollama 0.19プレビューで提供
Qwen3.5-35Bモデルのみ対応
Apple Silicon搭載Mac・RAM32GB以上が必要

性能改善と圧縮技術

キャッシュ性能の向上を実現
Nvidia NVFP4圧縮形式に対応
メモリ使用効率の大幅改善

ローカルLLM需要の高まり

OpenClawGitHubで30万スター突破
クラウドAPIの料金・制限への不満が背景

ローカルLLM実行ツールOllamaは、Appleが開発したオープンソースの機械学習フレームワークMLXへの対応を発表しました。これにより、Apple Silicon搭載Macでの大規模言語モデルの推論性能が大幅に向上します。

今回の対応はOllama 0.19のプレビュー版として提供されており、現時点で対応モデルはAlibabaのQwen3.5-35Bパラメータ版のみです。利用にはApple Silicon搭載Macに加え、最低32GBのRAMが必要とされています。

MLX対応に加え、キャッシュ性能の改善やNvidiaNVFP4モデル圧縮形式への対応も同時に発表されました。NVFP4はモデルのメモリ使用量を大幅に削減する技術で、より効率的な推論環境の構築が可能になります。

ローカルモデル実行への関心は急速に高まっています。OpenClawGitHubで30万スター以上を獲得し、中国を中心に世界的な注目を集めています。研究者やホビイスト以外の層にもローカルLLMの活用が広がりつつあります。

背景には、Claude CodeChatGPT Codexなどのクラウドサービスにおけるレート制限や高額なサブスクリプション費用への開発者の不満があります。OllamaはVisual Studio Codeとの統合も拡充しており、ローカル開発環境の充実を進めています。

Midjourney技術者がWeb設計を革新するOSSライブラリPretext公開

Pretextの技術革新

DOM迂回でテキスト計測を高速化
15KBのゼロ依存TypeScriptライブラリ
300〜600倍の描画性能向上を実現
モバイルでも120fps動作可能

開発手法と反響

48時間でGitHub星1.4万獲得
X上で1900万回閲覧を記録

企業への示唆

生成AIのUI構築に即時導入推奨
アクセシビリティ管理は自社責任に

MidjourneyエンジニアCheng Lou氏が2026年3月27日、Webテキストレイアウトを根本から変えるオSSライブラリPretextMITライセンスで公開しました。15KBのゼロ依存TypeScriptライブラリで、ブラウザのDOM操作を迂回し、テキストの計測と配置を高速に行います。

従来のWeb開発では、テキストの高さや位置を取得するたびにブラウザがレイアウトリフローと呼ばれる再計算を実行し、深刻なパフォーマンス低下を招いていました。PretextはブラウザのCanvasフォントメトリクスと純粋な算術演算を組み合わせ、DOMに一切触れずに文字・単語・行の配置を予測します。

ベンチマークによると、Pretextのlayout関数は500種類のテキストを約0.09ミリ秒で処理でき、従来のDOM読み取りと比較して300〜600倍の性能向上を達成しています。この速度により、ウィンドウリサイズや物理演算中でもリアルタイムにテキスト再配置が可能になりました。

開発にはAnthropicClaudeOpenAICodexなどAIコーディングツールが活用されました。多言語データセットや小説全文を用いてブラウザ実装とのピクセル単位の整合性を反復検証し、WebAssemblyやフォント解析ライブラリなしで高精度を実現しています。

公開から48時間でGitHubスター1万4000超、X上で1900万回閲覧を記録しました。コミュニティでは雑誌レイアウト、物理演算テキスト、ディスレクシア向けフォント調整など多彩なデモが登場し、Web表現の可能性が大きく広がっています。

企業にとっては、生成AI UIや高頻度データダッシュボードを構築する場合に即時導入が推奨されます。ただしレイアウトをユーザーランドに移すことで、ブラウザが担っていたアクセシビリティや標準準拠の責任を自社で管理する必要がある点には留意が必要です。

OpenAI、Codexにプラグイン機能を追加しコーディング以外に拡張

プラグインの概要

スキル・連携・MCPの統合パッケージ
GitHubGmailVercel等とワンクリック連携
組織横断で設定を再現可能

競合との関係

GoogleGemini CLIも同等機能提供済み
既存機能のパッケージ化が本質
検索可能なプラグインライブラリを新設

OpenAIは、エージェントコーディングアプリCodexにプラグイン機能を追加しました。これにより、Codexコーディング領域を超えた幅広いタスクに対応できるようになります。競合するAnthropicGoogleの類似機能に対抗する動きです。

プラグインは、スキル(ワークフローを記述するプロンプト)、アプリ連携、MCP(Model Context Protocol)サーバーを一つにまとめたバンドルです。特定のタスクに合わせてCodexを構成し、組織内の複数ユーザー間で再現可能にする仕組みとなっています。

技術的には、これまでもカスタム指示MCPサーバーを個別に設定すれば同等の機能を実現できました。しかし今回のプラグインでは、それらをワンクリックでインストールできるようパッケージ化した点が最大の特徴です。

Codexアプリ内には新たにプラグインセクションが設けられ、検索可能なライブラリからプラグインを選択できます。GitHubGmail、Box、CloudflareVercelなど主要サービスとの緊密な統合が用意されています。

この動きは、AIコーディングツール市場におけるプラットフォーム競争の激化を示しています。各社がエコシステムの拡充を通じて開発者の囲い込みを図る中、OpenAICodex汎用性を高めることで差別化を狙っています。

Vercel Sandboxにファイル自動永続化機能、ベータ提供開始

自動永続化の仕組み

停止時にファイルシステムを自動保存
再開時にスナップショットから復元
手動スナップショット操作が不要
状態保存のストレージ料金は無料

開発者向け新機能

カスタム名でSandboxを識別・管理
OpenAI Codex向けVercelプラグイン対応
39以上のプラットフォームスキルを提供
CLI・SDKともにベータ版で利用可能

Vercelは、クラウド開発環境「Vercel Sandbox」にファイルシステムの自動永続化機能をベータ版として追加しました。停止時に自動でスナップショットを取得し、再開時に復元することで、手動操作なしに長期稼働が可能になります。

自動永続化の仕組みは、ストレージとコンピュートを分離するオーケストレーションにより実現されています。Sandboxを停止するとセッションは終了しますが、ファイルシステムは自動的にスナップショットされます。再開時には新しいセッションがそのスナップショットから起動し、状態保存のストレージ料金は発生しません

あわせて、Sandboxにカスタム名を付与できる機能も導入されました。従来のID方式に代わり、プロジェクト内で一意の名前を設定することで、Sandboxの検索・参照・再開が容易になります。名前は自動永続化と連携し、作成時と再開時の識別に活用されます。

さらに、OpenAI CodexおよびCodex CLIへのVercelプラグイン対応も発表されました。39以上のプラットフォームスキルと3つの専門エージェント、リアルタイムコード検証機能を通じて、開発ワークフローを支援します。

これらの機能はすべてベータ版として全プランで利用可能です。SDK(@vercel/sandbox@beta)およびCLI(sandbox@beta)をインストールすることで、リソースの動的変更やセッション履歴の確認など高度な管理機能も含めて試用できます。

LangChain、エージェント間で業務知識を共有する「スキル」機能を公開

スキルの概要と特徴

業務知識エージェントに付与
関連時のみスキルを自動読込
ワークスペース全体で共有・同期
退職者の知見も組織に残存

作成方法と拡張性

AIとの対話から自動生成可能
テンプレートや手動作成にも対応
CLIでコード開発環境に連携
バージョン管理と権限拡張を予定

LangChainは2026年3月、AIエージェント開発基盤LangSmith Fleetにおいて、エージェント間で業務知識を共有できる「スキル」機能を正式に公開しました。スキルとは、特定タスクに必要な手順やドメイン知識をまとめた指示セットです。

現在のAIエージェント推論能力に優れる一方、業務固有の知識がなければ実用性に限界があります。たとえばサポートエージェントがSLAの優先度を知らなければ、すべての問い合わせを同一に扱ってしまいます。スキルはこの課題を解決する仕組みです。

スキルの作成方法は多彩で、AIとのチャットから自動生成する方法、エージェント作成時の自動提案、テンプレートからの選択、手動記述の4通りが用意されています。作成したスキルはワークスペースに共有でき、チーム全員のエージェントが即座に利用可能になります。

特筆すべきはポータビリティの高さです。LangSmith CLIを使えば、Fleet上のスキルをローカル開発環境にダウンロードし、Claude CodeCursorCodexなど任意のコーディングエージェントにそのまま連携できます。知識の再記述やコピーは不要です。

今後の機能拡張として、スキルのバージョン固定とロールバック、および複数オーナーによる共同編集権限の追加が予定されています。エージェントが高度な業務を担うほど、指示の質が成果を左右するとLangChainは強調しています。

ディズニーがOpenAIへの10億ドル投資を撤回、Sora終了で

提携白紙の経緯

OpenAISora終了を発表
ディズニーは事前通告なく寝耳に水
10億ドル投資計画を撤回
別形態の提携は引き続き協議中

Soraの急成長と急失速

11月に330万DLでピーク到達
2月には110万DLへ急落
累計収益はわずか214万ドル
OpenAIIPO準備で事業集約

ディズニーの戦略的誤算

Epic Gamesとのメタバース構想も停滞
SeeDanceなど競合アプリが台頭
新CEO就任直後に二重の危機直面

ディズニーは2026年3月、OpenAIへの10億ドル出資計画を撤回しました。OpenAI動画生成アプリSoraの終了を発表したことが直接の原因で、ディズニー側は事前に知らされておらず、計画の白紙撤回に踏み切りました。ただし両社は別の形での提携投資の可能性について協議を続けているとされています。

2025年12月に発表されたディズニーとOpenAI提携は、ハリウッドに大きな衝撃を与えました。Disney+上でSoraによるAI生成コンテンツを配信する計画で、前CEOボブ・アイガー氏は短尺動画の目玉にする構想を語っていました。しかしSoraのダウンロード数は2025年11月の330万件をピークに急減し、累計収益もわずか214万ドルにとどまりました。

OpenAIIPO準備の一環として事業の選択と集中を進めています。CFOのサラ・フライアー氏は「上場企業としての準備が必要」と述べ、Soraの研究チームはロボティクス向けの世界シミュレーション研究に再配置されます。ChatGPTCodex・Atlasを統合した「スーパーアプリ」構想に経営資源を集中させる方針です。

ディズニーにとってSora提携の頓挫は、テック投資戦略の見直しを迫る事態です。Epic Gamesとの15億ドル規模のメタバース構想も、Epic側の1000人規模のレイオフと5億ドルのコスト削減により先行きが不透明になっています。Fortniteのプレイヤー数減少も重なり、ディズニーブランドのメタバース実現は遠のいています。

新CEOジョシュ・ダマロ氏は就任1週間でOpenAIとEpicの二つの危機に直面する形となりました。一方、AI動画分野ではByteDanceSeeDance 2.0が急速に台頭し、ディズニーはIP無断使用に対する法的措置を進めています。今後のAI戦略の立て直しが、新体制の最重要課題となります。

Apple、WWDC26でAI進化を予告し6月開催発表

WWDC26の概要

6月8〜12日にオンライン開催
iOSmacOS等の全プラットフォーム更新
AI進化を主要テーマに明示
開発者向け新ツールも発表予定

Siri刷新への期待

Google Gemini連携契約を締結済み
新型Siriの高度なAI機能搭載
オンスクリーン認識と個人文脈理解強化

開発者向けAI基盤

Foundation Modelフレームワーク進化
XcodeにClaudeCodex統合済み

Appleは2026年3月、年次開発者会議WWDC26を6月8日から12日までオンラインおよびクパチーノ本社で開催すると発表しました。今年のテーマとして「AI進化」を明確に掲げています。

昨年のWWDCではLiquid Glassデザインが中心でAIへの言及は限定的でしたが、今年は大きく方針を転換します。Appleは年初にGoogleと契約を結び、GeminiをAI機能の基盤として採用することを決定しています。

最大の注目点はSiriの全面刷新です。高度なAI機能を搭載した新型Siriは、個人的な文脈の理解や画面上の情報認識といった機能が強化される見込みです。度重なる延期を経て、ついにお披露目となる可能性があります。

開発者向けには、昨年発表されたFoundation Modelフレームワークの進化が期待されます。オフラインで動作するAIモデルの拡充に加え、XcodeにはすでにAnthropicClaude AgentOpenAICodexといったエージェントコーディングツールが統合されています。

カンファレンスはApple Developerアプリ、公式サイト、YouTubeチャンネルでライブ配信されます。中国向けにはBilibiliチャンネルでも視聴可能で、グローバルな開発者コミュニティに向けた発信が強化されています。

OpenAI、デスクトップ統合「スーパーアプリ」を開発中

統合アプリの全容

ChatGPTCodex・Atlasを一本化
製品の分散化が品質低下の要因
モバイル版ChatGPT変更なし

競争環境と戦略転換

Anthropicとの競争が激化
Claude Codeの人気急上昇が背景
Codexへの集中投資を明言
「副次的探索」の縮小を指示

OpenAIは、ChatGPTアプリ、AIコーディングツール「Codex」、AIブラウザ「Atlas」を統合したデスクトップ向け「スーパーアプリ」の開発を進めていることが、米ウォール・ストリート・ジャーナルの報道で明らかになりました。アプリケーション部門CEOのフィジ・シモ氏が社内メモで方針を示しています。

シモ氏はメモの中で、製品の分散化が「開発速度を低下させ、求める品質基準の達成を困難にしている」と指摘しました。同社は昨年、動画生成AI「Sora」の発表やジョニー・アイブ氏のAIハードウェア企業買収など派手な展開を見せていましたが、戦略の再集中が急務となっています。

背景にはAnthropicとの競争激化があります。特にClaude Codeの急速な普及がOpenAIにとって脅威となっており、経営陣は優先度の低い取り組みの見直しを進めています。シモ氏は従業員に対し「副次的な探索に気を取られないように」と呼びかけました。

シモ氏はX(旧Twitter)への投稿で「企業には探索のフェーズと再集中のフェーズがあり、どちらも重要だ」と述べた上で、「Codexのように新しい賭けが成果を出し始めた今こそ、集中投資すべき時だ」と強調しました。

なお、モバイル版ChatGPTについては今回の統合の対象外とされています。OpenAIの広報担当者はコメントを控えており、統合アプリの具体的なリリース時期は明らかになっていません。今後のデスクトップ体験の大幅な刷新が見込まれます。

GitHub、AI時代のOSSメンター選定に「3C」指針を提唱

メンター危機の背景

AI生成PRが急増し選別困難に
月間PR数が4500万件超で前年比23%増
tldrawらがPR受付を停止する事態

3Cフレームワーク

Comprehension:問題理解の確認
Context:AI利用開示でレビュー最適化
Continuity:継続参加者に投資集中

実践と効果

ガイドライン未遵守のPRは即クローズ
公平性向上と属人的判断の排除

GitHubのAbigail Cabunoc Mayes氏は、AI時代におけるオープンソースのメンターシップのあり方を再考する指針「3Cフレームワーク」を提唱しました。AIツールの普及でコントリビューション量が急増し、メンテナーの負担が深刻化しています。

2025年のOctoverseレポートによると、GitHubでは月間約4500万件のプルリクエストがマージされ、前年比23%増を記録しました。一方でAI生成コードは一見高品質に見えるため、従来の貢献者評価シグナルが機能しなくなっています。

3Cの第一はComprehension(理解力)です。OpenAI CodexGemini CLIはPR提出前にイシュー承認を必須化しました。コードスプリントなど対面での理解度確認も有効とされ、貢献者が自分の理解度を超えたコードをコミットしないよう求めています。

第二のContext(文脈提供)では、AI利用の開示が重要です。ROOSTやFedoraなど複数プロジェクトがAI開示ポリシーを導入済みです。さらにAGENTS.mdの活用により、AIエージェントにプロジェクト規範を遵守させる動きも広がっています。

第三のContinuity(継続性)は、メンターシップ投資の最終判断基準です。一度きりの貢献ではなく繰り返し参加する人材にのみ深い指導を行うことで、メンターの乗数効果を最大化できます。明確な基準は属人的バイアスも排除し、より公平なコミュニティ形成につながります。

OpenAIがPython開発ツール企業Astralを買収へ

買収の狙いと背景

Codexチームに統合予定
uv・Ruff・tyの3ツールを獲得
AIコーディング支援市場の競争激化
Codex週間200万人超の利用者

OSSの継続と展望

買収後もオープンソース継続
Python開発ワークフロー全体を支援
AnthropicのBun買収に対抗
規制当局の承認が条件

OpenAIは2026年3月、人気のオープンソースPython開発ツールを手がけるAstral買収合意を発表しました。Astralはパッケージマネージャーuv、リンターRuff、型チェッカーtyを開発しており、買収後はCodexチームに統合される予定です。

Astralの主力ツールuvは月間1億2600万回以上ダウンロードされ、Ruffは1億7900万回に達するなど、Python開発者の間で広く普及しています。これらのツールは依存関係管理、コード品質チェック、型安全性の確保といった開発の基盤を担っています。

OpenAIは本買収について「Codexの開発を加速し、ソフトウェア開発ライフサイクル全体でAIができることを拡大する」と説明しています。Codexは年初から利用者が3倍、利用量が5倍に成長しており、週間アクティブユーザーは200万人を超えています。

この動きはAIコーディング支援市場での競争を反映しています。2025年11月にはAnthropicがJavaScriptランタイムBun買収Claude Codeに統合しており、OpenAIも今月初めにLLMセキュリティツールのPromptfoo買収するなど、開発者ツールの囲い込みが加速しています。

Astral創業者Charlie Marsh氏は、買収後もオープンソースツールの開発を継続しコミュニティとともに構築していくと表明しました。OpenAIも同様にOSSプロジェクトの支援を続けながら、Codexとのシームレスな統合を模索する方針です。買収完了には規制当局の承認が必要とされています。

Google、ブラウザAIエージェント開発チームを再編

開発体制の転換

Project Marinerチーム再編
研究者が高優先度プロジェクトへ異動
Gemini Agentに技術統合

業界の潮流変化

OpenClaw旋風で戦略転換
ブラウザ型の利用者数低迷
CLI操作が10〜100倍効率的

今後の展望

GUI操作は80/20の補完的役割
汎用エージェントへの進化が焦点

GoogleChromeブラウザを操作するAIエージェントProject Mariner」の開発チームを再編したことがWIREDの取材で明らかになりました。研究プロトタイプに携わっていたGoogle Labsのスタッフの一部が、より優先度の高いプロジェクトへ異動しています。

Googleの広報担当者はこの変更を認めたうえで、Project Marinerで培ったコンピュータ操作技術は同社のエージェント戦略に引き続き組み込まれると説明しています。すでに一部の機能は最近発表されたGemini Agentに統合されています。

背景にはOpenClawなど高性能コーディングエージェントの急速な台頭があります。NVIDIAのジェンスン・ファンCEOはOpenClawを「エージェント型コンピュータの新しいOS」と評し、「すべての企業がOpenClaw戦略を持つ必要がある」と述べました。

ブラウザエージェント普及は期待を下回っています。Perplexityの「Comet」は週間アクティブユーザー280万人にとどまり、OpenAIChatGPT Agentも100万人未満に減少しました。スクリーンショットベースの処理は計算コストが高く、テキストベースのCLI操作と比べ10〜100倍のステップが必要とされています。

一方で、コンピュータ操作エージェントが不要になるわけではないとの見方もあります。Simular CEOのアン・リー氏は「ターミナルで多くの問題を解決できるが、GUIでしか対応できない場面は常に存在する」と指摘しています。医療保険サイトやレガシーソフトウェアなど、APIが存在しない領域では引き続き重要な役割を果たすと述べました。

AI各社はコーディングエージェントを汎用アシスタントの基盤として位置づけ始めています。OpenAICodexChatGPT内の汎用エージェントにする構想を示し、AnthropicはターミナルなしでClaude Codeを使える「Claude Cowork」をすでに提供しています。

Xiaomi、1兆パラメータLLM「MiMo-V2-Pro」を低価格で公開

モデル性能と技術

1兆パラメータ中42Bのみ稼働
100万トークンの長大コンテキスト対応
幻覚率30%に大幅低減
エージェント評価で中国勢トップ

価格と市場影響

入力1ドル/100万トークンの低価格
GPT-5.2の約7分の1のコスト
オープンソース版も計画中
コード・端末操作に高い信頼性

Xiaomiは2026年3月18日、1兆パラメータの大規模言語モデル「MiMo-V2-Pro」を発表しました。開発を率いたのはDeepSeek R1出身のFuli Luo氏で、OpenAIAnthropicの最上位モデルに迫る性能を、約6〜7分の1の価格で提供します。

MiMo-V2-Proは1兆パラメータを擁しながら、1回の推論で稼働するのは42Bのみというスパース構造を採用しています。7対1のハイブリッドアテンション機構により、100万トークンの長大コンテキストでも性能劣化を抑え、効率的な推論を実現しています。

第三者機関Artificial Analysisの検証では、グローバル知能指数で10位・スコア49を獲得し、GPT-5.2 Codexと同等の評価を受けました。エージェント評価GDPval-AAではElo 1426を記録し、中国発モデルとして最高位に位置しています。

価格設定は入力1ドル・出力3ドル(100万トークンあたり、256K以下)と極めて競争力があります。GPT-5.2の全評価コスト2,304ドルに対し、MiMo-V2-Proはわずか348ドルで同等の処理が可能です。

企業導入においては、コスト対性能比の高さからインフラ部門に魅力的な選択肢となります。一方、エージェント機能の強力さゆえにプロンプトインジェクションリスクも増大するため、セキュリティ部門は監査体制の整備が不可欠です。Luo氏は安定版のオープンソース公開も予告しています。

MiniMax M2.7公開、自己進化型AIで開発工程の半分を自動化

自己進化と性能

RL工程の30〜50%を自動実行
MLE Benchメダル率66.6%達成
幻覚率34%Claude超え
SWE-Proで56.22%の高水準

コストと戦略転換

入力0.30ドル/100万トークン
GLM-5の3分の1以下のコスト
中国AI勢のプロプライエタリ転換
Claude Code11以上のツール対応

中国AI企業MiniMaxは2026年3月18日、新たなプロプライエタリLLM「M2.7」を公開しました。同モデルはエージェントワークフローとソフトウェア工学タスクに特化し、Vercel AI Gatewayでも標準版と高速版の2種類が利用可能となっています。

M2.7の最大の特徴は自己進化型の開発手法です。先行バージョンのモデルを活用して強化学習のハーネスを構築し、データパイプラインや学習環境の管理を自動化しました。これにより開発工程の30〜50%をモデル自身が担当し、100ラウンド以上の反復ループでコード修正を最適化しています。

ベンチマーク性能ではSWE-Pro 56.22%GPT-5.3-Codexに匹敵し、GDPval-AAではElo 1495を記録しました。幻覚率は34%とClaude Sonnet 4.6の46%やGemini 3.1 Pro Previewの50%を下回り、MLE Bench Liteのメダル率66.6%はGoogleGemini 3.1に並ぶ水準です。

価格面では入力0.30ドル、出力1.20ドル(100万トークンあたり)と前モデルM2.5から据え置きで、同等の知能水準を持つGLM-5と比較して3分の1以下のコストを実現しています。Claude CodeCursor、Trae等11以上の開発ツールへの公式統合も提供されています。

戦略的には、オープンソースで評価を高めてきた中国AI勢がプロプライエタリ路線へ転換する動きの一環として注目されます。一方で中国企業であることから米国・西側の規制産業での採用にはハードルがあり、企業の意思決定者はコスト効率と地政学的リスクを慎重に比較検討する必要があります。

Vercelがコーディングエージェント向けプラグインを公開

プラグインの主要機能

47種以上のスキルを搭載
Next.jsやAI SDK等の知識グラフ対応
3種の専門エージェントを内蔵
5つのスラッシュコマンドを提供

技術的な仕組み

ファイル編集やコマンドをリアルタイム監視
非推奨パターンを即時検出・警告
Claude CodeCursorに対応
OpenAI Codex対応も近日予定

Vercelは、コーディングエージェント向けの新プラグインを公開しました。Claude CodeCursorに対応し、Vercelプロジェクトの理解を深めるためのプラットフォーム知識グラフを提供します。

プラグインは47種以上のスキルを搭載しており、Next.js、AI SDK、Turborepo、Vercel Functions、Routing Middlewareなど主要技術をカバーしています。リレーショナル知識グラフにより、各技術間の関連性も把握できます。

AIアーキテクト、デプロイメントエキスパート、パフォーマンスオプティマイザーの3種の専門エージェントを内蔵しています。bootstrapやdeploy、env、status、marketplaceの5つのスラッシュコマンドも利用可能です。

技術的には、ビルド時にパターンマッチャーをコンパイルし、7つのライフサイクルフックで優先度付きの注入パイプラインを実行します。globパターンやbash正規表現、import文などに基づきスキルが発火し、セッション内で重複排除されます。

さらにPostToolUseバリデーションにより、非推奨パターンやサンセット済みパッケージ、古いAPIをリアルタイムで検出します。npxコマンドやClaude Code公式マーケットプレイスから簡単にインストールでき、OpenAI Codexへの対応も近日中に予定されています。

OpenAI、GPT-5.4 miniとnanoを公開

性能と価格

GPT-5 mini比2倍以上高速
SWE-Bench Proで54.4%達成
nano入力100万トークン0.20ドル
mini入力100万トークン0.75ドル

主な用途

コーディング補助の高速化
サブエージェント並列処理
スクリーンショット解析対応
Codexでコスト3分の1

OpenAIは2026年4月2日、小型高性能モデルGPT-5.4 miniGPT-5.4 nanoをAPI・CodexChatGPTで公開しました。大量処理ワークロード向けに設計された両モデルは、速度とコスト効率を重視しています。

GPT-5.4 miniは前世代のGPT-5 miniと比較して、コーディング推論・マルチモーダル理解・ツール使用の全領域で大幅に改善されています。処理速度は2倍以上に向上し、複数のベンチマークで上位モデルGPT-5.4に迫る性能を示しています。

ベンチマークではSWE-Bench Proで54.4%、OSWorld-Verifiedで72.1%を達成しました。特にOSWorldではGPT-5.4の75.0%にほぼ匹敵し、コンピュータ操作タスクでの実用性が際立っています。

料金体系はGPT-5.4 miniが入力100万トークンあたり0.75ドル、出力4.50ドルです。nanoはさらに安価で入力0.20ドル、出力1.25ドルに設定されています。両モデルとも40万トークンコンテキストウィンドウに対応します。

開発者にとって注目すべきはサブエージェント構成への最適化です。GPT-5.4が計画・判断を担い、miniやnanoが並列で個別タスクを高速処理する構成が推奨されており、Codexではmini利用時のクォータ消費が30%で済むため、コスト効率の高い開発体験を実現します。

OpenAI Codex SecurityがSASTレポートを採用しない理由

SAST の限界

データフロー追跡だけでは不十分
サニタイザー存在と安全性は別問題
変換チェーン後の制約維持が課題
順序・正規化の不整合が実際の脆弱性

エージェント型検証の設計

リポジトリ構造と脅威モデルから出発
z3ソルバーで制約充足を形式検証
サンドボックスでPoC実行検証
トリアージ前に証拠を確立

SAST起点を避ける理由

既存結果への早期収束リスク
暗黙の前提推論を歪める

OpenAIは自社のコードセキュリティ製品「Codex Security」において、従来の静的解析(SAST)レポートを起点としない設計を採用しました。代わりにリポジトリのアーキテクチャ、信頼境界、意図された動作から分析を開始し、人間に報告する前に検証を行う方針です。

SASTは入力源から危険なシンクまでのデータフロー追跡に優れますが、実際のコードベースでは間接呼び出しやリフレクション、フレームワーク固有の制御フローにより近似処理が必要になります。より根本的な問題は、サニタイザーが存在しても、その制約が変換チェーン全体で維持されるかを判定できない点にあります。

具体例として、JSONペイロードから取得したリダイレクトURLに対し正規表現チェック後にURLデコードを行うパターンがあります。CVE-2024-29041ではExpressにおいて、不正なURLがデコード・解釈の過程で許可リストを迂回できる脆弱性が発見されました。データフローは明白でも、変換後に検証が有効かが真の問題でした。

Codex Securityはコードパスをセキュリティ研究者のように読み、検証と実装の不一致を探します。最小のテスト可能な単位に分解してマイクロファザーを生成し、Python環境のz3ソルバーで制約充足問題として形式化することも可能です。サンドボックス環境でエンドツーエンドのPoCを実行し、疑惑と確証を区別します。

SASTレポートを起点としない理由は3つあります。第一に、既存の検出結果が探索範囲の早期収束を招きます。第二に、SASTが内包する暗黙の前提が推論を歪め、調査ではなく確認作業に陥ります。第三に、エージェント自身の発見能力の評価が困難になり、システム改善の妨げとなります。

マスク氏、xAIで再び大規模人員削減を指示

xAI組織再編の全容

SpaceXTeslaから監査役派遣
コーディング製品の不振が引き金
共同創業者2名が相次ぎ退社
訓練データの品質に重大な課題

競合との差と上場圧力

AnthropicOpenAIに大きく後れ
Grokは個人・法人とも普及せず
SpaceX統合で6月上場期限迫る
「基礎から再構築」とマスク氏表明

イーロン・マスクは、自身が率いるAIスタートアップxAIに対し、コーディング製品の低迷を理由に新たな人員削減を指示しました。SpaceXTeslaから「修正役」の管理職が送り込まれ、従業員の業務を監査しています。

AnthropicClaude CodeOpenAICodexといった競合AIコーディングツールが業界を席巻する中、xAIGrokチャットボットおよびコーディング製品は有料ユーザーの獲得に苦戦しています。設立からわずか2年で根本的な立て直しを迫られる異例の事態です。

SpaceXTeslaから派遣された管理職は、xAI社員の成果物を精査し、不十分と判断した社員を解雇しています。特にモデル訓練に使用するデータの品質が競合に劣る主因として注目されており、改善が急務となっています。

今回の混乱で、技術スタッフの最上級メンバーであったZihang Dai氏が退社しました。さらにGrokモデルの事前学習を統括していたGuodong Zhang氏も、コーディング製品の問題の責任を問われ主要業務を外されたことを受け、退社を表明しています。

マスク氏はxAISpaceX12.5億ドルで統合しており、6月の大型上場に向けた圧力が高まっています。同氏はXへの投稿で「xAIは最初の構築がうまくいかなかったため、基礎から再構築する。Teslaでも同じことがあった」と述べ、長期的な再建に自信を示しました。

YC支援のRandom LabsがAI群制御型コーディングエージェントSlate V1を公開

Slateの技術基盤

Thread Weavingで文脈維持
オーケストレータとワーカーの分離構造
エピソード記憶で状態圧縮
複数モデルの並列実行に対応

事業戦略と展望

従量課金クレジット制を採用
OpenAI CodexClaude Code連携を予定
Terminal Bench 2.0で高い安定性を実証
「次の2000万人エンジニア」が標的

Y Combinator支援のRandom Labsは、業界初の「スウォームネイティブ」自律型コーディングエージェント「Slate V1」を正式リリースしました。2024年にKiranとMihir Chintawarが共同創業した同社は、大規模並列処理で複雑なエンジニアリングタスクを実行する新しいアプローチを提案しています。

Slateの中核技術は「Thread Weaving」と呼ばれるアーキテクチャです。従来のAIコーディングツールが抱えていたコンテキストウィンドウの制約を、OS的なフレームワークで解決します。中央のオーケストレータが戦略的判断を担い、TypeScriptベースのDSLで並列ワーカースレッドにタスクを割り振る分離構造を採用しています。

記憶管理においても独自のアプローチを取ります。多くのエージェントが採用する「圧縮」方式では重要な状態情報が失われるリスクがありますが、Slateはワーカースレッド完了時に成功したツール呼び出しと結論のみを要約した「エピソード」を生成します。これによりスウォーム知性を維持しながら大規模並列処理を実現しています。

商業面では従量課金制のクレジットモデルへ移行し、組織レベルの課金管理機能を備えるなどプロフェッショナルチーム向けの設計が明確です。さらにOpenAICodexAnthropicClaude Codeとの直接連携を来週リリース予定と発表しており、競合ではなくオーケストレーション層としての立ち位置を狙っています。

性能面では、Terminal Bench 2.0のmake-mips-interpreterタスクで初期バージョンが3分の2のテストに合格しました。最新のフロンティアモデルでも単体では成功率20%未満とされるこのタスクでの好成績は、オーケストレーション型アーキテクチャの有効性を示しています。同社はSlateを開発者の代替ではなく、世界的なエンジニア不足を補う協調ツールと位置づけています。

OpenAIがResponses APIにコンピュータ環境を統合しエージェント基盤を強化

シェルツールの全容

Unix CLIで多言語実行
コマンド並列実行に対応
出力上限でコンテキスト節約
ストリーミング逐次応答

コンテナとスキル基盤

ファイル・SQLite永続管理
ネットワーク許可リスト制御
スキルで再利用可能な手順定義
コンパクション機能で長時間実行

OpenAIは、Responses APIにシェルツールとホスト型コンテナワークスペースを統合し、AIモデルが実際のコンピュータ環境でタスクを実行できるエージェント基盤を構築したと発表しました。従来のプロンプト応答を超え、ファイル操作やAPI呼び出しなど幅広い業務を自動化できます。

シェルツールは従来のコードインタプリタがPython限定だったのに対し、Go・Java・Node.jsなど多言語に対応します。モデルがコマンドを提案し、Responses APIがコンテナ内で実行、結果をモデルに返すループで動作します。複数コマンドの並列実行にも対応し、処理速度を大幅に向上させています。

コンテナ環境は3つの文脈を提供します。第一にファイルシステムでデータを整理し、第二にSQLiteなどの構造化データベースで効率的にクエリを実行できます。第三にネットワークアクセスはサイドカープロキシ経由で制御され、許可リストとドメイン単位の認証情報注入により安全性を確保しています。

エージェントスキルは繰り返し発生するワークフローを再利用可能な部品として定義する仕組みです。SKILL.mdファイルとリソースをバンドルし、バージョン管理されたパッケージとしてAPI経由で管理できます。モデルはシェルコマンドでスキルを発見し、指示を解釈して同一ループ内で実行します。

長時間タスクではコンテキストウィンドウが枯渇する課題に対し、ネイティブのコンパクション機能を実装しました。モデルが会話状態を分析し、重要情報を暗号化されたトークン効率の高い表現に圧縮します。OpenAICodexもこの仕組みに依存しており、長時間のコーディングタスクを品質を落とさず継続できます。

OpenAIがClaude Code追撃へCodex開発を全社加速

コーディングAI競争の構図

Claude Codeが年間売上25億ドル超
Codex10億ドルで後塵を拝す
Cursor買収を試みるも断念

OpenAI社内の巻き返し策

2025年3月にスプリントチーム結成
Windsurf買収Microsoft介入で破談
GPT-5.2搭載でCodex利用者が急増

業界への波及と今後の課題

Claude Code1兆ドル株安誘発
安全性と開発速度の両立が焦点

OpenAIがAIコーディングエージェントCodex」の開発を全社的に加速させています。競合Anthropicの「Claude Code」が年間売上25億ドル超と急成長する一方、Codexは2026年1月時点で10億ドル超にとどまり、後発の立場に置かれています。

OpenAIは2021年にCodexの初期版を開発し、MicrosoftGitHub Copilotに技術を提供していました。しかし2022年末のChatGPTの爆発的成功により、社内リソースがチャットボットやマルチモーダルAIに集中し、専任のコーディング製品チームが長期間不在となりました。

Anthropicはこの間、実際のコードリポジトリを使ったモデル訓練に注力しました。2024年6月にClaude Sonnet 3.5がリリースされると、そのコーディング能力が開発者に高く評価され、Cursorの急成長にもつながりました。OpenAICursor買収を持ちかけましたが、創業者らは独立を選びました。

OpenAIは2025年3月にスプリントチームを結成し、同時にWindsurfを30億ドルで買収する計画も進めました。しかしMicrosoft知的財産へのアクセスを要求し、両社の関係が緊張する中で買収は破談しました。その後GPT-5.2を搭載したCodexは性能が大幅に向上し、2025年9月にはClaude Codeの5%だった利用量が2026年1月には40%まで急伸しました。

一方でAIコーディングの社会的影響も拡大しています。Wall Street JournalはClaude Codeが1兆ドル規模の株安を引き起こしたと報じ、IBMは25年ぶりの株価急落に見舞われました。安全性団体からはOpenAICodex開発を急ぐあまり安全性評価をおろそかにしているとの指摘もあり、開発競争の加速と責任あるAI開発の両立が問われています。

AnthropicとOpenAIがLLM脆弱性スキャナーを無償公開、従来SASTの限界を露呈

2社の独自スキャナー比較

Claude Code Securityが500件超の未知脆弱性を発見
Codex Securityが120万超コミットをスキャン
OpenAI14件のCVEを新規発行
両ツールとも現在無償提供
誤検知率が50%以上低減

企業セキュリティへの影響

従来SATSのパターンマッチング限界が明確化
デュアルユースリスクの深刻化
静的コードスキャンの商品化が加速
予算の重心が修復自動化へ移行
ボードへの30日パイロット実施を推奨

2026年2月20日にAnthropicClaude Code Securityを、3月6日にOpenAICodex Securityを相次いでリリースし、LLM推論を活用した脆弱性スキャナーが企業向けに無償提供された。

AnthropicClaude Opus 4.6を用い、数十年間の専門家レビューと数百万時間のファジングを経た本番OSコードベースで500件超の高深刻度ゼロデイ脆弱性を発見しました。従来のカバレッジ誘導型ファジングでは検出不能だったLZW圧縮アルゴリズムのヒープバッファオーバーフローも特定しています。

OpenAICodex SecurityGPT-5搭載の社内ツール「Aardvark」から発展し、ベータ期間中に120万件超のコミットをスキャン。OpenSSH・GnuTLS・Chromiumなど著名OSSで792件の致命的問題と1万561件の高深刻度問題を検出し、14件のCVEが新規付番されました。

Checkmarx Zeroの検証では、Claude Code Securityが8件中2件しか真陽性を返せない事例も確認されており、LLMスキャナーの精度限界と第三者監査の必要性が指摘されています。Enkrypt AI CSO Merritt Baer氏は「OSSの脆弱性発見はゼロデイ級として扱うべきで、CVSSスコアだけでトリアージすべきではない」と警告しました。

企業セキュリティ担当者には7つのアクションが推奨されています。代表リポジトリで両ツールを同時実行して既存SATSとの差分(盲点)を把握すること、ガバナンスフレームワークをパイロット前に整備すること、ソフトウェア構成分析・コンテナスキャン・DASTなど両ツールがカバーしない領域を明確にすること、そして30日間のパイロットで取得した実証データを調達判断の根拠とすることが特に重要です。

OpenAI、コード脆弱性を自動検出するCodex Securityを公開

製品の特徴と精度

脅威モデル自動生成と編集機能
サンドボックスで検証し誤検知削減
修正パッチ文脈付きで提案
フィードバック学習で精度向上

OSS貢献と実績

14件のCVEをOSSで発見・報告
OpenSSH・GnuTLS等の重大脆弱性修正
誤検知率50%以上削減を達成
OSS支援プログラムを無償提供

OpenAIは2026年3月、アプリケーションセキュリティエージェントCodex Security」のリサーチプレビューを開始しました。ChatGPT Pro・Enterprise・Business・Edu顧客向けに、初月は無料で提供されます。

Codex Securityは旧名「Aardvark」として昨年からプライベートベータを実施してきました。ベータ期間中にSSRFやクロステナント認証バイパスなどの重大脆弱性を発見し、セキュリティチームが数時間以内にパッチを適用した実績があります。

同ツールの最大の特徴は、リポジトリを分析して脅威モデルを自動生成し、プロジェクト固有の文脈に基づいて脆弱性を優先順位付けする点です。サンドボックス環境での自動検証により、誤検知率を50%以上削減し、重要度の過大報告も90%以上減少させました。

OSSコミュニティへの貢献も注目されます。OpenSSH、GnuTLS、GOGS、Chromiumなど広く使われるプロジェクトで14件のCVEを報告しました。過去30日間で外部リポジトリの120万コミット以上をスキャンし、792件の重大・1万561件の高深刻度の脆弱性を検出しています。

OpenAIはOSSメンテナー向けに「Codex for OSS」プログラムも開始し、無償のChatGPT ProアカウントやCodex Securityを提供します。vLLMなどのプロジェクトが既に活用を開始しており、今後数週間で対象を拡大する予定です。

Block社ドーシーCEO、AI理由に従業員半数を解雇

大規模レイオフの背景

従業員約5000人を一斉解雇
AI進化で企業構造の抜本改革が必要と主張
12月のOpus 4.6やCodex 5.3が転機
過剰採用ではなく先手の判断と説明

AI中心の新企業像

管理階層を撤廃し知能層を構築
会社全体をミニAGI化する構想
顧客が自ら製品をバイブコーディング
1〜2年で対応しなければ存亡の危機

X・分散化・政治への見解

Xのアルゴリズム選択に改善余地
Blueskyもイデオロギー偏向と批判
政府と民間企業の分離が必要

Block(旧Square)のジャック・ドーシーCEOは、約1万人の従業員のうちほぼ半数を解雇したことを明らかにしました。同社は直近四半期に約30億ドルの利益を計上し、時価総額390億ドルの好業績下での決断です。

ドーシー氏は解雇の理由について、2025年12月にAnthropicOpus 4.6OpenAICodex 5.3などのAIツールが大規模コードベースへの対応力を劇的に向上させたことを挙げました。これにより企業の構造そのものを根本から見直す必要が生じたと説明しています。

同氏が描く新たな企業像は、従来の管理階層を完全に撤廃し、会社全体に知能レイヤーを構築する「ミニAGI」型の組織です。全社員がこの知能層に問いかけ、意図を組み込み、顧客向けの機能を迅速にスケールできる体制を目指しています。

イーロン・マスク氏が率いるX(旧Twitter)については、私企業化とビジネスモデル変革を評価しつつも、アルゴリズムによるフィルターバブルやイデオロギー的分断を批判しました。自身が創設に関わったBlueskyについても、VC投資を受けて普通の企業化した点に失望を表明しています。

ドーシー氏は、AIに対応しない企業は1〜2年以内に存亡の危機に直面すると警告しました。政治については「超混乱している」と述べ、テクノロジー企業と政府の分離の重要性を強調。AI企業間のモデル切り替えコストがほぼゼロである点にも言及し、業界の競争構造への懸念を示しました。

OpenAI、教育機関向けAI活用支援ツールを大幅拡充

学生のAI活用格差

週9億人ChatGPT利用
学生層が最大の利用者層
上級者でも活用度は90〜99%不足
基本利用から高度応用への移行が課題

教育機関向け新施策

研究用Prism環境を無料公開
OpenAI認定資格を試験導入
学習成果測定スイートを近日提供

OpenAIは、教育機関AI活用の格差を解消するための新たなツール群とリソースを発表しました。毎週9億人ChatGPTを利用するなか、大学生が年齢層別で最大の利用者であることが明らかになっています。

同社の分析によると、大学生は文章作成や分析、コーディングなど11分野中5分野で主流ユーザーのトップに立つ一方、パワーユーザーと比較すると活用度は90〜99%低い水準にとどまっています。この「能力活用格差」の解消が教育分野における重要課題と位置づけられています。

具体的な施策として、コーディングエージェントCodex」を授業に導入し、学生がバグ修正やテスト実行などの実務経験を積める環境を提供します。また、LaTeX対応の研究協業環境「Prism」を無料で公開し、論文執筆からAI支援ワークフローまでを一元化します。

アリゾナ州立大学やカリフォルニア州立大学システムでは、OpenAI認定資格のパイロット運用が開始されました。学生・教職員が実践的なAIスキルを習得し、雇用主に対して能力を証明できる仕組みです。ギリシャ、エストニア、UAEなど各国の教育システムも導入を進めています。

教員支援にも注力しており、「ChatGPT for Teachers」は全米の主要学区で15万人以上の教職員が利用中です。米国教員連盟との連携やOpenAI Academyを通じたコミュニティカレッジ向け無料研修も展開し、AI教育の裾野拡大を図っています。

OpenAIがGPT-5.4発表、PC操作や100万トークン対応

モデル性能の飛躍

GDPval専門家超え83%達成
OSWorldでPC操作成功率75%
事実誤認が33%減少
推論トークン消費量の大幅削減

エージェント基盤の進化

コンピュータ操作のネイティブ対応
Tool Searchでトークン47%削減
APIで100万トークン文脈窓
Excel・Sheets連携プラグイン提供

OpenAIは2026年3月5日、最新AIモデルGPT-5.4ChatGPT、API、Codexで公開しました。推論コーディングエージェント機能を統合した同社史上最高性能のフロンティアモデルと位置づけています。

GPT-5.4は同社初の汎用モデルとしてネイティブコンピュータ操作機能を搭載しています。Playwrightによるコード実行やスクリーンショットに基づくマウス・キーボード操作が可能で、OSWorldベンチマークでは人間の72.4%を上回る75.0%の成功率を達成しました。

ビジネス用途ではスプレッドシートプレゼンテーション、文書作成の能力が大幅に向上しています。投資銀行業務のモデリングタスクでは平均87.3%のスコアを記録し、前モデルGPT-5.2の68.4%から約19ポイント改善されました。

API向けにはTool Search機能を新たに導入し、多数のツール定義を事前にプロンプトへ含める従来方式を刷新しました。MCP Atlasベンチマークでは同精度を維持しつつトークン使用量を47%削減する効果が確認されています。

価格は入力100万トークンあたり2.50ドル、出力15ドルに設定され、GPT-5.2より引き上げられました。一方で推論効率の向上により、タスク全体のコストは抑制される見込みです。APIでは最大100万トークンコンテキストウィンドウに対応しています。

LangChain、コーディングエージェント向けスキル評価手法を公開

評価パイプラインの要点

Dockerで再現性ある環境構築
制約付きタスクで採点精度向上
バグ修正型タスクが検証に有効
スキル有無で完了率を比較

スキル設計の知見

XMLタグでモジュール化推奨
AGENTS.mdで確実な呼び出し実現
スキル数は12以下で正確に選択
LangSmithで軌跡を可視化

LangChainは2026年3月、Claude CodeCodexなどのコーディングエージェントに与える「スキル」の評価手法とベストプラクティスをブログで公開しました。スキルとは、特定領域でエージェントの性能を高めるための指示・スクリプト・リソースの集合体です。

評価パイプラインの基本は、タスクを定義し、スキルの有無エージェントの成績を比較する手法です。テスト環境には軽量なDockerコンテナを用い、ディレクトリの初期状態を統一することで再現性を確保しています。

タスク設計では、オープンエンドな課題よりもバグ修正型の制約付きタスクが有効であると報告されています。採点が容易になるだけでなく、エージェントの設計空間を適切に限定できるためです。評価指標には、スキルの呼び出し有無、タスク完了率、ターン数、実行時間などを採用しています。

スキル設計においては、AGENTS.mdCLAUDE.mdにスキルの使用方法を記載することで呼び出し率が安定しました。スキルを単独でプロンプト任せにした場合の呼び出し率は最大70%にとどまる一方、事前読み込みファイルに案内を記載すると一貫した呼び出しが実現できたと報告されています。

実験の結果、スキルを搭載したClaude Codeのタスク完了率は82%に達した一方、スキルなしでは9%に低下しました。LangSmithのトレース機能でエージェントの全行動を記録・分析し、失敗原因の特定とスキル内容の反復改善を高速に回すワークフローが紹介されています。

ByteDance動画AI「Seedance 2.0」に計算資源と著作権の壁

技術と普及の現状

Seedance 2.0が業界に衝撃
映画監督級の映像生成能力
GPU不足で数時間待ちの状態
中国国内アプリ限定で提供中

著作権問題の深刻化

Disney等が差止め書簡送付
ユーザーが著名キャラ映像を大量生成
中国のIP保護制度の未整備が背景

米中AI格差の構図

動画AIでは中国米国に先行
コーディングAIでは米国が優位

ByteDanceは2025年2月、動画生成AI「Seedance 2.0」を発表しました。中国のゲーム開発者や映像クリエイターから「監督のように考える」と高い評価を受け、AI動画の品質に懐疑的だった層にも衝撃を与えています。

しかし現時点では計算資源の深刻な不足が普及の障壁となっています。利用者によると、5秒の動画生成に約9万人待ちの行列が発生し、数時間の待機が必要です。月額70ドル超の有料会員でも長時間待たされる状況で、深夜に生成リクエストを送るなどの裏技が共有されています。

Disney、Netflix、Paramountなど大手映画スタジオがByteDance著作権侵害を主張する差止め書簡を送付しました。ユーザーがウルヴァリンやトム・クルーズなど著名キャラクターの映像を生成・拡散しており、グローバル展開時の法的リスクが急速に高まっています。

中国のエンタメ業界はハリウッドとは対照的にAI動画を積極的に受容しています。カンヌ受賞の賈樟柯監督がSeedance 2.0で作品を制作し公開するなど、著名クリエイターの参入が相次いでいます。春節晩会の背景映像にも採用され、政府の後押しも見られます。

米中AI分野の棲み分けも鮮明になっています。動画AIではKling AIを含む中国勢が世界をリードする一方、コーディングAIでは中国開発者Claude CodeCodexに依存しています。Seedance 2.0のAPI価格は15秒動画で約2ドルと公表されており、今後のサードパーティ開放が注目されます。

Raycast、AIコーディング統合アプリ基盤「Glaze」を発表

Glazeの基本機能

プロンプト入力だけでアプリ生成
クラウド保存やAPI管理を自動化
他人のアプリを取得しカスタマイズ可能

事業戦略と展望

Mac版先行、Windows・モバイル展開予定
無料版と月額20〜30ドルの有料プラン
Glaze Storeでアプリ共有・発見
Mac・WindowsApp Storeへの挑戦を表明

Raycastは、Mac向けランチャーアプリの開発元として知られる企業です。同社は新製品Glazeを発表し、AIを活用した「バイブコーディング」によるアプリの構築・利用・共有・発見を一元化するプラットフォームを提供します。

Glazeの最大の特徴は、プロンプトを入力するだけでアプリを一発生成できる点です。基盤モデルにはClaude CodeOpenAICodexを採用しており、クラウドストレージやAPI連携、デザイン原則の適用といった技術的な作業をすべて自動で処理します。

共同創業者のトーマス・ポール・マン氏は「コードを触る必要があるなら、それは我々の失敗だ」と述べています。Glaze Storeというディレクトリでは、他のユーザーが作成したアプリを閲覧・取得でき、さらに自分好みにカスタマイズして使うことも可能です。

GlazeはRaycastのランチャー機能と深く統合されており、生成したアプリはRaycastの拡張機能として自動的に連携します。現在はMac版のみですが、今後Windowsやモバイルにも対応予定で、無料版に加え月額20〜30ドルの有料プランを計画しています。

マン氏は現在を「ソフトウェアのiTunesモーメント」と表現し、あらゆるアプリが一か所で手に入る時代の到来を予見しています。MacやWindowsApp Storeに挑戦する意欲を示しており、個人の小さなユーティリティからチーム専用ツールまで、ソフトウェアの在り方を根本から変える可能性を秘めています。

OpenAI、社内データエージェントを2名で構築し全社展開

エージェントの全容

GPT-5.2基盤で自然言語対応
70%のコードをAIが生成
600PB超・7万データセットに対応
問合せ1件あたり2〜4時間短縮

技術的工夫と課題

Codexがテーブル探索を自動化
6層のコンテキスト階層で精度向上
過信防止の発見フェーズ強制
少量精選データが大量投入に勝る結果

企業への示唆

製品化せず構築用APIを外部提供
データガバナンスが成否を左右

OpenAIは、社内のデータ分析エージェントをわずか2名のエンジニアが3カ月で構築したことを明らかにしました。このツールはSlackやWebインターフェースから自然言語で問い合わせると、チャートやダッシュボードを数分で返す仕組みです。

同社のデータ基盤責任者であるEmma Tang氏によると、600ペタバイト超のデータと7万のデータセットを扱う環境で、5000人の社員のうち4000人以上がこのエージェントを日常的に利用しています。財務チームの地域別売上比較からエンジニアのレイテンシ調査まで、部門横断で活用されています。

技術的な最大の課題は、7万のデータセットから正しいテーブルを見つけることでした。Codexを活用した「Codex Enrichment」プロセスが日次でテーブルの依存関係や結合キーを自動解析し、ベクターデータベースに格納することでこの問題を解決しています。

モデルの過信という行動上の課題に対しては、プロンプトエンジニアリングで発見フェーズに時間をかけるよう強制する手法を導入しました。また評価の結果、コンテキストは量より質が重要であり、厳選された少量の情報のほうが高精度な結果を生むことが判明しています。

OpenAIはこのツールの製品化は予定しておらず、Responses APIやEvals APIなど外部利用可能なAPIのみで構築したと強調しています。Tang氏は「データガバナンスこそがAIエージェント成功の前提条件」と述べ、データの整備と注釈付けの重要性を企業に訴えました。

VC投資家がAI SaaS企業への選別を強化、汎用ツール離れ鮮明に

投資家が避けるSaaS領域

薄いワークフローや汎用水平ツールの敬遠
UIと自動化だけの差別化では参入障壁が不十分
独自データのない垂直SaaSへの投資縮小

SaaS業界の構造変化

AIエージェント台頭で座席課金モデルが崩壊危機
ソフトウェア株から約1兆ドルの時価総額が消失
KlarnaがSalesforce CRMを自社AI系に置換

今後の投資トレンド

ワークフロー所有とドメイン専門性に資本集中
成果報酬型や従量課金モデルへの移行加速

複数のVC投資家がTechCrunchの取材に応じ、AI SaaSスタートアップへの投資基準が大きく変化していることを明かしました。汎用的な水平ツールや薄いワークフロー層、独自データを持たない垂直SaaS投資対象から外れつつあります。

645 VenturesのAaron Holiday氏は、投資家が現在注目するのはAIネイティブ・インフラ、独自データを持つ垂直SaaS、ミッションクリティカルなワークフローに深く組み込まれたプラットフォームだと説明しました。AltaIR CapitalのRyabenkiy氏も製品の深さが不可欠と強調しています。

AIエージェントの進化により、従来の座席課金モデルが根本から揺らいでいます。Claude CodeOpenAI Codexなどのツールにより、SaaS製品の中核機能を容易に再現できるようになり、企業は自社開発を選ぶケースが増加しています。KlarnaがSalesforce CRMを自社AIシステムに置き換えた事例がその象徴です。

公開市場では、Anthropicの新製品発表のたびにSaaS株が下落する現象が続いています。2026年2月初旬には約1兆ドルの時価総額がソフトウェア株から消失しました。専門家はこの動きを「SaaSpocalypse」と呼び、SaaS終局価値が史上初めて根本的に問われていると指摘しています。

一方で投資家らはSaaSの完全な終焉は否定しています。コンプライアンス対応や監査支援など企業の基幹業務を支えるソフトウェアへの需要は持続するとの見方です。今後は従量課金や成果報酬型への移行が進み、ワークフロー所有とドメイン専門性を持つ企業に資本が集中すると予測されています。

FigmaがCodexと提携しデザイン連携を実現

統合の技術的内容

Figma MCPサーバー経由でCodexと直結
コード→デザインの即時変換が実現
Dev Mode・FigJamとのネイティブ連携
先週のAnthropic統合に続くマルチAI戦略
設計・実装サイクルの大幅短縮が可能

開発ワークフローへの影響

エンジニアコーディング環境から離れず設計変更
プロダクト開発の反復速度向上
デザインシステムとの自動整合が可能

FigmaOpenAIは2026年2月26日、Figma MCPサーバーを通じてOpenAI Codexデザインプラットフォームを直接連携させる統合を発表しました。エンジニアコーディング環境から離れることなく、デザインキャンバスの変更・反復が行えるようになります。

この統合の核心はFigma MCPサーバーの活用で、CodexFigmaデザインツール、Dev Mode、FigJamに直接アクセスできる点です。先週発表されたAnthropicとのMCP統合に続き、Figmaはマルチ大手AIとのエコシステム構築を加速しています。

開発チームにとっての実質的な価値は、コード変更がデザインに即座に反映されるフィードバックループの短縮です。従来は別々のツールを往来していた作業が一元化されます。

この動きはソフトウェア開発ワークフローにおけるAIエージェントの役割が、コード生成から設計・実装の統合制御へと拡張していることを示しています。

FigmaOpenAIAnthropic双方と提携した事実は、AIコーディングアシスタント市場の競争が激化し、各プラットフォームが設計ツール統合を差別化要因として争っていることを示しています。

GPT 5.3 CodexがVercelで利用可能

モデルの特徴

GPT-5.2 Codexの強みと推論深度を統合
従来比25%高速でトークン効率も改善
長時間エージェント作業に最適化

開発者への恩恵

Vercel AI Gatewayから即座にアクセス可能
コーディングエージェントの性能が一段向上
研究・ツール利用・長期実行に強み

OpenAIのGPT 5.3 CodexモデルがVercel AI Gatewayで利用可能になりました。このモデルはGPT-5.2のコーディング能力と深い推論能力を一つのモデルに統合したものです。

従来モデルより25%高速でトークン効率も改善されており、長時間のエージェントタスクや複雑なコーディング作業に特に適しています。Vercel経由で即座に利用できる利便性も魅力です。

インドAI投資競争、8エクサフロップス配備へ

インドAIインフラへの巨大投資

UAE・G42とCerebras8エクサフロップスの計算資源をインドに配備
Peak XVが13億ドルインド・アジア特化ファンドを設立
India AI Impact SummitがグローバルAI大手を集めてニューデリーで開催
インドデータ主権・コンプライアンス要件に準拠した設計
インフラ先行投資でAIエコシステムの地盤固め

インドAI消費・スタートアップ市場

SarvamがインドNLP特化チャットアプリIndusを正式公開
OpenAI India利用者の80%が30歳未満という若年層集中
ChatGPTインド利用は業務用途35%でグローバル平均超え
OpenAIのCodingアシスタントCodexインドで世界平均の3倍利用
ローカル言語モデル需要とグローバルAIの競争が激化

インドは2026年、世界で最も注目されるAI市場となっています。India AI Impact Summitには、OpenAIAnthropicNVIDIAMicrosoftGoogleCloudflareなどの主要AI大手のエグゼクティブが集結し、インドへのAI投資を競うように発表しました。

インフラ投資では、アブダビのG42がAIチップメーカーCerebrasと組み、8エクサフロップスの計算能力を持つスーパーコンピュータをインドに設置します。この規模はインドのAI産業の基盤を大幅に強化するものです。Peak XVは13億ドルの新規ファンドを設立し、AI分野に重点を置いています。

スタートアップ面では、インドのAI企業Sarvamがインド人ユーザー向けに最適化したチャットアプリ「Indus」を公開しました。ヒンディー語など地域言語への対応を強みとして、OpenAIGoogleとの差別化を図っています。ローカルAIとグローバルAIの競争が本格化しています。

OpenAIのデータによると、インドでのChatGPT利用者の約80%が30歳未満で、業務用途での利用が全体の35%を占めています。特にAIコーディングアシスタントの利用がグローバル平均の3倍という数字は、インドのIT産業との強い親和性を示しています。

インドのAIブームは、大規模インフラ投資、若年層の高い採用率、ローカルスタートアップの台頭という三つの力が重なる特別な現象です。グローバル vs ローカルの競争がインドのAI市場の形を決定づける2026年が始まっています。

GitHubとOpenAIがCodexとSoraでエージェントコーディングを拡張

エージェントコーディングの進化

GitHubエージェントワークフローでリポジトリタスクを自動化
OpenAICodexSoraのスケールアクセスを拡大
AIエージェントが開発ライフサイクルに深く統合

GitHubはAgenttic Workflowsを発表し、AIエージェントがリポジトリのタスク(コードレビュー、PR作成、ドキュメント更新など)を自動化できる機能を提供します。開発プロセス全体のエージェント化が加速しています。

OpenAIは同時期にCodexSoraの利用上限引き上げとアクセス拡大を発表しました。コーディングとビジュアル生成という二つの重要なAI機能のスケールが多くの開発者に開放されます。

この組み合わせは、コード生成だけでなくUI/UXのプロトタイピングにも活用できる統合的な開発環境を示唆しており、ソフトウェア開発の未来像として注目されます。

CodexとClaudeがカスタムGPUカーネルを全ユーザーに解放

GPU最適化の民主化

カスタムカーネル生成がAI支援で一般開発者に解放
CUDA専門知識なしでGPU最適化を実現
AI推論コストの削減を広く可能に

CodexClaudeのコード生成能力を組み合わせて、専門知識なしでカスタムGPUカーネルを生成できる機能が全ユーザーに開放されました。これまでCUDA専門家のみが担えたGPU最適化がAIの力で民主化されます。

カスタムGPUカーネルは特定の計算ワークロードに対してGPU使用効率を大幅に改善できますが、その開発には深い専門知識が必要でした。AIによる生成でこの技術的障壁が大幅に下がります。

この機能はMLエンジニアや研究者が推論効率を最大化する際の重要なツールとなります。自社AI推論のコスト削減に取り組む企業にとって実務的な価値があります。

HarnessがCodexでエージェントファースト開発を5ヶ月実践した知見

実践から得た知見

5ヶ月間のCodex活用実験の成果を公開
エージェントファーストの開発体制への移行
実務での課題と成功パターンを詳説

CI/CDプラットフォームのHarnessは、OpenAICodexを活用したエージェントファースト開発の5ヶ月間にわたる実験結果を公開しました。実際の製品機能の構築・出荷にエージェントを活用した現場レポートとして注目されます。

実験から得られた主な知見として、エージェントは繰り返しのルーティン作業では高い効果を発揮する一方、複雑な依存関係のある機能開発では人間の監督が依然として必要であることが確認されました。

このような実践からの学びは、AI開発ツールの導入を検討する企業にとって非常に参考になります。理論ではなく実際の開発現場での課題と解決策が語られており、日本の開発チームにも応用可能な示唆が含まれています。

OpenAI Codexアプリが1週間で100万ダウンロード突破

成長と影響

Mac専用Codexアプリが1週間で100万DL達成
全体Codexユーザーが前週比60%増
Sam AltmanがX上で自らマイルストーンを発表
ChatGPT初期リリース時の爆発的成長を想起させる
AIコーディング市場での存在感を急速に拡大

競争環境への影響

GitHub CopilotCursorWindsurf等との競争激化
OpenAIコーディングツール市場に本格参入
月間アクティブユーザー3億人超のChatGPTを基盤に展開
開発者市場でのシェア争いが本格化
AI支援コーディングの主流化を加速

OpenAIのCEO Sam AltmanはX上で、Mac向けの独立したCodexアプリケーションがリリース後1週間で100万ダウンロードを突破したと発表しました。これは全体のCodexユーザー数の前週比60%増を反映しています。

この成長速度は2022年末のChatGPT初期公開時の爆発的普及を想起させます。AI コーディングツール市場はGitHub CopilotCursorWindsurfなどが激戦を繰り広げており、OpenAIChatGPTの巨大ユーザーベースを武器に参入しました。

Codexアプリは現在Mac限定ですが、複数の並行AIコーディングタスクを実行できる機能を提供しています。3億人超の月間アクティブユーザーを持つChatGPTエコシステムと連携した展開が今後の競争力の鍵となります。

AI支援コーディングの主流化は、ソフトウェアエンジニア生産性に直接影響を与える重要なトレンドです。1週間での100万DLという数字は、開発者コミュニティにおけるOpenAIへの信頼と需要の高さを示しています。

今後のWindows版展開やエンタープライズ機能の拡充が注目されます。コーディングツール市場でのシェア争いは、AI企業のデベロッパー戦略の試金石となりそうです。

OpenAIがGPT-5.3-Codexを発表、コーディング超えたエージェント戦略

GPT-5.3-Codexの特徴

コーディング以外にも対応拡大
エージェントタスク実行が強み
システムカードリスク開示
プログラミング自律完遂能力
Claude Opus 4.6と同日リリース
AI競争の激化を象徴

開発者・企業への影響

複雑な業務自動化が可能に
デプロイパイプラインへの統合
コスト対性能の比較検討が必要

OpenAIは2026年2月5日、新しいコーディングエージェントモデル「GPT-5.3-Codex」を発表した。AnthropicClaude Opus 4.6とほぼ同日のリリースとなり、AI競争の激化を示した。

GPT-5.3-Codexはコード生成に特化した従来のCodexシリーズを進化させ、コーディング以外のエージェントタスクにも対応する汎用性を持つ。

OpenAIはシステムカードでモデルの能力・制限・安全性評価を詳細に開示しており、エンタープライズ顧客が導入判断をしやすい体制を整えた。

Arstechnicaの報道によれば「Codexはもはやコードを書くだけではない」とされ、複雑な業務プロセス全体を自律的に遂行できる能力が確認されている。

GPT-5.3-Codexとプレスの発表はOpenAIのエンタープライズ向けエージェントプラットフォーム戦略の一環で、Frontierとの統合でさらなる相乗効果を狙っている。

AnthropicがClaude Opus 4.6を公開、100万トークンとエージェントチーム機能

Opus 4.6の主要機能

100万トークンコンテキストウィンドウ
エージェントチーム機能を初搭載
コーディング超えた汎用性を強調
OpenAI Codexに正面から対抗
推論速度の大幅改善も実現
複数エージェント協調動作が可能

市場・競合へのインパクト

AIコーディング市場の競争激化
エンタープライズ需要の取り込みを狙う
スーパーボウル直前の戦略的発表

Anthropicは2026年2月5日、最新の大型モデル「Claude Opus 4.6」を公開した。100万トークンのコンテキストウィンドウと、複数AIが協調する「エージェントチーム」機能が目玉だ。

100万トークンのコンテキストは従来の4〜8倍以上の情報を一度に処理できることを意味し、大規模コードベースの解析や長文書類の一括処理が現実的になった。

エージェントチーム」はClaude同士が役割分担して複雑なタスクを遂行する仕組みで、ソフトウェア開発・リサーチ・分析業務での生産性向上が期待される。

リリースのタイミングはOpenAIGPT-5.3-Codex発表とほぼ同日で、スーパーボウルの週という注目度の高い時期を両社が狙ったことが読み取れる。

Claude Opus 4.6の登場はコーディング特化モデルから汎用エージェントAIへのシフトを明確にしており、企業の業務自動化プロジェクトに直接応用可能な水準に達した。

GitHubがClaudeとCodexのAIコーディングエージェントを統合

統合の詳細と利用条件

GitHub・VS CodeでClaudeCodexが利用可能
Copilot Pro+または Enterprise向け
GitHub Mobileでもエージェント操作対応
Agent HQで一元管理が可能
OpenAI CodexのApp Server構築詳細公開
コンテキスト切り替え摩擦の削減が目的

開発者への影響

PR作成からコードレビューまで自動化
AIコーディング市場での競争激化

GitHubは2026年2月4日、AnthropicClaudeOpenAICodexを直接GitHub上で利用できるパブリックプレビューを開始した。対象はCopilot Pro+またはCopilot Enterpriseのサブスクリプションユーザーだ。

この統合によりGitHubGitHub Mobile、Visual Studio Codeの各環境からAIコーディングエージェントシームレスに呼び出せるようになり、開発ワークフローの断絶が大幅に解消される。

Agent HQと呼ばれる新インターフェースにより、ClaudeCodex一元的に管理し、タスクに応じて最適なエージェントを選択することができる。

OpenAICodexのApp Server構築の技術的詳細を公開し、複数サーフェス(Webアプリ、CLI、API)での一貫した動作を実現する仕組みを説明した。

GitHubへのAIエージェント統合は開発者生産性向上に大きく寄与すると期待されており、AIコーディングツール市場における競争の新たな軸になっている。

AppleのXcode 26.3がClaudeとCodexを統合しエージェントコーディング時代へ

Xcode 26.3の新機能

Claude Agent SDKの統合
OpenAICodexのネイティブ対応
MCPプロトコルでの接続

開発者への影響

Appleプラットフォーム向けエージェント開発
Xcodeが主要AIツールの窓口に
iOSmacOS開発の生産性向上

AppleはXcode 26.3でAnthropicClaude Agent SDKとOpenAICodexを統合し、Appleプラットフォーム向けアプリ開発に本格的なエージェントコーディング機能を追加しました。

この統合はModel Context Protocol(MCP)を介して行われており、開発者はXcode内から直接Claude CodeCodexエージェント機能を呼び出してコード生成・リファクタ・テストを自動化できます。

AnthropicClaude Agent SDK対応により、iOSmacOS向けアプリにAIエージェント機能を組み込む開発が格段に容易になり、Apple Intelligenceとの連携も視野に入ります。

Xcodeが複数のAIプロバイダーに対応することで、開発者は好みのAIモデルを選択でき、ベンダーロックインを回避しながらAI補助開発を享受できます。

この発表はAppleが独自AIモデルだけでなく、外部AIエコシステムとのオープンな統合戦略を採用していることを示す重要なシグナルです。

AlibabaのQwen3-Coder-Nextがバイブコーダー向けの強力なオープンソースモデルに

モデルの特徴

超スパースアーキテクチャ採用
オープンソースで無料利用可能

競争への影響

Claude CodeCodexへの対抗
中国AIオープンソースの躍進
開発者コスト削減効果

アリババのQwenチームは、バイブコーディングユーザー向けに最適化されたオープンソースの超スパースモデル「Qwen3-Coder-Next」を公開しました。高い性能と低い計算コストを両立する超スパースアーキテクチャが特徴です。

超スパースモデルは、活性化されるパラメータが全体の一部に限られるため、同等性能のデンスモデルより低コスト・低レイテンシーで動作し、ローカル実行も現実的になります。

Claude CodeOpenAI CodexGitHub Copilotなど有料コーディングAIに対し、高品質なオープンソース代替を提供することは、コスト重視の開発者や企業への強い訴求力を持ちます。

Qwen3の一連のリリースは、中国のAI研究コミュニティがグローバルなオープンソースAIリーダーとして台頭していることを改めて示しています。

開発者にとってQwen3-Coder-Nextは実用的な選択肢であり、コーディングAIの競争激化がすべての開発者に恩恵をもたらします。

OpenAIがmacOS向けCodexデスクトップアプリを発表、並列AIコーディングエージェントを実現

Codexアプリの機能

複数エージェントの並列実行
長時間タスクの管理
Claude Codeへの対抗

開発者への影響

コーディングパラダイムの転換
チーム型AI開発の実現
macOSネイティブ体験

OpenAIは2026年2月2日、macOS向けのCodexデスクトップアプリを発表しました。単一のAIアシスタントとの対話型開発から、複数のAIエージェントが並列で異なるタスクを実行する「チーム型開発」への転換を可能にします。

Codexアプリは長時間実行タスクの管理・複数エージェントへの作業分配・進捗の可視化などの機能を持ち、Anthropicの人気ツールClaude Codeへの直接的な対抗として位置付けられています。

開発者にとってこれは、単に作業速度が上がるだけでなく、アーキテクチャレベルで複数の問題を同時に解決するという新しい開発モデルへの移行を意味します。

ただしエージェント型開発は適切なテスト・コードレビュー・ロールバック計画なしには技術的負債を急増させるリスクもあり、エンジニアリング文化の成熟も必要です。

この発表はAIコーディングツール競争の激化を示しており、GitHub CopilotCursorWindsurf等との競争がさらに激しくなるでしょう。

OpenAIがCodexエージェントループの内部設計を公開

アーキテクチャの詳細

マルチステップコード生成
テスト・デバッグの自動化
自律的なコーディングの実現

開発者への示唆

エージェント型AIの設計パターン
ループ設計の考え方
失敗回復の仕組み
実装の参考事例

OpenAICodexコーディングAIエージェントのループ設計を詳細に解説したブログ記事を公開した。計画・実行・テスト・修正というエージェントループの全工程を明らかにした。

エージェントが自律的にコードを書き、テストし、失敗から学んで修正する過程の設計原則が示されており、AI開発者にとって重要なアーキテクチャ参考資料となる。

この公開は、エージェント型AIの設計パターンへの理解を深め、自律コーディングエージェントの次世代開発を加速させると見られる。

DatadogがOpenAI Codexでシステムレベルのコードレビューを実現

大規模コードレビューの自動化

DatadogがOpenAI Codexを使ったシステムコードレビューを展開
数百万行規模のコードベースを自動的にレビュー
セキュリティ脆弱性・品質問題・パフォーマンス改善を検出
人間の reviewer では見落としやすい問題を発見
CI/CDパイプラインに統合してプルリクエスト毎に自動実行
開発速度を落とさずにコード品質を維持

OpenAIが紹介したDatadogの事例では、Codexを使ってシステム全体のレベルでのコードレビューを自動化しています。個々のプルリクエストを審査するだけでなく、コードベース全体の整合性を評価する仕組みを構築しています。

Datadog社内のコードリポジトリは巨大であり、人間のレビュアーだけでは全体的な品質維持が困難です。Codexによる自動スキャンは、セキュリティ脆弱性、パフォーマンスのアンチパターン、コーディング規約違反などを一括してフラグアップします。

この事例はSREやプラットフォームエンジニアにとって参考になるAI活用パターンです。大規模なマイクロサービスアーキテクチャを持つ企業ほど、Codexのようなシステムレベルのコードレビュー自動化の価値が高まります。

CursorがGraphite買収でAI開発環境を強化

Graphite買収の意義

AIコードレビューツールGraphiteを買収
評価額2.9億ドル超の価格で取得
スタックPRで並行開発が可能
生成から出荷まで一貫環境構築

AIコーディング対決

4大エージェントマインスイーパー対決
音声・モバイル対応も同一課題で評価
盲検判定で公平な比較を実施
最前線モデルの精度向上を確認

AIコーディングアシスタントCursorは、AIを活用したコードレビューデバッグツールのGraphiteを買収したと発表しました。買収額は非公開ですが、Graphiteの直近評価額2.9億ドルを大幅に上回ると報じられています。

Graphiteの主要機能であるスタック型プルリクエストは、承認待ちなしに複数の依存変更を並行して扱えるワークフローを提供します。AIが生成したコードのバグ修正サイクルを大幅に短縮する可能性があります。

Cursorは11月にも採用戦略会社Growth by Designを買収するなど積極的なM&A;を展開しており、評価額290億ドルの同社がAI開発の全工程を統合した環境構築を目指していることがわかります。

Ars Technicaは4つの主要AIコーディングエージェントCodex/GPT-5Claude Code/Opus 4.5、Gemini CLI、Mistral Vibe)にマインスイーパーを再実装させる比較実験を行いました。音声エフェクト・モバイル対応・サプライズ機能付きの完全版ゲームが課題です。

エージェントはHTML/JavaScriptファイルを直接操作し、ブラインド評価で結果が審査されました。AIコーディングツールへの開発者の信頼が揺れるなかで、最前線モデルが着実に精度向上を遂げていることが示されました。

Claude 4コーデックスとReplit安全技術

コーデックス詳細

コーデックスがGAで正式提供開始
CVE-Benchで87%を記録
長期セッションも文脈維持
防衛用途に段階的解放

Replit安全基盤

スナップショットで即座にロールバック
並列サンドボックスで複数解法試行
エージェント暴走を技術的に防止

AnthropicはAIコーディングエージェントClaude 4 Codex」を正式リリースしました。複数ファイルにわたる複雑な実装タスクを高い精度で自律的にこなします。

コンテキスト圧縮技術により、大規模リポジトリを横断する長期セッションでも文脈を正確に保ちながら継続作業ができ、複雑なタスクの長時間自律実行を安定して実現しています。

サイバーセキュリティ評価のCVE-Benchでは87%のスコアを記録し、従来モデルを大幅に上回る性能を示すことで防衛的セキュリティ用途への適用可能性を証明しました。

OpenAIは信頼できるセキュリティ研究者向けに防衛的サイバーセキュリティのパイロットプログラムを開始し、審査を通過したパートナーから順次利用範囲を段階的に拡大していく方針を明示しています。

ReplitはAIエージェントを安全に運用するための「スナップショットエンジン」の技術詳細を公式ブログで公開し、オープンソースコミュニティへの知見共有に貢献しました。

このスナップショット技術により、AIエージェントが誤った変更を加えた場合でも即座に以前の正常な状態へロールバックすることが技術的かつ確実に保証されており、安全性が大きく高まります。

今後は並列サンドボックスで複数の解法を同時試行する「並列サンプリング」機能の拡充も開発ロードマップに含まれており、エージェントの問題解決精度のさらなる向上が幅広い領域で期待されています。

CodexでSora Androidを28日で開発

わずか4人のチームが実現した高速リリース

4人のエンジニアCodexと並走し28日で本番リリース
GPT-5.1-Codexモデルを使用、誰でも利用可能な同バージョン
Play Storeで初日1位、24時間で動画生成100万件超
クラッシュフリー率99.9%の高品質を維持
コード全体の約**85%**をCodexが生成
iOSコードをKotlinへ意味保持で翻訳、クロスプラットフォーム開発を代替

Codexを最大活用するための実践的ワークフロー

AGENT.mdでアーキテクチャ方針を明文化しセッション間の一貫性を確保
まず理解・計画フェーズを経てから実装を依頼する手順が安定稼働の鍵
複数セッションを並列実行し、playback・search・エラー処理を同時進行
大規模タスクでは計画書をファイル保存してコンテキスト超過に対処
コードレビューにもCodexを活用し、マージ前のバグ検出に貢献
ボトルネックはコード執筆からアーキテクチャ判断・フィードバックへ移行

OpenAIエンジニアリングチームは、AIコーディングエージェントCodex」を活用し、SoraAndroidアプリをわずか28日で開発・グローバルリリースしました。投入したエンジニアはわずか4名であり、従来の開発常識を大きく覆す成果となっています。

使用したモデルはGPT-5.1-Codexの早期版であり、現在は誰でも利用できるバージョンと同一です。リリース初日にGoogle Play Storeで1位を獲得し、Androidユーザーは24時間で100万本以上の動画を生成しました。クラッシュフリー率は99.9%を維持しており、品質面でも従来型の開発プロセスと遜色ありません。

開発全体を通じてコードの約85%をCodexが生成しました。チームはアーキテクチャ設計・依存性注入・ナビゲーション構造などの基盤を自ら実装し、その上でCodexにパターンを学習させる方針を採りました。「動くものを速く作る」のではなく「我々のやり方で動くものを作る」という考え方が成功の核心です。

Codexを安定運用するうえで重要だったのは、AGENT.mdファイルへのスタイルガイドやパターンの明文化です。セッションをまたいで同じ指針を適用できるため、複数の並列タスクが同一のコーディング規約に従って進行しました。

実装前に理解・計画フェーズを設けるワークフローも効果的でした。Codexに関連ファイルを読ませてデータフローを説明させ、チームが認識を修正したうえで設計書を作成し、その計画に沿って実装を指示する手順により、長時間の無監視実行が可能になりました。

また、iOSの既存コードベースをKotlinへ翻訳する作業にもCodexを活用しました。アプリケーションロジックはSwiftでもKotlinでも本質的に同じであり、Codexが意味を保持したまま変換することで、クロスプラットフォームフレームワーク不要の開発スタイルが実現しました。

OpenAIの内部では、Codex自体の開発にもCodexが活用されており、「CodexのほぼすべてがCodexで構築されている」とプロダクトリードが明かしています。AI支援開発はツールの改善にも帰還的に適用される段階に達しています。

今回の事例は、AI支援開発がエンジニアの仕事を省力化するのではなく、アーキテクチャ設計・意思決定・品質管理といった高付加価値の業務に集中させる方向へシフトさせることを示しています。明日のソフトウェアエンジニアに求められるのは、深いシステム理解とAIとの長期的な協働能力です。

GitHubが提唱するAI自動最適化の新概念

Continuous Efficiencyとは何か

グリーンソフトウェアとContinuous AIを融合した新概念
コードベースの継続的・自動的な効率改善を目指す取り組み
GitHub NextとGitHub Sustainabilityチームが共同で開発
自然言語(Markdown)でワークフローを記述できる実験的フレームワーク
Claude CodeOpenAI Codexなど複数のAIエンジンに対応
現在はオープンソースの研究プロトタイプとして公開中

実証された主な活用事例

グリーンソフトウェアルールをコードベース全体に自動適用
RegExp最適化PRがnpm月5億DL超プロジェクトでマージ済み
Web持続可能性ガイドライン(WSG)の自動適用も実施
「Daily Perf Improver」によるFSharp.Control.AsyncSeqのパフォーマンス改善を確認
リポジトリ構造に応じてビルド・ベンチマーク手順を自動推論
マイクロベンチマーク駆動の最適化PRが複数マージ済み

GitHubは「Continuous Efficiency」と呼ぶ新しいエンジニアリング手法を提唱しました。これはグリーンソフトウェアの知見とContinuous AIを組み合わせ、コードの効率を継続的かつ自動的に改善するアプローチです。

同手法の基盤となるのが「Agentic Workflows」と呼ばれる実験的フレームワークです。エンジニアはYAMLやスクリプトの代わりにMarkdownで意図を記述し、GitHub Actions上でAIエージェントが自律的にタスクを実行します。

グリーンソフトウェアに関しては、月間5億回以上ダウンロードされるnpmパッケージにRegExpのホイスティング最適化を適用し、プルリクエストが承認・マージされました。小さな改善でも、スケールすることで大きな効果をもたらすことが実証されました。

Web持続可能性ガイドライン(WSG)のワークフローでは、GitHubおよびMicrosoftのWebプロパティに対してスクリプト遅延読み込みやネイティブブラウザ機能の活用など複数の改善機会を発見・修正しました。

パフォーマンスエンジニアリングへの応用では、「Daily Perf Improver」が三段階のワークフローを通じてリポジトリのビルド・ベンチマーク手順を自動推論し、FSharp.Control.AsyncSeqで実測可能な改善を実現しました。

AIエージェントは自然言語で記述されたルールを解釈し、コード全体に横断的に適用できます。従来の静的解析やリンターを超えた意味的な汎用性と、PRやコメントとして実装まで行うインテリジェントな修正が特徴です。

現時点では研究デモンストレーター段階であり、変更や誤りが生じる可能性もあります。GitHubはアーリーアダプターやデザインパートナーの参加を呼びかけており、今後さらなるルールセットやワークフローの公開を予定しています。

Codex、HF Skills連携でOSSモデル訓練可能に

統合の機能

トレーニングメトリクスの監視
チェックポイント評価と報告作成
GGUF量子化とHub公開

意義と展望

Claude Codeに続く統合
AGENTS.mdでリポジトリ設定
OSS開発の民主化に貢献

Hugging Faceが、OpenAIコーディングエージェントCodex」にHugging Face Skillsリポジトリを統合しました。先行してClaude Codeで実現された機能に続くもので、Codexオープンソースモデルの訓練から公開まで一連のMLタスクを実行できるようになります。

HF Skillsにより、Codexは言語モデルのファインチューニング、RL整合の適用、Trackioからのリアルタイムメトリクス監視、チェックポイント評価、実験レポート作成、GGUF量子化、Hugging Face Hubへの公開が可能です。AGENTS.mdファイルによるリポジトリレベルの設定に対応しています。

この統合は、コーディングエージェントとMLOpsプラットフォームの融合における重要な進展です。ソフトウェア開発とML エンジニアリングの壁を低くし、専門的なMLインフラの知識がないチームでもオープンソースモデル開発に取り組める環境の実現に貢献します。

OpenAI、自律防衛AI「Aardvark」公開 脆弱性を自動修正

AIの攻撃・防御能力が急伸

GPT-5.1のCTFスコアが76%に到達
8月の27%から3ヶ月で約3倍に急成長
次期モデルはゼロデイ攻撃可能な水準を想定

自律型セキュリティAIの投入

コード全体の脆弱性を発見し修正パッチを提案
すでにOSSで新規CVEを発見する実績
一部OSSリポジトリには無償提供を計画

安全なエコシステムの構築

専門家によるフロンティア・リスク評議会を設置
防御目的の利用者に信頼されたアクセスを提供

OpenAIは2025年12月10日、AIのサイバーセキュリティ能力向上に対応する新戦略を発表しました。同時に、脆弱性を自律的に発見・修正するAIエージェント「Aardvark」のベータ版を公開。最新モデル「GPT-5.1」のCTFスコアが76%に達するなど能力が急伸する中、防御側の体制強化を急ぎます。

最新の評価では、AIのハッキング能力が劇的に向上しています。2025年8月時点で27%だった「GPT-5」のCTF(旗取りゲーム)スコアは、11月の「GPT-5.1-Codex-Max」で76%へと約3倍に跳ね上がりました。同社は次期モデルが未知の脆弱性を突く「ゼロデイ攻撃」も可能な水準に達すると予測しています。

防御力強化の切り札として投入されたのが、自律型セキュリティ研究エージェント「Aardvark」です。コードベース全体を推論して脆弱性を特定し、修正パッチまで提案します。すでにオープンソースソフトウェア(OSS)において新規の脆弱性(CVE)を発見する実績を上げており、一部の非営利OSSには無償提供される計画です。

技術提供に加え、組織的な安全対策も強化します。新たに「フロンティア・リスク評議会」を設置し、外部のセキュリティ専門家と連携してリスク境界を定義します。また、防御目的の研究者や企業に対して、より強力なモデル機能へのアクセス権を付与する「信頼されたアクセスプログラム」の導入も予定しており、エコシステム全体の強化を図ります。

Vercel、OpenAI最新「GPT-5.1 Codex Max」対応

長時間開発に特化した進化

現実の開発タスクで学習
長時間の文脈維持が可能
従来より高速・高効率

導入と運用のメリット

統一APIで即座に利用
詳細なオブザーバビリティ
自動リトライで障害対策

Vercelは2025年12月5日、同社のAI GatewayにおいてOpenAIの最新モデル「GPT-5.1 Codex Max」が利用可能になったと発表しました。開発者は個別のプロバイダー契約を結ぶことなく、即座にこの強力なモデルをアプリケーションに統合できます。

特筆すべきは「Compaction」技術による最適化です。現実世界の開発タスクで学習されたこのモデルは、複数の文脈にまたがる長時間のコーディング作業でも、セッションを中断することなく推論と文脈を維持し続けることができます。

性能面でも進化を遂げており、従来のCodexモデルと比較して処理速度とトークン効率が向上しました。AI SDKでモデル名を指定するだけで利用でき、複雑なエンジニアリングタスクの自動化において威力を発揮します。

AI Gatewayを経由することで、開発者は単なるモデル利用にとどまらず、使用量やコストの追跡、自動リトライによる安定性向上といった恩恵を受けられます。企業レベルの信頼性が求められる開発現場にとって、強力な選択肢となるでしょう。

OpenAI新モデル、長時間自律開発で生産性7割増を実現

コンテキスト制限を打破する技術

コンパクション」で数百万トークンを処理
24時間以上の長時間タスクを自律的に完遂
推論トークンを30%削減しコストを低減

競合を凌駕する圧倒的性能

SWE-benchで77.9%を記録し首位
GoogleGemini 3 Proを上回る
社内エンジニアのPR出荷数が約70%増加
CLIやIDEなどの開発環境で即利用可能

OpenAIは2025年11月19日、エージェントコーディングモデル「GPT-5.1-Codex-Max」を発表しました。数百万トークンの文脈を維持し、長時間にわたる開発タスクを自律遂行可能です。エンジニア生産性を劇的に高める革新的なツールとして注目されます。

最大の特徴は、新技術「コンパクション」の搭載です。作業履歴を圧縮して記憶を継承することで、コンテキスト制限を克服しました。これにより、大規模なリファクタリングや24時間以上続くデバッグ作業など、従来は不可能だった複雑な長期タスクを完遂できます。

性能面では、Googleの最新モデル「Gemini 3 Pro」を主要指標で上回りました。SWE-bench Verifiedでは77.9%の正答率を記録し、業界最高水準を達成。さらに推論プロセスの最適化によりトークン使用量を30%削減し、コスト効率も向上させています。

ビジネスへの貢献も実証済みです。OpenAI社内ではエンジニアの95%が日常的に利用し、導入後のプルリクエスト出荷数が約70%増加しました。単なる支援ツールを超え、開発速度と品質を底上げする「自律的なパートナー」として機能しています。

本モデルは現在、ChatGPT PlusやEnterpriseプラン等のCodex環境で利用可能で、API提供も近日中に開始されます。デフォルトでサンドボックス環境にて動作し、ネットワークアクセスも制限されるなど、企業が安心して導入できるセキュリティ設計も徹底されています。

OpenAI、企業顧客100万人突破 史上最速で成長

驚異的な成長スピード

企業顧客数が100万人を突破
史上最速のビジネスプラットフォーム
Enterprise版シート数は前年比9倍
Work版シート数は700万席を突破

生産性を高める新機能群

GPT-5搭載のAgentKitで業務自動化
Codexコードレビュー時間を半減
マルチモーダル対応で多様な業務へ
企業の75%がプラスのROIを報告

OpenAIは、法人向けサービスの利用企業が世界で100万社を突破し、史上最速で成長するビジネスプラットフォームになったと発表しました。ChatGPT for Workのシート数も700万席を超え、2ヶ月で40%増と急拡大しています。消費者向けChatGPTの普及を背景に、業務自動化を支援する新ツール群も投入し、企業のAI活用を後押しします。

企業向けサービスの勢いは数字にも表れています。有料の法人顧客は100万人を超え、特に大企業向けのChatGPT Enterpriseのシート数は前年比で9倍に達しました。この成長は、AIが単なる実験的ツールから、事業運営に不可欠な基盤へと移行している現状を明確に示しています。

この急成長の背景には、消費者向けChatGPTの圧倒的な普及があります。週に8億人が利用するサービスに慣れ親しんでいるため、従業員が抵抗なく業務でAIを使い始められます。これにより、企業は導入時の摩擦を減らし投資対効果(ROI)を早期に実現できるのです。

OpenAIは企業の本格導入を支援するため、新ツール群も発表しました。社内データと連携する「AgentKit」や、コード生成を支援する「Codex」の利用が急増。画像音声も扱えるマルチモーダル機能も強化し、より幅広い業務での活用を可能にしています。

実際に多くの企業が成果を上げています。ウォートン校の調査では、導入企業の75%がプラスのROIを報告。求人サイトIndeedは応募数を20%増加させ、シスコはコードレビュー時間を半減させるなど、具体的なビジネス価値を生み出しています。

自社ツールへの組み込みも進んでいます。CanvaやShopifyなどがChatGPTと連携し、新たな顧客体験を創出しています。OpenAIは、単なるツール提供者にとどまらず、「仕事のOS」を再定義するプラットフォームとなることを目指しており、その動きは今後さらに加速しそうです。

Sora、無料枠超過分の有料販売を開始

有料化の背景と価格

無料モデルは「持続不可能」と判断
パワーユーザーの強い需要に対応
10回の追加生成で4ドル
App Store経由で購入可能

今後の収益化計画

将来的な無料生成枠の削減を示唆
クリエイター向け収益化策を検討
権利者への収益分配も視野に

動画生成AI「Sora」を開発するOpenAIは、無料の動画生成枠を使い切ったユーザー向けに、追加クレジットの有料販売を開始しました。Soraチームを率いるBill Peebles氏は、現在の無料提供モデルの経済性は「完全に持続不可能」であると指摘。パワーユーザーの旺盛な需要に応えつつ、事業の持続可能性を確保する狙いです。

追加クレジットは、AppleApp Storeを通じて購入できます。価格は10回の追加生成あたり4ドルに設定されています。ただし、生成する動画の長さや解像度によって消費クレジット数は変動します。購入したクレジットの有効期限は12ヶ月で、OpenAIコーディングプラットフォーム「Codex」でも利用可能です。

有料化に踏み切った背景には、膨大な計算コストがあります。Peebles氏は「パワーユーザーは現在の無料生成枠に満足していないことは明らかだ」と述べ、有料で必要なだけ生成できる選択肢を提供する必要性を強調しました。これにより、ユーザーは制限を気にすることなく創作活動に打ち込めるようになります。

さらに同氏は、将来的には無料の生成枠を削減する必要があるとも警告しています。「成長に対応するため、いずれ無料生成数を引き下げる必要がある」と述べ、変更がある場合は事前に透明性を持って告知する方針です。現在の寛大な無料枠がいつまで続くか、動向が注目されます。

今回の動きは、Soraを中心としたAIクリエイターエコノミー構築に向けた、より広範な収益化戦略の一環です。OpenAIは近く、クリエイター向けの収益化プログラムを試験的に開始する予定であり、人気キャラクターなどの権利者が利用料を設定できる仕組みも構想しています。

独HYGH、ChatGPTで開発爆速化、週2MVP達成

開発プロセスの革新

MVP開発が月単位から週単位
会議録からPRDを自動生成
Codex活用で即時プロトタイピング
インフラ移行計画の工数を削減

全社的な生産性向上

従業員1人あたり週5.5時間を節約
広告モックアップ作成の高速化
毎週のベストプラクティス共有会
売上増、納期短縮を実現

ドイツのデジタルメディア企業HYGHが、OpenAIChatGPT Businessを導入し、開発速度とキャンペーン提供のあり方を根本から変革しています。同社はAI活用により、ソフトウェア開発のリードタイムを数ヶ月から数日に短縮。従業員一人あたり週平均5.5時間の労働時間を削減し、週に2つのMVP(実用最小限の製品)をリリースできる体制を構築しました。この取り組みは、生産性と収益性の向上に直結しています。

特に大きな変革を遂げたのが、ソフトウェア開発の現場です。かつては1〜2ヶ月を要したMVP開発は、今や週に2本リリースする驚異的なペースを達成しました。会議の録音から製品要求仕様書(PRD)をAIが自動生成し、開発者Codexを用いて即座にプロトタイプを構築します。これにより、アイデアから製品化までのサイクルが劇的に短縮されました。

AIの恩恵はクリエイティブ業務にも及びます。広告代理店部門では、これまで時間のかかっていた広告キャンペーンのモックアップ作成が大幅に高速化。ChatGPT広告コピーやビジュアルの草案を生成することで、顧客への提案速度と選択肢が向上し、チームはより創造的な業務に集中できるようになりました。

同社は全社的なAI活用を推進しています。ChatGPT Businessへの移行により、共有ワークスペースや管理機能、GDPRに準拠したデータ保護が確保されました。共同創業者のアントニウス・リンク氏は「売上は上がり、納期は縮まり、生産性は爆発した」と成果を語ります。この成功は、AIがもたらすビジネスインパクトの大きさを物語っています。

AI活用の文化を根付かせるため、HYGHは毎週「ワークフロー水曜日」と名付けた社内勉強会を開催。従業員が自作の自動化ツールやベストプラクティスを共有し、互いに学び合うことで、組織全体のAIリテラシーが向上しました。特に若手従業員がネイティブにAIを使いこなす姿が、他の社員にも良い刺激を与えているようです。

リンク氏は「AIを使わない企業は取り残されるだろう」と断言します。AIは単なる効率化ツールではなく、アイデアをぶつけ合える『思考のパートナー』であると位置づけています。HYGHの事例は、AIを組織の隅々にまで浸透させることが、企業の競争力をいかに高めるかを示す好例と言えるでしょう。

OpenAIの真の主役、Codex正式版が開発を革新

Codexの進化と能力

7時間超の長時間タスクも遂行
研究版から製品版へ完全移行
専用SDKでシステム統合が容易

驚異的な生産性向上

OpenAI社内で生産性70%向上
技術スタッフの92%が毎日利用
コードレビュー時間を半減
自社製品の開発もCodexで加速

OpenAIが年次開発者会議「DevDay 2025」で、AIコーディング支援ツール「Codex」の正式版リリースを発表しました。ChatGPTアプリストアなど華やかな発表の影に隠れがちですが、これがソフトウェア開発の常識を覆し、企業の生産性を飛躍させる最も重要な一手と見られています。Codexは単なるツールではなく、開発の未来を創るエンジンとなるのでしょうか。

今回の発表の核となるのが、最新モデル「GPT-5-Codex」です。これは単なるコード補完ツールではありません。まるで人間のチームメイトのように振る舞い、複雑なリファクタリング作業を7時間以上も自律的に実行できます。単純なタスクは迅速に、複雑なタスクにはじっくり取り組む「適応的思考」を備え、開発者を強力にサポートします。

その効果はOpenAI社内で実証済みです。技術スタッフの92%が日常的にCodexを利用し、コード貢献度を示すプルリクエスト数は週に70%も増加しました。自社の新製品やクリエイティブツールもCodexを用いて短期間で開発されており、この生産性向上のサイクルこそが、同社の急速なイノベーションの源泉となっているのです。

特にエンタープライズ向けに強化されたのが、コードレビュー機能です。Codexはプログラムの依存関係を深く理解し、人間のレビュアーが見逃しがちな質の高いバグを毎日数百件も発見します。これにより、開発者は品質への自信を深め、手戻りを減らすことができます。これは「より速く、より確実に出荷する」という企業の目標達成に直結します。

Codexの正式版リリースは、OpenAIのエンタープライズ市場攻略戦略の要です。サム・アルトマンCEOも「優れた製品で企業市場を勝ち取ることに大きく注力する」と明言しています。すでにCiscoのような大企業が導入し、コードレビュー時間を半減させるなどの成果を上げており、その実用性は証明されつつあります。

消費者向けのAIがまだ模索を続ける一方で、Codexは今日、企業に具体的なROI(投資対効果)をもたらす「実績あるAIエージェント」としての地位を確立しました。新たに提供されるSDKにより、各社の独自ワークフローへの組み込みも可能になります。Codexは、次世代のソフトウェア開発を静かに、しかし強力に牽引する存在となるでしょう。

OpenAI「Codex」一般提供開始、Slack連携とSDKで開発を加速

開発を加速する新機能

Slack連携によるタスクの直接委任
Codex SDKで独自のワークフローへ統合
環境制御・監視を行う管理者向けツール追加
CI/CD向けにGitHub Actionsも提供開始

実証された生産性向上

日常利用が8月以降10倍以上に急増
OpenAI社内PRマージ数が週70%増加
Ciscoは複雑なレビュー時間を最大50%削減
Instacartは技術的負債の自動クリーンアップを実現

OpenAIは、コード生成とレビューを支援するコーディングエージェントCodex」の一般提供(GA)開始を発表しました。これにより、新たなSlack連携機能やCodex SDKが提供され、開発チームは既存のワークフロー内でAIをシームレスに活用できるようになります。世界中のスタートアップや大企業で採用が進んでおり、開発効率の劇的な向上が期待されています。

Codexは研究プレビュー開始以来、飛躍的に進化し、日常利用は8月上旬から10倍以上に急増しました。OpenAI社内ではほぼ全てのエンジニアが利用しており、プルリクエスト(PR)のマージ数が週70%増加しています。さらに、Codexが自動でPRをレビューし、本番環境に到達する前に重大な問題点を検出するなど、コード品質維持にも貢献しています。

今回のGAにおける目玉は、エンジニアリングワークフローに直接組み込むための「Codex SDK」と「Slack連携」です。SDKを利用すれば、Codex CLIの核となる強力なエージェントを独自のツールやアプリに数行のコードで統合できます。また、Slackから直接Codexにタスクを委任できるため、チームコラボレーションを効率化します。

大規模導入を進める企業向けには、新しい管理者ツールが追加されました。これにより、ChatGPTワークスペース管理者は、クラウド環境の制御、ローカル利用における安全なデフォルト設定の適用が可能になります。加えて、利用状況やコードレビューの品質を追跡するための分析ダッシュボードが提供され、ガバナンスと監視が強化されます。

導入事例として、Ciscoでは複雑なプルリクエストのレビュー時間を最大50%削減し、エンジニアはより創造的な業務に集中できています。また、InstacartではCodex SDKを統合し、ワンクリックでのエンドツーエンドのタスク完了や、デッドコードなどの技術的負債を自動で解消し、コードベース全体のレイテンシ改善に役立っています。

Slack連携およびSDKは、ChatGPT Plus、Pro、Business、Edu、Enterpriseの各プランで利用可能です。管理者向け機能は、企業での利用を想定しBusiness、Edu、Enterpriseプランに限定されています。OpenAIは、Codexを通じて開発者生産性を根本から変革することを目指しています。

GPT-5-Codexが開発生産性を劇的に向上させる理由

エージェント能力の進化

複雑なタスクで最長7時間以上の独立稼働
タスクに応じた思考時間の動的な調整
迅速な対話と長期的な独立実行の両立
実世界のコーディング作業に特化しRL学習を適用

ワークフローへの密着

CLI、IDE拡張機能、GitHubへシームレスに連携
ローカル環境とクラウド間のコンテキスト維持
画像やスクリーンショットを入力可能

品質と安全性の向上

コードレビューの精度が大幅に向上
重大なバグを早期に発見しレビュー負荷を軽減
サンドボックス環境による強固なセキュリティ

OpenAIは、エージェントコーディングに特化した新モデル「GPT-5-Codex」を発表し、開発環境Codexを大幅にアップグレードしました。これはGPT-5を実世界のソフトウェアエンジニアリング作業に最適化させたバージョンです。開発者はCLI、IDE、GitHubChatGPTアプリを通じて、より速く、信頼性の高いAIアシスタントを活用できるようになります。

最大の進化は、タスクの複雑性に応じて思考時間を動的に調整する能力です。GPT-5-Codexは、大規模なリファクタリングデバッグなどの複雑なタスクにおいて、最長7時間以上にわたり独立して作業を継続できることが確認されています。これにより、長期的なプロジェクトの構築と迅速なインタラクティブセッションの両方に対応します。

モデルは、既存のコードベース全体を理解し、依存関係を考慮しながら動作検証やテスト実行が可能です。特にコードレビュー機能が強化されており、コミットに対するレビューコメントの正確性と重要性が向上。重大な欠陥を早期に特定し、人間のレビュー工数を大幅に削減します。

開発ワークフローへの統合も一層強化されました。刷新されたCodex CLIとIDE拡張機能(VS Codeなどに対応)により、ローカル環境とクラウド環境間でシームレスに作業を移行できます。コンテキストが途切れないため、作業効率が劇的に向上します。

さらに、Codex画像やスクリーンショットを入力として受け付けるようになりました。これにより、フロントエンドのデザイン仕様やUIバグなどを視覚的にAIへ共有し、フロントエンドタスクの解決を効率化します。また、GitHub連携によりPRの自動レビューや編集指示も可能です。

安全性確保のため、Codexはデフォルトでサンドボックス環境で実行され、ネットワークアクセスは無効です。プロンプトインジェクションリスクを軽減するとともに、開発者セキュリティ設定をカスタマイズし、リスク許容度に応じて運用することが可能です。