Codexに関する最新ニュース（60件） | 【AI Times】生成AIやLLMの最新情報・ニュース

OpenAI、Codexを従量課金制で提供開始

2026年04月02日 OpenAI Notion ChatGPT Codex Windows MacOS ワークフローエンジニアリスクコーディング

料金体系の刷新

従量課金のCodex専用席を新設

トークン消費ベースで課金

レートリミットなしで利用可能

ChatGPT Business年額を25→20ドルに値下げ

導入支援と実績

新規メンバーに最大500ドルのクレジット付与

週間アクティブ開発者が200万人突破

企業向けCodex利用者が1月比6倍に成長

Notion・Rampなど大手が採用済み

詳細を見る

OpenAIは2026年4月2日、AIコーディングツール「Codex」をChatGPT BusinessおよびEnterprise向けに従量課金制で提供開始すると発表しました。固定のシート料金なしで利用でき、チーム単位での試験導入が容易になります。

新たに導入されたCodex専用シートは、レートリミットが撤廃され、トークン消費量に基づいて課金される仕組みです。これにより、予算やワークフローごとのコスト可視化が格段に向上し、企業の支出管理が容易になります。

従来のChatGPT Businessシートも引き続き利用可能ですが、年間料金が1シートあたり25ドルから20ドルに引き下げられました。また、macOSとWindows向けのCodexアプリやプラグイン、自動化機能が新たに追加されています。

導入促進策として、対象のChatGPT Businessワークスペースには、新規Codex専用メンバー1人あたり100ドル、チームあたり最大500ドルのクレジットが期間限定で付与されます。小規模チームでも低リスクで導入を開始できます。

現在、ChatGPTの有料ビジネスユーザーは900万人を超え、Codexの週間利用者は200万人以上に達しています。NotionやRamp、Braintrustなどの企業がすでにCodexを活用しており、エンジニアリングワークフローの高速化と再現性の向上を実現しています。

出典：OpenAI公式

Cursorが新エージェント型開発環境を発表、Claude CodeやCodexに対抗

2026年04月02日 OpenAI Anthropic Claude Claude Code Codex ワークフローエンジニアクラウドコーディング中国資金調達評価額エージェントオープンソースモデル Cursor

Cursor 3の全容

エージェント型コーディングUI刷新

自然言語でタスク指示が可能

複数エージェントの同時実行に対応

クラウド生成コードをローカルで確認

AI大手との競争激化

Claude Code・Codexに開発者流出

月200ドルで1000ドル超の利用価値提供

Cursor は従量課金へ転換済み

独自モデルComposer 2を投入

詳細を見る

Cursorは2026年4月、AIコーディングエージェントを中心とした新製品「Cursor 3」を発表しました。コード名Glassで開発された本製品は、AnthropicのClaude CodeやOpenAIのCodexに対抗するエージェント型開発体験を提供します。

Cursor 3は既存のデスクトップアプリ内に新しいインターフェースとして統合されます。中央のテキストボックスに自然言語でタスクを入力すると、AIエージェントがコードを自動生成します。サイドバーで複数のエージェントを同時に管理できる設計です。

競合製品との最大の差別化は、IDEとエージェント型製品の統合にあります。クラウド上でエージェントが生成したコードをローカル環境で即座に確認・編集できるため、開発者は従来のワークフローを維持しつつエージェントを活用できます。

一方で経営面の課題は深刻です。複数の開発者がClaude CodeやCodexへ移行したと証言しており、主な理由は月額200ドルの定額プランで1000ドル超相当の利用が可能な補助金付き価格設定です。Cursorは2025年6月に従量課金へ移行し、一部の開発者の不満を招きました。

Cursorは対抗策として独自AIモデル「Composer 2」の提供を開始しました。中国のMoonshot AIのオープンソースモデルをベースに追加学習を施したもので、性能・価格・速度の面で競争力があると主張しています。現在約500億ドルの評価額で資金調達を進めており、AI大手との消耗戦に備えています。

出典：WIRED

OpenAI、1220億ドル調達　評価額8520億ドルでIPOへ布石

史上最大の資金調達

評価額8520億ドルで完了

SoftBank・a16zら共同主導

個人投資家から30億ドル調達

急成長する事業規模

月間売上20億ドルに到達

週間ユーザー9億人超え

法人比率が売上の40%に拡大

インフラと今後の戦略

AIスーパーアプリ構想を発表

複数チップ基盤に分散投資

詳細を見る

OpenAIは2026年3月、1220億ドル（約18兆円）の資金調達を完了したと発表しました。評価額は8520億ドルに達し、同社史上最大の調達ラウンドとなります。年内に予定されるIPOに向けた布石とみられています。

ラウンドはSoftBankとAndreessen Horowitzが共同主導し、D.E. Shaw Ventures、MGX、TPGなどが参加しました。Amazon、NVIDIA、Microsoftも戦略的パートナーとして出資しています。初めて銀行チャネルを通じた個人投資家にも門戸を開き、30億ドル以上を集めました。

事業面では月間売上が20億ドルに達し、AlphabetやMetaの同時期と比べ4倍の成長速度だと同社は主張しています。ChatGPTの週間アクティブユーザーは9億人を超え、有料会員は5000万人以上です。検索利用は1年で約3倍に伸びています。

法人向け事業は売上全体の40%を占めるまでに成長し、2026年末までにコンシューマーと同等になる見通しです。最新モデルGPT-5.4がエージェント型ワークフローの需要を牽引し、APIは毎分150億トークン以上を処理しています。広告事業も開始からわずか6週間でARR1億ドルを突破しました。

同社はAIスーパーアプリ構想を掲げ、ChatGPT、Codex、ブラウジング機能などを単一のエージェント体験に統合する方針です。インフラ面ではNVIDIA、AMD、AWS Trainiumなど複数のチップ基盤に拡大し、回転信用枠も約47億ドルに増額しました。調達資金はAIチップやデータセンターの拡充に充てられます。

出典：TechCrunch | OpenAI公式

OllamaがApple MLX対応、Macでのローカル推論を大幅高速化

2026年03月31日 NVIDIA Apple GitHub ChatGPT Claude Claude Code Codex Qwen OpenClaw Llama エンジニア推論機械学習クラウドクラウドサービス中国 Ollama

MLX対応の概要

Apple MLXフレームワーク対応開始

Ollama 0.19プレビューで提供

Qwen3.5-35Bモデルのみ対応

Apple Silicon搭載Mac・RAM32GB以上が必要

性能改善と圧縮技術

キャッシュ性能の向上を実現

Nvidia NVFP4圧縮形式に対応

メモリ使用効率の大幅改善

ローカルLLM需要の高まり

OpenClawがGitHubで30万スター突破

クラウドAPIの料金・制限への不満が背景

詳細を見る

ローカルLLM実行ツールOllamaは、Appleが開発したオープンソースの機械学習フレームワークMLXへの対応を発表しました。これにより、Apple Silicon搭載Macでの大規模言語モデルの推論性能が大幅に向上します。

今回の対応はOllama 0.19のプレビュー版として提供されており、現時点で対応モデルはAlibabaのQwen3.5-35Bパラメータ版のみです。利用にはApple Silicon搭載Macに加え、最低32GBのRAMが必要とされています。

MLX対応に加え、キャッシュ性能の改善やNvidiaのNVFP4モデル圧縮形式への対応も同時に発表されました。NVFP4はモデルのメモリ使用量を大幅に削減する技術で、より効率的な推論環境の構築が可能になります。

ローカルモデル実行への関心は急速に高まっています。OpenClawがGitHubで30万スター以上を獲得し、中国を中心に世界的な注目を集めています。研究者やホビイスト以外の層にもローカルLLMの活用が広がりつつあります。

背景には、Claude CodeやChatGPT Codexなどのクラウドサービスにおけるレート制限や高額なサブスクリプション費用への開発者の不満があります。OllamaはVisual Studio Codeとの統合も拡充しており、ローカル開発環境の充実を進めています。

出典：Ars Technica

Midjourney技術者がWeb設計を革新するOSSライブラリPretext公開

2026年03月30日 OpenAI Anthropic GitHub Claude Codex エンジニアコーディングバイブコーディング MIT ベンチマーク Canva Pixel Midjourney

Pretextの技術革新

DOM迂回でテキスト計測を高速化

15KBのゼロ依存TypeScriptライブラリ

300〜600倍の描画性能向上を実現

モバイルでも120fps動作可能

開発手法と反響

ClaudeやCodexでAIバイブコーディング

48時間でGitHub星1.4万獲得

X上で1900万回閲覧を記録

企業への示唆

生成AIのUI構築に即時導入推奨

アクセシビリティ管理は自社責任に

詳細を見る

MidjourneyのエンジニアCheng Lou氏が2026年3月27日、Webテキストレイアウトを根本から変えるオSSライブラリPretextをMITライセンスで公開しました。15KBのゼロ依存TypeScriptライブラリで、ブラウザのDOM操作を迂回し、テキストの計測と配置を高速に行います。

従来のWeb開発では、テキストの高さや位置を取得するたびにブラウザがレイアウトリフローと呼ばれる再計算を実行し、深刻なパフォーマンス低下を招いていました。PretextはブラウザのCanvasフォントメトリクスと純粋な算術演算を組み合わせ、DOMに一切触れずに文字・単語・行の配置を予測します。

ベンチマークによると、Pretextのlayout関数は500種類のテキストを約0.09ミリ秒で処理でき、従来のDOM読み取りと比較して300〜600倍の性能向上を達成しています。この速度により、ウィンドウリサイズや物理演算中でもリアルタイムにテキスト再配置が可能になりました。

開発にはAnthropicのClaudeやOpenAIのCodexなどAIコーディングツールが活用されました。多言語データセットや小説全文を用いてブラウザ実装とのピクセル単位の整合性を反復検証し、WebAssemblyやフォント解析ライブラリなしで高精度を実現しています。

公開から48時間でGitHubスター1万4000超、X上で1900万回閲覧を記録しました。コミュニティでは雑誌レイアウト、物理演算テキスト、ディスレクシア向けフォント調整など多彩なデモが登場し、Web表現の可能性が大きく広がっています。

企業にとっては、生成AI UIや高頻度データダッシュボードを構築する場合に即時導入が推奨されます。ただしレイアウトをユーザーランドに移すことで、ブラウザが担っていたアクセシビリティや標準準拠の責任を自社で管理する必要がある点には留意が必要です。

出典：VentureBeat

OpenAI、Codexにプラグイン機能を追加しコーディング以外に拡張

プラグインの概要

スキル・連携・MCPの統合パッケージ

GitHub・Gmail・Vercel等とワンクリック連携

組織横断で設定を再現可能に

競合との関係

AnthropicのClaude Codeに対抗

GoogleのGemini CLIも同等機能提供済み

既存機能のパッケージ化が本質

検索可能なプラグインライブラリを新設

詳細を見る

OpenAIは、エージェント型コーディングアプリCodexにプラグイン機能を追加しました。これにより、Codexはコーディング領域を超えた幅広いタスクに対応できるようになります。競合するAnthropicやGoogleの類似機能に対抗する動きです。

プラグインは、スキル（ワークフローを記述するプロンプト）、アプリ連携、MCP（Model Context Protocol）サーバーを一つにまとめたバンドルです。特定のタスクに合わせてCodexを構成し、組織内の複数ユーザー間で再現可能にする仕組みとなっています。

技術的には、これまでもカスタム指示やMCPサーバーを個別に設定すれば同等の機能を実現できました。しかし今回のプラグインでは、それらをワンクリックでインストールできるようパッケージ化した点が最大の特徴です。

Codexアプリ内には新たにプラグインセクションが設けられ、検索可能なライブラリからプラグインを選択できます。GitHub、Gmail、Box、Cloudflare、Vercelなど主要サービスとの緊密な統合が用意されています。

この動きは、AIコーディングツール市場におけるプラットフォーム競争の激化を示しています。各社がエコシステムの拡充を通じて開発者の囲い込みを図る中、OpenAIもCodexの汎用性を高めることで差別化を狙っています。

出典：Ars Technica

LangChain、エージェント間で業務知識を共有する「スキル」機能を公開

2026年03月25日 LangChain Claude Claude Code Codex 推論コーディングエージェント Cursor LangSmith

スキルの概要と特徴

業務知識をエージェントに付与

作成方法と拡張性

AIとの対話から自動生成可能

テンプレートや手動作成にも対応

CLIでコード開発環境に連携

バージョン管理と権限拡張を予定

詳細を見る

LangChainは2026年3月、AIエージェント開発基盤LangSmith Fleetにおいて、エージェント間で業務知識を共有できる「スキル」機能を正式に公開しました。スキルとは、特定タスクに必要な手順やドメイン知識をまとめた指示セットです。

現在のAIエージェントは推論能力に優れる一方、業務固有の知識がなければ実用性に限界があります。たとえばサポートエージェントがSLAの優先度を知らなければ、すべての問い合わせを同一に扱ってしまいます。スキルはこの課題を解決する仕組みです。

スキルの作成方法は多彩で、AIとのチャットから自動生成する方法、エージェント作成時の自動提案、テンプレートからの選択、手動記述の4通りが用意されています。作成したスキルはワークスペースに共有でき、チーム全員のエージェントが即座に利用可能になります。

特筆すべきはポータビリティの高さです。LangSmith CLIを使えば、Fleet上のスキルをローカル開発環境にダウンロードし、Claude CodeやCursor、Codexなど任意のコーディングエージェントにそのまま連携できます。知識の再記述やコピーは不要です。

今後の機能拡張として、スキルのバージョン固定とロールバック、および複数オーナーによる共同編集権限の追加が予定されています。エージェントが高度な業務を担うほど、指示の質が成果を左右するとLangChainは強調しています。

出典：blog.langchain.com

ディズニーがOpenAIへの10億ドル投資を撤回、Sora終了で

2026年03月25日 OpenAI ChatGPT Sora Codex 動画生成シミュレーションレイオフコンテンツ動画ブランドロボティクス投資提携 IPO ByteDance

提携白紙の経緯

OpenAIがSora終了を発表

ディズニーは事前通告なく寝耳に水

10億ドル投資計画を撤回

別形態の提携は引き続き協議中

Soraの急成長と急失速

11月に330万DLでピーク到達

2月には110万DLへ急落

累計収益はわずか214万ドル

OpenAIはIPO準備で事業集約へ

ディズニーの戦略的誤算

Epic Gamesとのメタバース構想も停滞

SeeDanceなど競合アプリが台頭

新CEO就任直後に二重の危機直面

詳細を見る

ディズニーは2026年3月、OpenAIへの10億ドル出資計画を撤回しました。OpenAIが動画生成アプリSoraの終了を発表したことが直接の原因で、ディズニー側は事前に知らされておらず、計画の白紙撤回に踏み切りました。ただし両社は別の形での提携や投資の可能性について協議を続けているとされています。

2025年12月に発表されたディズニーとOpenAIの提携は、ハリウッドに大きな衝撃を与えました。Disney+上でSoraによるAI生成コンテンツを配信する計画で、前CEOボブ・アイガー氏は短尺動画の目玉にする構想を語っていました。しかしSoraのダウンロード数は2025年11月の330万件をピークに急減し、累計収益もわずか214万ドルにとどまりました。

OpenAIはIPO準備の一環として事業の選択と集中を進めています。CFOのサラ・フライアー氏は「上場企業としての準備が必要」と述べ、Soraの研究チームはロボティクス向けの世界シミュレーション研究に再配置されます。ChatGPT・Codex・Atlasを統合した「スーパーアプリ」構想に経営資源を集中させる方針です。

ディズニーにとってSora 提携の頓挫は、テック投資戦略の見直しを迫る事態です。Epic Gamesとの15億ドル規模のメタバース構想も、Epic側の1000人規模のレイオフと5億ドルのコスト削減により先行きが不透明になっています。Fortniteのプレイヤー数減少も重なり、ディズニーブランドのメタバース実現は遠のいています。

出典：Ars Technica | The Verge | WIRED

Apple、WWDC26でAI進化を予告し6月開催発表

2026年03月23日 Google OpenAI Anthropic Apple Gemini Claude iOS Codex Siri MacOS デザインエンジニアコーディング中国エージェント YouTube

WWDC26の概要

6月8〜12日にオンライン開催

iOS・macOS等の全プラットフォーム更新

AI進化を主要テーマに明示

開発者向け新ツールも発表予定

Siri刷新への期待

Google Gemini連携契約を締結済み

新型Siriの高度なAI機能搭載

オンスクリーン認識と個人文脈理解強化

開発者向けAI基盤

Foundation Modelフレームワーク進化

XcodeにClaude・Codex統合済み

詳細を見る

Appleは2026年3月、年次開発者会議WWDC26を6月8日から12日までオンラインおよびクパチーノ本社で開催すると発表しました。今年のテーマとして「AI進化」を明確に掲げています。

昨年のWWDCではLiquid Glassデザインが中心でAIへの言及は限定的でしたが、今年は大きく方針を転換します。Appleは年初にGoogleと契約を結び、GeminiをAI機能の基盤として採用することを決定しています。

最大の注目点はSiriの全面刷新です。高度なAI機能を搭載した新型Siriは、個人的な文脈の理解や画面上の情報認識といった機能が強化される見込みです。度重なる延期を経て、ついにお披露目となる可能性があります。

開発者向けには、昨年発表されたFoundation Modelフレームワークの進化が期待されます。オフラインで動作するAIモデルの拡充に加え、XcodeにはすでにAnthropicのClaude AgentやOpenAIのCodexといったエージェント型コーディングツールが統合されています。

カンファレンスはApple Developerアプリ、公式サイト、YouTubeチャンネルでライブ配信されます。中国向けにはBilibiliチャンネルでも視聴可能で、グローバルな開発者コミュニティに向けた発信が強化されています。

出典：TechCrunch

OpenAI、デスクトップ統合「スーパーアプリ」を開発中

2026年03月20日 OpenAI Anthropic ChatGPT Claude Sora Claude Code Codex 動画生成 AIブラウザハードウェア動画コーディング投資買収

統合アプリの全容

ChatGPT・Codex・Atlasを一本化

製品の分散化が品質低下の要因

モバイル版ChatGPTは変更なし

競争環境と戦略転換

Anthropicとの競争が激化

Claude Codeの人気急上昇が背景

Codexへの集中投資を明言

「副次的探索」の縮小を指示

詳細を見る

OpenAIは、ChatGPTアプリ、AIコーディングツール「Codex」、AIブラウザ「Atlas」を統合したデスクトップ向け「スーパーアプリ」の開発を進めていることが、米ウォール・ストリート・ジャーナルの報道で明らかになりました。アプリケーション部門CEOのフィジ・シモ氏が社内メモで方針を示しています。

シモ氏はメモの中で、製品の分散化が「開発速度を低下させ、求める品質基準の達成を困難にしている」と指摘しました。同社は昨年、動画生成AI「Sora」の発表やジョニー・アイブ氏のAIハードウェア企業買収など派手な展開を見せていましたが、戦略の再集中が急務となっています。

背景にはAnthropicとの競争激化があります。特にClaude Codeの急速な普及がOpenAIにとって脅威となっており、経営陣は優先度の低い取り組みの見直しを進めています。シモ氏は従業員に対し「副次的な探索に気を取られないように」と呼びかけました。

シモ氏はX（旧Twitter）への投稿で「企業には探索のフェーズと再集中のフェーズがあり、どちらも重要だ」と述べた上で、「Codexのように新しい賭けが成果を出し始めた今こそ、集中投資すべき時だ」と強調しました。

なお、モバイル版のChatGPTについては今回の統合の対象外とされています。OpenAIの広報担当者はコメントを控えており、統合アプリの具体的なリリース時期は明らかになっていません。今後のデスクトップ体験の大幅な刷新が見込まれます。

出典：The Verge

GitHub、AI時代のOSSメンター選定に「3C」指針を提唱

2026年03月19日 OpenAI GitHub Gemini Codex ポリシー投資エージェント

メンター危機の背景

AI生成PRが急増し選別困難に

月間PR数が4500万件超で前年比23%増

tldrawらがPR受付を停止する事態

3Cフレームワーク

Comprehension：問題理解の確認

Context：AI利用開示でレビュー最適化

Continuity：継続参加者に投資集中

実践と効果

ガイドライン未遵守のPRは即クローズ

公平性向上と属人的判断の排除

詳細を見る

GitHubのAbigail Cabunoc Mayes氏は、AI時代におけるオープンソースのメンターシップのあり方を再考する指針「3Cフレームワーク」を提唱しました。AIツールの普及でコントリビューション量が急増し、メンテナーの負担が深刻化しています。

2025年のOctoverseレポートによると、GitHubでは月間約4500万件のプルリクエストがマージされ、前年比23%増を記録しました。一方でAI生成コードは一見高品質に見えるため、従来の貢献者評価シグナルが機能しなくなっています。

3Cの第一はComprehension（理解力）です。OpenAI CodexやGemini CLIはPR提出前にイシュー承認を必須化しました。コードスプリントなど対面での理解度確認も有効とされ、貢献者が自分の理解度を超えたコードをコミットしないよう求めています。

第二のContext（文脈提供）では、AI利用の開示が重要です。ROOSTやFedoraなど複数プロジェクトがAI開示ポリシーを導入済みです。さらにAGENTS.mdの活用により、AIエージェントにプロジェクト規範を遵守させる動きも広がっています。

第三のContinuity（継続性）は、メンターシップ投資の最終判断基準です。一度きりの貢献ではなく繰り返し参加する人材にのみ深い指導を行うことで、メンターの乗数効果を最大化できます。明確な基準は属人的バイアスも排除し、より公平なコミュニティ形成につながります。

出典：GitHub公式

OpenAIがPython開発ツール企業Astralを買収へ

2026年03月19日 OpenAI Anthropic Claude Claude Code Codex ワークフローエンジニア創業者セキュリティコーディング開発ツール買収

買収の狙いと背景

Codexチームに統合予定

uv・Ruff・tyの3ツールを獲得

AIコーディング支援市場の競争激化

Codex週間200万人超の利用者

OSSの継続と展望

買収後もオープンソース継続

Python開発ワークフロー全体を支援

AnthropicのBun買収に対抗

規制当局の承認が条件

詳細を見る

OpenAIは2026年3月、人気のオープンソースPython開発ツールを手がけるAstralの買収合意を発表しました。Astralはパッケージマネージャーuv、リンターRuff、型チェッカーtyを開発しており、買収後はCodexチームに統合される予定です。

Astralの主力ツールuvは月間1億2600万回以上ダウンロードされ、Ruffは1億7900万回に達するなど、Python開発者の間で広く普及しています。これらのツールは依存関係管理、コード品質チェック、型安全性の確保といった開発の基盤を担っています。

OpenAIは本買収について「Codexの開発を加速し、ソフトウェア開発ライフサイクル全体でAIができることを拡大する」と説明しています。Codexは年初から利用者が3倍、利用量が5倍に成長しており、週間アクティブユーザーは200万人を超えています。

この動きはAIコーディング支援市場での競争を反映しています。2025年11月にはAnthropicがJavaScriptランタイムBunを買収しClaude Codeに統合しており、OpenAIも今月初めにLLMセキュリティツールのPromptfooを買収するなど、開発者ツールの囲い込みが加速しています。

Astral創業者のCharlie Marsh氏は、買収後もオープンソースツールの開発を継続しコミュニティとともに構築していくと表明しました。OpenAIも同様にOSSプロジェクトの支援を続けながら、Codexとのシームレスな統合を模索する方針です。買収完了には規制当局の承認が必要とされています。

出典：Ars Technica | OpenAI公式

Google、ブラウザAIエージェント開発チームを再編

2026年03月19日 Google OpenAI Anthropic NVIDIA Perplexity Gemini ChatGPT Claude Claude Code Chrome Codex OpenClaw Comet アシスタントコーディング医療エージェント Computer Use

開発体制の転換

Project Marinerチーム再編

研究者が高優先度プロジェクトへ異動

Gemini Agentに技術統合

業界の潮流変化

OpenClaw旋風で戦略転換

ブラウザ型の利用者数低迷

コーディング型エージェントが台頭

CLI操作が10〜100倍効率的

今後の展望

GUI操作は80/20の補完的役割

汎用エージェントへの進化が焦点

詳細を見る

GoogleがChromeブラウザを操作するAIエージェント「Project Mariner」の開発チームを再編したことがWIREDの取材で明らかになりました。研究プロトタイプに携わっていたGoogle Labsのスタッフの一部が、より優先度の高いプロジェクトへ異動しています。

Googleの広報担当者はこの変更を認めたうえで、Project Marinerで培ったコンピュータ操作技術は同社のエージェント戦略に引き続き組み込まれると説明しています。すでに一部の機能は最近発表されたGemini Agentに統合されています。

背景にはOpenClawなど高性能コーディングエージェントの急速な台頭があります。NVIDIAのジェンスン・ファンCEOはOpenClawを「エージェント型コンピュータの新しいOS」と評し、「すべての企業がOpenClaw戦略を持つ必要がある」と述べました。

ブラウザエージェントの普及は期待を下回っています。Perplexityの「Comet」は週間アクティブユーザー280万人にとどまり、OpenAIのChatGPT Agentも100万人未満に減少しました。スクリーンショットベースの処理は計算コストが高く、テキストベースのCLI操作と比べ10〜100倍のステップが必要とされています。

一方で、コンピュータ操作エージェントが不要になるわけではないとの見方もあります。Simular CEOのアン・リー氏は「ターミナルで多くの問題を解決できるが、GUIでしか対応できない場面は常に存在する」と指摘しています。医療保険サイトやレガシーソフトウェアなど、APIが存在しない領域では引き続き重要な役割を果たすと述べました。

AI各社はコーディングエージェントを汎用アシスタントの基盤として位置づけ始めています。OpenAIはCodexをChatGPT内の汎用エージェントにする構想を示し、AnthropicはターミナルなしでClaude Codeを使える「Claude Cowork」をすでに提供しています。

出典：WIRED

Xiaomi、1兆パラメータLLM「MiMo-V2-Pro」を低価格で公開

2026年03月18日 OpenAI Anthropic DeepSeek Codex GPT-5 推論リスクプロンプトインジェクションインフラセキュリティ中国エージェントプロンプトコンテキスト

モデル性能と技術

1兆パラメータ中42Bのみ稼働

100万トークンの長大コンテキスト対応

幻覚率30%に大幅低減

エージェント評価で中国勢トップ

価格と市場影響

入力1ドル/100万トークンの低価格

GPT-5.2の約7分の1のコスト

オープンソース版も計画中

コード・端末操作に高い信頼性

詳細を見る

Xiaomiは2026年3月18日、1兆パラメータの大規模言語モデル「MiMo-V2-Pro」を発表しました。開発を率いたのはDeepSeek R1出身のFuli Luo氏で、OpenAIやAnthropicの最上位モデルに迫る性能を、約6〜7分の1の価格で提供します。

MiMo-V2-Proは1兆パラメータを擁しながら、1回の推論で稼働するのは42Bのみというスパース構造を採用しています。7対1のハイブリッドアテンション機構により、100万トークンの長大コンテキストでも性能劣化を抑え、効率的な推論を実現しています。

第三者機関Artificial Analysisの検証では、グローバル知能指数で10位・スコア49を獲得し、GPT-5.2 Codexと同等の評価を受けました。エージェント評価GDPval-AAではElo 1426を記録し、中国発モデルとして最高位に位置しています。

価格設定は入力1ドル・出力3ドル（100万トークンあたり、256K以下）と極めて競争力があります。GPT-5.2の全評価コスト2,304ドルに対し、MiMo-V2-Proはわずか348ドルで同等の処理が可能です。

企業導入においては、コスト対性能比の高さからインフラ部門に魅力的な選択肢となります。一方、エージェント機能の強力さゆえにプロンプトインジェクションのリスクも増大するため、セキュリティ部門は監査体制の整備が不可欠です。Luo氏は安定版のオープンソース公開も予告しています。

出典：VentureBeat

MiniMax M2.7公開、自己進化型AIで開発工程の半分を自動化

2026年03月18日 Google Vercel Gemini Claude Claude Code Codex ワークフロー GPT-5 Sonnet 強化学習リスク開発ツール米国中国エージェントベンチマーク Cursor

自己進化と性能

RL工程の30〜50%を自動実行

MLE Benchメダル率66.6%達成

幻覚率34%でClaude超え

SWE-Proで56.22%の高水準

コストと戦略転換

入力0.30ドル/100万トークン

GLM-5の3分の1以下のコスト

中国AI勢のプロプライエタリ転換

Claude Code等11以上のツール対応

詳細を見る

中国AI企業MiniMaxは2026年3月18日、新たなプロプライエタリLLM「M2.7」を公開しました。同モデルはエージェント型ワークフローとソフトウェア工学タスクに特化し、Vercel AI Gatewayでも標準版と高速版の2種類が利用可能となっています。

M2.7の最大の特徴は自己進化型の開発手法です。先行バージョンのモデルを活用して強化学習のハーネスを構築し、データパイプラインや学習環境の管理を自動化しました。これにより開発工程の30〜50%をモデル自身が担当し、100ラウンド以上の反復ループでコード修正を最適化しています。

ベンチマーク性能ではSWE-Pro 56.22%でGPT-5.3-Codexに匹敵し、GDPval-AAではElo 1495を記録しました。幻覚率は34%とClaude Sonnet 4.6の46%やGemini 3.1 Pro Previewの50%を下回り、MLE Bench Liteのメダル率66.6%はGoogleのGemini 3.1に並ぶ水準です。

価格面では入力0.30ドル、出力1.20ドル（100万トークンあたり）と前モデルM2.5から据え置きで、同等の知能水準を持つGLM-5と比較して3分の1以下のコストを実現しています。Claude Code、Cursor、Trae等11以上の開発ツールへの公式統合も提供されています。

戦略的には、オープンソースで評価を高めてきた中国AI勢がプロプライエタリ路線へ転換する動きの一環として注目されます。一方で中国企業であることから米国・西側の規制産業での採用にはハードルがあり、企業の意思決定者はコスト効率と地政学的リスクを慎重に比較検討する必要があります。

出典：vercel.com | VentureBeat

Vercelがコーディングエージェント向けプラグインを公開

2026年03月17日 OpenAI Vercel Claude Claude Code Codex コーディングデプロイエージェント Cursor

プラグインの主要機能

47種以上のスキルを搭載

Next.jsやAI SDK等の知識グラフ対応

3種の専門エージェントを内蔵

5つのスラッシュコマンドを提供

技術的な仕組み

ファイル編集やコマンドをリアルタイム監視

非推奨パターンを即時検出・警告

Claude CodeとCursorに対応

OpenAI Codex対応も近日予定

詳細を見る

Vercelは、コーディングエージェント向けの新プラグインを公開しました。Claude CodeとCursorに対応し、Vercelプロジェクトの理解を深めるためのプラットフォーム知識グラフを提供します。

プラグインは47種以上のスキルを搭載しており、Next.js、AI SDK、Turborepo、Vercel Functions、Routing Middlewareなど主要技術をカバーしています。リレーショナル知識グラフにより、各技術間の関連性も把握できます。

AIアーキテクト、デプロイメントエキスパート、パフォーマンスオプティマイザーの3種の専門エージェントを内蔵しています。bootstrapやdeploy、env、status、marketplaceの5つのスラッシュコマンドも利用可能です。

技術的には、ビルド時にパターンマッチャーをコンパイルし、7つのライフサイクルフックで優先度付きの注入パイプラインを実行します。globパターンやbash正規表現、import文などに基づきスキルが発火し、セッション内で重複排除されます。

さらにPostToolUseバリデーションにより、非推奨パターンやサンセット済みパッケージ、古いAPIをリアルタイムで検出します。npxコマンドやClaude Code公式マーケットプレイスから簡単にインストールでき、OpenAI Codexへの対応も近日中に予定されています。

出典：vercel.com

OpenAI、GPT-5.4 miniとnanoを公開

2026年03月17日 OpenAI ChatGPT Codex GPT-5 エンジニア推論コーディングエージェントコンテキストベンチマーク Computer Use

性能と価格

GPT-5 mini比2倍以上高速

SWE-Bench Proで54.4%達成

nano入力100万トークン0.20ドル

mini入力100万トークン0.75ドル

主な用途

コーディング補助の高速化

サブエージェント並列処理

スクリーンショット解析対応

Codexでコスト3分の1

詳細を見る

OpenAIは2026年4月2日、小型高性能モデルGPT-5.4 miniとGPT-5.4 nanoをAPI・Codex・ChatGPTで公開しました。大量処理ワークロード向けに設計された両モデルは、速度とコスト効率を重視しています。

GPT-5.4 miniは前世代のGPT-5 miniと比較して、コーディング・推論・マルチモーダル理解・ツール使用の全領域で大幅に改善されています。処理速度は2倍以上に向上し、複数のベンチマークで上位モデルGPT-5.4に迫る性能を示しています。

ベンチマークではSWE-Bench Proで54.4%、OSWorld-Verifiedで72.1%を達成しました。特にOSWorldではGPT-5.4の75.0%にほぼ匹敵し、コンピュータ操作タスクでの実用性が際立っています。

料金体系はGPT-5.4 miniが入力100万トークンあたり0.75ドル、出力4.50ドルです。nanoはさらに安価で入力0.20ドル、出力1.25ドルに設定されています。両モデルとも40万トークンのコンテキストウィンドウに対応します。

開発者にとって注目すべきはサブエージェント構成への最適化です。GPT-5.4が計画・判断を担い、miniやnanoが並列で個別タスクを高速処理する構成が推奨されており、Codexではmini利用時のクォータ消費が30%で済むため、コスト効率の高い開発体験を実現します。

出典：OpenAI公式 | vercel.com

OpenAI Codex SecurityがSASTレポートを採用しない理由

2026年03月16日 OpenAI Codex 推論リスク脆弱性セキュリティエージェント

SAST の限界

データフロー追跡だけでは不十分

サニタイザー存在と安全性は別問題

変換チェーン後の制約維持が課題

順序・正規化の不整合が実際の脆弱性に

エージェント型検証の設計

リポジトリ構造と脅威モデルから出発

z3ソルバーで制約充足を形式検証

サンドボックスでPoC実行検証

トリアージ前に証拠を確立

SAST起点を避ける理由

既存結果への早期収束リスク

暗黙の前提が推論を歪める

詳細を見る

OpenAIは自社のコードセキュリティ製品「Codex Security」において、従来の静的解析（SAST）レポートを起点としない設計を採用しました。代わりにリポジトリのアーキテクチャ、信頼境界、意図された動作から分析を開始し、人間に報告する前に検証を行う方針です。

SASTは入力源から危険なシンクまでのデータフロー追跡に優れますが、実際のコードベースでは間接呼び出しやリフレクション、フレームワーク固有の制御フローにより近似処理が必要になります。より根本的な問題は、サニタイザーが存在しても、その制約が変換チェーン全体で維持されるかを判定できない点にあります。

具体例として、JSONペイロードから取得したリダイレクトURLに対し正規表現チェック後にURLデコードを行うパターンがあります。CVE-2024-29041ではExpressにおいて、不正なURLがデコード・解釈の過程で許可リストを迂回できる脆弱性が発見されました。データフローは明白でも、変換後に検証が有効かが真の問題でした。

Codex Securityはコードパスをセキュリティ研究者のように読み、検証と実装の不一致を探します。最小のテスト可能な単位に分解してマイクロファザーを生成し、Python環境のz3ソルバーで制約充足問題として形式化することも可能です。サンドボックス環境でエンドツーエンドのPoCを実行し、疑惑と確証を区別します。

SASTレポートを起点としない理由は3つあります。第一に、既存の検出結果が探索範囲の早期収束を招きます。第二に、SASTが内包する暗黙の前提が推論を歪め、調査ではなく確認作業に陥ります。第三に、エージェント自身の発見能力の評価が困難になり、システム改善の妨げとなります。

出典：OpenAI公式

マスク氏、xAIで再び大規模人員削減を指示

2026年03月14日 OpenAI Anthropic xAI Claude Grok Claude Code Codex チャットボット創業者事前学習コーディングイーロン・マスクスタートアップ SpaceX Tesla

xAI組織再編の全容

SpaceX・Teslaから監査役派遣

コーディング製品の不振が引き金

共同創業者2名が相次ぎ退社

訓練データの品質に重大な課題

競合との差と上場圧力

Anthropic・OpenAIに大きく後れ

Grokは個人・法人とも普及せず

SpaceX統合で6月上場期限迫る

「基礎から再構築」とマスク氏表明

詳細を見る

イーロン・マスク氏は、自身が率いるAIスタートアップxAIに対し、コーディング製品の低迷を理由に新たな人員削減を指示しました。SpaceXやTeslaから「修正役」の管理職が送り込まれ、従業員の業務を監査しています。

AnthropicのClaude CodeやOpenAIのCodexといった競合AIコーディングツールが業界を席巻する中、xAIのGrok チャットボットおよびコーディング製品は有料ユーザーの獲得に苦戦しています。設立からわずか2年で根本的な立て直しを迫られる異例の事態です。

SpaceXとTeslaから派遣された管理職は、xAI社員の成果物を精査し、不十分と判断した社員を解雇しています。特にモデル訓練に使用するデータの品質が競合に劣る主因として注目されており、改善が急務となっています。

今回の混乱で、技術スタッフの最上級メンバーであったZihang Dai氏が退社しました。さらにGrokモデルの事前学習を統括していたGuodong Zhang氏も、コーディング製品の問題の責任を問われ主要業務を外されたことを受け、退社を表明しています。

マスク氏はxAIとSpaceXを12.5億ドルで統合しており、6月の大型上場に向けた圧力が高まっています。同氏はXへの投稿で「xAIは最初の構築がうまくいかなかったため、基礎から再構築する。Teslaでも同じことがあった」と述べ、長期的な再建に自信を示しました。

出典：Ars Technica

YC支援のRandom LabsがAI群制御型コーディングエージェントSlate V1を公開

2026年03月12日 OpenAI Anthropic Claude Claude Code Codex エンジニアリスクコーディングエージェントコンテキスト

Slateの技術基盤

Thread Weavingで文脈維持

オーケストレータとワーカーの分離構造

エピソード記憶で状態圧縮

複数モデルの並列実行に対応

事業戦略と展望

従量課金クレジット制を採用

OpenAI Codex・Claude Code連携を予定

Terminal Bench 2.0で高い安定性を実証

「次の2000万人のエンジニア」が標的

詳細を見る

Y Combinator支援のRandom Labsは、業界初の「スウォームネイティブ」自律型コーディングエージェント「Slate V1」を正式リリースしました。2024年にKiranとMihir Chintawarが共同創業した同社は、大規模並列処理で複雑なエンジニアリングタスクを実行する新しいアプローチを提案しています。

Slateの中核技術は「Thread Weaving」と呼ばれるアーキテクチャです。従来のAIコーディングツールが抱えていたコンテキストウィンドウの制約を、OS的なフレームワークで解決します。中央のオーケストレータが戦略的判断を担い、TypeScriptベースのDSLで並列ワーカースレッドにタスクを割り振る分離構造を採用しています。

記憶管理においても独自のアプローチを取ります。多くのエージェントが採用する「圧縮」方式では重要な状態情報が失われるリスクがありますが、Slateはワーカースレッド完了時に成功したツール呼び出しと結論のみを要約した「エピソード」を生成します。これによりスウォーム知性を維持しながら大規模並列処理を実現しています。

商業面では従量課金制のクレジットモデルへ移行し、組織レベルの課金管理機能を備えるなどプロフェッショナルチーム向けの設計が明確です。さらにOpenAIのCodexやAnthropicのClaude Codeとの直接連携を来週リリース予定と発表しており、競合ではなくオーケストレーション層としての立ち位置を狙っています。

性能面では、Terminal Bench 2.0のmake-mips-interpreterタスクで初期バージョンが3分の2のテストに合格しました。最新のフロンティアモデルでも単体では成功率20%未満とされるこのタスクでの好成績は、オーケストレーション型アーキテクチャの有効性を示しています。同社はSlateを開発者の代替ではなく、世界的なエンジニア不足を補う協調ツールと位置づけています。

出典：VentureBeat

OpenAIがResponses APIにコンピュータ環境を統合しエージェント基盤を強化

2026年03月11日 OpenAI Codex ワークフローネットワーク認証コーディングエージェントプロンプトコンテキスト

シェルツールの全容

Unix CLIで多言語実行

コマンド並列実行に対応

出力上限でコンテキスト節約

ストリーミング逐次応答

コンテナとスキル基盤

ファイル・SQLite永続管理

ネットワークは許可リスト制御

スキルで再利用可能な手順定義

コンパクション機能で長時間実行

詳細を見る

OpenAIは、Responses APIにシェルツールとホスト型コンテナワークスペースを統合し、AIモデルが実際のコンピュータ環境でタスクを実行できるエージェント基盤を構築したと発表しました。従来のプロンプト応答を超え、ファイル操作やAPI呼び出しなど幅広い業務を自動化できます。

シェルツールは従来のコードインタプリタがPython限定だったのに対し、Go・Java・Node.jsなど多言語に対応します。モデルがコマンドを提案し、Responses APIがコンテナ内で実行、結果をモデルに返すループで動作します。複数コマンドの並列実行にも対応し、処理速度を大幅に向上させています。

コンテナ環境は3つの文脈を提供します。第一にファイルシステムでデータを整理し、第二にSQLiteなどの構造化データベースで効率的にクエリを実行できます。第三にネットワークアクセスはサイドカープロキシ経由で制御され、許可リストとドメイン単位の認証情報注入により安全性を確保しています。

エージェントスキルは繰り返し発生するワークフローを再利用可能な部品として定義する仕組みです。SKILL.mdファイルとリソースをバンドルし、バージョン管理されたパッケージとしてAPI経由で管理できます。モデルはシェルコマンドでスキルを発見し、指示を解釈して同一ループ内で実行します。

長時間タスクではコンテキストウィンドウが枯渇する課題に対し、ネイティブのコンパクション機能を実装しました。モデルが会話状態を分析し、重要情報を暗号化されたトークン効率の高い表現に圧縮します。OpenAIのCodexもこの仕組みに依存しており、長時間のコーディングタスクを品質を落とさず継続できます。

出典：OpenAI公式

OpenAIがClaude Code追撃へCodex開発を全社加速

コーディングAI競争の構図

Claude Codeが年間売上25億ドル超

Codexは10億ドルで後塵を拝す

Cursor 買収を試みるも断念

OpenAI社内の巻き返し策

2025年3月にスプリントチーム結成

Windsurf 買収もMicrosoft介入で破談

GPT-5.2搭載でCodex利用者が急増

業界への波及と今後の課題

Claude Codeが1兆ドル株安誘発

安全性と開発速度の両立が焦点

詳細を見る

OpenAIがAIコーディングエージェント「Codex」の開発を全社的に加速させています。競合Anthropicの「Claude Code」が年間売上25億ドル超と急成長する一方、Codexは2026年1月時点で10億ドル超にとどまり、後発の立場に置かれています。

OpenAIは2021年にCodexの初期版を開発し、MicrosoftのGitHub Copilotに技術を提供していました。しかし2022年末のChatGPTの爆発的成功により、社内リソースがチャットボットやマルチモーダルAIに集中し、専任のコーディング製品チームが長期間不在となりました。

Anthropicはこの間、実際のコードリポジトリを使ったモデル訓練に注力しました。2024年6月にClaude Sonnet 3.5がリリースされると、そのコーディング能力が開発者に高く評価され、Cursorの急成長にもつながりました。OpenAIはCursorの買収を持ちかけましたが、創業者らは独立を選びました。

OpenAIは2025年3月にスプリントチームを結成し、同時にWindsurfを30億ドルで買収する計画も進めました。しかしMicrosoftが知的財産へのアクセスを要求し、両社の関係が緊張する中で買収は破談しました。その後GPT-5.2を搭載したCodexは性能が大幅に向上し、2025年9月にはClaude Codeの5%だった利用量が2026年1月には40%まで急伸しました。

一方でAIコーディングの社会的影響も拡大しています。Wall Street JournalはClaude Codeが1兆ドル規模の株安を引き起こしたと報じ、IBMは25年ぶりの株価急落に見舞われました。安全性団体からはOpenAIがCodex開発を急ぐあまり安全性評価をおろそかにしているとの指摘もあり、開発競争の加速と責任あるAI開発の両立が問われています。

出典：WIRED

AnthropicとOpenAIがLLM脆弱性スキャナーを無償公開、従来SASTの限界を露呈

2026年03月10日 OpenAI Anthropic Claude Claude Code Codex GPT-5 Opus 専門家推論リスク脆弱性セキュリティ

2社の独自スキャナー比較

Claude Code Securityが500件超の未知脆弱性を発見

Codex Securityが120万超コミットをスキャン

OpenAIが14件のCVEを新規発行

両ツールとも現在無償提供中

誤検知率が50%以上低減

企業セキュリティへの影響

従来SATSのパターンマッチング限界が明確化

デュアルユースリスクの深刻化

静的コードスキャンの商品化が加速

予算の重心が修復自動化へ移行

ボードへの30日パイロット実施を推奨

詳細を見る

2026年2月20日にAnthropicがClaude Code Securityを、3月6日にOpenAIがCodex Securityを相次いでリリースし、LLM推論を活用した脆弱性スキャナーが企業向けに無償提供された。

AnthropicはClaude Opus 4.6を用い、数十年間の専門家レビューと数百万時間のファジングを経た本番OSコードベースで500件超の高深刻度ゼロデイ脆弱性を発見しました。従来のカバレッジ誘導型ファジングでは検出不能だったLZW圧縮アルゴリズムのヒープバッファオーバーフローも特定しています。

OpenAIのCodex SecurityはGPT-5搭載の社内ツール「Aardvark」から発展し、ベータ期間中に120万件超のコミットをスキャン。OpenSSH・GnuTLS・Chromiumなど著名OSSで792件の致命的問題と1万561件の高深刻度問題を検出し、14件のCVEが新規付番されました。

Checkmarx Zeroの検証では、Claude Code Securityが8件中2件しか真陽性を返せない事例も確認されており、LLMスキャナーの精度限界と第三者監査の必要性が指摘されています。Enkrypt AI CSO Merritt Baer氏は「OSSの脆弱性発見はゼロデイ級として扱うべきで、CVSSスコアだけでトリアージすべきではない」と警告しました。

企業セキュリティ担当者には7つのアクションが推奨されています。代表リポジトリで両ツールを同時実行して既存SATSとの差分（盲点）を把握すること、ガバナンスフレームワークをパイロット前に整備すること、ソフトウェア構成分析・コンテナスキャン・DASTなど両ツールがカバーしない領域を明確にすること、そして30日間のパイロットで取得した実証データを調達判断の根拠とすることが特に重要です。

出典：VentureBeat

OpenAI、コード脆弱性を自動検出するCodex Securityを公開

2026年03月06日 OpenAI ChatGPT Codex 脆弱性パッチセキュリティ認証エージェント

製品の特徴と精度

脅威モデル自動生成と編集機能

サンドボックスで検証し誤検知削減

修正パッチを文脈付きで提案

フィードバック学習で精度向上

OSS貢献と実績

14件のCVEをOSSで発見・報告

OpenSSH・GnuTLS等の重大脆弱性修正

誤検知率50%以上削減を達成

OSS支援プログラムを無償提供

詳細を見る

OpenAIは2026年3月、アプリケーションセキュリティエージェント「Codex Security」のリサーチプレビューを開始しました。ChatGPT Pro・Enterprise・Business・Edu顧客向けに、初月は無料で提供されます。

Codex Securityは旧名「Aardvark」として昨年からプライベートベータを実施してきました。ベータ期間中にSSRFやクロステナント認証バイパスなどの重大脆弱性を発見し、セキュリティチームが数時間以内にパッチを適用した実績があります。

同ツールの最大の特徴は、リポジトリを分析して脅威モデルを自動生成し、プロジェクト固有の文脈に基づいて脆弱性を優先順位付けする点です。サンドボックス環境での自動検証により、誤検知率を50%以上削減し、重要度の過大報告も90%以上減少させました。

OSSコミュニティへの貢献も注目されます。OpenSSH、GnuTLS、GOGS、Chromiumなど広く使われるプロジェクトで14件のCVEを報告しました。過去30日間で外部リポジトリの120万コミット以上をスキャンし、792件の重大・1万561件の高深刻度の脆弱性を検出しています。

OpenAIはOSSメンテナー向けに「Codex for OSS」プログラムも開始し、無償のChatGPT ProアカウントやCodex Securityを提供します。vLLMなどのプロジェクトが既に活用を開始しており、今後数週間で対象を拡大する予定です。

出典：OpenAI公式

Block社ドーシーCEO、AI理由に従業員半数を解雇

2026年03月06日 OpenAI Anthropic Codex Opus レイオフ AGI コーディングバイブコーディングイーロン・マスク投資ベンチャーキャピタルバブル

大規模レイオフの背景

従業員約5000人を一斉解雇

AI進化で企業構造の抜本改革が必要と主張

12月のOpus 4.6やCodex 5.3が転機

過剰採用ではなく先手の判断と説明

AI中心の新企業像

管理階層を撤廃し知能層を構築

会社全体をミニAGI化する構想

顧客が自ら製品をバイブコーディング

1〜2年で対応しなければ存亡の危機

X・分散化・政治への見解

Xのアルゴリズム選択に改善余地

Blueskyもイデオロギー偏向と批判

政府と民間企業の分離が必要

詳細を見る

Block（旧Square）のジャック・ドーシーCEOは、約1万人の従業員のうちほぼ半数を解雇したことを明らかにしました。同社は直近四半期に約30億ドルの利益を計上し、時価総額390億ドルの好業績下での決断です。

ドーシー氏は解雇の理由について、2025年12月にAnthropicのOpus 4.6やOpenAIのCodex 5.3などのAIツールが大規模コードベースへの対応力を劇的に向上させたことを挙げました。これにより企業の構造そのものを根本から見直す必要が生じたと説明しています。

同氏が描く新たな企業像は、従来の管理階層を完全に撤廃し、会社全体に知能レイヤーを構築する「ミニAGI」型の組織です。全社員がこの知能層に問いかけ、意図を組み込み、顧客向けの機能を迅速にスケールできる体制を目指しています。

イーロン・マスク氏が率いるX（旧Twitter）については、私企業化とビジネスモデル変革を評価しつつも、アルゴリズムによるフィルターバブルやイデオロギー的分断を批判しました。自身が創設に関わったBlueskyについても、VC 投資を受けて普通の企業化した点に失望を表明しています。

ドーシー氏は、AIに対応しない企業は1〜2年以内に存亡の危機に直面すると警告しました。政治については「超混乱している」と述べ、テクノロジー企業と政府の分離の重要性を強調。AI企業間のモデル切り替えコストがほぼゼロである点にも言及し、業界の競争構造への懸念を示しました。

出典：WIRED

OpenAI、教育機関向けAI活用支援ツールを大幅拡充

2026年03月05日 OpenAI ChatGPT Codex AI活用ワークフロー学生コーディング米国エージェント教師学校

学生のAI活用格差

週9億人がChatGPT利用

大学生層が最大の利用者層

上級者でも活用度は90〜99%不足

基本利用から高度応用への移行が課題

教育機関向け新施策

Codexでコーディング実習提供

研究用Prism環境を無料公開

OpenAI認定資格を試験導入

学習成果測定スイートを近日提供

詳細を見る

OpenAIは、教育機関がAI活用の格差を解消するための新たなツール群とリソースを発表しました。毎週9億人がChatGPTを利用するなか、大学生が年齢層別で最大の利用者であることが明らかになっています。

同社の分析によると、大学生は文章作成や分析、コーディングなど11分野中5分野で主流ユーザーのトップに立つ一方、パワーユーザーと比較すると活用度は90〜99%低い水準にとどまっています。この「能力活用格差」の解消が教育分野における重要課題と位置づけられています。

具体的な施策として、コーディングエージェント「Codex」を授業に導入し、学生がバグ修正やテスト実行などの実務経験を積める環境を提供します。また、LaTeX対応の研究協業環境「Prism」を無料で公開し、論文執筆からAI支援ワークフローまでを一元化します。

アリゾナ州立大学やカリフォルニア州立大学システムでは、OpenAI認定資格のパイロット運用が開始されました。学生・教職員が実践的なAIスキルを習得し、雇用主に対して能力を証明できる仕組みです。ギリシャ、エストニア、UAEなど各国の教育システムも導入を進めています。

教員支援にも注力しており、「ChatGPT for Teachers」は全米の主要学区で15万人以上の教職員が利用中です。米国教員連盟との連携やOpenAI Academyを通じたコミュニティカレッジ向け無料研修も展開し、AI教育の裾野拡大を図っています。

出典：OpenAI公式

OpenAIがGPT-5.4発表、PC操作や100万トークン対応

2026年03月05日 OpenAI ChatGPT Codex スライド GPT-5 専門家推論コーディング投資エージェントプロンプトコンテキストベンチマーク MCP Computer Use

モデル性能の飛躍

GDPvalで専門家超え83%達成

OSWorldでPC操作成功率75%

事実誤認が33%減少

推論トークン消費量の大幅削減

エージェント基盤の進化

コンピュータ操作のネイティブ対応

Tool Searchでトークン47%削減

APIで100万トークン文脈窓

Excel・Sheets連携プラグイン提供

詳細を見る

OpenAIは2026年3月5日、最新AIモデルGPT-5.4をChatGPT、API、Codexで公開しました。推論・コーディング・エージェント機能を統合した同社史上最高性能のフロンティアモデルと位置づけています。

GPT-5.4は同社初の汎用モデルとしてネイティブコンピュータ操作機能を搭載しています。Playwrightによるコード実行やスクリーンショットに基づくマウス・キーボード操作が可能で、OSWorldベンチマークでは人間の72.4%を上回る75.0%の成功率を達成しました。

ビジネス用途ではスプレッドシート、プレゼンテーション、文書作成の能力が大幅に向上しています。投資銀行業務のモデリングタスクでは平均87.3%のスコアを記録し、前モデルGPT-5.2の68.4%から約19ポイント改善されました。

API向けにはTool Search機能を新たに導入し、多数のツール定義を事前にプロンプトへ含める従来方式を刷新しました。MCP Atlasベンチマークでは同精度を維持しつつトークン使用量を47%削減する効果が確認されています。

価格は入力100万トークンあたり2.50ドル、出力15ドルに設定され、GPT-5.2より引き上げられました。一方で推論効率の向上により、タスク全体のコストは抑制される見込みです。APIでは最大100万トークンのコンテキストウィンドウに対応しています。

LangChain、コーディングエージェント向けスキル評価手法を公開

2026年03月05日 LangChain Claude Claude Code Codex ワークフローコーディングエージェントプロンプト LangSmith

評価パイプラインの要点

Dockerで再現性ある環境構築

制約付きタスクで採点精度向上

バグ修正型タスクが検証に有効

スキル有無で完了率を比較

スキル設計の知見

XMLタグでモジュール化推奨

AGENTS.mdで確実な呼び出し実現

スキル数は12以下で正確に選択

LangSmithで軌跡を可視化

詳細を見る

LangChainは2026年3月、Claude CodeやCodexなどのコーディングエージェントに与える「スキル」の評価手法とベストプラクティスをブログで公開しました。スキルとは、特定領域でエージェントの性能を高めるための指示・スクリプト・リソースの集合体です。

評価パイプラインの基本は、タスクを定義し、スキルの有無でエージェントの成績を比較する手法です。テスト環境には軽量なDockerコンテナを用い、ディレクトリの初期状態を統一することで再現性を確保しています。

タスク設計では、オープンエンドな課題よりもバグ修正型の制約付きタスクが有効であると報告されています。採点が容易になるだけでなく、エージェントの設計空間を適切に限定できるためです。評価指標には、スキルの呼び出し有無、タスク完了率、ターン数、実行時間などを採用しています。

スキル設計においては、AGENTS.mdやCLAUDE.mdにスキルの使用方法を記載することで呼び出し率が安定しました。スキルを単独でプロンプト任せにした場合の呼び出し率は最大70%にとどまる一方、事前読み込みファイルに案内を記載すると一貫した呼び出しが実現できたと報告されています。

実験の結果、スキルを搭載したClaude Codeのタスク完了率は82%に達した一方、スキルなしでは9%に低下しました。LangSmithのトレース機能でエージェントの全行動を記録・分析し、失敗原因の特定とスキル内容の反復改善を高速に回すワークフローが紹介されています。

出典：blog.langchain.com

ByteDance動画AI「Seedance 2.0」に計算資源と著作権の壁

2026年03月05日 Claude Claude Code Codex 動画生成エンジニアクリエイターリスク GPU 著作権動画コーディング米国中国米中 ByteDance

技術と普及の現状

Seedance 2.0が業界に衝撃

映画監督級の映像生成能力

GPU不足で数時間待ちの状態

中国国内アプリ限定で提供中

著作権問題の深刻化

Disney等が差止め書簡送付

ユーザーが著名キャラ映像を大量生成

中国のIP保護制度の未整備が背景

米中AI格差の構図

動画AIでは中国が米国に先行

コーディングAIでは米国が優位

詳細を見る

ByteDanceは2025年2月、動画生成AI「Seedance 2.0」を発表しました。中国のゲーム開発者や映像クリエイターから「監督のように考える」と高い評価を受け、AI動画の品質に懐疑的だった層にも衝撃を与えています。

しかし現時点では計算資源の深刻な不足が普及の障壁となっています。利用者によると、5秒の動画生成に約9万人待ちの行列が発生し、数時間の待機が必要です。月額70ドル超の有料会員でも長時間待たされる状況で、深夜に生成リクエストを送るなどの裏技が共有されています。

Disney、Netflix、Paramountなど大手映画スタジオがByteDanceに著作権侵害を主張する差止め書簡を送付しました。ユーザーがウルヴァリンやトム・クルーズなど著名キャラクターの映像を生成・拡散しており、グローバル展開時の法的リスクが急速に高まっています。

中国のエンタメ業界はハリウッドとは対照的にAI動画を積極的に受容しています。カンヌ受賞の賈樟柯監督がSeedance 2.0で作品を制作し公開するなど、著名クリエイターの参入が相次いでいます。春節晩会の背景映像にも採用され、政府の後押しも見られます。

米中AI分野の棲み分けも鮮明になっています。動画AIではKling AIを含む中国勢が世界をリードする一方、コーディングAIでは中国の開発者もClaude CodeやCodexに依存しています。Seedance 2.0のAPI価格は15秒動画で約2ドルと公表されており、今後のサードパーティ開放が注目されます。

出典：WIRED

Raycast、AIコーディング統合アプリ基盤「Glaze」を発表

2026年03月04日 OpenAI Claude Claude Code App Store Codex Windows デザイン創業者クラウドコーディングバイブコーディングプロンプト基盤モデル

Glazeの基本機能

プロンプト入力だけでアプリ生成

Claude CodeとCodexが基盤モデル

クラウド保存やAPI管理を自動化

他人のアプリを取得しカスタマイズ可能

事業戦略と展望

Mac版先行、Windows・モバイル展開予定

無料版と月額20〜30ドルの有料プラン

Glaze Storeでアプリ共有・発見

Mac・WindowsApp Storeへの挑戦を表明

詳細を見る

Raycastは、Mac向けランチャーアプリの開発元として知られる企業です。同社は新製品Glazeを発表し、AIを活用した「バイブコーディング」によるアプリの構築・利用・共有・発見を一元化するプラットフォームを提供します。

Glazeの最大の特徴は、プロンプトを入力するだけでアプリを一発生成できる点です。基盤モデルにはClaude CodeとOpenAIのCodexを採用しており、クラウドストレージやAPI連携、デザイン原則の適用といった技術的な作業をすべて自動で処理します。

共同創業者のトーマス・ポール・マン氏は「コードを触る必要があるなら、それは我々の失敗だ」と述べています。Glaze Storeというディレクトリでは、他のユーザーが作成したアプリを閲覧・取得でき、さらに自分好みにカスタマイズして使うことも可能です。

GlazeはRaycastのランチャー機能と深く統合されており、生成したアプリはRaycastの拡張機能として自動的に連携します。現在はMac版のみですが、今後Windowsやモバイルにも対応予定で、無料版に加え月額20〜30ドルの有料プランを計画しています。

マン氏は現在を「ソフトウェアのiTunesモーメント」と表現し、あらゆるアプリが一か所で手に入る時代の到来を予見しています。MacやWindowsのApp Storeに挑戦する意欲を示しており、個人の小さなユーティリティからチーム専用ツールまで、ソフトウェアの在り方を根本から変える可能性を秘めています。

出典：The Verge

OpenAI、社内データエージェントを2名で構築し全社展開

2026年03月03日 OpenAI Slack Codex GPT-5 エンジニアエージェントプロンプトコンテキスト

エージェントの全容

GPT-5.2基盤で自然言語対応

70%のコードをAIが生成

600PB超・7万データセットに対応

問合せ1件あたり2〜4時間短縮

技術的工夫と課題

Codexがテーブル探索を自動化

6層のコンテキスト階層で精度向上

過信防止の発見フェーズ強制

少量精選データが大量投入に勝る結果

企業への示唆

製品化せず構築用APIを外部提供

データガバナンスが成否を左右

詳細を見る

OpenAIは、社内のデータ分析エージェントをわずか2名のエンジニアが3カ月で構築したことを明らかにしました。このツールはSlackやWebインターフェースから自然言語で問い合わせると、チャートやダッシュボードを数分で返す仕組みです。

同社のデータ基盤責任者であるEmma Tang氏によると、600ペタバイト超のデータと7万のデータセットを扱う環境で、5000人の社員のうち4000人以上がこのエージェントを日常的に利用しています。財務チームの地域別売上比較からエンジニアのレイテンシ調査まで、部門横断で活用されています。

技術的な最大の課題は、7万のデータセットから正しいテーブルを見つけることでした。Codexを活用した「Codex Enrichment」プロセスが日次でテーブルの依存関係や結合キーを自動解析し、ベクターデータベースに格納することでこの問題を解決しています。

モデルの過信という行動上の課題に対しては、プロンプトエンジニアリングで発見フェーズに時間をかけるよう強制する手法を導入しました。また評価の結果、コンテキストは量より質が重要であり、厳選された少量の情報のほうが高精度な結果を生むことが判明しています。

OpenAIはこのツールの製品化は予定しておらず、Responses APIやEvals APIなど外部利用可能なAPIのみで構築したと強調しています。Tang氏は「データガバナンスこそがAIエージェント成功の前提条件」と述べ、データの整備と注釈付けの重要性を企業に訴えました。

出典：VentureBeat

VC投資家がAI SaaS企業への選別を強化、汎用ツール離れ鮮明に

2026年03月01日 OpenAI Anthropic Salesforce Claude Claude Code Codex ワークフロー CRM 専門家投資家インフラコンプライアンススタートアップ投資ベンチャーキャピタルエージェント SaaS

投資家が避けるSaaS領域

薄いワークフロー層や汎用水平ツールの敬遠

UIと自動化だけの差別化では参入障壁が不十分

独自データのない垂直SaaSへの投資縮小

SaaS業界の構造変化

AIエージェント台頭で座席課金モデルが崩壊危機

ソフトウェア株から約1兆ドルの時価総額が消失

KlarnaがSalesforce CRMを自社AI系に置換

今後の投資トレンド

ワークフロー所有とドメイン専門性に資本集中

成果報酬型や従量課金モデルへの移行加速

詳細を見る

複数のVC 投資家がTechCrunchの取材に応じ、AI SaaSスタートアップへの投資基準が大きく変化していることを明かしました。汎用的な水平ツールや薄いワークフロー層、独自データを持たない垂直SaaSは投資対象から外れつつあります。

645 VenturesのAaron Holiday氏は、投資家が現在注目するのはAIネイティブ・インフラ、独自データを持つ垂直SaaS、ミッションクリティカルなワークフローに深く組み込まれたプラットフォームだと説明しました。AltaIR CapitalのRyabenkiy氏も製品の深さが不可欠と強調しています。

AIエージェントの進化により、従来の座席課金モデルが根本から揺らいでいます。Claude CodeやOpenAI Codexなどのツールにより、SaaS製品の中核機能を容易に再現できるようになり、企業は自社開発を選ぶケースが増加しています。KlarnaがSalesforce CRMを自社AIシステムに置き換えた事例がその象徴です。

公開市場では、Anthropicの新製品発表のたびにSaaS株が下落する現象が続いています。2026年2月初旬には約1兆ドルの時価総額がソフトウェア株から消失しました。専門家はこの動きを「SaaSpocalypse」と呼び、SaaSの終局価値が史上初めて根本的に問われていると指摘しています。

一方で投資家らはSaaSの完全な終焉は否定しています。コンプライアンス対応や監査支援など企業の基幹業務を支えるソフトウェアへの需要は持続するとの見方です。今後は従量課金や成果報酬型への移行が進み、ワークフロー所有とドメイン専門性を持つ企業に資本が集中すると予測されています。

出典：TechCrunch | TechCrunch

FigmaがCodexと提携しデザイン連携を実現

2026年02月26日 OpenAI Anthropic Codex エコシステムアシスタントワークフローデザインエンジニアコーディング提携エージェント MCP Canva Figma

統合の技術的内容

Figma MCPサーバー経由でCodexと直結

コード→デザインの即時変換が実現

Dev Mode・FigJamとのネイティブ連携

先週のAnthropic統合に続くマルチAI戦略

設計・実装サイクルの大幅短縮が可能

開発ワークフローへの影響

エンジニアがコーディング環境から離れず設計変更

プロダクト開発の反復速度向上

デザインシステムとの自動整合が可能

詳細を見る

FigmaとOpenAIは2026年2月26日、Figma MCPサーバーを通じてOpenAI Codexとデザインプラットフォームを直接連携させる統合を発表しました。エンジニアはコーディング環境から離れることなく、デザインキャンバスの変更・反復が行えるようになります。

この統合の核心はFigma MCPサーバーの活用で、CodexがFigmaのデザインツール、Dev Mode、FigJamに直接アクセスできる点です。先週発表されたAnthropicとのMCP統合に続き、Figmaはマルチ大手AIとのエコシステム構築を加速しています。

開発チームにとっての実質的な価値は、コード変更がデザインに即座に反映されるフィードバックループの短縮です。従来は別々のツールを往来していた作業が一元化されます。

この動きはソフトウェア開発ワークフローにおけるAIエージェントの役割が、コード生成から設計・実装の統合制御へと拡張していることを示しています。

FigmaがOpenAI・Anthropic双方と提携した事実は、AIコーディングアシスタント市場の競争が激化し、各プラットフォームが設計ツール統合を差別化要因として争っていることを示しています。

出典：TechCrunch | OpenAI公式

インドAI投資競争、8エクサフロップス配備へ

2026年02月20日 Google OpenAI Anthropic NVIDIA マイクロソフト Cloudflare Cerebras ChatGPT Codex エコシステムアシスタント半導体インフラコンプライアンスコーディングインドスタートアップ投資

インドAIインフラへの巨大投資

UAE・G42とCerebrasが8エクサフロップスの計算資源をインドに配備

Peak XVが13億ドルのインド・アジア特化ファンドを設立

India AI Impact SummitがグローバルAI大手を集めてニューデリーで開催

インドのデータ主権・コンプライアンス要件に準拠した設計

インフラ先行投資でAIエコシステムの地盤固め

インドAI消費・スタートアップ市場

SarvamがインドNLP特化チャットアプリIndusを正式公開

OpenAI India利用者の80%が30歳未満という若年層集中

ChatGPTのインド利用は業務用途35%でグローバル平均超え

OpenAIのCodingアシスタントCodexがインドで世界平均の3倍利用

ローカル言語モデル需要とグローバルAIの競争が激化

詳細を見る

インドは2026年、世界で最も注目されるAI市場となっています。India AI Impact Summitには、OpenAI、Anthropic、NVIDIA、Microsoft、Google、Cloudflareなどの主要AI大手のエグゼクティブが集結し、インドへのAI投資を競うように発表しました。

インフラ投資では、アブダビのG42がAIチップメーカーCerebrasと組み、8エクサフロップスの計算能力を持つスーパーコンピュータをインドに設置します。この規模はインドのAI産業の基盤を大幅に強化するものです。Peak XVは13億ドルの新規ファンドを設立し、AI分野に重点を置いています。

スタートアップ面では、インドのAI企業Sarvamがインド人ユーザー向けに最適化したチャットアプリ「Indus」を公開しました。ヒンディー語など地域言語への対応を強みとして、OpenAIやGoogleとの差別化を図っています。ローカルAIとグローバルAIの競争が本格化しています。

OpenAIのデータによると、インドでのChatGPT利用者の約80%が30歳未満で、業務用途での利用が全体の35%を占めています。特にAIコーディングアシスタントの利用がグローバル平均の3倍という数字は、インドのIT産業との強い親和性を示しています。

インドのAIブームは、大規模インフラ投資、若年層の高い採用率、ローカルスタートアップの台頭という三つの力が重なる特別な現象です。グローバル vs ローカルの競争がインドのAI市場の形を決定づける2026年が始まっています。

出典：TechCrunch | TechCrunch | TechCrunch | TechCrunch

GitHubとOpenAIがCodexとSoraでエージェントコーディングを拡張

2026年02月13日 OpenAI GitHub Sora Flow Codex ワークフローエンジニアコーディングコードレビューエージェント

エージェントコーディングの進化

GitHubがエージェントワークフローでリポジトリタスクを自動化

OpenAIがCodexとSoraのスケールアクセスを拡大

AIエージェントが開発ライフサイクルに深く統合

詳細を見る

GitHubはAgenttic Workflowsを発表し、AIエージェントがリポジトリのタスク（コードレビュー、PR作成、ドキュメント更新など）を自動化できる機能を提供します。開発プロセス全体のエージェント化が加速しています。

OpenAIは同時期にCodexとSoraの利用上限引き上げとアクセス拡大を発表しました。コーディングとビジュアル生成という二つの重要なAI機能のスケールが多くの開発者に開放されます。

この組み合わせは、コード生成だけでなくUI/UXのプロトタイピングにも活用できる統合的な開発環境を示唆しており、ソフトウェア開発の未来像として注目されます。

出典：GitHub公式 | OpenAI公式

CodexとClaudeがカスタムGPUカーネルを全ユーザーに解放

2026年02月13日 Claude Codex エンジニア専門家推論 GPU

GPU最適化の民主化

カスタムカーネル生成がAI支援で一般開発者に解放

CUDA専門知識なしでGPU最適化を実現

AI推論コストの削減を広く可能に

詳細を見る

CodexとClaudeのコード生成能力を組み合わせて、専門知識なしでカスタムGPUカーネルを生成できる機能が全ユーザーに開放されました。これまでCUDA専門家のみが担えたGPU最適化がAIの力で民主化されます。

カスタムGPUカーネルは特定の計算ワークロードに対してGPU使用効率を大幅に改善できますが、その開発には深い専門知識が必要でした。AIによる生成でこの技術的障壁が大幅に下がります。

この機能はMLエンジニアや研究者が推論効率を最大化する際の重要なツールとなります。自社AI推論のコスト削減に取り組む企業にとって実務的な価値があります。

出典：Hugging Face

HarnessがCodexでエージェントファースト開発を5ヶ月実践した知見

2026年02月11日 OpenAI Codex 開発ツール CI/CD 日本エージェント

実践から得た知見

5ヶ月間のCodex活用実験の成果を公開

エージェントファーストの開発体制への移行

実務での課題と成功パターンを詳説

詳細を見る

CI/CDプラットフォームのHarnessは、OpenAIのCodexを活用したエージェントファースト開発の5ヶ月間にわたる実験結果を公開しました。実際の製品機能の構築・出荷にエージェントを活用した現場レポートとして注目されます。

実験から得られた主な知見として、エージェントは繰り返しのルーティン作業では高い効果を発揮する一方、複雑な依存関係のある機能開発では人間の監督が依然として必要であることが確認されました。

このような実践からの学びは、AI開発ツールの導入を検討する企業にとって非常に参考になります。理論ではなく実際の開発現場での課題と解決策が語られており、日本の開発チームにも応用可能な示唆が含まれています。

出典：OpenAI公式

OpenAI Codexアプリが1週間で100万ダウンロード突破

2026年02月09日 OpenAI GitHub ChatGPT Copilot GitHub Copilot Codex Windows 生産性エコシステムエンジニアコーディングサム・アルトマン Cursor Windsurf

成長と影響

Mac専用Codexアプリが1週間で100万DL達成

全体Codexユーザーが前週比60%増

Sam AltmanがX上で自らマイルストーンを発表

ChatGPT初期リリース時の爆発的成長を想起させる

AIコーディング市場での存在感を急速に拡大

競争環境への影響

GitHub Copilot・Cursor・Windsurf等との競争激化

OpenAIがコーディングツール市場に本格参入

月間アクティブユーザー3億人超のChatGPTを基盤に展開

開発者市場でのシェア争いが本格化

AI支援コーディングの主流化を加速

詳細を見る

OpenAIのCEO Sam AltmanはX上で、Mac向けの独立したCodexアプリケーションがリリース後1週間で100万ダウンロードを突破したと発表しました。これは全体のCodexユーザー数の前週比60%増を反映しています。

この成長速度は2022年末のChatGPT初期公開時の爆発的普及を想起させます。AI コーディングツール市場はGitHub Copilot、Cursor、Windsurfなどが激戦を繰り広げており、OpenAIはChatGPTの巨大ユーザーベースを武器に参入しました。

Codexアプリは現在Mac限定ですが、複数の並行AIコーディングタスクを実行できる機能を提供しています。3億人超の月間アクティブユーザーを持つChatGPTのエコシステムと連携した展開が今後の競争力の鍵となります。

AI支援コーディングの主流化は、ソフトウェアエンジニアの生産性に直接影響を与える重要なトレンドです。1週間での100万DLという数字は、開発者コミュニティにおけるOpenAIへの信頼と需要の高さを示しています。

今後のWindows版展開やエンタープライズ機能の拡充が注目されます。コーディングツール市場でのシェア争いは、AI企業のデベロッパー戦略の試金石となりそうです。

出典：VentureBeat

OpenAIがGPT-5.3-Codexを発表、コーディング超えたエージェント戦略

2026年02月05日 OpenAI Anthropic Claude Codex GPT-5 Opus エンジニアリスクコーディングデプロイエージェント

GPT-5.3-Codexの特徴

コーディング以外にも対応拡大

エージェント型タスク実行が強み

システムカードでリスク開示

プログラミング自律完遂能力

Claude Opus 4.6と同日リリース

AI競争の激化を象徴

開発者・企業への影響

複雑な業務自動化が可能に

デプロイパイプラインへの統合

コスト対性能の比較検討が必要

詳細を見る

OpenAIは2026年2月5日、新しいコーディングエージェントモデル「GPT-5.3-Codex」を発表した。AnthropicのClaude Opus 4.6とほぼ同日のリリースとなり、AI競争の激化を示した。

GPT-5.3-Codexはコード生成に特化した従来のCodexシリーズを進化させ、コーディング以外のエージェントタスクにも対応する汎用性を持つ。

OpenAIはシステムカードでモデルの能力・制限・安全性評価を詳細に開示しており、エンタープライズ顧客が導入判断をしやすい体制を整えた。

Arstechnicaの報道によれば「Codexはもはやコードを書くだけではない」とされ、複雑な業務プロセス全体を自律的に遂行できる能力が確認されている。

GPT-5.3-Codexとプレスの発表はOpenAIのエンタープライズ向けエージェントプラットフォーム戦略の一環で、Frontierとの統合でさらなる相乗効果を狙っている。

出典：OpenAI公式 | OpenAI公式 | Ars Technica | TechCrunch | VentureBeat

AnthropicがClaude Opus 4.6を公開、100万トークンとエージェントチーム機能

2026年02月05日 OpenAI Anthropic Claude Codex 生産性 GPT-5 Opus 推論コーディングエージェントコンテキスト

Opus 4.6の主要機能

100万トークンコンテキストウィンドウ

エージェントチーム機能を初搭載

コーディング超えた汎用性を強調

OpenAI Codexに正面から対抗

推論速度の大幅改善も実現

複数エージェントの協調動作が可能

市場・競合へのインパクト

AIコーディング市場の競争激化

エンタープライズ需要の取り込みを狙う

スーパーボウル直前の戦略的発表

詳細を見る

Anthropicは2026年2月5日、最新の大型モデル「Claude Opus 4.6」を公開した。100万トークンのコンテキストウィンドウと、複数AIが協調する「エージェントチーム」機能が目玉だ。

100万トークンのコンテキストは従来の4〜8倍以上の情報を一度に処理できることを意味し、大規模コードベースの解析や長文書類の一括処理が現実的になった。

「エージェントチーム」はClaude同士が役割分担して複雑なタスクを遂行する仕組みで、ソフトウェア開発・リサーチ・分析業務での生産性向上が期待される。

リリースのタイミングはOpenAIのGPT-5.3-Codex発表とほぼ同日で、スーパーボウルの週という注目度の高い時期を両社が狙ったことが読み取れる。

Claude Opus 4.6の登場はコーディング特化モデルから汎用エージェントAIへのシフトを明確にしており、企業の業務自動化プロジェクトに直接応用可能な水準に達した。

出典：The Verge | TechCrunch | VentureBeat | Anthropic公式 | The Verge

GitHubがClaudeとCodexのAIコーディングエージェントを統合

2026年02月04日 OpenAI Anthropic GitHub Claude Copilot Codex 生産性ワークフローエンジニアコーディングコードレビューエージェントコンテキスト

統合の詳細と利用条件

GitHub・VS CodeでClaudeとCodexが利用可能

Copilot Pro+または Enterprise向け

GitHub Mobileでもエージェント操作対応

Agent HQで一元管理が可能

OpenAI CodexのApp Server構築詳細公開

コンテキスト切り替え摩擦の削減が目的

開発者への影響

マルチエージェントコーディング環境実現

PR作成からコードレビューまで自動化

AIコーディング市場での競争激化

詳細を見る

GitHubは2026年2月4日、AnthropicのClaude とOpenAIのCodexを直接GitHub上で利用できるパブリックプレビューを開始した。対象はCopilot Pro+またはCopilot Enterpriseのサブスクリプションユーザーだ。

この統合によりGitHub、GitHub Mobile、Visual Studio Codeの各環境からAIコーディングエージェントをシームレスに呼び出せるようになり、開発ワークフローの断絶が大幅に解消される。

Agent HQと呼ばれる新インターフェースにより、ClaudeとCodexを一元的に管理し、タスクに応じて最適なエージェントを選択することができる。

OpenAIはCodexのApp Server構築の技術的詳細を公開し、複数サーフェス（Webアプリ、CLI、API）での一貫した動作を実現する仕組みを説明した。

GitHubへのAIエージェント統合は開発者の生産性向上に大きく寄与すると期待されており、AIコーディングツール市場における競争の新たな軸になっている。

出典：The Verge | GitHub公式 | OpenAI公式

AppleのXcode 26.3がClaudeとCodexを統合しエージェントコーディング時代へ

2026年02月03日 OpenAI Anthropic Apple Claude iOS Claude Code Codex MacOS 生産性エコシステムエンジニアコーディングエージェント MCP Intel

Xcode 26.3の新機能

Claude Agent SDKの統合

OpenAICodexのネイティブ対応

MCPプロトコルでの接続

開発者への影響

Appleプラットフォーム向けエージェント開発

Xcodeが主要AIツールの窓口に

iOS・macOS開発の生産性向上

詳細を見る

AppleはXcode 26.3でAnthropicのClaude Agent SDKとOpenAIのCodexを統合し、Appleプラットフォーム向けアプリ開発に本格的なエージェントコーディング機能を追加しました。

この統合はModel Context Protocol（MCP）を介して行われており、開発者はXcode内から直接Claude CodeやCodexのエージェント機能を呼び出してコード生成・リファクタ・テストを自動化できます。

AnthropicのClaude Agent SDK対応により、iOS・macOS向けアプリにAIエージェント機能を組み込む開発が格段に容易になり、Apple Intelligenceとの連携も視野に入ります。

Xcodeが複数のAIプロバイダーに対応することで、開発者は好みのAIモデルを選択でき、ベンダーロックインを回避しながらAI補助開発を享受できます。

この発表はAppleが独自AIモデルだけでなく、外部AIエコシステムとのオープンな統合戦略を採用していることを示す重要なシグナルです。

出典：VentureBeat | The Verge | Anthropic公式 | Ars Technica | TechCrunch

AlibabaのQwen3-Coder-Nextがバイブコーダー向けの強力なオープンソースモデルに

2026年02月03日 OpenAI GitHub Claude Copilot Claude Code GitHub Copilot Codex Qwen エンジニアコーディングバイブコーディング中国オープンソースモデル

モデルの特徴

超スパースアーキテクチャ採用

バイブコーディング特化設計

オープンソースで無料利用可能

競争への影響

Claude Code・Codexへの対抗

中国AIオープンソースの躍進

開発者コスト削減効果

詳細を見る

アリババのQwenチームは、バイブコーディングユーザー向けに最適化されたオープンソースの超スパースモデル「Qwen3-Coder-Next」を公開しました。高い性能と低い計算コストを両立する超スパースアーキテクチャが特徴です。

超スパースモデルは、活性化されるパラメータが全体の一部に限られるため、同等性能のデンスモデルより低コスト・低レイテンシーで動作し、ローカル実行も現実的になります。

Claude Code・OpenAI Codex・GitHub Copilotなど有料コーディングAIに対し、高品質なオープンソース代替を提供することは、コスト重視の開発者や企業への強い訴求力を持ちます。

Qwen3の一連のリリースは、中国のAI研究コミュニティがグローバルなオープンソースAIリーダーとして台頭していることを改めて示しています。

開発者にとってQwen3-Coder-Nextは実用的な選択肢であり、コーディングAIの競争激化がすべての開発者に恩恵をもたらします。

出典：VentureBeat

OpenAIがmacOS向けCodexデスクトップアプリを発表、並列AIコーディングエージェントを実現

2026年02月02日 OpenAI Anthropic GitHub Claude Copilot Claude Code GitHub Copilot Codex MacOS アシスタントエンジニアリスクコーディングコードレビューエージェント Cursor Windsurf

Codexアプリの機能

複数エージェントの並列実行

長時間タスクの管理

Claude Codeへの対抗

開発者への影響

コーディングパラダイムの転換

チーム型AI開発の実現

macOSネイティブ体験

詳細を見る

OpenAIは2026年2月2日、macOS向けのCodexデスクトップアプリを発表しました。単一のAIアシスタントとの対話型開発から、複数のAIエージェントが並列で異なるタスクを実行する「チーム型開発」への転換を可能にします。

Codexアプリは長時間実行タスクの管理・複数エージェントへの作業分配・進捗の可視化などの機能を持ち、Anthropicの人気ツールClaude Codeへの直接的な対抗として位置付けられています。

開発者にとってこれは、単に作業速度が上がるだけでなく、アーキテクチャレベルで複数の問題を同時に解決するという新しい開発モデルへの移行を意味します。

ただしエージェント型開発は適切なテスト・コードレビュー・ロールバック計画なしには技術的負債を急増させるリスクもあり、エンジニアリング文化の成熟も必要です。

この発表はAIコーディングツール競争の激化を示しており、GitHub Copilot・Cursor・Windsurf等との競争がさらに激しくなるでしょう。

出典：OpenAI公式 | VentureBeat | Ars Technica

OpenAIがCodexエージェントループの内部設計を公開

2026年01月23日 OpenAI Codex エンジニアコーディングデバッグエージェント

アーキテクチャの詳細

Codexのエージェントループ

マルチステップコード生成

テスト・デバッグの自動化

自律的なコーディングの実現

開発者への示唆

エージェント型AIの設計パターン

ループ設計の考え方

失敗回復の仕組み

実装の参考事例

詳細を見る

OpenAIはCodex コーディングAIエージェントのループ設計を詳細に解説したブログ記事を公開した。計画・実行・テスト・修正というエージェントループの全工程を明らかにした。

エージェントが自律的にコードを書き、テストし、失敗から学んで修正する過程の設計原則が示されており、AI開発者にとって重要なアーキテクチャ参考資料となる。

この公開は、エージェント型AIの設計パターンへの理解を深め、自律コーディングエージェントの次世代開発を加速させると見られる。

出典：OpenAI公式

DatadogがOpenAI Codexでシステムレベルのコードレビューを実現

2026年01月09日 OpenAI Codex AI活用エンジニア脆弱性セキュリティコーディングコードレビュー CI/CD

大規模コードレビューの自動化

DatadogがOpenAI Codexを使ったシステムコードレビューを展開

数百万行規模のコードベースを自動的にレビュー

セキュリティ脆弱性・品質問題・パフォーマンス改善を検出

人間の reviewer では見落としやすい問題を発見

CI/CDパイプラインに統合してプルリクエスト毎に自動実行

開発速度を落とさずにコード品質を維持

詳細を見る

OpenAIが紹介したDatadogの事例では、Codexを使ってシステム全体のレベルでのコードレビューを自動化しています。個々のプルリクエストを審査するだけでなく、コードベース全体の整合性を評価する仕組みを構築しています。

Datadog社内のコードリポジトリは巨大であり、人間のレビュアーだけでは全体的な品質維持が困難です。Codexによる自動スキャンは、セキュリティ脆弱性、パフォーマンスのアンチパターン、コーディング規約違反などを一括してフラグアップします。

この事例はSREやプラットフォームエンジニアにとって参考になるAI活用パターンです。大規模なマイクロサービスアーキテクチャを持つ企業ほど、Codexのようなシステムレベルのコードレビュー自動化の価値が高まります。

出典：OpenAI公式

Graphite買収の意義

AIコードレビューツールGraphiteを買収

評価額2.9億ドル超の価格で取得

スタックPRで並行開発が可能

生成から出荷まで一貫環境構築

AIコーディング対決

4大エージェントがマインスイーパー対決

音声・モバイル対応も同一課題で評価

盲検判定で公平な比較を実施

最前線モデルの精度向上を確認

詳細を見る

AIコーディングアシスタントのCursorは、AIを活用したコードレビュー・デバッグツールのGraphiteを買収したと発表しました。買収額は非公開ですが、Graphiteの直近評価額2.9億ドルを大幅に上回ると報じられています。

Graphiteの主要機能であるスタック型プルリクエストは、承認待ちなしに複数の依存変更を並行して扱えるワークフローを提供します。AIが生成したコードのバグ修正サイクルを大幅に短縮する可能性があります。

Cursorは11月にも採用戦略会社Growth by Designを買収するなど積極的なM&A;を展開しており、評価額290億ドルの同社がAI開発の全工程を統合した環境構築を目指していることがわかります。

Ars Technicaは4つの主要AIコーディングエージェント（Codex/GPT-5、Claude Code/Opus 4.5、Gemini CLI、Mistral Vibe）にマインスイーパーを再実装させる比較実験を行いました。音声エフェクト・モバイル対応・サプライズ機能付きの完全版ゲームが課題です。

各エージェントはHTML/JavaScriptファイルを直接操作し、ブラインド評価で結果が審査されました。AIコーディングツールへの開発者の信頼が揺れるなかで、最前線モデルが着実に精度向上を遂げていることが示されました。

出典：TechCrunch | Ars Technica

Claude 4コーデックスとReplit安全技術

2025年12月18日 OpenAI Anthropic Replit Claude Codex セキュリティコーディングエージェントコンテキスト

コーデックス詳細

コーデックスがGAで正式提供開始

CVE-Benchで87%を記録

長期セッションも文脈維持

防衛用途に段階的解放

Replit安全基盤

スナップショットで即座にロールバック

並列サンドボックスで複数解法試行

エージェント暴走を技術的に防止

詳細を見る

AnthropicはAIコーディングエージェント「Claude 4 Codex」を正式リリースしました。複数ファイルにわたる複雑な実装タスクを高い精度で自律的にこなします。

コンテキスト圧縮技術により、大規模リポジトリを横断する長期セッションでも文脈を正確に保ちながら継続作業ができ、複雑なタスクの長時間自律実行を安定して実現しています。

サイバーセキュリティ評価のCVE-Benchでは87%のスコアを記録し、従来モデルを大幅に上回る性能を示すことで防衛的セキュリティ用途への適用可能性を証明しました。

OpenAIは信頼できるセキュリティ研究者向けに防衛的サイバーセキュリティのパイロットプログラムを開始し、審査を通過したパートナーから順次利用範囲を段階的に拡大していく方針を明示しています。

ReplitはAIエージェントを安全に運用するための「スナップショットエンジン」の技術詳細を公式ブログで公開し、オープンソースコミュニティへの知見共有に貢献しました。

このスナップショット技術により、AIエージェントが誤った変更を加えた場合でも即座に以前の正常な状態へロールバックすることが技術的かつ確実に保証されており、安全性が大きく高まります。

今後は並列サンドボックスで複数の解法を同時試行する「並列サンプリング」機能の拡充も開発ロードマップに含まれており、エージェントの問題解決精度のさらなる向上が幅広い領域で期待されています。

出典：OpenAI公式 | VentureBeat | blog.replit.com

CodexでSora Androidを28日で開発

2025年12月12日 Google OpenAI Sora Android iOS Codex ワークフロー動画生成 GPT-5 エンジニア品質保証動画コーディングコードレビューエージェントコンテキスト

わずか4人のチームが実現した高速リリース

4人のエンジニアがCodexと並走し28日で本番リリース

GPT-5.1-Codexモデルを使用、誰でも利用可能な同バージョン

Play Storeで初日1位、24時間で動画生成100万件超

クラッシュフリー率99.9%の高品質を維持

コード全体の約**85%**をCodexが生成

iOSコードをKotlinへ意味保持で翻訳、クロスプラットフォーム開発を代替

Codexを最大活用するための実践的ワークフロー

AGENT.mdでアーキテクチャ方針を明文化しセッション間の一貫性を確保

まず理解・計画フェーズを経てから実装を依頼する手順が安定稼働の鍵

複数セッションを並列実行し、playback・search・エラー処理を同時進行

大規模タスクでは計画書をファイル保存してコンテキスト超過に対処

コードレビューにもCodexを活用し、マージ前のバグ検出に貢献

ボトルネックはコード執筆からアーキテクチャ判断・フィードバックへ移行

詳細を見る

OpenAIのエンジニアリングチームは、AIコーディングエージェント「Codex」を活用し、SoraのAndroidアプリをわずか28日で開発・グローバルリリースしました。投入したエンジニアはわずか4名であり、従来の開発常識を大きく覆す成果となっています。

使用したモデルはGPT-5.1-Codexの早期版であり、現在は誰でも利用できるバージョンと同一です。リリース初日にGoogle Play Storeで1位を獲得し、Androidユーザーは24時間で100万本以上の動画を生成しました。クラッシュフリー率は99.9%を維持しており、品質面でも従来型の開発プロセスと遜色ありません。

開発全体を通じてコードの約85%をCodexが生成しました。チームはアーキテクチャ設計・依存性注入・ナビゲーション構造などの基盤を自ら実装し、その上でCodexにパターンを学習させる方針を採りました。「動くものを速く作る」のではなく「我々のやり方で動くものを作る」という考え方が成功の核心です。

Codexを安定運用するうえで重要だったのは、AGENT.mdファイルへのスタイルガイドやパターンの明文化です。セッションをまたいで同じ指針を適用できるため、複数の並列タスクが同一のコーディング規約に従って進行しました。

実装前に理解・計画フェーズを設けるワークフローも効果的でした。Codexに関連ファイルを読ませてデータフローを説明させ、チームが認識を修正したうえで設計書を作成し、その計画に沿って実装を指示する手順により、長時間の無監視実行が可能になりました。

また、iOSの既存コードベースをKotlinへ翻訳する作業にもCodexを活用しました。アプリケーションロジックはSwiftでもKotlinでも本質的に同じであり、Codexが意味を保持したまま変換することで、クロスプラットフォームフレームワーク不要の開発スタイルが実現しました。

OpenAIの内部では、Codex自体の開発にもCodexが活用されており、「CodexのほぼすべてがCodexで構築されている」とプロダクトリードが明かしています。AI支援開発はツールの改善にも帰還的に適用される段階に達しています。

今回の事例は、AI支援開発がエンジニアの仕事を省力化するのではなく、アーキテクチャ設計・意思決定・品質管理といった高付加価値の業務に集中させる方向へシフトさせることを示しています。明日のソフトウェアエンジニアに求められるのは、深いシステム理解とAIとの長期的な協働能力です。

出典：OpenAI公式 | Ars Technica

GitHubが提唱するAI自動最適化の新概念

2025年12月12日 OpenAI マイクロソフト GitHub Claude Claude Code Flow Codex ワークフローデザインエンジニア推論エージェントベンチマーク

Continuous Efficiencyとは何か

グリーンソフトウェアとContinuous AIを融合した新概念

コードベースの継続的・自動的な効率改善を目指す取り組み

GitHub NextとGitHub Sustainabilityチームが共同で開発

自然言語（Markdown）でワークフローを記述できる実験的フレームワーク

Claude CodeやOpenAI Codexなど複数のAIエンジンに対応

現在はオープンソースの研究プロトタイプとして公開中

実証された主な活用事例

グリーンソフトウェアルールをコードベース全体に自動適用

RegExp最適化PRがnpm月5億DL超プロジェクトでマージ済み

Web持続可能性ガイドライン（WSG）の自動適用も実施

「Daily Perf Improver」によるFSharp.Control.AsyncSeqのパフォーマンス改善を確認

リポジトリ構造に応じてビルド・ベンチマーク手順を自動推論

マイクロベンチマーク駆動の最適化PRが複数マージ済み

詳細を見る

GitHubは「Continuous Efficiency」と呼ぶ新しいエンジニアリング手法を提唱しました。これはグリーンソフトウェアの知見とContinuous AIを組み合わせ、コードの効率を継続的かつ自動的に改善するアプローチです。

同手法の基盤となるのが「Agentic Workflows」と呼ばれる実験的フレームワークです。エンジニアはYAMLやスクリプトの代わりにMarkdownで意図を記述し、GitHub Actions上でAIエージェントが自律的にタスクを実行します。

グリーンソフトウェアに関しては、月間5億回以上ダウンロードされるnpmパッケージにRegExpのホイスティング最適化を適用し、プルリクエストが承認・マージされました。小さな改善でも、スケールすることで大きな効果をもたらすことが実証されました。

Web持続可能性ガイドライン（WSG）のワークフローでは、GitHubおよびMicrosoftのWebプロパティに対してスクリプト遅延読み込みやネイティブブラウザ機能の活用など複数の改善機会を発見・修正しました。

パフォーマンスエンジニアリングへの応用では、「Daily Perf Improver」が三段階のワークフローを通じてリポジトリのビルド・ベンチマーク手順を自動推論し、FSharp.Control.AsyncSeqで実測可能な改善を実現しました。

AIエージェントは自然言語で記述されたルールを解釈し、コード全体に横断的に適用できます。従来の静的解析やリンターを超えた意味的な汎用性と、PRやコメントとして実装まで行うインテリジェントな修正が特徴です。

現時点では研究デモンストレーター段階であり、変更や誤りが生じる可能性もあります。GitHubはアーリーアダプターやデザインパートナーの参加を呼びかけており、今後さらなるルールセットやワークフローの公開を予定しています。

出典：GitHub公式

Codex、HF Skills連携でOSSモデル訓練可能に

2025年12月11日 OpenAI Claude Claude Code Codex エンジニアファインチューニングインフラコーディングエージェントオープンソースモデル Hugging Face

統合の機能

ファインチューニングとRL整合

トレーニングメトリクスの監視

チェックポイント評価と報告作成

GGUF量子化とHub公開

意義と展望

Claude Codeに続く統合

AGENTS.mdでリポジトリ設定

コーディングエージェントとMLOpsの融合

OSS開発の民主化に貢献

詳細を見る

Hugging Faceが、OpenAIのコーディングエージェント「Codex」にHugging Face Skillsリポジトリを統合しました。先行してClaude Codeで実現された機能に続くもので、Codexがオープンソースモデルの訓練から公開まで一連のMLタスクを実行できるようになります。

HF Skillsにより、Codexは言語モデルのファインチューニング、RL整合の適用、Trackioからのリアルタイムメトリクス監視、チェックポイント評価、実験レポート作成、GGUF量子化、Hugging Face Hubへの公開が可能です。AGENTS.mdファイルによるリポジトリレベルの設定に対応しています。

この統合は、コーディングエージェントとMLOpsプラットフォームの融合における重要な進展です。ソフトウェア開発とML エンジニアリングの壁を低くし、専門的なMLインフラの知識がないチームでもオープンソースモデル開発に取り組める環境の実現に貢献します。

出典：Hugging Face

OpenAI、自律防衛AI「Aardvark」公開　脆弱性を自動修正

2025年12月10日 OpenAI Codex エコシステム GPT-5 専門家推論リスク脆弱性パッチセキュリティエージェント

AIの攻撃・防御能力が急伸

GPT-5.1のCTFスコアが76%に到達

8月の27%から3ヶ月で約3倍に急成長

次期モデルはゼロデイ攻撃可能な水準を想定

自律型セキュリティAIの投入

コード全体の脆弱性を発見し修正パッチを提案

すでにOSSで新規CVEを発見する実績

一部OSSリポジトリには無償提供を計画

安全なエコシステムの構築

専門家によるフロンティア・リスク評議会を設置

防御目的の利用者に信頼されたアクセスを提供

詳細を見る

米OpenAIは2025年12月10日、AIのサイバーセキュリティ能力向上に対応する新戦略を発表しました。同時に、脆弱性を自律的に発見・修正するAIエージェント「Aardvark」のベータ版を公開。最新モデル「GPT-5.1」のCTFスコアが76%に達するなど能力が急伸する中、防御側の体制強化を急ぎます。

最新の評価では、AIのハッキング能力が劇的に向上しています。2025年8月時点で27%だった「GPT-5」のCTF（旗取りゲーム）スコアは、11月の「GPT-5.1-Codex-Max」で76%へと約3倍に跳ね上がりました。同社は次期モデルが未知の脆弱性を突く「ゼロデイ攻撃」も可能な水準に達すると予測しています。

防御力強化の切り札として投入されたのが、自律型セキュリティ研究エージェント「Aardvark」です。コードベース全体を推論して脆弱性を特定し、修正パッチまで提案します。すでにオープンソースソフトウェア（OSS）において新規の脆弱性（CVE）を発見する実績を上げており、一部の非営利OSSには無償提供される計画です。

技術提供に加え、組織的な安全対策も強化します。新たに「フロンティア・リスク評議会」を設置し、外部のセキュリティ専門家と連携してリスク境界を定義します。また、防御目的の研究者や企業に対して、より強力なモデル機能へのアクセス権を付与する「信頼されたアクセスプログラム」の導入も予定しており、エコシステム全体の強化を図ります。

出典：OpenAI公式

Vercel、OpenAI最新「GPT-5.1 Codex Max」対応

2025年12月05日 OpenAI Vercel Codex GPT-5 エンジニア推論コーディング

長時間開発に特化した進化

現実の開発タスクで学習

長時間の文脈維持が可能

従来より高速・高効率

導入と運用のメリット

統一APIで即座に利用

詳細なオブザーバビリティ

自動リトライで障害対策

詳細を見る

Vercelは2025年12月5日、同社のAI GatewayにおいてOpenAIの最新モデル「GPT-5.1 Codex Max」が利用可能になったと発表しました。開発者は個別のプロバイダー契約を結ぶことなく、即座にこの強力なモデルをアプリケーションに統合できます。

特筆すべきは「Compaction」技術による最適化です。現実世界の開発タスクで学習されたこのモデルは、複数の文脈にまたがる長時間のコーディング作業でも、セッションを中断することなく推論と文脈を維持し続けることができます。

性能面でも進化を遂げており、従来のCodexモデルと比較して処理速度とトークン効率が向上しました。AI SDKでモデル名を指定するだけで利用でき、複雑なエンジニアリングタスクの自動化において威力を発揮します。

AI Gatewayを経由することで、開発者は単なるモデル利用にとどまらず、使用量やコストの追跡、自動リトライによる安定性向上といった恩恵を受けられます。企業レベルの信頼性が求められる開発現場にとって、強力な選択肢となるでしょう。

出典：vercel.com

OpenAI新モデル、長時間自律開発で生産性7割増を実現

2025年11月19日 Google OpenAI Gemini ChatGPT Codex 生産性ネットワーク GPT-5 エンジニア推論セキュリティコーディングデバッグリファクタリングエージェントコンテキスト

コンテキスト制限を打破する技術

「コンパクション」で数百万トークンを処理

24時間以上の長時間タスクを自律的に完遂

推論トークンを30%削減しコストを低減

競合を凌駕する圧倒的性能

SWE-benchで77.9%を記録し首位

GoogleのGemini 3 Proを上回る

社内エンジニアのPR出荷数が約70%増加

CLIやIDEなどの開発環境で即利用可能

詳細を見る

OpenAIは2025年11月19日、エージェント型コーディングモデル「GPT-5.1-Codex-Max」を発表しました。数百万トークンの文脈を維持し、長時間にわたる開発タスクを自律遂行可能です。エンジニアの生産性を劇的に高める革新的なツールとして注目されます。

最大の特徴は、新技術「コンパクション」の搭載です。作業履歴を圧縮して記憶を継承することで、コンテキスト制限を克服しました。これにより、大規模なリファクタリングや24時間以上続くデバッグ作業など、従来は不可能だった複雑な長期タスクを完遂できます。

性能面では、Googleの最新モデル「Gemini 3 Pro」を主要指標で上回りました。SWE-bench Verifiedでは77.9%の正答率を記録し、業界最高水準を達成。さらに推論プロセスの最適化によりトークン使用量を30%削減し、コスト効率も向上させています。

ビジネスへの貢献も実証済みです。OpenAI社内ではエンジニアの95%が日常的に利用し、導入後のプルリクエスト出荷数が約70%増加しました。単なる支援ツールを超え、開発速度と品質を底上げする「自律的なパートナー」として機能しています。

本モデルは現在、ChatGPT PlusやEnterpriseプラン等のCodex環境で利用可能で、API提供も近日中に開始されます。デフォルトでサンドボックス環境にて動作し、ネットワークアクセスも制限されるなど、企業が安心して導入できるセキュリティ設計も徹底されています。

出典：OpenAI公式 | OpenAI公式 | VentureBeat

OpenAI、企業顧客100万人突破史上最速で成長

2025年11月05日 OpenAI ChatGPT Codex 生産性 AI活用 GPT-5 画像音声コードレビュー投資 Canva

驚異的な成長スピード

企業顧客数が100万人を突破

史上最速のビジネスプラットフォーム

Enterprise版シート数は前年比9倍

Work版シート数は700万席を突破

生産性を高める新機能群

GPT-5搭載のAgentKitで業務自動化

Codexでコードレビュー時間を半減

マルチモーダル対応で多様な業務へ

企業の75%がプラスのROIを報告

詳細を見る

OpenAIは、法人向けサービスの利用企業が世界で100万社を突破し、史上最速で成長するビジネスプラットフォームになったと発表しました。ChatGPT for Workのシート数も700万席を超え、2ヶ月で40%増と急拡大しています。消費者向けChatGPTの普及を背景に、業務自動化を支援する新ツール群も投入し、企業のAI活用を後押しします。

企業向けサービスの勢いは数字にも表れています。有料の法人顧客は100万人を超え、特に大企業向けのChatGPT Enterpriseのシート数は前年比で9倍に達しました。この成長は、AIが単なる実験的ツールから、事業運営に不可欠な基盤へと移行している現状を明確に示しています。

この急成長の背景には、消費者向けChatGPTの圧倒的な普及があります。週に8億人が利用するサービスに慣れ親しんでいるため、従業員が抵抗なく業務でAIを使い始められます。これにより、企業は導入時の摩擦を減らし、投資対効果（ROI）を早期に実現できるのです。

OpenAIは企業の本格導入を支援するため、新ツール群も発表しました。社内データと連携する「AgentKit」や、コード生成を支援する「Codex」の利用が急増。画像や音声も扱えるマルチモーダル機能も強化し、より幅広い業務での活用を可能にしています。

実際に多くの企業が成果を上げています。ウォートン校の調査では、導入企業の75%がプラスのROIを報告。求人サイトIndeedは応募数を20%増加させ、シスコはコードレビュー時間を半減させるなど、具体的なビジネス価値を生み出しています。

自社ツールへの組み込みも進んでいます。CanvaやShopifyなどがChatGPTと連携し、新たな顧客体験を創出しています。OpenAIは、単なるツール提供者にとどまらず、「仕事のOS」を再定義するプラットフォームとなることを目指しており、その動きは今後さらに加速しそうです。

出典：OpenAI公式

Sora、無料枠超過分の有料販売を開始

2025年10月31日 OpenAI Apple Sora App Store Codex 動画生成クリエイター動画コーディング

有料化の背景と価格

無料モデルは「持続不可能」と判断

パワーユーザーの強い需要に対応

10回の追加生成で4ドル

App Store経由で購入可能

今後の収益化計画

将来的な無料生成枠の削減を示唆

クリエイター向け収益化策を検討

権利者への収益分配も視野に

詳細を見る

動画生成AI「Sora」を開発するOpenAIは、無料の動画生成枠を使い切ったユーザー向けに、追加クレジットの有料販売を開始しました。Soraチームを率いるBill Peebles氏は、現在の無料提供モデルの経済性は「完全に持続不可能」であると指摘。パワーユーザーの旺盛な需要に応えつつ、事業の持続可能性を確保する狙いです。

追加クレジットは、AppleのApp Storeを通じて購入できます。価格は10回の追加生成あたり4ドルに設定されています。ただし、生成する動画の長さや解像度によって消費クレジット数は変動します。購入したクレジットの有効期限は12ヶ月で、OpenAIのコーディングプラットフォーム「Codex」でも利用可能です。

有料化に踏み切った背景には、膨大な計算コストがあります。Peebles氏は「パワーユーザーは現在の無料生成枠に満足していないことは明らかだ」と述べ、有料で必要なだけ生成できる選択肢を提供する必要性を強調しました。これにより、ユーザーは制限を気にすることなく創作活動に打ち込めるようになります。

さらに同氏は、将来的には無料の生成枠を削減する必要があるとも警告しています。「成長に対応するため、いずれ無料生成数を引き下げる必要がある」と述べ、変更がある場合は事前に透明性を持って告知する方針です。現在の寛大な無料枠がいつまで続くか、動向が注目されます。

今回の動きは、Soraを中心としたAIクリエイターエコノミー構築に向けた、より広範な収益化戦略の一環です。OpenAIは近く、クリエイター向けの収益化プログラムを試験的に開始する予定であり、人気キャラクターなどの権利者が利用料を設定できる仕組みも構想しています。

出典：The Verge

独HYGH、ChatGPTで開発爆速化、週2MVP達成

2025年10月10日 OpenAI ChatGPT Codex 生産性 AI活用ワークフロー広告クリエイティブエンジニア創業者インフラドイツ

開発プロセスの革新

MVP開発が月単位から週単位へ

会議録からPRDを自動生成

Codex活用で即時プロトタイピング

インフラ移行計画の工数を削減

全社的な生産性向上

従業員1人あたり週5.5時間を節約

広告モックアップ作成の高速化

毎週のベストプラクティス共有会

売上増、納期短縮を実現

詳細を見る

ドイツのデジタルメディア企業HYGHが、OpenAIのChatGPT Businessを導入し、開発速度とキャンペーン提供のあり方を根本から変革しています。同社はAI活用により、ソフトウェア開発のリードタイムを数ヶ月から数日に短縮。従業員一人あたり週平均5.5時間の労働時間を削減し、週に2つのMVP（実用最小限の製品）をリリースできる体制を構築しました。この取り組みは、生産性と収益性の向上に直結しています。

特に大きな変革を遂げたのが、ソフトウェア開発の現場です。かつては1〜2ヶ月を要したMVP開発は、今や週に2本リリースする驚異的なペースを達成しました。会議の録音から製品要求仕様書（PRD）をAIが自動生成し、開発者はCodexを用いて即座にプロトタイプを構築します。これにより、アイデアから製品化までのサイクルが劇的に短縮されました。

AIの恩恵はクリエイティブ業務にも及びます。広告代理店部門では、これまで時間のかかっていた広告キャンペーンのモックアップ作成が大幅に高速化。ChatGPTが広告コピーやビジュアルの草案を生成することで、顧客への提案速度と選択肢が向上し、チームはより創造的な業務に集中できるようになりました。

同社は全社的なAI活用を推進しています。ChatGPT Businessへの移行により、共有ワークスペースや管理機能、GDPRに準拠したデータ保護が確保されました。共同創業者のアントニウス・リンク氏は「売上は上がり、納期は縮まり、生産性は爆発した」と成果を語ります。この成功は、AIがもたらすビジネスインパクトの大きさを物語っています。

AI活用の文化を根付かせるため、HYGHは毎週「ワークフロー水曜日」と名付けた社内勉強会を開催。従業員が自作の自動化ツールやベストプラクティスを共有し、互いに学び合うことで、組織全体のAIリテラシーが向上しました。特に若手従業員がネイティブにAIを使いこなす姿が、他の社員にも良い刺激を与えているようです。

リンク氏は「AIを使わない企業は取り残されるだろう」と断言します。AIは単なる効率化ツールではなく、アイデアをぶつけ合える『思考のパートナー』であると位置づけています。HYGHの事例は、AIを組織の隅々にまで浸透させることが、企業の競争力をいかに高めるかを示す好例と言えるでしょう。

出典：OpenAI公式

OpenAIの真の主役、Codex正式版が開発を革新

2025年10月09日 OpenAI ChatGPT App Store Codex 生産性ワークフロークリエイティブ GPT-5 エンジニアコーディングコードレビューリファクタリングサム・アルトマン投資エージェント

Codexの進化と能力

GPT-5搭載で自律コーディング

7時間超の長時間タスクも遂行

研究版から製品版へ完全移行

専用SDKでシステム統合が容易

驚異的な生産性向上

OpenAI社内で生産性70%向上

技術スタッフの92%が毎日利用

コードレビュー時間を半減

自社製品の開発もCodexで加速

詳細を見る

OpenAIが年次開発者会議「DevDay 2025」で、AIコーディング支援ツール「Codex」の正式版リリースを発表しました。ChatGPTのアプリストアなど華やかな発表の影に隠れがちですが、これがソフトウェア開発の常識を覆し、企業の生産性を飛躍させる最も重要な一手と見られています。Codexは単なるツールではなく、開発の未来を創るエンジンとなるのでしょうか。

今回の発表の核となるのが、最新モデル「GPT-5-Codex」です。これは単なるコード補完ツールではありません。まるで人間のチームメイトのように振る舞い、複雑なリファクタリング作業を7時間以上も自律的に実行できます。単純なタスクは迅速に、複雑なタスクにはじっくり取り組む「適応的思考」を備え、開発者を強力にサポートします。

その効果はOpenAI社内で実証済みです。技術スタッフの92%が日常的にCodexを利用し、コード貢献度を示すプルリクエスト数は週に70%も増加しました。自社の新製品やクリエイティブツールもCodexを用いて短期間で開発されており、この生産性向上のサイクルこそが、同社の急速なイノベーションの源泉となっているのです。

特にエンタープライズ向けに強化されたのが、コードレビュー機能です。Codexはプログラムの依存関係を深く理解し、人間のレビュアーが見逃しがちな質の高いバグを毎日数百件も発見します。これにより、開発者は品質への自信を深め、手戻りを減らすことができます。これは「より速く、より確実に出荷する」という企業の目標達成に直結します。

Codexの正式版リリースは、OpenAIのエンタープライズ市場攻略戦略の要です。サム・アルトマンCEOも「優れた製品で企業市場を勝ち取ることに大きく注力する」と明言しています。すでにCiscoのような大企業が導入し、コードレビュー時間を半減させるなどの成果を上げており、その実用性は証明されつつあります。

消費者向けのAIがまだ模索を続ける一方で、Codexは今日、企業に具体的なROI（投資対効果）をもたらす「実績あるAIエージェント」としての地位を確立しました。新たに提供されるSDKにより、各社の独自ワークフローへの組み込みも可能になります。Codexは、次世代のソフトウェア開発を静かに、しかし強力に牽引する存在となるでしょう。

出典：VentureBeat

OpenAI「Codex」一般提供開始、Slack連携とSDKで開発を加速

2025年10月06日 OpenAI GitHub Slack ChatGPT Codex 生産性ワークフローエンジニアクラウドコーディングコードレビュー CI/CD スタートアップエージェント

開発を加速する新機能

Slack連携によるタスクの直接委任

Codex SDKで独自のワークフローへ統合

環境制御・監視を行う管理者向けツール追加

CI/CD向けにGitHub Actionsも提供開始

実証された生産性向上

日常利用が8月以降10倍以上に急増

OpenAI社内PRマージ数が週70%増加

Ciscoは複雑なレビュー時間を最大50%削減

Instacartは技術的負債の自動クリーンアップを実現

詳細を見る

OpenAIは、コード生成とレビューを支援するコーディングエージェント「Codex」の一般提供（GA）開始を発表しました。これにより、新たなSlack連携機能やCodex SDKが提供され、開発チームは既存のワークフロー内でAIをシームレスに活用できるようになります。世界中のスタートアップや大企業で採用が進んでおり、開発効率の劇的な向上が期待されています。

Codexは研究プレビュー開始以来、飛躍的に進化し、日常利用は8月上旬から10倍以上に急増しました。OpenAI社内ではほぼ全てのエンジニアが利用しており、プルリクエスト（PR）のマージ数が週70%増加しています。さらに、Codexが自動でPRをレビューし、本番環境に到達する前に重大な問題点を検出するなど、コード品質維持にも貢献しています。

今回のGAにおける目玉は、エンジニアリングワークフローに直接組み込むための「Codex SDK」と「Slack連携」です。SDKを利用すれば、Codex CLIの核となる強力なエージェントを独自のツールやアプリに数行のコードで統合できます。また、Slackから直接Codexにタスクを委任できるため、チームコラボレーションを効率化します。

大規模導入を進める企業向けには、新しい管理者ツールが追加されました。これにより、ChatGPTワークスペース管理者は、クラウド環境の制御、ローカル利用における安全なデフォルト設定の適用が可能になります。加えて、利用状況やコードレビューの品質を追跡するための分析ダッシュボードが提供され、ガバナンスと監視が強化されます。

導入事例として、Ciscoでは複雑なプルリクエストのレビュー時間を最大50%削減し、エンジニアはより創造的な業務に集中できています。また、InstacartではCodex SDKを統合し、ワンクリックでのエンドツーエンドのタスク完了や、デッドコードなどの技術的負債を自動で解消し、コードベース全体のレイテンシ改善に役立っています。

Slack連携およびSDKは、ChatGPT Plus、Pro、Business、Edu、Enterpriseの各プランで利用可能です。管理者向け機能は、企業での利用を想定しBusiness、Edu、Enterpriseプランに限定されています。OpenAIは、Codexを通じて開発者の生産性を根本から変革することを目指しています。

出典：OpenAI公式

GPT-5-Codexが開発生産性を劇的に向上させる理由

エージェント能力の進化

複雑なタスクで最長7時間以上の独立稼働

タスクに応じた思考時間の動的な調整

迅速な対話と長期的な独立実行の両立

実世界のコーディング作業に特化しRL学習を適用

ワークフローへの密着

CLI、IDE拡張機能、GitHubへシームレスに連携

ローカル環境とクラウド間のコンテキスト維持

画像やスクリーンショットを入力可能

品質と安全性の向上

コードレビューの精度が大幅に向上

重大なバグを早期に発見しレビュー負荷を軽減

サンドボックス環境による強固なセキュリティ

詳細を見る

OpenAIは、エージェント型コーディングに特化した新モデル「GPT-5-Codex」を発表し、開発環境Codexを大幅にアップグレードしました。これはGPT-5を実世界のソフトウェアエンジニアリング作業に最適化させたバージョンです。開発者はCLI、IDE、GitHub、ChatGPTアプリを通じて、より速く、信頼性の高いAIアシスタントを活用できるようになります。

最大の進化は、タスクの複雑性に応じて思考時間を動的に調整する能力です。GPT-5-Codexは、大規模なリファクタリングやデバッグなどの複雑なタスクにおいて、最長7時間以上にわたり独立して作業を継続できることが確認されています。これにより、長期的なプロジェクトの構築と迅速なインタラクティブセッションの両方に対応します。

モデルは、既存のコードベース全体を理解し、依存関係を考慮しながら動作検証やテスト実行が可能です。特にコードレビュー機能が強化されており、コミットに対するレビューコメントの正確性と重要性が向上。重大な欠陥を早期に特定し、人間のレビュー工数を大幅に削減します。

開発ワークフローへの統合も一層強化されました。刷新されたCodex CLIとIDE拡張機能（VS Codeなどに対応）により、ローカル環境とクラウド環境間でシームレスに作業を移行できます。コンテキストが途切れないため、作業効率が劇的に向上します。

さらに、Codexは画像やスクリーンショットを入力として受け付けるようになりました。これにより、フロントエンドのデザイン仕様やUIバグなどを視覚的にAIへ共有し、フロントエンドタスクの解決を効率化します。また、GitHub連携によりPRの自動レビューや編集指示も可能です。

安全性確保のため、Codexはデフォルトでサンドボックス環境で実行され、ネットワークアクセスは無効です。プロンプトインジェクションのリスクを軽減するとともに、開発者はセキュリティ設定をカスタマイズし、リスク許容度に応じて運用することが可能です。

出典：OpenAI公式 | OpenAI公式 | TechCrunch

Codex（プロダクト）に関するニュース一覧

Codex（プロダクト）に関するニュース一覧

料金体系の刷新

導入支援と実績

Cursor 3の全容

AI大手との競争激化

史上最大の資金調達

急成長する事業規模

インフラと今後の戦略

MLX対応の概要

性能改善と圧縮技術

ローカルLLM需要の高まり

Pretextの技術革新

開発手法と反響

企業への示唆

プラグインの概要

競合との関係

スキルの概要と特徴

作成方法と拡張性

提携白紙の経緯

Soraの急成長と急失速

ディズニーの戦略的誤算

WWDC26の概要

Siri刷新への期待

開発者向けAI基盤

統合アプリの全容

競争環境と戦略転換

メンター危機の背景

3Cフレームワーク

実践と効果

買収の狙いと背景

OSSの継続と展望

開発体制の転換

業界の潮流変化

今後の展望

モデル性能と技術

価格と市場影響

自己進化と性能

コストと戦略転換

プラグインの主要機能

技術的な仕組み

性能と価格

主な用途

SAST の限界

エージェント型検証の設計

SAST起点を避ける理由

xAI組織再編の全容

競合との差と上場圧力

Slateの技術基盤

事業戦略と展望

シェルツールの全容

コンテナとスキル基盤

コーディングAI競争の構図

OpenAI社内の巻き返し策

業界への波及と今後の課題

2社の独自スキャナー比較

企業セキュリティへの影響

製品の特徴と精度

OSS貢献と実績

大規模レイオフの背景

AI中心の新企業像

X・分散化・政治への見解

学生のAI活用格差

教育機関向け新施策

モデル性能の飛躍

エージェント基盤の進化

評価パイプラインの要点

スキル設計の知見

技術と普及の現状

著作権問題の深刻化

米中AI格差の構図

Glazeの基本機能

事業戦略と展望

エージェントの全容

技術的工夫と課題

企業への示唆

投資家が避けるSaaS領域

SaaS業界の構造変化

今後の投資トレンド

統合の技術的内容