Canva(企業)に関するニュース一覧

Elgato、Stream DeckにAI操作機能を追加 MCPで音声指示に対応

MCP対応の概要

Stream Deck 7.4でMCP対応
ClaudeChatGPT等と連携可能
音声や文字でマクロ実行

設定と仕組み

設定画面からMCP Actionsを有効化
専用プロファイルに配置した操作が対象
Node.jsと専用ブリッジが必要

MCPの業界動向

MicrosoftAnthropic等が採用
AI連携の共通規格として普及加速

Elgatoは2026年4月1日、カスタムボタンデバイス「Stream Deck」のソフトウェアをバージョン7.4に更新し、AIアシスタントからボタン操作を実行できるMCP(Model Context Protocol)対応を発表しました。

MCPは、AIアシスタントが外部アプリケーションと直接連携するための標準プロトコルです。今回の対応により、ClaudeChatGPTNvidia G-Assistなどのツールから、Stream Deckに割り当てたマクロ操作を音声や文字入力で呼び出せるようになります。

設定方法は、Stream Deckアプリを最新版に更新後、「Preferences」の「General」タブから「Enable MCP Actions」にチェックを入れます。すると専用の「MCP Actions」プロファイルが作成され、そこに配置したアクションがAIツールからアクセス可能になります。

実際の利用には、Node.jsツールとElgato製のMCPサーバーブリッジをパソコンにインストールする必要があります。MCP統合に不慣れなユーザーにはやや複雑ですが、Elgatoは詳細なステップバイステップのガイドを公開しています。

MCPMicrosoftAnthropicFigmaCanvaなど主要企業が採用を進めており、AI連携の「USBケーブル」とも呼ばれる共通規格として急速に普及しています。Stream Deckへの対応は、ハードウェア操作にもAI連携が広がる事例として注目されます。

FLORA、Vercel基盤で画像生成AIエージェント「FAUNA」を構築

FAUNAの特徴と狙い

50以上の画像生成モデルを統合
アイデアから自動で多方向の視覚探索を展開
ワークフロー設計の負担をエージェントが代替

Vercel移行の効果

AI SDKとWorkflow SDKで基盤を一本化
本番投入までの速度が2倍に向上
インフラ議論からプロダクト議論へ転換

今後の展望と周辺機能

UI/UX以外の全デザイン業務を支援対象
Vercelがチーム間のDB移行機能も追加

クリエイティブワークフロー基盤を提供するFLORAは、VercelAIスタック上に画像生成AIエージェントFAUNA」を構築したと発表しました。50以上の画像モデルを統合し、ファッションキャンペーンなどの視覚制作を効率化する狙いです。

FAUNAは従来のノードベースのキャンバスとは異なり、ユーザーがアイデアを伝えるだけで参考画像の収集、モデル選択、バリエーション生成を自動で行います。ワークフロー設計の知識がなくても、プロ品質のビジュアル探索が可能になります。

技術面では、画像動画生成は数分かかり、1回のセッションで多数の並行ジョブが発生します。FAUNAはVercelAI SDKエージェントフレームワークとWorkflow SDKの永続化機能を組み合わせ、長時間実行や障害時の再試行に対応しています。

FLORA開発チームは以前LangChainとTemporalを併用していましたが、2つのシステムの保守負担が課題でした。Vercelへの移行により基盤が一本化され、本番投入速度が2倍に向上したと報告しています。インフラの議論が不要になり、プロダクト改善に集中できるようになりました。

FLORAはUI/UX以外の全デザイン業務の支援を最終目標に掲げています。また、Vercelは同時期にダッシュボードからチーム間でDB移行ができる機能も公開しました。Prisma、Neon、Supabaseに対応し、今後対応プロバイダーを拡大する予定です。

Midjourney技術者がWeb設計を革新するOSSライブラリPretext公開

Pretextの技術革新

DOM迂回でテキスト計測を高速化
15KBのゼロ依存TypeScriptライブラリ
300〜600倍の描画性能向上を実現
モバイルでも120fps動作可能

開発手法と反響

48時間でGitHub星1.4万獲得
X上で1900万回閲覧を記録

企業への示唆

生成AIのUI構築に即時導入推奨
アクセシビリティ管理は自社責任に

MidjourneyエンジニアCheng Lou氏が2026年3月27日、Webテキストレイアウトを根本から変えるオSSライブラリPretextMITライセンスで公開しました。15KBのゼロ依存TypeScriptライブラリで、ブラウザのDOM操作を迂回し、テキストの計測と配置を高速に行います。

従来のWeb開発では、テキストの高さや位置を取得するたびにブラウザがレイアウトリフローと呼ばれる再計算を実行し、深刻なパフォーマンス低下を招いていました。PretextはブラウザのCanvasフォントメトリクスと純粋な算術演算を組み合わせ、DOMに一切触れずに文字・単語・行の配置を予測します。

ベンチマークによると、Pretextのlayout関数は500種類のテキストを約0.09ミリ秒で処理でき、従来のDOM読み取りと比較して300〜600倍の性能向上を達成しています。この速度により、ウィンドウリサイズや物理演算中でもリアルタイムにテキスト再配置が可能になりました。

開発にはAnthropicClaudeOpenAICodexなどAIコーディングツールが活用されました。多言語データセットや小説全文を用いてブラウザ実装とのピクセル単位の整合性を反復検証し、WebAssemblyやフォント解析ライブラリなしで高精度を実現しています。

公開から48時間でGitHubスター1万4000超、X上で1900万回閲覧を記録しました。コミュニティでは雑誌レイアウト、物理演算テキスト、ディスレクシア向けフォント調整など多彩なデモが登場し、Web表現の可能性が大きく広がっています。

企業にとっては、生成AI UIや高頻度データダッシュボードを構築する場合に即時導入が推奨されます。ただしレイアウトをユーザーランドに移すことで、ブラウザが担っていたアクセシビリティや標準準拠の責任を自社で管理する必要がある点には留意が必要です。

Webtoon、AI翻訳ツールでマンガの多言語展開を支援

AI翻訳の仕組み

7言語への自動翻訳機能
独自LLMと外部LLMの併用
用語集で翻訳一貫性を維持
テキスト要素のみ処理し学習に不使用

クリエイター支援策

広告収益共有を全言語に拡大
新ダッシュボードで読者分析強化
翻訳は任意でオプトアウト可能
誤訳は人間レビューで対応

Webtoonは2026年春、ユーザー投稿プラットフォーム「Canvas」にAI翻訳ツールを導入すると発表しました。英語・スペイン語・フランス語・インドネシア語・タイ語・繁体字中国語・ドイツ語の7言語に対応し、クリエイターのグローバル展開を支援します。

翻訳ツールはWebtoon独自の言語モデルと外部の大規模言語モデルを組み合わせて構築されています。マンガページのテキスト要素のみを処理し、コンテンツがLLMの追加学習に使用されることはないと同社は説明しています。

ローカライズの精度を高めるため、クリエイターが作品固有の用語集を登録できる機能も備えています。エピソード数が増えるほどモデルが文脈を蓄積し、翻訳品質が向上する仕組みです。誤訳が見つかった場合は報告を通じて人間による品質保証プロセスが発動します。

さらにWebtoonは広告収益共有プログラムCanvas対応の全言語のクリエイターに拡大する計画です。新しいダッシュボードでは作品パフォーマンスの詳細な分析やコミュニティエンゲージメント管理ツールも提供されます。

同社のキム社長は「言語の壁と流通の課題がクリエイターのリーチを制限してきた」と述べ、AIツールはあくまでクリエイターを支援するものであり代替するものではないと強調しました。翻訳機能は完全に任意で、オプトアウトすれば翻訳版は削除されます。

AI動画編集のMirageがGeneral Catalystから7500万ドル調達

事業転換と成長戦略

CaptionsからMirageに社名変更
AI研究所として再ブランディング
フリーミアムモデルへ移行
広告・マーケティング業界へ展開

実績と市場展開

累計2億本超の動画を生成
年間320万ダウンロード達成
米国外が売上の75%を占める
アジア高成長市場への拡大を計画

AI動画編集アプリCaptionsを運営するMirageは、General CatalystのCustomer Value Fund(CVF)から7500万ドルの成長資金を調達しました。同社はAI研究所としての位置づけを強化し、広告やマーケティング分野への展開を進めています。

Mirageは過去1年間で大きな変革を遂げています。社名をCaptionsからMirageに変更し、短尺動画のペーシングやフレーミング、注目度の動態に特化したモデルを開発しました。2025年1月にはByteD anceのCapCutやMetaのEditsに対抗するためフリーミアムモデルに移行しています。

共同創業者兼CEOのGaurav Misra氏は、今後「アセンブリ・インテリジェンス」と呼ぶ分野のモデル開発を計画していると述べました。これは異なるソースや素材を組み合わせて動画を自動生成する技術です。新たな音声モデルでは国際ユーザーのアクセントを忠実に再現する機能も実現しました。

分析会社Appfiguresのデータによると、Captionsは過去1年間で320万回以上ダウンロードされ、アプリ内収益は2840万ドルに達しています。プラットフォーム上で作成された動画は累計2億本を超え、売上の75%が米国外から生まれるなど国際的なユーザー基盤を構築しています。

General CatalystのPranav Singhvi氏は、Mirageのユニットエコノミクスが競合他社を明確にリードしていると評価しました。CanvaやD-ID、HeyGenなどAI動画マーケティング領域の競争が激化する中、同社は調達資金を成長投資アジア市場の開拓に充てる方針です。

Moda、AIデザインエージェントを本番投入し非デザイナー向け設計基盤を構築

マルチエージェント構成

3種のエージェントが協調動作
デザイン・リサーチ・ブランドの役割分担
Deep Agents基盤で構築
LangSmithで全実行をトレース

コンテキスト工学の工夫

独自DSLでレイアウト抽象化
トリアージでスキル動的注入
キャンバス規模に応じた文脈制御

UXと今後の展開

Cursor型サイドバーで対話的編集
B2B営業チーム向けにPMFを確認

Modaは、マーケターや創業者などデザイン未経験者向けのAIネイティブデザインプラットフォームです。LangChain Deep Agentsを基盤としたマルチエージェントシステムにより、プレゼン資料やSNS投稿、PDFなどをプロ品質で自動生成する仕組みを本番環境で稼働させています。

システムの中核は、デザインエージェント、リサーチエージェントブランドキットエージェント3つのエージェントで構成されています。リサーチエージェントは外部ソースから構造化コンテンツを取得し、ブランドキットエージェントはロゴやフォント、カラーなどのブランド資産を取り込み、一貫したデザインを実現します。

AIデザインの最大の課題は、PowerPointのXML仕様のようなXY座標ベースの表現がLLMの推論に不向きな点です。Modaは独自のコンテキスト表現レイヤーを開発し、HTMLのFlexboxのようなレイアウト抽象化をLLMに提供することで、トークンコストを削減しつつ出力品質を大幅に向上させました。

各リクエストはまず軽量なトリアージノードで分類され、適切なスキルが動的に注入されます。コアツールは12〜15個に抑え、追加の約30ツールは必要時のみ読み込む設計により、プロンプトキャッシュの効率を最大化しています。LangSmithによるノード単位のコスト追跡が、この最適化を可能にしました。

UX面では、生成と置換の一方通行ではなく、完全に編集可能な2Dベクターキャンバ上でAIが直接操作する設計を採用しています。Cursor風のサイドバーで反復的な対話を行い、ユーザーとAIが協調してデザインを仕上げます。B2B企業の営業チームを中心にプロダクトマーケットフィットを確認しており、今後はメモリ機能の統合やマルチブランド対応の拡張を予定しています。

Replit「Agent 4」発表、並列タスクで開発を自動化

並列タスクの技術革新

マージ競合の90%を自動解決
依存関係を自動判定し並列実行
複数の特化モデルを組合せ運用
マイクロVMで即時ブランチ生成

非エンジニアへの開放

Infinite Canvasデザインと開発統合
リアルタイム共同編集機能を実装
コラボレーターの席課金なし
導入企業が年間100万ドル超削減

Replitは自社本社からのライブ配信で、AIコーディングエージェントの最新版「Agent 4」を正式に発表しました。共同創業者Amjad Masad氏とHaya Odeh氏を含む5名のチームメンバーが、新機能の技術的背景と設計思想を解説しています。

Agent 4の中核機能である並列タスク処理では、複数のAIエージェントが同一プロジェクト内で同時に作業できます。AIエンジニアのPeter氏によると、コーディングモデルの能力向上によりマージ競合の90%が自動解決可能になり、残り10%のみをユーザーに判断を委ねる仕組みです。

共同創業者のHaya Odeh氏が設計した「Infinite Canvas」は、デザインエンジニアリングの境界を解消する新しいワークスペースです。デザイナーがプロトタイプを作成する環境とエンジニアが開発する環境が統合され、プロトタイプがそのまま製品コードになります。ファッションデザイナーや栄養士など非プログラマーの利用を強く意識した設計です。

コラボレーション機能では、プロジェクト内で誰がどのタスクに取り組んでいるかをリアルタイムで可視化できるようになりました。Google Docsのような共同編集体験をソフトウェア開発に持ち込み、メインブランチに反映する前にチームメイトの作業をレビューできます。コラボレーターへの追加課金はありません

CEO Amjad Masad氏はAgent 4を「アイデアから出荷まで離脱不要な環境」と位置づけました。実例として、6000万ドル規模のメディア企業FireCrown MediaReplitでマーケティング自動化を構築し、年間100万ドル超のコスト削減を実現。削減分の一部でAI人材の新規採用にも充てたと紹介しています。

Replit「Agent 4」発表、無限キャンバスで協働開発を刷新

Agent 4の新機能

Infinite Canvasで複数成果物を一元管理
並列タスクと統合ビルド対応
Web・モバイルを単一プロジェクトで構築
デザインバリエーション自動生成機能

社内活用と実証事例

BigQuery連携で3Dデータ可視化実現
設計者がAgent 4でAgent 4自体を設計
企業向けデモを一晩で構築・納品
クリエイター支援プログラムの国際展開加速

Replitは自社HQからのライブ配信で、AIコーディングツール最新版「Agent 4」を正式発表しました。新機能の中核となるInfinite Canvasや並列タスク処理により、複数人での協働アプリ開発が大幅に効率化されます。

コミュニティマネージャーのManny Bernabe氏は、Agent 4で構築した「テイスト開発アプリ」を実演しました。画像Google Geminiで分析し、タイポグラフィや配色、レイアウトの評価を返すこのアプリは、ランディングページ・Webアプリ・モバイル版を1つのキャンバス上で同時に管理できます。

Raymmar Tirado氏は「Replitopolis」と呼ばれる3D都市を披露しました。BigQueryのデータをリアルタイムで可視化し、各ビルがユーザーを、高さがプロンプト送信数を表現します。企業の読み取り専用データに接続するだけで内部ツールを構築できる可能性を示しました。

デザイナーのZade Keylani氏は、Agent 4のUIデザイン自体をAgent 4で構築した経験を共有しました。Figmaファイルではなく動作するプロトタイプをエンジニアに引き渡す手法により、開発中にリアルな問題を発見・報告できたと語ります。空間的思考を活かすCanvasが試行錯誤のハードルを下げたと強調しました。

マーケティング担当のRaina Saboo氏は、Agent 4のテーマを「意図ある創造性」と説明しました。Agent 3が自律性を追求したのに対し、Agent 4は人間の方向性とAIの能力を掛け合わせる設計思想です。DatabricksStripeなど大手企業顧客も早期アクセスで導入を進めており、ローンチ週には資金調達発表とブランド刷新も同時に実施されました。

Replit Agent 4が設計・協業・開発の全面刷新を発表

設計と構築の進化

Design Canvasで無限キャンバス化
全アーティファクト型に対応
アプリ以外もスライドモバイル作成可
外部サービス連携が可能に

協業とワークフロー

フォーク型から共有プロジェクト方式へ
カンバンボードでタスク可視化
計画と構築の同時並行実行
AIが競合解決を自動支援

Replitは、AIコーディングプラットフォームの最新版「Agent 4」を発表しました。設計、コラボレーション、構築対象、計画・実行ワークフローの4つの柱を根本から再設計し、開発体験を大幅に向上させています。

設計面では、従来の「Design Mode」タブが「Design Canvas」に置き換わりました。無限キャンバス上でアーティファクトのライブプレビューとデザインモックアップを並べて表示でき、モバイル・タブレット・デスクトップの各画面サイズでのプレビューにも対応しています。

構築対象も大幅に拡張されました。Agent 3ではアプリに限定されていましたが、Agent 4ではスライド、Webサイト、Webアプリ、モバイルアプリなど多様な成果物を作成可能です。Linear、SlackNotionなどの外部サービスとの連携も実現しています。

コラボレーションモデルは、フォーク&マージ方式から共有プロジェクト方式へ移行しました。各メンバーが同一プロジェクト内で独自のチャットスレッドを持ち、共有カンバンボードでタスクの進捗をリアルタイムに把握できます。

ワークフローも「計画してから構築」から「計画しながら構築」へと進化しました。メインビルドの実行中に別チャットで計画を進められ、各タスクは隔離環境で並行実行されるため、互いの作業を上書きするリスクがありません。既存プロジェクトもそのまま動作し、新規プロジェクトで全新機能が利用可能です。

MicrosoftがSequoia出資のAI協業ツールCoveチームを採用

Coveの経緯と技術

Google Maps技術者3名が2023年創業
Sequoia主導で600万ドル調達
AI活用無限キャンバ型協業ツール
ブラウザ・PDF統合で文脈付きAI生成

Microsoft移籍の影響

チーム全員がMicrosoft AIに合流
Coveは4月1日でサービス終了
3月分サブスク全額返金を実施
Microsoft WhiteboardCopilot強化に期待

Sequoia Capitalが出資するAIコラボレーションツール「Cove」のチーム全員がMicrosoftに合流することが、顧客向けメールで明らかになりました。サービスは2026年4月1日に終了し、全ユーザーデータが削除されます。

Coveは2023年末に元Google Mapsエンジニア3名が創業したスタートアップです。Street Viewなどの開発経験を持つStephen Chau氏、Andy Szybalski氏、Mike Chu氏が共同で設立し、2024年にSequoia Capitalらから600万ドルのシード資金を調達していました。

同社のツールはAIが旅行計画などのタスク用ブロックを生成できる無限ホワイトボードでした。チャット型AIインターフェースでは編集が難しいという課題に着目し、キャンバス形式でプロンプトの方向性を柔軟に変えられる設計を採用していました。

競合にはMiro、TLDraw、Kosmikなどが存在していました。Coveは内蔵ブラウザやPDF閲覧機能でAIに豊富な文脈を与え、カード・テーブル・リストを自動生成できる点で差別化を図っていましたが、大手との競争は厳しい状況でした。

Coveは「AIとの協業を再定義する」というミッションをMicrosoft AIで継続すると表明しています。Microsoftは2023年に自社のWhiteboardCopilotを統合済みであり、Coveの技術やアイデアが同製品群に活かされる可能性があります。

Google AI Studioがバイブコーディング機能を大幅刷新

AI Studio新機能

マルチプレイヤーアプリ構築対応
Firebase連携でDB・認証を自動統合
外部APIキーのシークレット管理機能
Next.jsをフレームワークに追加

Stitch設計ツール刷新

無限キャンバでAIネイティブ設計
音声対話でリアルタイム設計修正
DESIGN.mdデザインシステム共有
MCP連携でコード変換を効率化

Googleは2026年3月、Google AI Studioバイブコーディング機能を全面刷新し、プロンプトから本番対応アプリを構築できる新体験を発表しました。同時にUIデザインツールStitchも「バイブデザイン」対応へと進化しています。

AI Studioの新機能では、Google Antigravityコーディングエージェントを活用し、マルチプレイヤーゲームや共同作業ツールなどリアルタイム接続が必要なアプリケーションをプロンプトだけで構築できるようになりました。

Firebaseとの統合により、エージェントがデータベースや認証の必要性を自動検出し、Cloud FirestoreとFirebase Authenticationを自動でプロビジョニングします。外部APIキーを安全に管理するシークレットマネージャーも新設されました。

デザインツールStitchは、自然言語から高品質UIデザインを生成するAIネイティブの無限キャンバスへと刷新されました。音声エージェントと対話しながらリアルタイムにデザインを修正でき、創造的なフローを維持できます。

StitchではDESIGN.mdというマークダウン形式でデザインシステムを他ツールと共有でき、MCPサーバーやSDKを通じてAI StudioやAntigravityへのエクスポートも可能です。アイデアから実装までの一気通貫のワークフローが実現します。

Gamma、AI画像生成ツールでCanva・Adobeに挑戦

新製品の概要

Gamma Imagine発表
テキストからブランド素材を生成
100以上のテンプレート提供
チャートやインフォグラフィック対応

成長と資金調達

a16z主導で6800万ドル調達
評価額21億ドル到達
ARR1億ドル・ユーザー1億人に迫る

戦略的位置づけ

AdobeFigmaPowerPointの中間
ナレッジワーカー向け市場を狙う

AIプレゼンテーションプラットフォームのGammaは、マーケティング素材を生成する新製品「Gamma Imagine」を発表しました。CanvaAdobeとの競争激化を見据え、テキストプロンプトからブランド固有のビジュアル資産を作成できる機能を提供します。

Gamma Imagineでは、インタラクティブなチャートやデータビジュアライゼーション、マーケティング資料、SNS用グラフィック、インフォグラフィックなどを生成できます。現在100以上のテンプレートが用意されており、AI機能と組み合わせて活用することが可能です。

データ駆動型の素材生成を実現するため、ChatGPTClaude、Make、Zapier、Atlassian、n8nなど主要ツールとの連携を進めています。これにより外部データを取り込んだ高度なビジュアル作成が可能になります。

CEOのGrant Lee氏は、Gammaの立ち位置をAdobeFigmaなどのプロ向けツールPowerPointなどのレガシーツールの中間と位置づけています。デザインリソースを持たないビジネスパーソンにAIネイティブなアプローチで視覚的コミュニケーションを提供する考えです。

同社は2025年11月にa16z主導のシリーズBで6800万ドルを調達し、評価額は21億ドルに達しました。当時ARR1億ドル・ユーザー7000万人と発表しており、現在は1億人に迫る規模に成長しています。

Replit評価額90億ドル到達、Agent 4を発表

Agent 4の4本柱

無限キャンバデザイン探索
コードとデザイン統合環境
並列エージェントで同時タスク実行
アプリ・スライド動画一括制作

資金調達と成長

シリーズDで4億ドル調達
半年で評価額3倍の90億ドル
年内ARR10億ドル目標
Fortune 500の85%が利用

Replitは2026年3月11日、AIコーディングエージェントの最新版「Agent 4」を発表するとともに、シリーズDで4億ドルを調達し、企業評価額90億ドルに達したことを明らかにしました。わずか半年前の30億ドルから3倍の急成長です。

Agent 4は「人間の創造性を中心に据える」をコンセプトに設計されています。前世代のAgent 3が自律性を追求したのに対し、Agent 4ではデザインとコードを同一環境で扱える統合キャンバを導入し、デザイン反復のスピードを大幅に向上させました。

最大の特徴は並列タスク実行です。複数のエージェント認証・データベース・フロントエンドなど異なるタスクを同時に処理し、完了後にメインプロジェクトへマージします。競合が発生した場合は専用のサブエージェントが自動解決する仕組みです。

資金調達Georgian Partnersが主導し、Andreessen Horowitz、Coatue、Y Combinatorなどが参加しました。エンジェル投資家としてシャキール・オニールやジャレッド・レトも名を連ねています。調達資金は欧州・アジア・中東へのグローバル展開と製品開発に充てられます。

同社はFortune 500企業の85%にユーザーを持ち、Atlassian・PayPal・Zillow・Adobeなどが活用しています。年内にARR10億ドル到達を目指しており、ノーコードバイブコーディング市場での圧倒的な存在感を示しています。

Canva、AI生成画像をレイヤー分解する新機能を公開ベータで提供開始

Magic Layersの概要

フラット画像をレイヤー分解
オブジェクトや文字を個別選択可能
元のレイアウトを維持したまま編集
米英加豪で公開ベータ開始

競合との差別化

Adobe製品は生成要素のみ別レイヤー
Canva画像全体を自動分解
プロンプト不要で部分編集実現

創作への影響

手動制御の強化で編集自由度向上
AI生成と手作業の区別が困難に

Canvaは2026年3月11日、フラットな画像ファイルやAI生成ビジュアルをレイヤー分解し、完全に編集可能なデザインに変換する新機能「Magic Layers」の公開ベータを米国英国・カナダ・オーストラリアで開始しました。

同機能はAI研究チームのブレークスルーから生まれたもので、オブジェクト・テキストボックス・グラフィックスなどのデザイン要素を個別に選択・編集できます。元のレイアウトを崩すことなく、プロンプトなしで部分的な修正が可能になります。

対応形式はAI生成画像に限らず、単一ページのPNG・JPEGファイル全般をサポートしています。Canvaはここ数年、生成AI機能を積極的に推進しており、今回の機能もAI画像の微調整ニーズに応える位置づけです。今後さらに対応範囲を拡大する予定です。

競合との比較では、AdobePhotoshopやExpressがAI生成要素を別レイヤーとして追加する機能を持つ一方、画像全体を自動的にレイヤー分解する機能は提供していません。Magic Layersはこの点で業界をリードする位置づけとなります。

一方で、フラット画像をレイヤー化できることで、AI生成デザイン手作業によるデザインの区別がより困難になるという指摘もあります。従来はレイヤー構造の有無がクリエイターの手作業を証明する手段の一つでしたが、その根拠が揺らぐ可能性があります。

a16z調査:ChatGPT週間9億人、エージェント時代が本格到来

プラットフォーム競争

ChatGPTが依然トップ、週間9億人利用
GeminiClaudeが有料契約者数で急成長
コネクター生態系がロックインを形成
OpenAIはスーパーアプリ戦略を推進

クリエイティブとエージェント

動画生成画像生成を勢力図で逆転
中国製モデルが動画品質でリード
OpenClawGitHub最多スター獲得
ManusMetaに20億ドルで買収

a16zは2026年3月、生成AIコンシューマーアプリ第6版を公表し、ChatGPTが週間アクティブユーザー9億人を達成、世界人口の10%以上が毎週利用していることを明らかにした。

ChatGPTはウェブでGeminiの2.7倍、モバイルで2.5倍の規模を維持しているが、GeminiClaudeが有料契約者数で加速しており、それぞれ前年比258%・200%超の成長を記録している。

今版からCapCut・CanvaNotionなど、AIが中核機能に組み込まれたレガシーアプリも対象に加えられた。NotionのAI機能は有料契約者への付帯率が1年で20%から50%超に急増し、ARRの約半分を占めている。

エージェント領域では、オープンソースのOpenClawGitHubスター数でReactやLinuxを超えて首位となり、OpenAIが2026年2月に買収ManusMetaが約20億ドルで取得し、Gensparkは3億ドルのシリーズBを調達した。

地理的にはAI市場が西側・中国・ロシアの3極に分化。Claude Codeは6カ月で年換算収益10億ドルに到達するなど、ブラウザやデスクトップへのAI浸透が進み、ウェブ訪問数では捕捉できない利用実態が拡大している。

Google検索のAIモードにCanvas機能を全米展開

Canvas機能の概要

AI Mode内の専用作業空間
文書作成やコーディングに対応
検索情報と連携したプロトタイプ生成
ナレッジグラフからの情報統合

競合との違い

ChatGPTは自動起動方式を採用
GeminiアプリではGemini 3搭載済み
Google検索の圧倒的リーチが強み
英語のみで提供開始

Googleは2026年3月、検索のAIモードに搭載する作業空間機能「Canvas」を米国の全ユーザーに英語で開放しました。これにより、AI検索内で文書作成やコーディング、プロジェクト管理が可能になります。

Canvas機能は当初、Geminiアプリ内でリアルタイムの文書・コード作成ツールとして提供されていました。その後AIモードでも旅行プラン可視化に限定してテストされていましたが、今回クリエイティブライティングコーディングにも対応範囲が拡大されました。

利用方法はAIモードのチャット画面でツールメニュー(+)からCanvasを選択し、作りたい内容を記述するだけです。右側のサイドパネルに結果が表示され、ウェブ上の最新情報やナレッジグラフのデータを統合したプロトタイプが生成されます。

早期テスターからは奨学金情報のダッシュボード作成など、要件・締切・金額を一覧化する活用例が報告されています。生成されたコードの確認や、会話形式での反復的な改善も可能で、実用的なツール開発を支援します。

競合するOpenAICanvas機能がクエリに応じて自動起動するのに対し、GoogleAnthropicClaudeはユーザーの明示的な操作を必要とします。しかしGoogle検索の圧倒的なリーチにより、Geminiに触れたことのない数十億規模のユーザーにもAI機能を届けられる点が最大の優位性です。

FigmaがCodexと提携しデザイン連携を実現

統合の技術的内容

Figma MCPサーバー経由でCodexと直結
コード→デザインの即時変換が実現
Dev Mode・FigJamとのネイティブ連携
先週のAnthropic統合に続くマルチAI戦略
設計・実装サイクルの大幅短縮が可能

開発ワークフローへの影響

エンジニアコーディング環境から離れず設計変更
プロダクト開発の反復速度向上
デザインシステムとの自動整合が可能

FigmaOpenAIは2026年2月26日、Figma MCPサーバーを通じてOpenAI Codexデザインプラットフォームを直接連携させる統合を発表しました。エンジニアコーディング環境から離れることなく、デザインキャンバスの変更・反復が行えるようになります。

この統合の核心はFigma MCPサーバーの活用で、CodexFigmaデザインツール、Dev Mode、FigJamに直接アクセスできる点です。先週発表されたAnthropicとのMCP統合に続き、Figmaはマルチ大手AIとのエコシステム構築を加速しています。

開発チームにとっての実質的な価値は、コード変更がデザインに即座に反映されるフィードバックループの短縮です。従来は別々のツールを往来していた作業が一元化されます。

この動きはソフトウェア開発ワークフローにおけるAIエージェントの役割が、コード生成から設計・実装の統合制御へと拡張していることを示しています。

FigmaOpenAIAnthropic双方と提携した事実は、AIコーディングアシスタント市場の競争が激化し、各プラットフォームが設計ツール統合を差別化要因として争っていることを示しています。

AdobeがAIで動画初稿を自動生成

Quick Cutの機能

映像とB-rollを自動でつなぎ初稿を生成
自然言語指示でカット・トランジションを制御
従来の手動編集工程を大幅に短縮

クリエイターへの影響

映像編集の民主化が一段と加速
Adobe Premiereとの統合が期待される
プロ・アマ両方の制作効率が向上

Adobe FireflyのAI動画エディターに「Quick Cut」という新機能が追加されました。ユーザーが映像クリップとB-rollをアップロードして指示を出すと、AIが自動的にトランジションを含む動画の初稿を生成します。

これまで動画編集は素材のインポートから始まりタイムラインへの手動配置、トランジション設定など多くの手順が必要でした。Quick Cutにより編集の第一段階が大幅に短縮され、クリエイターはより高次の表現に集中できます。

動画コンテンツの重要性が高まる中、Adobe Firefly動画編集機能の強化はAdobe Premiere ProやCanvaとの競争においても重要な位置づけです。

Adobe AcrobatがAIでPDFをポッドキャストや資料に変換

新機能の概要

プロンプト編集で12種の操作
PDFからポッドキャスト自動生成
Spacesからプレゼン資料作成
Acrobat Studioに統合
Microsoft GPT+Google音声を活用

競合との差別化

NotebookLMと類似の音声要約
Canvaとの競合領域
Adobe Express連携で差別化
エンタープライズ向け共有強化

AdobeはAcrobat Studioに、AIによるポッドキャスト生成・プレゼン作成・プロンプト編集の3つの新機能を追加した。複数PDFをまとめて音声要約できるGenerate Podcast機能は、MicrosoftのGPTモデルとGoogle音声モデルを活用している。

プロンプト編集機能では、ページ削除・テキスト置換・電子署名の追加など12種類の操作をチャット形式で指示可能だ。企業内でのSpaces共有ファイルから直接プレゼン資料を生成する機能もAdobeExpressのテーマライブラリと連携する。

Google NotebookLMCanvaなど競合他社も類似機能を持つが、Adobeは既存のAcrobatユーザーベースとExpress連携を強みとする。PDF文書のワークフロー生成AIを本格統合した動きとして注目される。

AnthropicとOpenAIが安全・保護強化

Anthropicの安全施策

Agent Skillsをオープン公開
SB53準拠の透明性枠組み
過度な同調性を抑制評価

OpenAIの保護方針

U18原則を仕様に追加
自傷会話の評価結果公開
企業ポリシー一元管理
発達科学に基づく安全応答定義

AnthropicはAgent Skillsをオープンスタンダードとして公開し、企業がAIエージェント機能を既存のワークフローや社内システムに容易に組み込めるよう標準化の取り組みを進めました。

Atlassian・FigmaCanvaStripeNotionなどの主要パートナーがすでに独自のSkillsを構築しており、エコシステムが急速に拡大しつつある状況が明らかになっています。

エンタープライズ顧客向けに組織全体でのClaude利用ポリシーを一元管理できる管理ツールも同時に発表され、大企業での全社導入をさらに後押しする機能として注目されています。

OpenAIはモデル仕様に「U18原則」を追加し、13歳から17歳のユーザーに対して発達科学に基づいた安全で年齢に適切な応答パターンを明確に定義することで保護を強化しました。

Anthropicは自傷・自殺関連の会話でのClaudeの評価結果を積極的に公開し、共感的かつ正直にAIとしての限界を伝えながら適切な支援につなげる方針の詳細を明文化しています。

過度な同調性(sycophancy)を抑制するための評価基準も新たに導入され、ユーザーが望む答えよりも真実を優先するAIの動作が技術的かつ体系的に促進される仕組みが整いました。

AnthropicはカリフォルニアのフロンティアAI透明性法(SB53)への準拠フレームワークを詳細に公開し、法令遵守を超えた業界全体の透明性向上に積極的に貢献しています。

NetSuite Next、AIがERP業務を自律実行し経営を変革

深層統合による「実行するAI」

単なる助言でなく業務を自律実行
後付けでなくワークフローの核に統合
5年の開発を経た根本的な再構築

革新的な新機能とメリット

自然言語で業務設計するAI Canvas
役割に応じ回答変化する文脈認識機能
透明性を保ち判断する管理された自律動作

Oracle基盤による強み

全階層統合による堅牢なセキュリティ
追加コスト不要で全業務にAI実装

Oracle NetSuiteは、AIをERPの中核に統合した新基盤「NetSuite Next」を発表しました。従来の対話型アシスタントとは一線を画し、AIがワークフロー内で自律的に業務を実行することが最大の特徴です。2026年より北米で提供開始予定の本作は、経営者や現場リーダーに対し、意思決定の迅速化と業務プロセスの根本的な変革を約束します。

他社が既存システムへの「後付け」でAI対応を進める中、NetSuiteは5年をかけ、AIを前提としたシステム再構築を行いました。AIは単なる助言役にとどまらず、業務プロセスの実行主体として機能します。ユーザーはツールを切り替えることなく、日常業務の中で自然にAIを活用できます。

新機能「AI Canvas」では、自然言語でプロセスを記述するだけで、システムが実行可能なワークフローを自動構築します。また「Ask Oracle」は、CFOには財務分析、倉庫長には在庫情報といったように、ユーザーの役割や文脈を理解し、その時々に最適な情報を提示します。

「管理された自律動作」により、AIは支払いタイミングの最適化や口座照合などを自動で遂行します。AIはその判断根拠を明示するため、人間はロジックを確認した上で承認や修正が可能です。透明性と効率性を両立し、経営者は複雑なデータ分析作業から解放されます。

本システムはOracleの包括的な技術スタック上で動作し、高度なセキュリティとデータ統合を実現しています。創業者ゴールドバーグ氏は、かつてのクラウド移行と同様に、組み込み型AIの採用が企業の競争力を左右すると語り、AIファーストな経営体制への転換を促しています。

独画像生成AIが3億ドル調達、評価額32.5億ドルへ

大型調達と豪華な投資家陣

シリーズBで3億ドルを調達
評価額32.5億ドルに到達
SalesforceNVIDIAが参加
CanvaFigmaも出資

技術力と急速な普及

マスク氏のGrokが技術採用
最新モデルFlux 2を発表
4K解像度画像生成に対応
Stable Diffusion開発陣が創業

ドイツを拠点とする画像生成AI企業Black Forest Labsは12月1日、シリーズBラウンドで3億ドルを調達したと発表しました。今回の大型調達により、同社の企業評価額32.5億ドルへと急伸しています。

本ラウンドはSalesforce Venturesなどが主導し、a16zNVIDIAといった有力VC・テク企業に加え、CanvaFigmaなどのデザインプラットフォームも出資しました。調達資金は、さらなる研究開発(R&D;)に充てられます。

2024年8月の設立以来、同社は急速に市場シェアを拡大してきました。イーロン・マスク氏のAI「Grok」が同社モデルを採用したことで注目を集め、現在ではAdobeやPicsartなど、クリエイティブ領域の主要企業が技術を導入しています。

直近では最新モデル「Flux 2」を発表し、テキスト描画やレンダリング品質を向上させました。最大10枚の画像を参照してトーンを維持する機能や、4K解像度での生成を実現するなど、プロフェッショナル用途への対応を強化しています。

同社の共同創業者であるRobin Rombach氏らは、かつてStability AIStable Diffusionの開発を主導した研究者たちです。その確かな技術的背景と実績が、短期間での巨額調達と市場からの高い信頼を支えています。

AI買物Ontonが750万ドル調達、家具からアパレルへ

ユーザー200万人突破と大型調達

MAUが5万から200万へ急増
750万ドルを追加調達し拡大へ
家具からアパレル・家電へ展開

幻覚を排除する独自AI技術

ニューロシンボリックAIを採用
LLMの弱点を補い論理的推論を実現
画像生成無限キャンバで購買支援
従来EC比で3〜5倍のCV率達成

AI搭載ショッピング検索の米Ontonが、750万ドル資金調達を実施しました。同社の月間アクティブユーザー数は5万から200万人へと急成長しており、今回の資金で家具中心の事業をアパレルや家電へと拡大する計画です。

同社の核は「ニューロシンボリックAI」です。確率的なLLMの弱点である「幻覚」を排除し、例えば「ペット向き」なら「汚れに強い素材」を導き出すなど、商品データに基づいた論理的な検索結果を提供できる点が競合との差異です。

チャット形式にとどまらない視覚的なUXも特徴です。ユーザーは部屋の画像をアップロードして家具配置を試したり、無限キャンバス上で商品比較を行ったりでき、従来のECサイトと比較して3〜5倍のコンバージョン率を達成しています。

AI商品検索GooglePerplexityも参入する激戦区です。Ontonは旧名Deftから改称し、現在は10名の少数精鋭ですが、今後はエンジニア採用を強化し、家具での成功を基盤にアパレル分野でのシェア獲得を狙います。

Gemini 3実機検証:3D生成と自律操作の進化と課題

高度な可視化とUI生成機能

複雑な3D可視化やUI生成が可能
生成物の細部はデモより粗い傾向
旅行計画等を動的Webページで提示

エージェント機能の実力と限界

Gmail整理や予定登録を自律実行
Googleアプリ連携は他社より強力
予約代行等は動作が不安定な側面も

Googleが今週発表した最新AIモデル「Gemini 3」について、米テックメディアThe Vergeが実機レビューを行いました。双方向の3D可視化や自律的なタスク実行など、生産性を高める新機能が実装されましたが、実際の使用感は宣伝に対してどこまで忠実か、その実力を検証した結果、強力な機能とともに一部課題も残ることが判明しました。

開発ワークスペース「Canvas」では、複雑なプロンプトからインタラクティブな3Dモデルを生成可能です。デモ同様の比較図表が作成できた一方、細部の画質や正確性ではGoogleの公式デモに劣るケースも確認されました。特に3Dモデルのディテールは簡素になる傾向があります。

新機能「Generative UI」は、旅行計画などの情報を雑誌風レイアウトや動的なWebページとして提示します。ユーザーの好みに応じて表示内容を即座に再構築するため、情報の視認性と操作性が大幅に向上しており、単なるテキスト回答を超えた体験を提供します。

自律機能「Gemini Agent」はGmailと強力に連携し、未読メールの整理や請求書のリマインダー登録を自動化します。他社AIが読み取り専用に留まる中、Googleエコシステム内での直接操作において明確な優位性を見せました。特に大量のメール処理には有用です。

一方で、レストラン予約などの複雑なタスクでは、架空の手数料を警告したり確認を繰り返したりと不安定な挙動も見られます。現時点では手動操作の方が早い場面もあり、完全な自律化には時間を要するでしょう。日常的なツールとして定着するには、さらなる信頼性の向上が不可欠です。

グーグル、AI旅行機能を世界展開 検索が旅のプランナーに

世界展開する新機能

AI格安航空券検索世界展開
200以上の国・地域で利用可能
日本韓国欧州でも提供開始
60以上の言語に対応し利便性向上

AIによる計画と予約

新機能Canvasで旅程を自動生成
航空券やホテル情報を一元管理
米国でレストランのAI代理予約開始
将来は航空券やホテル予約もAIで

Googleは2025年11月17日、検索エンジンにAIを活用した新たな旅行計画機能を導入し、世界規模でサービスを拡充すると発表しました。格安航空券検索ツール「Flight Deals」を世界200以上の国と地域で提供開始するほか、旅程を自動生成する「Canvas」機能を米国で導入。これにより、ユーザーは検索から計画、予約まで一気通貫で、よりパーソナライズされた旅行体験を得られるようになります。

今回の拡充の目玉の一つが、AI搭載の格安航空券検索ツール「Flight Deals」の世界展開です。これまで米国など一部地域限定でしたが、日本韓国欧州を含む200以上の国と地域で利用可能になりました。ユーザーが行き先や日程を自然言語で入力するだけで、AIが最適な格安航空券を提案。60以上の言語に対応し、世界中の旅行者の利便性を大きく向上させます。

さらに、米国ではデスクトップ版の「AI Mode」にCanvas」と呼ばれる新機能が加わりました。これは、ユーザーの要望に応じてフライト、ホテル、Googleマップの写真やレビュー、Web上の関連情報などを統合し、具体的な旅行プランをサイドパネルに自動生成するものです。対話形式で条件を追加・変更でき、まるで専属の旅行プランナーがいるかのような体験を提供します。

計画だけでなく、実行段階のサポートも強化されます。AIがユーザーに代わって予約作業を行う「代理予約(Agentic Booking)」機能が、レストラン予約において米国の全ユーザーに開放されました。今後は航空券やホテルの予約もAI Mode内で直接完了できるよう開発を進めており、旅行業界のエコシステムを大きく変える可能性があります。

GoogleはBooking.comやExpediaといった大手旅行会社との提携も進めており、既存の業界プレーヤーと協力しながらエコシステムを構築する姿勢を見せています。検索エンジンが単なる情報収集ツールから、具体的なタスクを実行するエージェントへと進化する今回の動きは、旅行業界のみならず、あらゆる業界のビジネスパーソンにとってAI活用の未来を占う重要な事例と言えるでしょう。

Adobe Firefly、生成AIを統合した新基盤

Fireflyの統合機能

着想から制作までを支援
複数AIモデルを一元管理
画像動画音声のフル生成
手間を省くクイックアクション

独自のクレジット制度

機能ごとにクレジットを消費
モデルや出力品質で変動
有料プランは標準機能が無制限

商用利用について

アドビ製モデルは商用利用可
パートナー製モデルは要注意

アドビが提供する「Firefly」は、単なる画像生成AIではありません。アドビ自社モデルに加え、GoogleOpenAIなどのサードパーティ製AIモデルを統合した、クリエイティブワークフローのための包括的な生成AIツール群です。画像動画の生成から編集、アイデア出しまで、あらゆるクリエイティブ作業を一つのプラットフォーム上で完結させることを目指しています。

Fireflyの機能は大きく4つに分類されます。無限のキャンバスでアイデアを練る「着想」、テキストから画像動画を生成する「生成」、動画の自動キャプション付けなどを行う「制作」、そしてファイル変換といった定型作業を効率化する「クイックアクション」です。これらを組み合わせることで、制作プロセス全体を加速させます。

Fireflyの利用には「生成クレジット」という独自の制度が採用されています。使用するAIモデルや出力品質に応じて消費クレジット数が変動する従量課金的な側面を持ちます。例えば、Googleの最新モデルは高コストに設定されるなど、機能によって消費量が異なるため、利用計画には注意が必要です。

料金プランは無料版から月額200ドルのプレミアム版まで4種類が用意されています。有料プランでは、基本的な生成機能が無制限で利用でき、割り当てられたクレジットをより高度な「プレミアム機能」に集中して使用できます。Creative CloudのProプランにもFirefly Pro相当の機能が含まれます。

ビジネスユーザーにとって最も重要な商用利用については、明確な指針が示されています。アドビが自社データでトレーニングしたFireflyモデルで生成したコンテンツは商用利用が可能です。一方、パートナー企業が提供するモデルを使用する場合は、著作権侵害のリスクがないか個別に確認する必要があります。

Adobe Fireflyは、乱立する生成AIツールを一つに集約し、クリエイターや企業がAIをよりシームレスに活用するための強力な基盤となりつつあります。今後、クリエイティブ産業の生産性を大きく変革する可能性を秘めていると言えるでしょう。

OpenAI、企業顧客100万人突破 史上最速で成長

驚異的な成長スピード

企業顧客数が100万人を突破
史上最速のビジネスプラットフォーム
Enterprise版シート数は前年比9倍
Work版シート数は700万席を突破

生産性を高める新機能群

GPT-5搭載のAgentKitで業務自動化
Codexコードレビュー時間を半減
マルチモーダル対応で多様な業務へ
企業の75%がプラスのROIを報告

OpenAIは、法人向けサービスの利用企業が世界で100万社を突破し、史上最速で成長するビジネスプラットフォームになったと発表しました。ChatGPT for Workのシート数も700万席を超え、2ヶ月で40%増と急拡大しています。消費者向けChatGPTの普及を背景に、業務自動化を支援する新ツール群も投入し、企業のAI活用を後押しします。

企業向けサービスの勢いは数字にも表れています。有料の法人顧客は100万人を超え、特に大企業向けのChatGPT Enterpriseのシート数は前年比で9倍に達しました。この成長は、AIが単なる実験的ツールから、事業運営に不可欠な基盤へと移行している現状を明確に示しています。

この急成長の背景には、消費者向けChatGPTの圧倒的な普及があります。週に8億人が利用するサービスに慣れ親しんでいるため、従業員が抵抗なく業務でAIを使い始められます。これにより、企業は導入時の摩擦を減らし投資対効果(ROI)を早期に実現できるのです。

OpenAIは企業の本格導入を支援するため、新ツール群も発表しました。社内データと連携する「AgentKit」や、コード生成を支援する「Codex」の利用が急増。画像音声も扱えるマルチモーダル機能も強化し、より幅広い業務での活用を可能にしています。

実際に多くの企業が成果を上げています。ウォートン校の調査では、導入企業の75%がプラスのROIを報告。求人サイトIndeedは応募数を20%増加させ、シスコはコードレビュー時間を半減させるなど、具体的なビジネス価値を生み出しています。

自社ツールへの組み込みも進んでいます。CanvaやShopifyなどがChatGPTと連携し、新たな顧客体験を創出しています。OpenAIは、単なるツール提供者にとどまらず、「仕事のOS」を再定義するプラットフォームとなることを目指しており、その動きは今後さらに加速しそうです。

AI企業、学生の不正助長か 責任回避の姿勢に批判集中

AI企業の販売戦略

学生向け無料キャンペーンの乱発
紹介プログラムによる利用者拡大
不正利用を示唆するような広告
責任は学生にあるとする企業の開き直り

教育現場の混乱と懸念

AIによる課題の自動提出が横行
学習管理システムの対策は困難
教育者からの規制要求の高まり
ガイドライン不在のまま技術が普及

OpenAIGoogleなどの大手テック企業が、学生向けに自社AIツールの利用を積極的に推進しています。しかし、課題の自動提出などを可能にするAIエージェント学生の不正行為に悪用される事例が急増し、問題となっています。企業側は責任回避の姿勢を見せており、教育現場からは対策を求める声が強まっています。

特に検索AIを手がけるPerplexity社は、AIが小テストを代行する広告をSNSで展開するなど、不正利用を助長しているとの批判を受けています。同社CEOはSNSで『絶対にやるな』と冗談めかして投稿する一方、広報は『いつの時代も不正はあった』と開き直り、企業の倫理観が問われる事態です。

OpenAI学生向けにChatGPT Plusの無料提供を行い、Googleも同様のキャンペーンを実施しています。OpenAIは『学習を阻害しない』学習モードを追加するなど配慮を見せる一方で、市場獲得を優先する姿勢は明らかです。教育現場では、これらのツールが生徒の学習能力そのものを奪うとの懸念が広がっています。

多くの大学や学校で利用される学習管理システム『Canvas』では、AIエージェント学生になりすまし課題を提出する動画が拡散されました。運営元のInstructure社は当初、技術的な対策は困難とし、AIの導入は止められないとの見解を示しました。教育現場とプラットフォーム側の認識の乖離が浮き彫りになっています。

こうした状況を受け、教育関係者からはAI企業に対し、不正利用を防ぐための責任ある製品開発と、教育者がAIツールの利用を制御できる機能を求める声が高まっています。専門家は現状を、ルールなき『ワイルド・ウエスト(無法地帯)』だと指摘し、早急なガイドライン策定の必要性を訴えています。

結局のところ、倫理的な指針や規制が確立されないまま、AIツールは教育現場に浸透してしまいました。不正行為の発見や指導といった最終的な負担は個々の教師に押し付けられているのが現状です。テクノロジーの進化と教育倫理のバランスをどう取るのか、社会全体での議論が求められます。

Google検索AI、チケットや美容室の予約代行を開始

AIが予約を代行

イベントチケットの予約支援
美容・ウェルネスの予約も可能
複数サイトを横断検索
条件に合う選択肢をリスト化

利用方法と今後の展望

自然言語でAIに指示するだけ
米国Search Labsで先行提供
レストラン予約に続く機能拡張
有料プランは利用上限が高い

Googleは2025年11月4日、同社の検索機能「AIモード」に新たなエージェント機能を追加したと発表しました。これにより、イベントのチケット予約や美容・ウェルネス施設の予約をAIが支援します。米国内の実験的サービス「Search Labs」の利用者を対象に提供が開始され、複雑なタスクを検索内で完結させることを目指します。

新機能では、例えば「コンサートの安い立ち見席を2枚探して」と自然言語で指示するだけで、AIが複数のウェブサイトを横断検索します。条件に合うチケットの選択肢をリアルタイムでリスト化し、ユーザーを直接予約ページへ誘導することで、購入までの手間を大幅に削減します。

この機能は、8月に先行導入されたレストラン予約機能の拡張版と位置づけられています。レストラン予約では、人数、日時、場所、料理の種類といった複数の条件を組み合わせて空席情報を探すことが可能で、今回の機能追加で対応範囲がさらに広がった形です。

現在、このエージェント機能は米国内でGoogleの実験的サービス「Search Labs」に参加しているユーザーが利用できます。なお、有料プランである「Google AI Pro」および「Ultra」の加入者は、利用回数の上限が緩和される特典が設けられています。

Googleは、Perplexity AIやOpenAIChatGPT Searchといった競合サービスに対抗するため、2025年3月にAIモードを導入しました。以来、180カ国以上へと提供を拡大し、学習計画を支援する「Canvas」機能などを追加しながら、検索体験の高度化を急いでいます。

Googleは「この機能はまだ初期の実験段階であり、間違いを犯す可能性もある」と注意を促しています。しかし、検索エンジンが単なる情報検索ツールから、ユーザーの目的達成を能動的に支援する「エージェント」へと進化する方向性を明確に示したと言えるでしょう。

Figma、AI動画生成Weavy買収 デザイン機能強化へ

買収の概要

デザイン大手Figmaがイスラエル企業を買収
買収額は非公開、従業員20名が合流
ブランドFigma Weave」として統合予定

Weavyの強み

複数AIモデルで画像動画を生成
プロンプト微調整可能な高度編集機能
ノードベースで生成物を分岐・リミックス

今後の展望

当面はスタンドアロン製品として提供
Figmaのプラットフォームに順次統合

デザインプラットフォーム大手のFigmaは10月30日、AIによる画像動画生成を手がけるイスラエルのスタートアップWeavyを買収したと発表しました。Weavyの従業員20名がFigmaに合流し、同社の技術は新ブランドFigma Weave」として将来的にはFigmaのプラットフォームに統合されます。この買収により、FigmaデザインプロセスにおけるAI生成能力を大幅に強化する狙いです。

Weavyは2024年にテルアビブで設立された新興企業です。創業から1年足らずで、シードラウンドにて400万ドルを調達するなど注目を集めていました。同社のツールは、ユーザーが複数のAIモデルを組み合わせて高品質な画像動画を生成し、プロ向けの編集機能で細かく調整できる点が特徴です。

Weavyの技術的な強みは、その柔軟な生成プロセスにあります。ユーザーは無限キャンバス上で、画像生成動画生成プロンプトを組み合わせるなど自由な発想でメディアを作成できます。この「ノードベース」のアプローチにより、生成結果を分岐させたり、リミックスしたりと、創造的な試行錯誤と改良が容易になります。

Figmaによると、Weavyは当面スタンドアロン製品として提供が継続されます。その後、新ブランドFigma Weave」としてFigmaのプラットフォーム全体に統合される計画です。Figmaのディラン・フィールドCEOは、Weavyの「シンプルさ、親しみやすさ、そしてパワフルさのバランス」を高く評価しており、統合によるシナジーに期待を寄せています。

AIデザインツールの市場は競争が激化しています。AI検索Perplexityデザインツールチームを買収するなど、大手テック企業によるAIクリエイティブ領域への投資が活発化しています。今回の買収は、デザインワークフローのあらゆる段階にAIを組み込もうとするFigmaの強い意志を示すものであり、今後の業界の動向を占う上で重要な一歩と言えるでしょう。

Canva、AI統合の新OSでマーケティングを革新

「創造性のOS」の核心

デザイン特化の独自AIモデルを搭載
制作から配信まで一気通貫の作業環境
人とAIの協働を新たな哲学に

マーケティング機能強化

新機能「Canva Grow」で広告運用を自動化
効果測定データからAIが学習・改善
コーディング不要のメールデザイン機能

競合との差別化

デザイナー向けの圧倒的な使いやすさ
60万超のテンプレートと1.4億超のアセット

デザインプラットフォーム大手のCanvaが、デザイン特化の独自AIを統合した新サービス「Creative Operating System (COS)」を発表しました。これにより、マーケティングチームはクリエイティブ制作から広告配信、効果測定までを一気通貫で行えるようになります。同社はAIが主導する「想像力の時代」の中核戦略と位置づけ、企業の生産性向上を強力に支援する構えです。

COSは従来のOSではなく、同社のツール群を統合した包括的なワークスペースを指します。その中核をなすのが、デザインの複雑性を理解するために独自開発されたAIモデルです。写真や動画、3Dグラフィックスといった多様な要素を、企業のブランドスタイルに合わせてリアルタイムで生成・編集することが可能になります。

特に注目されるのが、マーケティング自動化プラットフォームCanva Grow」です。企業のウェブサイトをAIが自動でスキャンし、ターゲット顧客やブランドアセットを分析。最適な広告クリエイティブを生成し、Metaなどのプラットフォームへ直接配信、効果測定までを一貫して行えるため、マーケティング業務が劇的に効率化します。

新機能「Ask Canva」も強力な武器となるでしょう。ユーザーは「@Canva」と入力するだけで、AIからコピーライティングの提案やスマートな編集案を受け取れます。これは、常にAIという優秀なデザインパートナーと協働できることを意味し、同社が掲げる「人とAIのコラボレーション」という哲学を体現しています。

Canvaの強みは、Adobe ExpressやMicrosoft Designerといった競合と比べ、デザイナーでも直感的に使える点にあります。60万を超える豊富なテンプレートと1.4億点以上のアセットライブラリが、専門知識のないユーザーでも高品質なクリエイティブを迅速に作成することを可能にしています。

既にWalmartやDisneyなどのグローバル企業が導入し、成果を上げています。例えばDocuSign社は、Canvaの全面導入により500時間以上の工数削減と30万ドル以上のデザイン費用節約を実現したと報告。月間2.5億人以上が利用する巨大プラットフォームの進化は、あらゆる企業のクリエイティブ戦略に大きな影響を与えそうです。

ChatGPT、外部アプリ連携で万能アシスタント化

連携で広がる可能性

自然言語で外部アプリを操作
チャット内でタスクを完結
パーソナライズされた体験

ビジネスでの活用例

Figma図表やロードマップ作成
Canvaプレゼン資料を自動生成
Expediaで出張のフライト・ホテル予約

利用時の注意点

アプリとのデータ共有許可が必須
現在は米国・カナダでのみ提供

OpenAIが、ChatGPT内で外部アプリを直接操作できる新機能を発表しました。Spotifyでのプレイリスト作成からFigmaでの図表生成まで、チャットを通じて様々なタスクを完結できます。この連携は、AIを日常業務に活用するビジネスパーソンにとって、生産性を飛躍的に高める可能性を秘めています。

特にビジネスシーンでの活用が期待されます。例えば、デザインツールFigmaと連携すれば、ブレインストーミングの結果をフローチャートやロードマップとして即座に可視化できます。また、Canvaを使えば「第4四半期のロードマップに関するプレゼン資料」といった指示だけで、資料の雛形を自動生成することも可能です。

業務効率化はデザイン分野に限りません。出張手配では、ExpediaやBooking.comと連携し、予算や日程に合わせたフライトやホテルを対話形式で検索できます。さらにCourseraと連携すれば、自身のスキルレベルに合ったオンライン講座を効率的に探すことができ、自己投資やリスキリングにも役立ちます。

利用開始は簡単で、プロンプトの冒頭で使いたいアプリ名を指定するか、設定メニューからアカウントを接続するだけです。ただし、連携には各アプリのデータ共有の許可が前提となります。どのような情報がChatGPTに渡るのか、プライバシーに関する権限を事前に確認することが重要です。接続はいつでも解除できます。

OpenAIは今後、DoorDashやUber、Walmartなどもパートナーに追加する計画です。これにより、ChatGPTは日常のあらゆる場面をサポートするプラットフォームとしての役割を強めるでしょう。なお、この機能は現在、米国とカナダのユーザーに限定して提供されており、日本での展開時期は未定です。

Google Gemini、動画・スライド・TVへ機能拡張

動画とプレゼン作成を自動化

リアルな動画を生成するVeo 3.1
効果音付きの対話動画も作成可能
トピック入力でプレゼン資料を自動生成

日常業務と家庭での活用

複雑な手順を段階的に解説
数式のコピーや編集が容易に
テレビ番組検索音声対話で支援
質問にYouTube動画で回答

Googleは2025年10月24日、AIアシスタントGemini」の月次アップデートを発表しました。今回の「October Gemini Drop」では、動画生成AI「Veo 3.1」や、プレゼンテーション資料を自動生成する「Canvas」機能が追加されました。さらにGoogle TVとの連携も実現し、クリエイティブ制作から家庭での利用まで、活用の幅を大きく広げます。生産性向上を目指すビジネスパーソンにとって注目の内容です。

中でも注目されるのが、動画生成AIの最新版Veo 3.1」です。実写に近いリアルな質感の映像を生成できるほか、カメラワークの制御もより簡単になりました。さらに、効果音付きの対話を含む動画の作成も可能となり、マーケティングやコンテンツ制作の現場で、時間とコストを大幅に削減する可能性を秘めています。

プレゼン資料作成の常識を覆すのが新機能Canvas」です。トピックや参考資料をアップロードするだけで、AIがテーマや関連画像を含むスライド一式を自動で生成します。完成した資料はGoogleスライドで微調整でき、企画書作成を劇的に効率化します。この機能はまずProユーザー向けに提供が開始されます。

Geminiの活用シーンは家庭にも広がります。Gemini for Google TV」により、視聴したい番組を対話形式で探せるようになります。さらに、一般的な質問に対して、関連するYouTube動画を提示しながら回答する機能も搭載。単なる検索アシスタントにとどまらない、新しいテレビ視聴体験を提供します。

このほか、複雑なトピックを段階的に解説する能力が向上したGemini 2.5 Flashのアップデートや、Web版での数式(LaTeX)の扱いやすさ向上など、専門的な作業を支援する改善も含まれています。今回のアップデートは、Geminiが多機能で実用的なAIアシスタントへと進化したことを示しています。

豪州「AI国家」へ、NVIDIAがエコシステムを主導

シドニーにAI関係者1000人集結

テーマは「ソブリンAI
生成AIやロボティクスなど最新技術を議論
大手銀やCanvaなど業界リーダーが参加

豪州AIエコシステムの急成長

スタートアップVCの連携加速
量子コンピューティング分野も活況
HPCやVFXの強みをAIに活用

NVIDIAは先週、オーストラリアのシドニーで「NVIDIA AI Day」を開催し、1000人以上の開発者や研究者、スタートアップが集結しました。イベントでは、各国が自国のデータを管理・活用する「ソブリンAI」をテーマに、生成AIやロボティクスなどの最新動向が議論されました。NVIDIAインフラ提供やパートナーシップを通じて、オーストラリアのAIエコシステム構築を強力に後押しし、同国をAI分野の世界的リーダーへと押し上げる構えです。

今回のイベントは、オーストラリアにおけるAIの可能性を明確に示しました。コモンウェルス銀行の最高情報責任者は「次世代のコンピュートがAIを牽引している」と述べ、NVIDIAが同国のAIエコシステム構築に貢献していることを高く評価。金融サービスから公共部門まで、幅広い業界でAIによるデジタルトランスフォーメーションが加速している現状が浮き彫りになりました。

エコシステムの中核を担う企業の動きも活発です。オーストラリア発のデザインプラットフォーム大手Canvaは、NVIDIAの技術を活用して数億人のユーザー向けに生成AIソリューションを開発している事例を紹介。同社のエンジニアリング担当シニアディレクターは「NVIDIAの技術を広範に活用し、AI機能をユーザーに提供している」と語り、具体的な協業の成果を強調しました。

未来の成長を担うスタートアップの育成にも力が注がれています。NVIDIAは今回、スタートアップベンチャーキャピタルVC)、パートナー企業を一堂に集めるネットワーキングイベントを初開催。量子コンピューティングや医療AIなど多様な分野の新興企業が登壇し、自社の技術を披露しました。地域のAI戦略を推進し、セクターを超えた協業を創出する絶好の機会となりました。

NVIDIAは、オーストラリアが持つ強みをAI時代の成長エンジンと見ています。同社の現地法人の責任者は「高性能コンピューティング(HPC)やVFXで培った専門知識と、活気ある量子・ロボティクス産業の融合が鍵だ」と指摘。強力な官民連携と世界クラスのインフラを武器に、オーストラリアAIによる経済発展の世界的リーダーになる未来像を描いています。

AI基盤Fal.ai、企業価値40億ドル超で大型調達

企業価値が爆発的に増大

企業価値は40億ドルを突破
わずか3ヶ月で評価額2.7倍
調達額は約2億5000万ドル
著名VCが大型出資を主導

マルチモーダルAI特化

600以上のメディア生成モデルを提供
開発者数は200万人を突破
AdobeCanvaなどが顧客
動画AIなど高まる需要が追い風

マルチモーダルAIのインフラを提供するスタートアップのFal.aiが、企業価値40億ドル(約6000億円)超で新たな資金調達ラウンドを完了しました。関係者によると、調達額は約2億5000万ドルに上ります。今回のラウンドはKleiner PerkinsSequoia Capitalという著名ベンチャーキャピタルが主導しており、AIインフラ市場の過熱ぶりを象徴しています。

驚くべきはその成長速度です。同社はわずか3ヶ月前に評価額15億ドルでシリーズCを終えたばかりでした。当時、売上高は9500万ドルを超え、プラットフォームを利用する開発者は200万人を突破。1年前の年間経常収益(ARR)1000万ドル、開発者数50万人から爆発的な成長を遂げています。

この急成長の背景には、マルチモーダルAIへの旺盛な需要があります。特に、OpenAIの「Sora」に代表される動画生成AIが消費者の間で絶大な人気を博していることが、Fal.aiのようなインフラ提供企業への追い風となっています。アプリケーションの需要が、それを支える基盤技術の価値を直接押し上げているのです。

Fal.aiは開発者向けに、画像動画音声、3Dなど600種類以上のAIモデルを提供しています。数千基のNVIDIA製H100およびH200 GPUを保有し、高速な推論処理に最適化されたクラウド基盤が強みです。API経由のアクセスやサーバーレスでの提供など、柔軟な利用形態も支持されています。

MicrosoftGoogleなど巨大IT企業もAIホスティングサービスを提供していますが、Fal.aiはメディアとマルチモーダルに特化している点が競争優位性です。顧客にはAdobeCanvaPerplexity、Shopifyといった大手企業が名を連ね、広告、Eコマース、ゲームなどのコンテンツ制作で広く活用されています。

同社は2021年、Coinbaseで機械学習を率いたBurkay Gur氏と、Amazon出身のGorkem Yurtseven氏によって共同設立されました。多くの技術者が大規模言語モデル(LLM)開発に走る中、彼らはマルチメディア生成の高速化と大規模化にいち早く着目し、今日の成功を収めました。

Anthropic、専門業務AI化へ 新機能『Skills』発表

新機能「Skills」とは

業務知識をフォルダでパッケージ化
タスクに応じAIが自動でスキル読込
ノーコードでもカスタムAI作成可能

導入企業のメリット

プロンプト手間を削減し作業効率化
属人化しがちな専門知識を共有
楽天は業務時間を8分の1に短縮

主な特徴と利点

複数スキルを自動で組合せ実行
APIなど全製品で一度作れば再利用OK

AI開発企業Anthropicは10月16日、同社のAIモデル「Claude」向けに新機能「Skills」を発表しました。これは、企業の特定業務に関する指示書やデータをパッケージ化し、Claudeに専門的なタスクを実行させるAIエージェント構築機能です。複雑なプロンプトを都度作成する必要なく、誰でも一貫した高品質のアウトプットを得られるようになり、企業の生産性向上を支援します。

「Skills」の核心は、業務知識の再利用可能なパッケージ化にあります。ユーザーは、指示書やコード、参考資料などを一つのフォルダにまとめることで独自の「スキル」を作成。Claudeは対話の文脈を理解し、数あるスキルの中から最適なものを自動で読み込んでタスクを実行します。これにより、AIの利用が特定の個人のノウハウに依存する問題を解決します。

導入効果は劇的です。先行導入した楽天グループでは、これまで複数部署間の調整が必要で丸一日かかっていた管理会計業務を、わずか1時間で完了できるようになったと報告しています。これは生産性8倍に相当します。他にもBox社やCanva社が導入し、コンテンツ作成や資料変換といった業務で大幅な時間短縮を実現しています。

技術的には「段階的開示」と呼ばれるアーキテクチャが特徴です。AIはまずスキルの名称と要約だけを認識し、タスクに必要と判断した場合にのみ詳細情報を読み込みます。これにより、モデルのコンテキストウィンドウの制限を受けずに膨大な専門知識を扱える上、処理速度とコスト効率を維持できるのが、競合の類似機能に対する優位点です。

本機能は、Claudeの有料プラン(Pro、Max、Team、Enterprise)のユーザーであれば追加費用なしで利用できます。GUI上で対話形式でスキルを作成できるため、エンジニアでなくとも利用可能です。もちろん、開発者向けにはAPIやSDKも提供され、より高度なカスタムAIエージェントを自社システムに組み込めます。

一方で、SkillsはAIにコードの実行を許可するため、セキュリティには注意が必要です。Anthropicは、企業管理者が組織全体で機能の有効・無効を制御できる管理機能を提供。ユーザーが信頼できるソースから提供されたスキルのみを利用するよう推奨しており、企業ガバナンスの観点からも対策が講じられています。

AIエージェント開発競争が激化する中、Anthropicは企業の実用的なニーズに応える形で市場での存在感を高めています。専門知識を形式知化し、組織全体の生産性を高める「Skills」は、AI活用の次の一手となる可能性を秘めているのではないでしょうか。

OpenAIの全方位戦略、既存ソフト業界に激震

OS化するChatGPT

ChatGPT内で外部アプリが動作
CanvaやZillowなどと連携
開発者向けツールを積極拡充
目指すはAI時代のOS

SaaS市場への地殻変動

社内ツール公開で株価が急落
DocuSignなどが直接的な影響
提携発表による株価急騰も
AIバブルへの懸念も浮上

OpenAI開発者会議でChatGPTのアプリ連携機能を発表し、AIの「OS化」を本格化させています。この動きは、社内ツールの公開だけでSaaS企業の株価が急落するなど、ソフトウェア市場に大きな地殻変動を引き起こしています。AI時代の新たなプラットフォーマーの誕生は、既存ビジネスを根底から揺るがす号砲となるかもしれません。

戦略の核心は、ChatGPTを単なる対話型AIから、あらゆるサービスが連携するプラットフォームへと進化させることです。CanvaやZillowといった身近なアプリがChatGPT上で直接使えるようになり、ユーザーはシームレスな体験を得られます。これはかつてのスマートフォンOSがアプリストアを通じてエコシステムを築いた動きと酷似しています。

この戦略がもたらす影響は絶大です。OpenAIが「DocuGPT」という社内ツールについて言及しただけで、競合と目されたDocuSignの株価は12%も下落しました。これは、OpenAI実験的な取り組み一つが、確立されたSaaS企業の市場価値を瞬時に毀損しうるという現実を突きつけています。

一方で、OpenAIとの連携は強力な追い風にもなります。CEOのサム・アルトマン氏がFigmaに言及すると、同社の株価は7%上昇しました。市場はOpenAIとの距離感に極めて敏感に反応しており、提携はプラスに、競合はマイナスに作用する二面性を示しています。もはやOpenAIの動向は無視できない経営指標と言えるでしょう。

既存のSaaS企業は、単に自社製品にAIを組み込むだけでは不十分です。OpenAIという巨大な重力源の周辺で、いかに独自の価値を提供し、共存あるいは対抗するかの戦略が問われています。あなたのビジネスは、このAIによる市場再定義の波にどう立ち向かいますか。

ただし、こうした熱狂には冷静な視点も必要です。AIインフラへの投資額が5000億ドルに達すると予測される一方、消費者のAIへの支出は120億ドルに留まるとの指摘もあります。この巨額投資と実需の乖離が「AIバブル」ではないかとの懸念も高まっており、今後の動向を慎重に見極める必要があります。

ChatGPTがOS化へ。「Apps SDK」で外部アプリを統合

連携アプリの核心

ChatGPT内で完結する対話型アプリを実現
サードパーティ連携を可能にするApps SDKを発表
既存のGPTsとは異なる本格的なアプリ連携

対話を通じた機能実行

自然言語でアプリを呼び出しタスクを実行
地図・動画・資料などインタラクティブUI表示
Zillowで住宅検索Canvaデザイン生成

開発者への新機会

8億人超ChatGPTユーザーへリーチ
将来的にアプリ収益化と専用ストアを導入

OpenAIは年次開発者会議「DevDay」で、サードパーティ製アプリをChatGPT内に直接統合できる新ツール「Apps SDK」を発表しました。これにより、ChatGPTは単なるチャットボットから、AI駆動のオペレーティングシステム(OS)へと進化します。ZillowやSpotify、Canvaなどの有名サービスが既に連携を始めており、ユーザーはチャットを離れることなく、アプリの機能を自然言語で呼び出して利用できます。

Apps SDKの最大の特長は、従来のプラグインやGPTsと異なり、完全にインタラクティブなUIをチャット内に表示できる点です。例えば、ユーザーが特定の不動産検索すれば、チャットウィンドウ内にZillowの対話型マップが表示されます。これにより、会話の流れを中断せず、視覚的な要素や操作を通じてタスクを完了できるため、ユーザー体験が大幅に向上します。

具体的な利用シーンとして、Canva連携では、「次のセール用インスタグラム投稿を作成して」と依頼するだけで、デザイン案が生成されます。また、ExpediaやBooking.comとの連携により、旅行の計画やホテルの予約も会話を通じて完結します。これは、AIがユーザーの指示を理解し、外部サービスのアクションを代行するエージェント」機能の実現を意味します。

開発者にとって、Apps SDKは既存のシステムとAIを連携させる強力な手段です。これは、オープンスタンダードである「Model Context Protocol(MCP」に基づいて構築されており、既存の顧客ログインやプレミアム機能へのアクセスも容易になります。これにより、開発者8億人以上ChatGPTユーザーという巨大な流通チャネルを獲得可能です。

今後、OpenAIはアプリの収益化サポートを強化する予定です。「Agentic Commerce Protocol」により、チャット内での即時決済機能(インスタントチェックアウト)を導入する計画も示されました。さらに、法人・教育機関向けプランへの展開や、ユーザーがアプリを探せる専用ディレクトリの公開も予定されており、AIエコシステム構築が加速します。

OpenAI、AgentKitを発表:AIエージェント開発を数時間で実現

開発効率を劇的に向上

Agent Builderによる視覚的なワークフロー設計
複雑なオーケストレーションを数時間レベルで実現
開発サイクルを70%短縮(Ramp社事例)
エンジニア専門家同一インターフェースで共同作業

主要機能とエンタープライズ対応

ChatKit:製品にネイティブに組み込めるチャットUI
Connector Registry:外部データ接続の一元管理
評価機能Evalsのトレース採点に対応
GuardrailsによるPIIマスキングや安全層の確保

OpenAIはAIエージェントの構築、デプロイ、最適化を劇的に効率化する統合ツールキット「AgentKit」を発表しました。これまで断片化していたツール群を一本化し、複雑なマルチエージェントワークフロー視覚的に設計可能にします。これにより、開発期間が大幅に短縮され、市場投入までの摩擦を最小限に抑えることを目指し、企業の生産性向上を強力に支援します。

AgentKitの中核となるのは「Agent Builder」です。これはドラッグ&ドロップでロジックを構成できる視覚的なキャンバスであり、数ヶ月要していた複雑なオーケストレーションを数時間で完了させることが可能になります。金融企業のRamp社やLY Corporationといった事例は、このツールによりエージェント構築とデプロイの時間を劇的に短縮したことを実証しています。

エージェントを製品に組み込むための「ChatKit」は、チャットUIのデプロイを簡素化し、製品にネイティブな外観で埋め込みを可能にします。また「Connector Registry」により、管理者はDropboxやGoogle Driveなどの外部データ接続を一元管理できます。これは、大企業がセキュアな環境エージェントを活用するための基盤となります。

信頼性の高いエージェント開発を支えるため、OpenAIは評価機能「Evals」を大幅に強化しました。エージェントワークフローの全行程を評価する「トレース採点」や、評価結果に基づいたプロンプトの自動最適化機能が追加されています。これにより、開発時間を50%以上短縮し、エージェントの精度向上に直結します。

Agent Builderには、オープンソースの安全レイヤーである「Guardrails」も統合されています。これは、個人識別情報(PII)のマスキングやジェイルブレイク検出などに対応し、エージェントの予期せぬ挙動や悪意ある利用から保護します。これにより、エンタープライズ利用に不可欠な安全層を確保しています。

AgentKitの提供状況は段階的です。ChatKitと強化されたEvals機能はすでに一般提供が始まっていますが、Agent Builderは現在ベータ版です。OpenAIはこれらのツールを標準APIモデル料金に含めることで、GoogleMicrosoftといった競合他社との開発競争を優位に進めたい考えです。

「直感」でアプリ開発へ。AIが切り拓くバイブ・コーディングの衝撃

バイブ・コーディングとは

定義:エンジニアでも開発可能に
自然言語でアイデアを具現化
AIが自動でコードを生成・視覚化

開発変革の具体策

アイデアのプロトタイピングを加速
開発者とのビジュアル連携を強化
バグ修正や機能追加のタスク自動化

活用ツールとプロセス

Gemini (Canvas)で基本製品を生成
StitchでUI/フロントエンドを設計
Jules生産レベルのコードを実装

Googleは、コーディングスキルがない人でも直感(Vibe)でアプリ開発を可能にする新領域「バイブ・コーディング」を提唱しています。これは、AIを活用し、作りたいもののイメージを自然言語で説明するだけで、ウェブサイトやアプリのプロトタイプを生成する手法です。これにより、アイデアを具現化するプロセスが大幅に民主化され、エンジニア以外のリーダーやデザイナーも開発に参画しやすくなります。

バイブ・コーディングを支えるのは、Googleが開発する複数のAIエージェントです。例えば、GeminiCanvas機能は簡易なウェブアプリの試作を生成し、StitchはUI生成とフロントエンドコードを担当します。このデザインを、AIコーディングエージェントJulesが受け取り、プロダクションレベルで動作するコードへと実装することで、アイデアから製品化までの全ループを支援します。

特にJulesは、開発者生産性を飛躍的に高めるツールです。自然言語による指示に基づき、既存のコードに新しい機能を追加したり、バグ修正を自動的に実行したりできます。これにより、エンジニアは反復的な作業から解放され、より複雑なアーキテクチャ設計や重要な意思決定に集中できるようになります。

この手法の最大の利点は、ドキュメントではなく、インタラクティブなビジュアルから開発をスタートできる点にあります。非エンジニアは、頭の中で描いたビジョンを具体的なプロトタイプとして視覚化し、それを開発チームに正確に伝えることが可能です。これにより、設計段階での認識のズレを防ぎ、手戻りを最小限に抑えられます。

ただし、AIに任せきりにするのは禁物です。バイブ・コーディングを成功させる鍵は、最初のプロンプトの質にあります。Geminiなどを活用し、「考慮していない点は何か」「別の切り口はないか」と対話することで、プロンプトを洗練させ、より詳細で質の高いアウトプットを引き出す「センス」を磨くことが重要だとGoogleは指摘しています。

Perplexity、デザインチーム買収で体験価値向上へ

買収の概要

AI検索Perplexityがチームを買収
対象はAIデザインの新興企業
新設「Agent Experiences」部門へ
買収額など条件は非公開

今後の影響

買収元の製品は90日以内に終了
利用者はデータ移行と返金が可能
PerplexityのUX強化への布石
Sequoia出資の有望チームを獲得

AI検索エンジンを手がける米Perplexityは10月2日、AIデザインツールを開発する米Visual Electricのチームを買収したと発表しました。Visual ElectricのチームはPerplexity内に新設される「Agent Experiences」グループに合流します。この買収は、単なる検索エンジンの枠を超え、より高度なユーザー体験を提供するための戦略的な一手とみられます。

Perplexityのアラビンド・スリニバスCEOがX(旧Twitter)で買収を認めましたが、買収金額などの詳細な条件は明らかにされていません。新設される「Agent Experiences」グループは、同社の今後の成長を担う重要部門と位置づけられており、対話型AIエージェント体験価値向上をミッションとします。

買収されたVisual Electricは2022年設立。創業者にはAppleFacebookMicrosoft出身のエンジニアデザイナーが名を連ねます。その高い技術力とデザイン性は、著名ベンチャーキャピタルSequoia Capitalなどから250万ドルを調達した実績にも裏付けられています。

Visual Electricの主力製品は、デザイナーがAIで画像を生成し、無限のキャンバス上でアイデアを練るためのツールでした。今回の買収に伴い、この製品は90日以内にサービスを終了します。既存ユーザーはデータの書き出しが可能で、有料プラン加入者には日割りの返金対応が行われる予定です。

今回の動きは、Perplexityが単なる「回答エンジン」から、より高度でインタラクティブな「AIエージェント」へと進化する強い意志の表れと言えるでしょう。優秀なデザインチームの獲得は、複雑なタスクをこなすAIのUXを向上させる上で不可欠です。今後のサービス展開が一層注目されます。

Google新画像AI、編集・生成の常識を覆す

驚異の編集・生成能力

文脈を理解し一貫性を維持
本人そっくりの人物画像を生成
自然言語によるピクセル単位の修正
AIが曖昧な指示も的確に解釈

新たな創造性の探求

スケッチからリアルな画像を生成
古い写真の修復・カラー化も可能
最大3枚の画像を融合し新画像を創造
開発者向けツールとのシームレスな連携

Googleは2025年8月下旬、Geminiアプリに搭載された新しい画像生成・編集AIモデル「Nano Banana」を発表しました。このモデルはテキストと画像を同時に処理するネイティブなマルチモーダル能力を持ち、リリースからわずかな期間で50億以上の作品を生み出すなど世界中で注目を集めています。専門的なツールを不要にするその革新的な機能は、ビジネスにおける創造性の常識を大きく変える可能性を秘めています。

Nano Bananaの最大の強みは、シーンやキャラクターの一貫性を維持する能力です。一度生成した人物の服装やポーズ、背景だけを変更するなど、連続した編集が可能です。これにより、従来のAIが生成しがちだった「本人とは少し違う」違和感を解消し、広告素材のバリエーション作成や製品プロモーションなど、より実用的な応用が期待されます。

さらに、自然言語による「ピクセル単位の編集」も注目すべき機能です。「ソファの色を赤に変えて」といった簡単な指示で、画像内の特定要素だけを他の部分に影響を与えることなく修正できます。これにより、インテリアデザインシミュレーションや、WebサイトのUIモックアップ修正といったタスクを、専門家でなくとも直感的に行えるようになります。

このモデルは、曖昧な指示から文脈を読み取って画像を生成したり、古い写真を歴史的背景を理解した上で修復・カラー化したりすることも可能です。また、最大3枚の画像を組み合わせて全く新しい画像を創造する機能もあり、アイデアの着想からプロトタイピングまでの時間を大幅に短縮し、これまでにないクリエイティブな表現を可能にします。

エンジニア開発者にとってもNano Bananaは強力なツールとなります。Geminiアプリ内のCanvasやGoogle AI Studioと統合されており、画像ベースのアプリケーションを容易に構築できます。実際に、1枚の写真から様々な時代のスタイルに合わせた画像を生成する「PictureMe」のようなアプリが、社内のプロジェクトから生まれています。

Nano Bananaは、単なる画像生成ツールにとどまりません。専門的なスキルがなくとも誰もがアイデアを形にできる「創造性の民主化」を加速させます。Googleはすでに次の改良に取り組んでおり、この技術が今後、企業のマーケティングや製品開発にどのような革新をもたらすか、引き続き目が離せないでしょう。

Emergent、AIアプリ開発の民主化へ 2300万ドル調達

AIアプリ開発プラットフォームを手がけるスタートアップEmergent社が9月24日、シリーズAで2300万ドル(約34億円)の資金調達を発表しました。非技術者がプロンプトでアプリを開発できるプラットフォームを構築します。AIエージェントが開発からデプロイ、バグ修正までを支援し、アプリ制作のハードルを大幅に下げることを目指しています。 今回のラウンドはLightspeed社が主導し、Y Combinator社やTogether Fund社なども参加しました。著名なエンジェル投資家として、元a16zのBalaji Srinivasan氏やGoogleのJeff Dean氏も名を連ねています。これにより、同社の累計調達額は3000万ドル(約45億円)に達しました。 Emergentの最大の特徴は、専門知識のないユーザーを対象としている点です。ユーザーが簡単な指示を出すと、AIエージェントが対話形式で要件を確認し、アプリを構築します。API連携やサーバーへのデプロイといった技術的な工程も自動で管理するため、ユーザーはアイデアの実現に集中できます。 同社は、開発プロセスを支えるインフラを独自に構築しました。特に、AIエージェントがコードのエラーを自動で検出し、修正する機能は強力です。これにより、ユーザーは技術的なエラーメッセージに悩まされることなく、スムーズにアプリを完成させ、運用・保守することが可能になります。 プラットフォームは2025年6月のローンチ以来、既に100万人以上が利用し、150万を超えるアプリが作成されるなど、急速にユーザーを拡大しています。ペットのワクチン管理アプリを30分足らずで作成できた事例もあり、その手軽さと実用性が証明されています。 創業者は、元GoogleスタートアップCTOのMukund Jha氏と、元Dropbox勤務のMadhav Jha氏の双子の兄弟です。二人はAIによるエージェントベースのアプリ開発が今後の経済で巨大な役割を果たすと確信し、この問題の解決に長期的に取り組むことを決意しました。 アプリ開発の簡易化市場にはCanvaFigmaなどの大手も参入し、競争が激化しています。その中でEmergentは、アプリを「作る」だけでなく、公開後の共有、バグ修正、サポートといったライフサイクル全体をAIで支援する点で他社との差別化を図っています。 リード投資家であるLightspeed社のパートナーは、Emergentの深い技術力と、開発後の運用まで見据えた包括的なアプローチを高く評価しています。「コーディング能力という参入障壁をほぼゼロにし、誰もがデジタル経済に参加できる世界を目指す」と同氏は期待を寄せています。