動画生成(ユースケース)に関するニュース一覧

Google Vids、Veo 3.1搭載で動画生成を無料開放

動画生成の新機能

Veo 3.1による8秒動画生成
無料アカウントで月10回生成可能
AI Ultra契約で月1,000回まで拡大
Lyria 3でカスタム音楽生成

AIアバターと共有

テキスト指示でアバター演出可能
外見・衣装・背景をプロンプトで変更
YouTube直接エクスポート機能追加
Chrome拡張で画面録画に対応

Googleは2026年4月2日、動画編集ツール「Google Vids」に最新の動画生成モデル「Veo 3.1」を統合し、すべてのGoogleアカウントユーザーに無料で動画生成機能を開放しました。

無料アカウントでは月10回の動画生成が可能で、AI Proでは50回、AI Ultraでは月1,000回まで利用できます。生成される動画は8秒・720p解像度で、テキストプロンプトや写真から高品質なクリップを作成できます。

音楽生成モデル「Lyria 3」および「Lyria 3 Pro」もVidsに統合され、30秒から3分のオリジナル楽曲をAIで自動生成できるようになりました。歌詞入力は不要で、雰囲気を指示するだけで楽曲が完成します。

AIアバター機能も大幅に強化され、テキストプロンプトでアバターの動作を演出できるようになりました。商品やプロップとの対話シーンを指示でき、外見・衣装・背景もプロンプトで自在に変更しながら、声やアイデンティティの一貫性を維持します。

完成した動画YouTubeに直接エクスポートする機能や、ブラウザ上で画面録画ができるChrome拡張機能も追加されました。競合にはSynthesiaやHeyGenなどがあり、AI動画編集市場の競争が一段と激化しています。

ハリウッドAIサミットで過熱する期待と冷静な現実

Runway AIサミットの熱狂

RunwayがNYでAIサミット開催
ParamountCTOがAIを火の発見と同列視
EA・Adobe幹部もAIの革命的可能性を主張

OpenAI Sora終了の影響

OpenAISoraを終了しDisney契約頓挫
AI動画生成の将来性に疑問符
デモ映像の品質に批判の声も

K・ケネディの現実論

キャスリーン・ケネディが「味覚」の重要性を強調
3Dプリント小道具の失敗例を紹介

2026年3月、AI企業Runwayがニューヨークで「AI Summit」を開催し、ハリウッドの映画スタジオ幹部やテック企業の経営者が一堂に会しました。OpenAISoraを終了した直後のタイミングでの開催となりました。

RunwayのCEOクリストバル・バレンズエラ氏は基調講演で「私たちは魔法の時代に生きている」と宣言し、AIの可能性を強調しました。ParamountのCTOフィル・ワイザー氏は生成AIを「歴史上のテクノロジートレンドのトップ10、あるいはトップ5」と位置づけ、印刷機や火の発見と同列に語りました。

一方で、デモで披露されたAI生成画像の多くは明らかに合成的で不自然な仕上がりでした。AIスタジオSilversideが制作したコカ・コーラのAI生成ホリデー広告は広く批判を浴びた事例ですが、サミットではその事実に触れられませんでした。

こうした熱狂の中で冷静な視点を示したのが、『ジュラシック・パーク』やスター・ウォーズシリーズを手がけた超大物プロデューサー、キャスリーン・ケネディ氏です。同氏はAFI(米国映画協会)にAIツール教育における「テイスト(審美眼)」の育成を問いかけ、人間の判断力の重要性を訴えました。

ケネディ氏はまた、最近のスター・ウォーズ作品で3Dプリントの小道具が数テイクで壊れた事例を紹介しました。熟練の小道具職人が持つ経験的直感がなければ、見た目だけで実用に耐えない製品になると指摘し、創造的プロセスにおける偶然や試行錯誤の価値を強調しました。

FLORA、Vercel基盤で画像生成AIエージェント「FAUNA」を構築

FAUNAの特徴と狙い

50以上の画像生成モデルを統合
アイデアから自動で多方向の視覚探索を展開
ワークフロー設計の負担をエージェントが代替

Vercel移行の効果

AI SDKとWorkflow SDKで基盤を一本化
本番投入までの速度が2倍に向上
インフラ議論からプロダクト議論へ転換

今後の展望と周辺機能

UI/UX以外の全デザイン業務を支援対象
Vercelがチーム間のDB移行機能も追加

クリエイティブワークフロー基盤を提供するFLORAは、VercelAIスタック上に画像生成AIエージェントFAUNA」を構築したと発表しました。50以上の画像モデルを統合し、ファッションキャンペーンなどの視覚制作を効率化する狙いです。

FAUNAは従来のノードベースのキャンバスとは異なり、ユーザーがアイデアを伝えるだけで参考画像の収集、モデル選択、バリエーション生成を自動で行います。ワークフロー設計の知識がなくても、プロ品質のビジュアル探索が可能になります。

技術面では、画像動画生成は数分かかり、1回のセッションで多数の並行ジョブが発生します。FAUNAはVercelAI SDKエージェントフレームワークとWorkflow SDKの永続化機能を組み合わせ、長時間実行や障害時の再試行に対応しています。

FLORA開発チームは以前LangChainとTemporalを併用していましたが、2つのシステムの保守負担が課題でした。Vercelへの移行により基盤が一本化され、本番投入速度が2倍に向上したと報告しています。インフラの議論が不要になり、プロダクト改善に集中できるようになりました。

FLORAはUI/UX以外の全デザイン業務の支援を最終目標に掲げています。また、Vercelは同時期にダッシュボードからチーム間でDB移行ができる機能も公開しました。Prisma、Neon、Supabaseに対応し、今後対応プロバイダーを拡大する予定です。

Runway、AI動画の先へ 1000万ドルのVC基金と開発者支援を開始

VC基金の投資方針

1000万ドル規模のファンド設立
プレシード〜シード企業に最大50万ドル出資
AI・メディア・世界シミュレーションが対象
LanceDBやTamarind Bioなど既に投資実績

Builders支援プログラム

50万APIクレジットを無償提供
Characters APIへのアクセス開放
リアルタイム映像エージェント活用を促進

エコシステム戦略の狙い

自社では追えない用途を外部に委ねる構想
医療・教育・ゲーム分野への展開を期待

AI動画生成の大手Runwayは2026年3月、早期段階のスタートアップを支援する1000万ドル規模のベンチャーファンドと、APIクレジットを無償提供する「Builders」プログラムの立ち上げを発表しました。同社は動画生成ツールからより広い「映像知能」のエコシステム構築へと事業を拡大します。

ファンドは既存投資家やパートナーの出資で組成され、プレシードからシード段階の企業に最大50万ドルを投じます。投資対象は、AIの技術的フロンティアを開拓するチーム、基盤モデル上のアプリケーション層を構築する開発者、新しいメディア創作や配信に取り組む企業の3分野です。

過去1年半にわたり、Runwayは非公開で複数のスタートアップに出資してきました。AI向けデータベースのLanceDBや、AIでたんぱく質設計を行う創薬企業Tamarind Bio、リアルタイム音声生成のCartesiaなどが含まれます。

Buildersプログラムでは、シードからシリーズCの企業が50万APIクレジットと、同社の「Characters」APIを利用できます。Charactersはリアルタイムで対話可能な映像エージェントを生成する技術で、顧客対応やブランドキャラクター、遠隔医療、教育など幅広い活用が見込まれています。

Runwayはこれまでに約8億6000万ドルを調達し、評価額約53億ドルに達しています。AI企業がVC活動に乗り出す動きは、OpenAIのStartup FundやPerplexityの5000万ドルファンドなど業界全体に広がっており、Runwayもこの潮流に本格参入した形です。

Google、低価格動画生成モデル「Veo 3.1 Lite」を提供開始

Veo 3.1 Liteの特徴

Veo 3.1 Fastの半額以下で同等速度
テキスト・画像からの動画生成に対応
720p・1080pの解像度を選択可能
4秒・6秒・8秒の長さ指定に対応

開発者向け提供体制

Gemini APIとAI Studioで即日利用可
4月7日にVeo 3.1 Fastも値下げ予定
縦横比16:9と9:16の両方に対応

Googleは2026年3月31日、動画生成AIモデルファミリーの新モデル「Veo 3.1 Lite」の提供を開始しました。開発者が大量の動画を低コストで生成できることを目的とした、同社で最もコスト効率の高い動画モデルです。

Veo 3.1 Liteの最大の特徴は、上位モデル「Veo 3.1 Fast」と同等の生成速度を維持しながら、コストを50%以下に抑えた点です。大量の動画を扱うアプリケーション開発において、大幅なコスト削減が期待できます。

機能面では、テキストから動画を生成する「Text-to-Video」と、画像から動画を生成する「Image-to-Video」の両方に対応しています。解像度は720p1080pを選択でき、動画の長さも4秒・6秒・8秒から指定可能です。

アスペクト比は横型の16:9と縦型の9:16に対応しており、SNS向けの短尺動画からビジネス用途まで幅広い活用が見込まれます。利用はGemini APIおよびGoogle AI Studioの有料プランから可能です。

さらにGoogleは4月7日からVeo 3.1 Fastの価格も引き下げる予定です。動画生成モデル全体のコスト低減を進めることで、より多くの開発者がプロダクトに動画生成機能を組み込めるよう環境を整備しています。

OpenAI、動画生成AI「Sora」を提供開始からわずか半年で終了

Sora終了の背景

日次100万ドルの運用コスト
ユーザー数50万人未満に急減
Disneyとの10億ドル契約も消滅
IPO見据え企業向けに集中

AI動画業界への影響

ByteDanceSeedance 2.0展開延期
著作権・技術面の課題が顕在化
ハリウッド代替論に現実の壁
消費者向けAI動画の転換点に

OpenAIは2026年3月、動画生成AI「Sora」のアプリおよび関連モデルの提供終了を発表しました。公開からわずか半年での撤退となり、AI動画市場に大きな衝撃を与えています。

Wall Street Journalの調査によると、Soraのユーザー数は公開直後に約100万人に達したものの、その後50万人未満に急減しました。一方で動画生成には膨大な計算資源が必要で、日次約100万ドルのコストが発生し続けていたことが判明しています。

終了の判断にはAnthropicとの競争激化も影響しています。Claude Codeエンジニアや企業顧客を急速に獲得する中、OpenAISoraに投じていた計算資源を解放し、収益を生む企業向け・開発者向け製品へ再配分する戦略を選択しました。

DisneySoraとの提携に10億ドル規模を投じていましたが、終了の通知を受けたのは公表の1時間未満前だったと報じられています。TechCrunchの記者は、この決断をIPOを見据えた「AI企業の成熟の証」と評価しています。

同時期にByteDanceもSeedance 2.0の海外展開を延期しており、知的財産保護や法的課題への対応が求められています。「プロンプト入力だけで長編映画を制作できる」という楽観論に対し、技術的・法的な現実が突きつけられた転換点となりました。

OpenAI、動画生成アプリSoraを廃止しDisney契約も解消

Sora廃止の背景

計算資源の大量消費が収益に見合わず
競合Google・Klingに品質で劣後
DL数が10月480万→3月110万に急減
投資家からの収益化圧力が強まる

戦略転換の方向性

Disneyとの10億ドル契約を3カ月で解消
コーディング・企業向けツールに資源集中
IPOを見据え利益体質への転換急ぐ

OpenAIは2026年3月、動画生成アプリSoraの廃止とAPI提供の終了を発表しました。同時にDisneyとの10億ドル規模の提携契約も解消し、経営幹部の役割変更や追加100億ドルの資金調達も明らかにしています。

Sora廃止の最大の要因は、膨大な計算資源を消費しながら十分な収益を生み出せなかったことです。Render Network Foundation関係者によると、Google DeepMindVeoやKlingなど競合モデルに品質面で後れを取り、明確な優位性を失っていました。市場調査会社Sensor Towerのデータでは、ダウンロード数が昨年10月の約480万件から今年3月には110万件へと大幅に減少しています。

OpenAIAGI展開担当CEOFidji Simo氏は社内で「サイドクエストに気を取られてこの瞬間を逃すわけにはいかない」と発言し、生産性ビジネス面への集中を訴えました。ChatGPTへの広告導入や新たなサブスクリプション階層の検討など、収益化の取り組みが加速しています。

Disneyとの提携解消は特に注目を集めました。3年間のライセンス契約がわずか3カ月で終了し、Disney側はSora関連プロジェクトの作業中に廃止を知らされたと報じられています。ただしDisney側はGoogleRunway、Lumaなど他社とのキャラクターライセンス契約に前向きな姿勢を示しています。

今後OpenAIは計算資源をAIエージェント開発やコーディングツール、企業向けサービスに集中させる方針です。これによりAnthropicとの直接競争が一層激化する見通しです。NPO団体Witnessの代表は、Soraが半年間で「ハイパーリアルなAI生成コンテンツ」を常態化させた影響は、アプリが消えても長く残ると警鐘を鳴らしています。

OpenAIがSoraアプリ終了、Meta裁判で敗訴も

AI業界の転換点

OpenAISoraアプリを終了
Metaに2件の不利な判決
AI過熱と現実の衝突が鮮明に
82歳女性がデータセンター用地売却を拒否

VC投資と新興企業

Kleiner Perkinsが35億ドル調達
ドローン企業3社が実需で成長
予測市場CEOが共同で3500万ドルファンド
SNS依存訴訟が「たばこ訴訟」級に

OpenAI動画生成アプリSoraの提供終了を発表しました。同時期にMetaはSNS依存症をめぐる裁判で陪審員から過失認定を受け、AI・テック業界が現実からの反発に直面しています。

ケンタッキー州の82歳の女性が、AIデータセンター建設のために自身の農地を2600万ドル買収したいという提案を拒否しました。AI企業は近隣の約800ヘクタールの用途変更を試みる構えですが、AIインフラの拡大に地域社会が抵抗を示す象徴的な事例です。

VC業界ではAIへの大型投資が続いています。老舗VCKleiner Perkinsは35億ドルを新たに調達し、AI分野への集中投資を宣言しました。予測市場のKalshiPolymarketのCEOはライバル同士ながら3500万ドルの共同ファンドを設立しています。

ドローン分野では、配送のZiplineが2億ドルを追加調達し、窓清掃のLucid Botsや警察ヘリ代替を目指すBrincなど、他のロボティクス企業が苦戦するなかで実用的な牽引力を得ている企業が台頭しています。

Metaに対する2件の裁判敗訴は、SNS業界にとって「たばこ訴訟」に匹敵する転換点になる可能性があります。YouTubeも同じ裁判で過失認定を受けており、プラットフォーム企業の社会的責任が改めて問われる局面を迎えています。

OpenAI、ChatGPT無料版に広告を本格導入へ

広告の実態

質問5回に1回の頻度で表示
質問内容に連動したターゲティング広告
旅行系の質問で最も高い表示率
競合他社の広告表示も確認

収益化と信頼の両立

検索広告市場の数十億ドル規模を狙う
無料ユーザーの維持コストが課題
信頼毀損ならユーザー離脱リスク
カナダ・豪州・NZへの拡大を計画

OpenAIは2026年2月から米国ChatGPT無料版への広告表示テストを開始し、現在本格展開を進めています。記者が500件の質問を投げたテストでは、新規スレッドの約5回に1回の頻度で回答の下部に広告が表示されました。広告はユーザーの質問内容に連動しており、旅行関連の質問で最も多く表示される傾向が確認されました。

広告の内容はドッグフードからホテル予約、生産性ソフトウェア、AIコーディングツールまで多岐にわたります。質問にブランド名を含めると、そのブランド直接的な競合他社広告が表示されるケースも確認されました。コロンビア大学のマーケティング教授はこれを「ポーチング」と呼び、検索広告で確立された手法がLLM広告にも応用されていると指摘しています。

OpenAIサム・アルトマンCEOは2024年にハーバード・ビジネス・スクールで「広告は嫌いだ」「最後の手段」と語っていました。しかし同社は2026年に入り、動画生成アプリSoraの終了やエロティック版ChatGPTの計画撤回など事業の選択と集中を進めており、広告導入はその一環と位置づけられています。同社はIPOの噂との関連を否定し、長期的なアクセシビリティ戦略だと説明しています。

現在オンライン検索の習慣が変化する中、検索広告に投じられている数十億ドルがこの新たな広告形態に流れる可能性があるとコロンビア大学のトゥビア教授は分析しています。一方で無料ユーザーの維持コストは高く、広告によるマネタイズは経営上の重要課題です。OpenAI広告ChatGPTの回答内容に影響しないとし、会話全文は広告主に共有されないと明言しています。

ウォートン校のプントーニ教授は、積極的すぎる広告展開はユーザーの信頼を損ない、GoogleGeminiAnthropicClaudeといった競合への流出を招くと警告しています。OpenAIは3月26日の報告で「消費者信頼指標への影響なし」「低い広告却下率」と好結果を示し、カナダ・オーストラリア・ニュージーランドへの展開を計画しています。広告専門の採用も複数ポジションで進めており、今後の実装が同社の将来を左右する重要な局面を迎えています。

OpenAI、ChatGPTのアダルトモード開発を無期限凍結

凍結の背景

社内外から安全性懸念が噴出
顧問が「性的自殺コーチ」化を警告
投資家レピュテーションリスクを問題視
違法コンテンツフィルタリングが困難

戦略転換の全体像

動画生成Soraも同時期に終了
即時購入機能も優先度引き下げ
法人・開発者向け中核事業に集中
Anthropicとの競争激化が背景

OpenAIは2026年3月26日、ChatGPTに搭載予定だった性的コンテンツ生成機能「アダルトモード」の開発を無期限で凍結すると発表しました。Financial Times紙の報道によると、同社は中核製品への集中を理由に挙げています。

アダルトモードは2025年10月にサム・アルトマンCEOが構想を示したものですが、技術監視団体や社内スタッフから強い反発を受けていました。同社の顧問会議では「性的な自殺コーチ」を生み出しかねないとの警告が飛び出し、リリースは繰り返し延期されていました。

技術面でも深刻な課題がありました。安全上の理由から性的会話を避けるよう訓練されたAIモデルを再調整する困難さに加え、学習データに性的コンテンツを含めると獣姦や近親相姦など違法行為の出力を排除できない問題が浮上していました。

投資家の間でも懸念が広がっていました。関係者によると、ビジネス上の収益見込みが限定的であるにもかかわらず企業の信用を毀損しかねない機能に対し、なぜリスクを取るのかという疑問の声が上がっていたといいます。

今回の凍結は、OpenAIが進める大規模な戦略転換の一環です。同社は直前の1週間で動画生成サービス「Sora」の終了や即時購入機能の優先度引き下げも発表しており、法人顧客と開発者向けの中核事業に経営資源を集中させる方針を鮮明にしています。

背景にはAnthropicとの競争激化があります。Anthropicコーディングやビジネス向けツールを矢継ぎ早にリリースし顧客獲得で成果を上げており、OpenAIは国防総省との2億ドル契約を獲得する一方、散漫な製品展開からの脱却を迫られている状況です。

Google、社員撮影写真やW杯連携など多角的な取り組みを展開

スクリーンセーバー刷新

社員撮影写真を毎年公募
年間50〜60枚を厳選採用
6〜7名の審査員が匿名評価
「穏やかさ」重視で過激な写真は除外

W杯・広告AI強化

アルゼンチン・仏代表提携
Search AIモードで試合情報提供
Veoで静止画から動画広告生成
クリエイター連携でCVR30%向上

Googleは2026年3月、スクリーンセーバー写真の社員公募プログラム、W杯に向けた各国代表チームとの提携広告プラットフォームのAI強化など、複数の取り組みを同時に発表しました。いずれもユーザー体験とクリエイティブの質向上を目指すものです。

Google TVデバイスのアンビエントスクリーンセーバーに表示される写真は、その多くがプロではなくGoogle社員の撮影によるものです。2020年からは毎年Q3に社内公募を実施し、6〜7名の審査員パネルが匿名で評価する仕組みを整えています。

審査基準はユニークで、「穏やかな背景」にふさわしいかが最優先されます。猛々しい虎の写真はペットを怖がらせる懸念から不採用となり、刺激的すぎる構図やハイコントラストの写真もHDRテレビでの眩しさを理由に除外されるなど、独自の選定方針が貫かれています。

サッカーFIFAワールドカップ2026に向けては、アルゼンチンおよびフランス代表チームとのパートナーシップを発表しました。大会期間中はSearch AIモードで試合スコアや関連情報を提供し、Geminiが観戦パーティーの企画支援なども行う予定です。

広告分野ではDemand Genの3月アップデートとして、AI動画生成ツールVeoによる静止画からの高品質動画変換機能を提供開始しました。YouTubeクリエイターとの連携広告では、YouTube Shortsで平均30%のコンバージョンリフト向上が確認されており、広告主の成果改善に寄与しています。

ByteDance、AI動画モデルSeedance 2.0をCapCutに搭載開始

モデルの主要機能

テキスト数語から動画生成
画像・参照動画からの編集対応
リアルな質感・動き・照明の描写
最大15秒・6アスペクト比対応

展開と安全対策

7カ国で段階的に提供開始
知的財産問題で米国展開は見送り
実在人物の顔での生成を制限
不可視透かしで生成コンテンツを識別

ByteDanceは2026年3月26日、AI動画生成モデルDreamina Seedance 2.0動画編集プラットフォームCapCutに搭載し、ブラジルインドネシアなど7カ国で段階的に提供を開始すると発表しました。OpenAISoraアプリを終了する中での展開となります。

同モデルはプロンプト画像、参照動画を使って動画音声コンテンツの作成・編集・同期が可能です。参照画像がなくても数語のテキスト入力だけでシーンを自動生成でき、リアルな質感や動き、照明の再現に優れています。

料理レシピやフィットネスチュートリアル、ビジネス概要、アクション系コンテンツなど幅広いジャンルに対応します。従来のAI動画モデルが苦手としていた動きの多い映像でも高品質な出力が期待できると同社は説明しています。

展開地域が限定的な背景には、ハリウッドからの著作権侵害批判があります。映画協会がByteDanceに対し侵害行為の停止を求めたことを受け、グローバル展開を一時中断していた経緯があり、知的財産に関する対応が続いています。

安全対策として、実在の顔を含む画像動画からの生成をブロックし、無許可の知的財産利用も制限します。生成コンテンツには不可視の電子透かしが埋め込まれ、プラットフォーム外での共有時にもAI生成であることを識別可能にしています。

ディズニーがOpenAIへの10億ドル投資を撤回、Sora終了で

提携白紙の経緯

OpenAISora終了を発表
ディズニーは事前通告なく寝耳に水
10億ドル投資計画を撤回
別形態の提携は引き続き協議中

Soraの急成長と急失速

11月に330万DLでピーク到達
2月には110万DLへ急落
累計収益はわずか214万ドル
OpenAIIPO準備で事業集約

ディズニーの戦略的誤算

Epic Gamesとのメタバース構想も停滞
SeeDanceなど競合アプリが台頭
新CEO就任直後に二重の危機直面

ディズニーは2026年3月、OpenAIへの10億ドル出資計画を撤回しました。OpenAI動画生成アプリSoraの終了を発表したことが直接の原因で、ディズニー側は事前に知らされておらず、計画の白紙撤回に踏み切りました。ただし両社は別の形での提携投資の可能性について協議を続けているとされています。

2025年12月に発表されたディズニーとOpenAI提携は、ハリウッドに大きな衝撃を与えました。Disney+上でSoraによるAI生成コンテンツを配信する計画で、前CEOボブ・アイガー氏は短尺動画の目玉にする構想を語っていました。しかしSoraのダウンロード数は2025年11月の330万件をピークに急減し、累計収益もわずか214万ドルにとどまりました。

OpenAIIPO準備の一環として事業の選択と集中を進めています。CFOのサラ・フライアー氏は「上場企業としての準備が必要」と述べ、Soraの研究チームはロボティクス向けの世界シミュレーション研究に再配置されます。ChatGPTCodex・Atlasを統合した「スーパーアプリ」構想に経営資源を集中させる方針です。

ディズニーにとってSora提携の頓挫は、テック投資戦略の見直しを迫る事態です。Epic Gamesとの15億ドル規模のメタバース構想も、Epic側の1000人規模のレイオフと5億ドルのコスト削減により先行きが不透明になっています。Fortniteのプレイヤー数減少も重なり、ディズニーブランドのメタバース実現は遠のいています。

新CEOジョシュ・ダマロ氏は就任1週間でOpenAIとEpicの二つの危機に直面する形となりました。一方、AI動画分野ではByteDanceSeeDance 2.0が急速に台頭し、ディズニーはIP無断使用に対する法的措置を進めています。今後のAI戦略の立て直しが、新体制の最重要課題となります。

OpenAIが動画生成アプリSoraを終了、Disney契約も白紙に

Sora終了の経緯

SoraアプリとAPIを廃止発表
具体的な終了日は未定
データ保存方法を後日案内
ピーク月間DL数333万件から急減

戦略転換の背景

ロボティクス研究に計算資源再配分
Anthropic対抗のスーパーアプリ構想
AGI達成へリソース集中
エネルギーコスト高騰も一因

Disney提携の破綻

10億ドル出資契約が白紙撤回
実際の資金移動は未実行
Disney側は他AI活用を継続表明

OpenAIは2026年3月、動画生成アプリSoraの終了を発表しました。アプリとAPI双方が廃止対象で、具体的な終了日は未定ですが、ユーザーの作品保存方法については後日案内するとしています。発表はX上で突如行われました。

Soraは2024年2月のプレビューで世界を驚かせ、同年12月に正式公開されました。TikTok風のソーシャル機能やディープフェイク的な「カメオ」機能を搭載し、2025年11月にはダウンロード数が333万件に達しましたが、2026年2月には113万件まで急減していました。

最大の影響はDisneyとの提携破綻です。わずか4カ月前に発表された10億ドル規模の出資契約は白紙となりました。DisneyキャラクターをSoraで生成可能にする計画でしたが、実際の資金移動は行われておらず、Disney側は今後も他のAIプラットフォームとの連携を続けると表明しています。

OpenAIは終了の理由として、Soraの基盤技術をロボティクスや物理世界シミュレーション研究に転用する方針を示しました。競合AnthropicClaudeが企業向けで急成長する中、ChatGPTを核とした「スーパーアプリ」構想に経営資源を集中させる狙いがあります。

背景には米国・イスラエル対イラン戦争によるエネルギー価格高騰もあり、動画生成は特に計算コストが高い分野です。エンターテインメント領域から撤退し、製造・物流など収益性の高い市場へ舵を切る戦略転換といえます。同時に発表された非営利部門の再編では、ライフサイエンスや雇用分野に10億ドルを投資する方針も示されました。

OpenAI、Sora 2の安全対策を包括的に公開

コンテンツ保護策

C2PAメタデータを全動画に埋込
可視・不可視の透かしを二重付与
画像検索で生成元を高精度追跡
肖像利用時は同意確認を義務化

未成年者保護と有害対策

10代向けに成熟コンテンツ制限
大人から未成年へのDM送信を禁止
多層防御で性的・テロ・自傷を自動遮断
音声アーティスト模倣を検出・阻止

OpenAI動画生成AI「Sora 2」および専用アプリにおける安全対策の全容を公開しました。生成されるすべての動画に業界標準のC2PAメタデータと可視・不可視の透かしを埋め込み、AI生成コンテンツの出所を明確にします。

肖像権の保護では、写真からの動画生成時にユーザーが被写体の同意を得ていることを宣誓する仕組みを導入しました。特に子どもや若年層が含まれる画像には、通常より厳格なガードレールとモデレーションが適用されます。

独自の「キャラクター」機能により、自身の外見や声の使用を完全に管理できます。アクセス権の付与・取消はユーザーが随時行え、他者が作成した下書き動画も確認・削除・通報が可能です。公人の描写はキャラクター機能経由のみに制限されています。

未成年者向けには、フィードから不適切コンテンツを自動除外し、大人からのメッセージ開始を遮断します。保護者はChatGPTの管理画面からDMの送受信やフィードのパーソナライズ設定を制御でき、連続スクロールにも初期上限が設けられています。

有害コンテンツ対策としては、生成前のプロンプト検査と出力の多層スキャンを組み合わせ、性的素材やテロプロパガンダ、自傷促進を遮断します。音声領域では生成された音声の書き起こしを自動検査し、存命アーティストや既存楽曲の模倣を阻止する仕組みも整備されています。

生成AIと優生学の深い繋がりを暴くドキュメンタリーが公開

映画の問題提起

優生学が現代AI技術の土台に
「人工知能」はマーケティング用語に過ぎない
人種差別的な出力が放置される現状

歴史的系譜

ゴルトンの優生統計が機械学習の基礎に
ロジスティック回帰は優生学研究から発展
人間の知能を測定可能とする誤った前提

業界の無関心

OpenAI人種差別的バグを放置
AI企業は構造的問題への対処を拒否

映画監督のヴァレリー・ヴィーチ氏は、ドキュメンタリー『Ghost in the Machine』を制作し、生成AI技術がいかに優生学の思想的系譜の上に成り立っているかを明らかにしました。同作品は2026年3月26日から28日までKinemaで配信され、秋にはPBSで放映予定です。

ヴィーチ氏がこの映画を制作するきっかけとなったのは、OpenAI動画生成AI「Sora」を試した際の体験でした。アーティスト向けSlackコミュニティで、有色人種の女性メンバーが自身の写真を元に画像生成したところ、モデルが常に白人化した画像を出力するという深刻な問題が発覚しました。

同氏がOpenAI人種差別的・性差別的な出力について直接報告したところ、「修正できることはない」と事実上問題を黙殺されました。この対応が、生成AI技術の根本的な構造問題を探る動機となりました。

映画は、チャールズ・ダーウィンの従兄弟であるフランシス・ゴルトンが創始した優生学にまで歴史を遡ります。ゴルトンの多次元モデリング手法は弟子のカール・ピアソンに引き継がれ、ピアソンが開発したロジスティック回帰は現代の機械学習の基礎的構成要素となっています。

AI研究者や歴史家、批判理論家らが出演する本作は、AI業界のあらゆる側面が差別的世界観を支える科学分野との歴史的つながりに深く影響されていると主張します。ヴィーチ氏は「サム・アルトマンをカメラの前で抱擁するのはプロパガンダだ」と述べ、AI企業トップへの取材を意図的に排除しました。

OpenAI、デスクトップ統合「スーパーアプリ」を開発中

統合アプリの全容

ChatGPTCodex・Atlasを一本化
製品の分散化が品質低下の要因
モバイル版ChatGPT変更なし

競争環境と戦略転換

Anthropicとの競争が激化
Claude Codeの人気急上昇が背景
Codexへの集中投資を明言
「副次的探索」の縮小を指示

OpenAIは、ChatGPTアプリ、AIコーディングツール「Codex」、AIブラウザ「Atlas」を統合したデスクトップ向け「スーパーアプリ」の開発を進めていることが、米ウォール・ストリート・ジャーナルの報道で明らかになりました。アプリケーション部門CEOのフィジ・シモ氏が社内メモで方針を示しています。

シモ氏はメモの中で、製品の分散化が「開発速度を低下させ、求める品質基準の達成を困難にしている」と指摘しました。同社は昨年、動画生成AI「Sora」の発表やジョニー・アイブ氏のAIハードウェア企業買収など派手な展開を見せていましたが、戦略の再集中が急務となっています。

背景にはAnthropicとの競争激化があります。特にClaude Codeの急速な普及がOpenAIにとって脅威となっており、経営陣は優先度の低い取り組みの見直しを進めています。シモ氏は従業員に対し「副次的な探索に気を取られないように」と呼びかけました。

シモ氏はX(旧Twitter)への投稿で「企業には探索のフェーズと再集中のフェーズがあり、どちらも重要だ」と述べた上で、「Codexのように新しい賭けが成果を出し始めた今こそ、集中投資すべき時だ」と強調しました。

なお、モバイル版ChatGPTについては今回の統合の対象外とされています。OpenAIの広報担当者はコメントを控えており、統合アプリの具体的なリリース時期は明らかになっていません。今後のデスクトップ体験の大幅な刷新が見込まれます。

ネタニヤフ首相のAIクローン疑惑が映像信頼の危機を浮き彫りに

ディープフェイク疑惑の経緯

記者会見映像で指6本と指摘
Snopes等がAI生成を否定
反証動画もさらに疑惑を招く
コーヒーカップの液体に不自然な動き

真正性証明の構造的課題

C2PA等の認証メタデータが未付与
プラットフォーム側も真偽を判定せず
トランプ大統領もAI偽情報を批判
自政権もAI生成画像を多用する矛盾

イスラエルのネタニヤフ首相が2026年3月の記者会見で「指が6本に見える」映像が拡散し、首相がAI生成のディープフェイクに置き換えられたとする陰謀論がSNS上で急速に広がりました。

ファクトチェック機関のSnopesやPolitiFactは映像の画質劣化や照明が原因と結論づけ、約40分の長尺映像は現行のAI動画生成モデルでは作成不可能と指摘しています。しかしこうした検証にもかかわらず、疑念は収まりませんでした。

ネタニヤフ首相はカフェで指を数える反証動画をXに投稿しましたが、コーヒーの液体の動きや指輪の不自然な消失など新たな「証拠」が指摘され、かえって疑惑を深める結果となりました。カップの持ち方や「雰囲気」まで疑われる異常事態です。

根本的な問題は、いずれの映像にもC2PA Content CredentialsやSynthIDといった真正性証明のメタデータが付与されていない点です。InstagramYouTubeなどのプラットフォームもAI生成の有無を表示しておらず、映像の真偽を客観的に判定する仕組みが整っていません。

トランプ大統領はイランがAIを偽情報兵器として使用していると批判しましたが、自身もディープフェイクを政治的に利用した経歴があり、米政権自体がAI生成画像を多用しているという矛盾が指摘されています。AI時代における映像の信頼性確保は、技術・制度の両面で喫緊の課題です。

ByteDance、動画生成AI「Seedance 2.0」の海外展開を延期

著作権問題の経緯

トム・クルーズ動画が拡散
ディズニーらがIP侵害で警告書送付
ハリウッド脚本家が危機感を表明
ByteDanceがIP保護強化を約束

海外展開の見通し

3月中旬のグローバル公開を延期
技術・法務チームが法的リスク対応中
中国国内では2月に提供開始済み

ByteDanceは、AI動画生成モデル「Seedance 2.0」のグローバル展開を一時停止しました。The Informationの報道によると、同社は3月中旬に予定していた海外公開を、著作権問題への対応が完了するまで延期する方針です。

同モデルは2026年2月に中国国内で先行公開されました。公開直後、トム・クルーズとブラッド・ピットが格闘するようなセレブリティ動画がSNS上で急速に拡散し、AI生成動画の品質の高さが大きな話題を呼びました。

これに対しハリウッドの映画業界は強く反発しました。著名な脚本家が「我々の仕事は終わりだ」と危機感を示す一方、複数のスタジオがByteD anceに差止警告書を送付。特にディズニーは「ディズニーIPの仮想的な強奪」と厳しく批判しました。

ByteDanceはこれらの批判を受け、知的財産に関するより強力なセーフガードを導入すると表明しました。しかし海外展開には法的リスクが依然として残っており、エンジニアと弁護士が追加の法的問題の回避策を検討しています。

TikTokの親会社として知られるByteD anceは、米国でのTikTok事業を分離した経緯もあり、海外市場での規制対応に慎重な姿勢を見せています。AI動画生成をめぐる著作権問題は業界全体の課題となっており、今後の対応が注目されます。

米高校生がAI動画で教師を中傷する「誹謗ページ」が拡散

誹謗ページの実態

Viggle AI教師の顔を合成
極右・インセル用語を多用した動画
10万超いいねの投稿も出現
InstagramTikTokで拡散

学校と企業の対応

学区が懲戒・法的措置を警告
MetaTikTokが一部コンテンツ削除
投稿者は匿名を維持し活動継続
教師への嫌がらせ被害が深刻化

米テキサス州の高校生たちが、AI動画生成ツールを使って教師を嘲笑・中傷する「スランダーページ(誹謗ページ)」と呼ばれるSNSアカウントを運営し、InstagramTikTokで急速に拡散しています。一部の投稿は10万件以上の「いいね」を獲得しています。

これらの動画では、Viggle AIなどの画像変換ツールを用いて教師の顔写真を別人の動画に合成し、侮辱的なキャプションを付けて投稿されています。ネオナチのオカルト概念やインセル文化由来の用語が多用され、教師を「捕食者」と呼ぶなど名誉毀損に該当しうる内容も含まれています。

テキサス州クランドール高校の事例では、数十万フォロワーを持つ外部のTikTokerにまで拡散が波及しました。教師への迷惑電話やスパムメールといった実害も発生し、アカウント運営者が一度は自主的に削除する事態に至りましたが、その後投稿を再開しています。

ワイリー学区の広報担当者は、アカウントの存在を把握しており「責任者を特定した場合は懲戒処分および法的措置を講じる」との声明を発表しました。MetaTikTokポリシーに違反するコンテンツの削除と自動検出ルールの導入を行ったと回答しています。

アムステルダム大学の研究者らは、デジタルネイティブ世代がプライバシーやアイデンティティに対して異なる感覚を持ち、「自分の顔は視聴者のもの」という文化に社会化されていると指摘しています。無害な冗談のつもりでも、AI技術によって拡散力と被害が飛躍的に増大するという深刻な断絶が生じています。

OpenAI、動画生成AI「Sora」をChatGPTに統合へ

ChatGPT統合の狙い

SoraChatGPT内で直接利用可能に
画像生成に続く動画生成機能の追加
単独アプリの伸び悩みを受けた統合戦略

競争激化と懸念

AnthropicClaude人気が急伸
ChatGPTアンインストールが295%急増
動画生成コスト増による料金改定の可能性

OpenAI動画生成AI「Sora」をChatGPTに統合する計画を進めていることが、The Informationの報道で明らかになりました。現在Soraは専用サイトとスタンドアロンアプリでのみ利用可能ですが、ChatGPT内で直接動画生成ができるようになる見通しです。

この統合は、昨年ChatGPT画像生成機能が追加されたのと同様の動きです。Soraの単独アプリはChatGPTほどの人気を獲得できておらず、統合によってより多くのユーザーに動画生成機能を届ける狙いがあります。

一方で、ディープフェイクの拡散が深刻な懸念として浮上しています。Soraアプリの公開直後には、歴史的人物の不適切な偽動画著作権侵害コンテンツが生成される問題が発生しました。ChatGPTへの統合でアクセスが容易になれば、ガードレール回避の試みがさらに増加する恐れがあります。

背景には競争環境の激化があります。AnthropicClaudeが急速に人気を伸ばす一方、ChatGPTのアンインストール数が295%急増しています。OpenAI米国防総省の契約条件に同意したことへの反発も影響しており、Sora統合はユーザー引き留め策とみられています。

ただし、The Informationによれば、Sora統合はOpenAI運用コストを押し上げる可能性があります。先月には低価格プランで広告表示が開始されており、今後さらなる料金体系の見直しにつながる可能性も指摘されています。

NVIDIAがComfyUI連携強化、ローカルAI動画生成を大幅高速化

ComfyUI刷新

App Viewで初心者も利用可能に
ノード不要の簡易UIを追加
RTX最適化で40%高速化達成

性能と4K対応

NVFP4で2.5倍高速・VRAM60%削減
RTX Videoで4Kアップスケール対応
Python開発者向け無償パッケージ公開

対応モデル拡大

FLUX.2 KleinのNVFP4/FP8版公開
LTX-2.3のNVFP4対応も近日予定

NVIDIAは米サンフランシスコで開催中のGame Developers Conference(GDC)において、ComfyUIとの連携強化を含むAI動画生成の高速化アップデートを発表しました。RTX GPUおよびDGX Sparkデスクトップ向けに、コンセプト開発やストーリーボード制作の効率を大幅に向上させます。

ComfyUIに新たに追加されたApp Viewは、ノードグラフに不慣れなアーティスト向けの簡易インターフェースです。プロンプト入力とパラメータ調整だけで画像生成が可能になり、従来のNode Viewとの切り替えもシームレスに行えます。AI創作ツールの利用障壁を大きく引き下げる取り組みです。

性能面では、RTX GPUへの最適化により9月比で40%の高速化を実現しました。さらにGeForce RTX 50シリーズのNVFP4フォーマットを活用することで、パフォーマンスは2.5倍に向上し、VRAMの使用量は60%削減されます。FP8でも1.7倍の高速化と40%のVRAM削減を達成しています。

RTX Video Super ResolutionがComfyUIのノードとして利用可能になり、生成した動画リアルタイムで4Kにアップスケールできるようになりました。従来の手法と比較して30倍高速で、VRAM消費も大幅に抑えられます。AI開発者向けにはPyPIから無償のPythonパッケージも公開されています。

対応モデルも拡充され、FLUX.2 Kleinの4Bおよび9BモデルのNVFP4・FP8版がHugging Faceで公開されました。LTX-2.3のFP8版も利用可能で、NVFP4対応も近日中に予定されています。ゲーム開発者クリエイターがローカル環境で高品質なAI動画を生成できる基盤が着実に整いつつあります。

a16z調査:ChatGPT週間9億人、エージェント時代が本格到来

プラットフォーム競争

ChatGPTが依然トップ、週間9億人利用
GeminiClaudeが有料契約者数で急成長
コネクター生態系がロックインを形成
OpenAIはスーパーアプリ戦略を推進

クリエイティブとエージェント

動画生成画像生成を勢力図で逆転
中国製モデルが動画品質でリード
OpenClawGitHub最多スター獲得
ManusMetaに20億ドルで買収

a16zは2026年3月、生成AIコンシューマーアプリ第6版を公表し、ChatGPTが週間アクティブユーザー9億人を達成、世界人口の10%以上が毎週利用していることを明らかにした。

ChatGPTはウェブでGeminiの2.7倍、モバイルで2.5倍の規模を維持しているが、GeminiClaudeが有料契約者数で加速しており、それぞれ前年比258%・200%超の成長を記録している。

今版からCapCut・CanvaNotionなど、AIが中核機能に組み込まれたレガシーアプリも対象に加えられた。NotionのAI機能は有料契約者への付帯率が1年で20%から50%超に急増し、ARRの約半分を占めている。

エージェント領域では、オープンソースのOpenClawGitHubスター数でReactやLinuxを超えて首位となり、OpenAIが2026年2月に買収ManusMetaが約20億ドルで取得し、Gensparkは3億ドルのシリーズBを調達した。

地理的にはAI市場が西側・中国・ロシアの3極に分化。Claude Codeは6カ月で年換算収益10億ドルに到達するなど、ブラウザやデスクトップへのAI浸透が進み、ウェブ訪問数では捕捉できない利用実態が拡大している。

GoogleがVoIP先駆者クロアク博士の功績をAIドキュメンタリーで記録

AIで歴史を可視化

Veo3Nano Bananaでドキュメンタリー制作
映像記録のない場面をAIで補完
Flow経由でGoogle AIツールを活用
クロアク博士の遺産を新手法で保存

女性月間の取り組み

Google Arts & Cultureで女性文化コレクション公開
Google PlayとYouTubeでIWD特集コンテンツ
Google DoodleからAIモード検索へ連携
Google Meetに女性史月間背景画像を追加

Googleは国際女性デーに合わせ、VoIP技術の先駆者であるMarian Rogers Croak博士の軌跡を追ったドキュメンタリー「The Art of Possible」を制作・公開した。

クロアク博士はVoIPの特許取得を主導した人物であり、現在はGoogle人間中心のAIと機械学習部門を率いている。STEMにおける女性・黒人の先駆者として広く知られる。

本作はGoogleのAI動画生成ツールVeo3およびNano Bananaを、Flowプラットフォームを通じて活用。映像記録が残っていない歴史的場面をAIで視覚化し、臨場感ある描写を実現した。

Googleは同月、Google Arts & Cultureの「Women in Culture」コレクション、Google PlayのIWDアプリ特集、YouTubeクリエイター特集など、複数のプロダクトで女性の功績を称えるコンテンツを横断展開している。

Googleホームページの特別DoodleをクリックするとAIモード検索が起動し、女性主導の発明や発見をさらに深掘りできる仕組みも導入。テクノロジーと文化発信を組み合わせた取り組みが注目される。

Replitが動画生成機能を正式公開、数分で製品紹介映像を作成可能に

機能の特徴

自然言語動画を指示
モーション制作会社が不要
アプリと同じワークスペースで制作
数分で初版を生成可能

開発経緯と実績

社内デザイン実験から製品化
Fast Mode紹介動画100万imp達成
Gemini 3.1 Pro基盤で正式提供
社内でも外注より内製を選択

Replitは、開発環境内でモーションスタイルの製品紹介動画を自然言語の指示だけで生成できる新機能「Replit Animation」を正式に公開しました。従来は専門のモーショングラフィックス制作会社に依頼していた作業を、開発者自身が数分で完了できるようになります。

この機能はプロダクトデザイナーのSamuel氏による社内実験から生まれました。Replit Design上でサイトやスライドを生成する仕組みをアニメーションに応用できないかと試したところ、わずか30分でスタジオ品質の動画が完成したといいます。

その直後、Fast Modeのローンチ動画が急遽必要になり、Samuel氏が実験的に作成した動画をそのまま公開したところ、オーガニックで100万インプレッションを超える反響を得ました。モーションデザイナーでない同氏がわずか数ドルのコストで制作した動画がこの成果を上げたことで、社内での活用が本格化しました。

Replit AnimationはVeoSoraのようなAI動画生成とは異なり、モーショングラフィックススタジオを開発環境に組み込んだような位置づけです。ユーザーはローンチ対象や想定顧客、雰囲気を自然言語で伝えるだけで、絵コンテやコードを書く必要がありません。従来は数千ドルと数週間を要していた工程を大幅に短縮できます。

実践的なワークフローとしては、ビルドタイプをanimationに設定し、プロンプト最適化機能でシーン構成を自動生成した後、複数タブで並行生成して最良の要素を組み合わせる手法が推奨されています。特定シーンの修正も「イントロを変更」「トランジションを強く」といった対話的な指示で調整でき、ゼロからやり直す必要はありません。

Hugging Face、画像生成パイプラインを自在に組み替える新基盤を公開

モジュラー設計の核心

ブロック単位で自由に着脱
既存APIと互換性を維持
カスタムブロックをHub共有可能
コンポーネントの遅延読み込み対応

エコシステムの広がり

Kreaがリアルタイム動画生成に採用
ノードUIMellonと統合
モジュラーリポジトリで量子化モデル参照
コミュニティパイプラインがHub上で増加

Hugging Faceは、画像生成ライブラリDiffusersの新機能「Modular Diffusers」を公開しました。従来の固定的なDiffusionPipelineクラスに代わり、テキストエンコード・デノイズ・デコードなどの処理を独立したブロックとして組み合わせる設計を導入しています。

各ブロックは入出力が明確に定義されており、パイプラインから任意のブロックを抜き出して単独実行したり、別のブロックと差し替えたりすることが可能です。たとえば深度推定ブロックを作成し、ControlNetワークフローの先頭に挿入するといった柔軟な構成が数行のコードで実現できます。

カスタムブロックはHugging Face Hubに公開でき、他のユーザーがtrust_remote_codeオプションで即座に読み込めます。公式テンプレートも用意されており、コンポーネント定義・入出力宣言・処理ロジックの3要素を記述するだけでブロックを作成できます。

すでにコミュニティでの活用が始まっており、KreaはB200 GPU1枚で11fpsのリアルタイム動画生成パイプラインを構築しました。またOverworldのWaypoint-1はインタラクティブなワールド生成をモジュラーブロックで実装しています。

ノードベースのビジュアルインターフェース「Mellon」との統合も進んでおり、ブロックのAPI定義からUIを自動生成する仕組みを備えています。ComfyUIに似た操作感ながら、モデルに応じてノードが動的に変化する点や、パイプライン全体を1ノードに集約できる点が特徴です。

ByteDance動画AI「Seedance 2.0」に計算資源と著作権の壁

技術と普及の現状

Seedance 2.0が業界に衝撃
映画監督級の映像生成能力
GPU不足で数時間待ちの状態
中国国内アプリ限定で提供中

著作権問題の深刻化

Disney等が差止め書簡送付
ユーザーが著名キャラ映像を大量生成
中国のIP保護制度の未整備が背景

米中AI格差の構図

動画AIでは中国米国に先行
コーディングAIでは米国が優位

ByteDanceは2025年2月、動画生成AI「Seedance 2.0」を発表しました。中国のゲーム開発者や映像クリエイターから「監督のように考える」と高い評価を受け、AI動画の品質に懐疑的だった層にも衝撃を与えています。

しかし現時点では計算資源の深刻な不足が普及の障壁となっています。利用者によると、5秒の動画生成に約9万人待ちの行列が発生し、数時間の待機が必要です。月額70ドル超の有料会員でも長時間待たされる状況で、深夜に生成リクエストを送るなどの裏技が共有されています。

Disney、Netflix、Paramountなど大手映画スタジオがByteDance著作権侵害を主張する差止め書簡を送付しました。ユーザーがウルヴァリンやトム・クルーズなど著名キャラクターの映像を生成・拡散しており、グローバル展開時の法的リスクが急速に高まっています。

中国のエンタメ業界はハリウッドとは対照的にAI動画を積極的に受容しています。カンヌ受賞の賈樟柯監督がSeedance 2.0で作品を制作し公開するなど、著名クリエイターの参入が相次いでいます。春節晩会の背景映像にも採用され、政府の後押しも見られます。

米中AI分野の棲み分けも鮮明になっています。動画AIではKling AIを含む中国勢が世界をリードする一方、コーディングAIでは中国開発者Claude CodeCodexに依存しています。Seedance 2.0のAPI価格は15秒動画で約2ドルと公表されており、今後のサードパーティ開放が注目されます。

Google NotebookLMが映画風AI動画生成機能を公開

映画風動画の特徴

Gemini 3Veo 3を統合活用
ナレーション付きスライドから映像表現へ進化
Geminiが構成・演出を自動決定
流動的アニメーションと詳細な視覚表現

提供条件と制約

Google AI Ultra契約者限定
英語のみで本日提供開始
1日最大20本の生成上限
Web・モバイル両対応

Googleは、AIノートツール「NotebookLM」に映画風の動画生成機能「Cinematic Video Overviews」を追加したと発表しました。ユーザーのリサーチやノートを基に、完全にアニメーション化された没入型の動画を自動生成します。

従来のVideo Overviews機能はナレーション付きスライドショーの生成に限られていましたが、新機能ではGemini 3Nano Banana Pro、Veo 3など複数のAIモデルを組み合わせることで、滑らかなアニメーションと豊かな視覚表現を実現しています。

Geminiは「クリエイティブディレクター」として機能し、最適なナラティブ構成、ビジュアルスタイル、フォーマットの決定から、一貫性を確保するための自己修正まで、数百に及ぶ構造的・様式的判断を自動的に行います。

本機能は現在、Google AI Ultraサブスクリプション契約者(18歳以上)に限定して英語版のみ提供されています。1日あたりの生成上限は20本に設定されており、Web版とモバイル版の両方で利用可能です。

Googleは近月、Veo AIモデルのアップグレードや動画生成ツールFlowのアクセス拡大、ゲーム風映像を生成する「Project Genie」のデモなど、AI動画分野への投資を加速させており、今回の機能追加もその一環に位置づけられます。

Black Forest Labs、外部教師不要の自己学習手法で訓練速度2.8倍に

Self-Flowの技術革新

外部エンコーダ依存を完全排除
二重タイムステップ方式で自己蒸留
画像動画音声統一学習を実現

性能と効率の飛躍

従来比約50倍の訓練ステップ削減
FID 3.61でREPA超えの画質達成
テキスト描画精度が大幅向上
ロボット制御タスクでも高成功率

企業への戦略的意義

計算コスト3分の1で最先端到達
外部モデル依存排除で技術負債削減

独Black Forest Labsは、生成AIモデルの訓練において外部の意味理解モデルに依存しない新手法「Self-Flow」を発表しました。従来のStable DiffusionやFLUXなどの拡散モデルはCLIPやDINOv2といった凍結エンコーダに頼っていましたが、この制約を根本から解消する技術です。

Self-Flowの核心は「二重タイムステップスケジューリング」と呼ばれる仕組みです。入力データに異なるレベルのノイズを適用し、生徒モデルには強く劣化させたデータを、教師モデル(自身のEMA版)にはより鮮明なデータを与えます。生徒が教師の見ている内容を予測する自己蒸留により、生成と意味理解を同時に学習します。

実用面での成果は顕著です。Self-Flowは現行標準のREPA手法と比較して約2.8倍高速に収束し、従来のバニラ訓練と比べると必要ステップ数は約50分の1に削減されました。40億パラメータのマルチモーダルモデルでは、画像FID 3.61、動画FVD 47.81とREPAを上回るスコアを記録しています。

特筆すべきはマルチモーダル対応力です。AIが苦手としてきたテキスト描画の精度が大幅に向上し、動画生成では手足が消える幻覚アーティファクトが解消されました。さらに映像と音声同期生成も単一プロンプトから可能になり、外部エンコーダでは困難だった領域を克服しています。

企業にとっての戦略的価値も大きく、計算予算を約3分の1に圧縮しつつ最先端性能を達成できます。ロボティクス分野では675Mパラメータ版をRT-1データセットで微調整し、複雑な多段階タスクで高い成功率を実現しました。外部エンコーダへの依存排除により、技術負債の削減とスケーラビリティの確保が可能となり、自社データに特化した独自モデル開発の現実性が大きく高まっています。

Seedance 2.0が動画AI生成をリード

Seedance 2.0の実力

映画監督も認める映像品質の大幅向上
Tom Cruise・Brad Pittを模倣したデモが話題
SoraRunwayを超える可能性を示す

残された課題

一貫性と細部の品質にまだ課題
著名人の無許可模倣への懸念
コンテンツポリシーの整備が遅れ気味

ByteDanceの新しい動画生成モデルSeedance 2.0が公開され、アイルランドの映画監督Ruairi Robinson氏がX上に投稿したデモ映像が大きな反響を呼んでいます。映像のリアリズムは従来のAI動画ジェネレーターを大きく上回っています。

しかし著名人を模倣した映像が生成できることへの懸念が上がっており、コンテンツポリシーの整備が求められています。生成動画スロップ問題も依然として残っており、完成度の高さとリスク管理のバランスが課題です。

Vercel GatewayにGrok・Veo追加

動画生成APIの統合

4つの動画モデルをGatewayに追加
Grok Imagine Video・Kling・Veo・Wan
統一APIで動画生成を簡素化

VercelAI Gatewayに、Grok Imagine Video、Kling、Google Veo、Wan(Alibaba)の4つの動画生成モデルが一斉に追加されました。

一つのAPIエンドポイントから複数の動画生成モデルを呼び出せるようになり、動画AI開発のハードルが大幅に低下します。

ByteDanceがSeedance 2.0にガードレール追加、ハリウッドの圧力に折れる

Hollywood対応の内容

Disney・Paramount Skydanceが差し止め請求
著名キャラクター・有名人の再現をブロックへ
ガードレール改修を緊急実施と発表
業界団体も連名で抗議文書を提出

動画AI規制の行方

中国発AI動画モデルに著作権の壁
完全排除は技術的に困難との見方
AI動画ツールに法的リスクが顕在化
ライセンス契約モデルが業界標準に?

ByteDanceのAI動画生成モデル「Seedance 2.0」に対し、DisneyとParamount Skydanceが差し止め請求書を送付しました。これを受けByeDanceは著名キャラクターや有名人の動画生成をブロックするためのガードレール改修作業を開始しました。

Hollywood業界団体は「AIによるクリップアート化」と批判し、Seedance 2.0が著作権保護されたコンテンツを自由に複製・変形できる状態であることを問題視しています。

技術的には、AIモデルが著作権のある対象を完全にブロックするのは困難です。ガードレールはキーワードベースのフィルタやファインチューニングによる制約によって実装されますが、回避手法も存在します。

この問題はByteDanceだけでなく、RunwaySora、Klingなど他のAI動画生成ツールにも同様の法的リスクが存在することを示しています。コンテンツライセンスの業界標準整備が急務です。

長期的には、ハリウッドとAI企業の間で、コンテンツ学習データや生成物に対するライセンス料・使用許諾の枠組みが構築される方向に向かうと見られており、Getty Imagesのアプローチが一つのモデルとなっています。

ByteDanceのSeedance 2.0がハリウッドから著作権侵害で猛反発

ハリウッドの反発

Disney・Paramountなど主要スタジオが抗議
映画キャラクターの「クリップアート化」と批判
著作権保護の侵害ツールとして急拡散
業界団体が書面での抗議を提出

規制リスクと技術課題

ByteDanceガードレール改修を急ぐ
中国発のAI動画モデル米国市場で摩擦
有名人のディープフェイク生成が問題化
著作権訴訟リスクが現実化

ByteDanceが発表したAI動画生成モデル「Seedance 2.0」に対し、DisneyやParamountを含むハリウッドの大手映画スタジオや業界団体が著作権侵害を訴えて抗議声明を発表しました。

問題となっているのは、ユーザーがSeedance 2.0を使って映画キャラクターや有名人の動画を高精度に生成できてしまうことです。業界団体は「あからさまな著作権侵害のツール」と非難しました。

ByteDanceはすでにガードレールの改修作業に着手したと表明していますが、AI動画生成モデルにおいて著作権のある対象物を完全にブロックすることは技術的に困難な課題です。

この問題は、中国発のAI企業が米国欧州市場に進出する際に直面する知的財産権の壁を改めて浮き彫りにしました。Stability AI等のケースに続く事例として注目されています。

ハリウッドとAI企業の関係は今後も緊張が続くとみられており、コンテンツライセンスや使用制限をめぐる法的・ビジネス的枠組みの整備が急務です。

ByteDanceが次世代マルチモーダル動画生成AIを発表

新モデルの能力

テキスト・画像音声動画統合入力して映像生成
あらゆるマルチモーダル入力に対応する次世代モデル
ByteDance動画AI技術が一段階進化

ByteDanceはテキスト、画像音声、既存動画の任意の組み合わせを入力として動画クリップを生成できる新世代AIモデルを発表しました。RunwaySoraと競合するマルチモーダル動画生成の最前線を争います。

TikTokの親会社として膨大な動画データを持つByteDanceにとって、動画生成AIは戦略的な中核技術です。クリエイター向けツールから広告制作まで幅広い応用が見込まれます。

Soraとの比較では、入力の柔軟性において優位性があるとされています。既存の映像素材を入力として新しいコンテンツを生成する映像編集AIとしての活用が注目されます。

Runway、315億円調達で評価額5300億円に

資金調達の詳細

シリーズEで315Mドル調達
評価額が53億ドルに倍増
世界モデル開発に注力

戦略と展望

動画生成から物理理解
エンタメ業界での採用拡大
競合との差別化を加速

AI動画生成スタートアップRunwayがシリーズEで3億1500万ドルを調達し、評価額は53億ドルとほぼ倍増しました。

調達資金はより高度な世界モデルの開発に充てられます。物理法則を理解し、現実世界をシミュレーションできるAIの構築が目標です。

Runwayは映画やテレビなどエンターテインメント業界での採用が進んでおり、プロフェッショナル向けツールとしての地位を確立しています。

SoraPika、Klingなどの競合がひしめくAI動画生成市場で、世界モデルへの投資は差別化戦略として注目されます。

AI動画生成市場は急成長中であり、大型調達が相次ぐ状況です。Runwayの資金力強化は業界の競争をさらに激化させるでしょう。

AutodeskがGoogleをFlow商標で提訴

訴訟の概要

Flow商標の侵害を主張
AI動画ツールが対象
3Dソフト大手が法的措置

背景と影響

AI製品の命名競争が激化
商標紛争の増加傾向
製品展開に遅延の可能性

3Dデザインソフト大手のAutodeskが、GoogleのAI動画制作ツール「Flow」の名称が自社商標を侵害しているとして提訴しました。

Reutersが最初に報じたこの訴訟は、AI製品の命名を巡る紛争が増加している状況を反映しています。AutodeskはFlowの名称を自社製品群で使用しています。

GoogleFlow AIは動画生成ツールとして開発されたものですが、既存ブランドとの衝突により製品展開に影響が出る可能性があります。

OpenAIの「io」ブランド断念と同日の報道であり、AI企業が商標の壁に直面するケースが目立っています。ブランド戦略の見直しが求められます。

AI市場の急拡大に伴い、知的財産を巡る法的紛争は今後も増加する見通しです。企業は製品命名時の事前調査を徹底する必要があります。

MetaがAI生成「Vibes」動画のスタンドアロンアプリをテスト

新アプリの概要

MetaVibes」のAI動画アプリ開発
テキスト入力から短編動画を生成
Reelsとは別個のアプリとして展開
AIクリエイター支援ツールとして設計
TikTok競合としての位置づけ
TechCrunchがテスト段階を報告

動画AI市場の動向

SoraRunwayとの競合格化
SNS動画生成AIの普及加速
クリエイター経済の構造変化

TechCrunchは2026年2月5日、MetaがAI生成動画「Vibes」専用のスタンドアロンアプリをテストしていると報じた。

Vibesアプリはユーザーがテキストプロンプトや簡単な入力から短編AIビデオを生成し共有できる仕組みで、Instagramのreels機能とは別プロダクトとして展開される。

MetaOpenAISoraRunwayPika Labsなどと競合するAI動画生成市場に本格参入する意向を示しており、Vibesはその先鋒となる。

Metaの既存の30億人超のSNSユーザー基盤を活かし、AI動画の民主化を大規模に推進できる体制を持つことが強みだ。

SNSでのAI生成動画の普及はコンテンツ制作の敷居を下げる一方、偽情報・著作権問題を複雑化させる課題も伴う。

Google PhotosがAIで画像をビデオに変換する新機能を追加

新機能の概要

画像からビデオ変換機能追加
変換スタイルを自然言語で指定
AIによる映像生成の民主化

消費者価値

思い出の動画
クリエイティブ表現の拡大
競合サービスへの対抗

Google Photosに自然言語で変換スタイルを指定して画像をビデオ化する機能が追加されました。「波が揺れる」「桜が舞い散る」などのプロンプト動画を生成できます。

この機能はAI動画生成を日常的な写真管理に組み込む革新的な取り組みで、SoraRunwayなどの動画生成ツールへの対抗でもあります。

NVIDIA RTX PCで視覚的生成AIを始めるガイド

ガイドの内容

RTX PCでの画像動画生成
Stable Diffusion等のローカル実行
最適なモデルと設定の解説
プライベート生成AIの構築

オンデバイスAIの意義

クラウドAPIコスト削減
プライバシーの完全確保
ローカル実行の表現の自由
自社環境でのAI活用

NVIDIAはRTX PC(GeForce・Quadroシリーズ)でStable Diffusionなどのビジュアル生成AIをローカルで実行するための入門ガイドを公開した。

クラウドAPIを使わずに高品質な画像動画を生成できることで、プライバシーの確保とAPI課金コストの削減が実現できる。コンシューマー向けオンデバイスAIの普及を後押しする。

RTX GPUのTensorコアとDLSSを活用した推論最適化により、手頃なPCでもプロ品質の生成AI利用が可能になることを示したガイドだ。

OverworldがWaypoint-1でリアルタイムインタラクティブ動画拡散を実現

Waypoint-1の技術

リアルタイム動画を生成・変換
インタラクティブ操作に対応
拡散モデルベースの新アーキテクチャ
ゲーム・映像制作への応用
レイテンシーの大幅低減を実現

応用可能性

ゲームグラフィクスの革新
映画制作コストの削減
バーチャルプロダクションへの応用
リアルタイム映像編集が可能に
メタバースの新技術基盤に

OverworldはWaypoint-1という新しいリアルタイムインタラクティブ動画拡散モデルをリリースしました。ユーザーの操作に反応しながらリアルタイムで動画を生成できる点が革新的です。

従来の動画生成AIは事前生成型でしたが、インタラクティブ性を加えることでゲームエンジンの代替やリアルタイム映像制作への応用が広がります。

ゲーム産業での応用が最も期待されており、NPCの行動や環境をリアルタイムで動画として生成する新しいゲームエンジンアーキテクチャへの道が開けます。

動画生成AIのリアルタイム化は研究の最前線テーマであり、Overworld以外にも複数の研究グループが同様の目標に向けて競争しています。

GoogleのAI動画生成ツールFlowがWorkspaceユーザーに開放

機能と展開

GoogleFlowがWorkspace対応
テキストから動画生成が可能
企業向けWorkspaceユーザーに開放
2025年5月のローンチ後に拡大
ビジネス用途での活用が広がる

ビジネスインパクト

動画コンテンツ制作コスト削減
マーケティング生産性が向上
研修・プレゼン資料作成に活用
競合Soraとの差別化要素
エンタープライズでの採用加速

GoogleはAI動画生成ツール「Flow」をGoogle Workspaceユーザーに提供開始しました。2025年5月にローンチして以来、アクセスを段階的に拡大しています。

Flowはテキストや画像から高品質な動画を生成できるツールで、Workspaceとの統合によりビジネスユーザーが日常業務で活用しやすくなります。

マーケティング部門や研修コンテンツプレゼン資料など企業の動画ニーズに応えるもので、専門のビデオ制作会社への外注コストを削減できる可能性があります。

OpenAISoraなど競合製品と比べ、Google Workspaceエコシステムとの親和性が差別化のポイントです。

元Snap幹部設立のAI動画スタートアップHiggsfield が評価額1300億円を達成

企業と市場の詳細

元Snapエグゼクティブが設立
評価額13億ドルに達成
AI動画生成市場での高成長
Soraや他の動画AIとの競合
クリエイティブ市場での差別化戦略

元Snap幹部が設立したAI動画生成スタートアップHiggsfieldが13億ドルの評価額を達成しました。OpenAISoraRunway、Kling、Google Veoとの競合が激化するAI動画市場において、ソーシャルメディア向けのクリエイティブ機能に特化した差別化戦略を取っています。

AI動画生成市場は急速に拡大しており、複数の有力スタートアップが高い評価額を獲得しています。ユニークな創作表現と使いやすさで差別化を図るHiggsfieldのアプローチは、一般消費者とプロクリエイター双方への展開を狙っています。

GoogleがVeo 3.1を発表、縦向き動画生成と参照画像からの動画変換に対応

新機能の詳細

縦向き(ポートレート)動画の生成に対応
参照画像からAI動画を生成可能
4Kクオリティへの解像度向上
Gemini APIでも利用可能
食材から料理動画を自動生成する機能

創作と業務への影響

SNS向けコンテンツ制作を効率化
縦型動画主流のモバイル時代に対応
参照画像が一貫性を担保
ブランドコンテンツ制作コストを削減
競合Soraやルーミへの対抗策

Google動画生成AIモデルVeo 3.1の強化版を発表しました。最大の新機能は縦向き(ポートレート)動画の生成対応で、TikTokInstagram Reelsなどモバイル向けコンテンツ制作に直接対応しています。また参照画像からAI動画を生成できる機能も追加され、ブランドの視覚的一貫性を保ちながらコンテンツ制作できます。

Veo 3.1はGemini APIを通じて開発者が利用でき、食材の写真から料理手順動画を自動生成するデモも公開されました。より高い一貫性とクリエイティブコントロールが実現され、商業的なコンテンツ制作パイプラインへの組み込みが容易になっています。

OpenAISoraRunwayとの競争が激化する動画生成AI市場において、縦型フォーマット対応Googleが実用的なユースケースで差別化を図る戦略的判断です。SNSコンテンツ制作の現場では縦型動画が主流となっており、この対応は多くのクリエイターやマーケターにとって直接的な価値を持ちます。

NvidiaがCESでDLSS 4.5・RTX AI動画・Siemens提携を発表

CES 2026のNvidia主要発表

DLSS 4.5でMulti Frame Generationを大幅強化
トランスフォーマーモデルで映像品質と性能を向上
G-SYNC PulsarによるゲームディスプレイのAI制御
GeForce NOWをLinuxとAmazon Fire TVに対応
RTXがLTX-2とComfyUIで4K AI動画生成を加速
SiemensのEDAツールをNvidia GPUで高速化

産業への応用拡大

EDA(電子設計自動化)分野へのGPU活用が拡大
半導体設計シミュレーションを大幅に短縮
AIワークロードの多様化でGPU需要が増加
クラウドゲーミングのエコシステムが拡充
映像生成AIがプロ・コンシューマー両市場に展開
Nvidiaのプラットフォーム戦略が多方面に浸透

Nvidiaは今年のCES 2026で複数の重要発表を行いました。DLSS 4.5は新しい動的マルチフレーム生成技術と6倍マルチフレームモードを導入し、ゲームのフレームレートと画質を同時に向上させます。第2世代のトランスフォーマーモデルを採用し、従来のCNNベースのDLSSから大きく進化しています。

GeForce NOWはLinux PCとAmazon Fire TVへの対応を新たに追加し、クラウドゲーミングのアクセス可能なデバイスを拡大しました。またRTX AI動画生成では、LTX-2モデルとComfyUIの連携により、PC上での4K品質の動画生成が可能になっています。

SiemensのEDAツールとNvidiaGPUを組み合わせる提携は、半導体設計の電子シミュレーションを劇的に高速化することを目指しています。AIチップの需要拡大とともに、設計ツールの高速化が業界全体の競争力に直結する重要な取り組みです。

GoogleがCES 2026でGoogle TV向けGemini AIを大幅強化

Gemini搭載TV新機能の全貌

画像動画生成機能がTV上で利用可能に
音声コマンドでTV設定を直接操作
Nano Banana(新モデル名)をGoogle TVに搭載
コンテンツ推薦Geminiの理解力で精度向上
プロジェクターを含む幅広いデバイスに対応
Google TV Streamerからブランド横断で展開

テレビ体験のAI変革

視聴中のリアルタイム質問への回答機能
番組・映画の詳細情報をAIが即座に提供
家族のプロファイルに基づく個人化推薦
音声AIがリモコン操作を代替
多言語対応でグローバル展開を加速
スマートホームとの統合制御も視野に

GoogleはCES 2026でGoogle TV向けのGemini AI機能を大幅に拡張すると発表した。最も注目される新機能は画像動画生成で、リビングルームのテレビから直接AIコンテンツを作成できるようになる。

Nano Banana」という開発コードで呼ばれる新しいGeminiモデルがGoogle TVに組み込まれ、音声コマンドでテレビの設定(字幕・音量・画質など)を直接操作できる。リモコン不要の音声制御が完全な形で実現する。

コンテンツ推薦機能もGeminiの自然言語理解により大幅に向上する。「先週見た映画みたいなアクション映画で、主人公が女性のもの」といった自然言語での要求に応じた精密な推薦が可能になる。

対応範囲はGoogle TV Streamer(従来のChromecast後継)を起点に、Sony・TCL・Hisenseなどのパートナーメーカー製TVやプロジェクターにも広がる予定だ。このエコシステム拡大により、数億台の家庭用TVにGeminiが搭載される可能性がある。

将来的にはGoogle Homeのスマートホームデバイスとの統合制御も予定されており、テレビを通じて照明・温度・セキュリティカメラなどを音声制御できる「スマートホームのハブ」としての機能強化が計画されている。

ハリウッドとAI:2025年の失望と不気味なGemini広告再現実験

ハリウッドのAI挑戦が空振りに

2025年は生成AIがエンタメ産業に本格参入した年
Netflix・Amazon・Disneyが次々にAI活用を宣言
AmazonのAIアニメ吹替が品質不足で即時公開停止に
Disney×OpenAIの10億ドル×3年ライセンスが業界の転換点
テキスト→ビデオのスロップワークフロー改善に貢献せず
金銭節約が主目的でありクリエイティブ価値創出とは乖離

Gemini広告の再現から見えた限界

GoogleGemini広告の「ぬいぐるみ世界旅行」シナリオを実際に試行
商品検索では1800語の試行錯誤のあとも「TargetかEbayで探して」の結論
画像生成は概ねできるが細部の不整合が頻発
動画生成は1日3本制限でCMで見た流暢さを再現できず
子どもの名前を入れたAI音声に「不気味の谷」を体験
プロンプト全文が広告に映らない点に「手品の仕掛け」の疑念

2025年はNetflixが生成AIのガイドラインを公開し、Amazonが複数の日本アニメシリーズにAI吹替を採用し、DisneyがOpenAIと10億ドル規模の3年間ライセンス契約を締結するなど、エンターテインメント産業でのAI活用が一気に加速した年でした。

しかし成果は芳しくありませんでした。AmazonのゲームチェンジャーになるはずだったAI吹替は細部の品質が低く即座に公開停止に。AIドラマのリキャップ機能も番組の内容を頻繁に間違えて公開停止されるなど、矢継ぎ早の失敗が続きました。

一方でDisneyのOpenAI提携はエンタメ業界に「後れを取るな」というシグナルを送り、2026年以降さらに多くのスタジオがAI活用に踏み込む可能性を示しています。Disneyは自社ストリーミングサービスの一角をSoraによるユーザー生成コンテンツに充てる計画です。

The Vergeの記者がGoogleGemini広告を自分のぬいぐるみで再現してみたところ、商品検索機能は1800語の試行錯誤の末「TargetかEbayで探して」という答えで終わりました。広告で見たシームレスな体験とは程遠い現実が明らかになりました。

画像生成は比較的うまく機能しましたが、動画生成Gemini Proアカウントでも1日3本に制限されており、CMで流れるような滑らかな一連のシーンを短時間で作ることは実際には困難でした。プロンプトの全文広告に映らないことへの疑問も生じました。

最も印象的だったのは、AIが生成したぬいぐるみが子どもの名前を直接呼ぶ動画を見た時の違和感でした。「AIがデジタルでオーバーライトすることで子どもとぬいぐるみの関係の魔法を壊してしまう」という懸念は、技術の倫理的限界を問うものでした。

MetaがAI画像・動画モデルを2026年前半に公開

新モデルの全容

画像動画モデルMangoを開発中
テキストモデルAvocadoもコード強化
視覚的推論ワールドモデル探求
2026年前半のリリースを目標

Metaが抱える課題

OpenAIGoogleAI競争で後れ
MSLから研究者が離脱相次ぐ
LeCunが独立スタートアップ設立
SNS頼みのユーザー基盤に依存

Metaは2026年前半のリリースを目指して、画像動画生成の新AIモデル「Mango」とテキストベースの新モデル「Avocado」の開発を進めていることが報じられました。

発表はScale AIの共同創業者Meta超知性ラボ(MSL)を率いるAlexandr WangとCPOのChris Coxが行ったとされます。Avocadoはコーディング能力の向上を目指すほか、視覚情報の理解や推論・計画を可能にするワールドモデルの探求も進めます。

Metaは近年、OpenAIAnthropicGoogleに対してAI競争で後れを取っており、2025年に入ってMSLの大規模再編が複数回行われました。研究者の引き抜きや離脱も相次いでいます。

首席AIサイエンティストのYann LeCunも2025年後半にMetaを離れ、独立したAIスタートアップ「AMI Labs」を設立することを発表しました。

現在のMeta AIアシスタントInstagramFacebookのサーチバーへの組み込みでユーザー数を維持していますが、独自の競争力ある製品としての地位は未確立です。MangoとAvocadoはMSLの最初の本格成果物として大きなプレッシャーを背負っています。

ChatGPT30億ドル突破、AI競争激化

ChatGPT成長の実態

累計消費額が30億ドル突破
31ヶ月でTikTok上回る速度
2025年は前年比408%

競合各社の台頭

GeminiがDAU6倍速で増加
ClaudeCodeがARR10億
GrokはMAU3800万到達
特化型スタートアップ急拡大

ChatGPTのモバイルアプリが世界累計消費額30億ドルに達しました。TikTokが同水準に到達するまで58ヶ月を要したのに対し、わずか31ヶ月という歴史的な速さでの達成です。

2025年の年間モバイル消費額は推定24.8億ドルで、前年の4.87億ドルから実に408%の急成長が確認され、ChatGPTが消費者アプリ市場を根本から塗り替えたことを数字が証明しました。

a16zの調査ではChatGPTのDAU/MAU比が36%と非常に高く、デスクトップユーザーの12ヶ月後継続率も50%を維持しており、習慣的利用が定着していることを示しています。

GeminiはデスクトップユーザーをChatGPTの約6倍のペースで増やしており、有料ユーザーの年間成長率も約300%と急拡大中であり、Googleの猛追が鮮明になっています。

AnthropicはエンタープライズおよびAPI技術系ユーザーへの特化戦略を続けており、Claude Codeは提供開始からわずか6ヶ月で年間換算10億ドルのランレートを突破しました。

xAI Grokは2025年初頭に単独アプリの提供を開始し、コンパニオン機能や動画生成モデルを相次いで追加した結果、12月にはMAUが3800万人に達するまでに成長しています。

Replit・Lovable・Sunoなどの専門特化スタートアップも独自のインターフェースを武器に数百万人規模のユーザーを獲得しており、AI市場の多極化が加速しています。

Googleの2025年、訴訟乗り越え最高益

法的リスクの乗り越えと業績

Chrome売却命令を回避検索独占是正は軽微な措置のみ
四半期売上1000億ドル超の初達成
Google Cloud収益150億ドルでAI効果が顕在化
独自チップIronwoodAnthropicら外部企業に初販売

AI競争と財務実績

Gemini 3 Proの登場がOpenAIを「コードレッド」状態に
Veo 3動画生成SNSを席巻
Nano Banana Proが市場最強の画像編集モデル
Google Playがホリデーシーズン向け機能・特典を強化

2025年初頭、GoogleChrome売却命令、広告技術の分割、Epicとのアプリストア訴訟、そしてAI競争という4つの大きな脅威に直面していましたが、1年を経て業績・法的地位ともに良好な状態で年を締めくくっています。

最大の脅威だったChrome売却については、判事がこれを「非常に混乱を招き、リスクが高い」と退けました。代わりに競合他社への検索データ販売という比較的軽微な是正措置が命じられました。これはOpenAIPerplexityなどとの競争激化がGoogleに有利な状況を生み出したためでもあります。

広告技術の独占訴訟でも、判事がAd ExchangeとAd Managerの売却より行動変更の方が望ましいと示唆しており、解体を免れる可能性が高まっています。Epicとの和解も手数料引き下げとAndroidの部分的な開放という形で決着する見通しです。

AI競争では、Googleが明確な勝者の一角を占めるようになりました。Gemini 3 Proの登場はOpenAIに「コードレッド」状態をもたらし、Veo 3Soraより先に動画生成SNSを席巻。Nano Banana Proは市場で最も説得力のある画像生成モデルと評価されています。

財務面では10月に四半期として初めて売上高1000億ドルを突破し、利益は310億ドルに達しました。Google Cloudの150億ドルという売上高はAIの商業的成果の証明であり、自社設計のTPUチップ「Ironwood」を初めて外部企業(AnthropicMeta他)に販売することでNVIDIAへの挑戦も始まっています。

Google Playは年末に向けてホリデー向けの100以上のブランドギフトカード販売や、アプリ・ゲームの最大90%オフセール、Google Play Books 15周年記念特典などを展開しています。

メリアム・ウェブスター、2025年「今年の言葉」に「スロップ」を選定

AIが生む低品質コンテンツの蔓延

スロップの定義:AIが大量生成する低品質デジタルコンテンツ
コンテンツ75%がAI関与との調査結果
広告収益目的の「スロップ経済」が台頭
法律文書やサイバー報告にも侵食が拡大
情報格差:有料良質コンテンツと無料粗悪の二極化
YouTubeやWikipediaはスロップ対策を実施

各辞典が捉えたAI語の潮流

マクォーリー辞典も「AIスロップ」を今年の語に選出
オックスフォードは「レイジベイト」を選択
ケンブリッジは「パラソーシャル」を選定
コリンズは「バイブコーディング」を採用
2023年のWOTYは「ハルシネーション」(ケンブリッジ)
AI関連語が言葉の記録に定着しつつある状況

メリアム・ウェブスター辞典は2025年の「今年の言葉」として「スロップ(slop)」を選定しました。同辞典は「人工知能によって通常大量に生産される低品質のデジタルコンテンツ」と定義しています。

スロップという言葉は1700年代に泥や汚水を意味する語として英語に登場し、1800年代には豚の残飯を指すようになりました。現代ではAIが生み出す粗悪なコンテンツの象徴的な言葉として定着しています。

同辞典のグレッグ・バーロウ社長はAP通信に対し、「AIというトランスフォーマティブな技術の一部であり、人々が魅力的にも、うんざりとも、少し滑稽にも感じている言葉だ」と語りました。

2025年には新たなウェブコンテンツの約75%に何らかのAI関与があったとする調査が発表されました。OpenAISoraGoogle GeminiVeoなどの動画生成ツールが普及し、AI製の書籍・ポッドキャスト・楽曲・CM・映画まで登場しています。

広告収益を目的に大量のAIコンテンツを量産する「スロップ経済」も問題視されています。研究者らは、この傾向がデジタルコミュニティの二極化を促進し、有料の高品質コンテンツへアクセスできる層とスロップを消費せざるを得ない層の格差を広げると警告しています。

YouTubeやWikipedia、Spotify、Pinterestはスロップの排除に取り組む一方、MetaOpenAIはAI生成動画のスクロール型アプリを提供するなど、対応が分かれています。ディズニーもSora生成動画をストリーミングに導入する契約を結びました。

今年は複数の辞典がAI関連語を年間ワードに選定しました。オックスフォードは「レイジベイト」、ケンブリッジは「パラソーシャル」、コリンズは「バイブコーディング」、マクォーリー辞典は「AIスロップ」を選んでおり、AIが文化・言語に深く浸透していることを示しています。

CodexでSora Androidを28日で開発

わずか4人のチームが実現した高速リリース

4人のエンジニアCodexと並走し28日で本番リリース
GPT-5.1-Codexモデルを使用、誰でも利用可能な同バージョン
Play Storeで初日1位、24時間で動画生成100万件超
クラッシュフリー率99.9%の高品質を維持
コード全体の約**85%**をCodexが生成
iOSコードをKotlinへ意味保持で翻訳、クロスプラットフォーム開発を代替

Codexを最大活用するための実践的ワークフロー

AGENT.mdでアーキテクチャ方針を明文化しセッション間の一貫性を確保
まず理解・計画フェーズを経てから実装を依頼する手順が安定稼働の鍵
複数セッションを並列実行し、playback・search・エラー処理を同時進行
大規模タスクでは計画書をファイル保存してコンテキスト超過に対処
コードレビューにもCodexを活用し、マージ前のバグ検出に貢献
ボトルネックはコード執筆からアーキテクチャ判断・フィードバックへ移行

OpenAIエンジニアリングチームは、AIコーディングエージェントCodex」を活用し、SoraAndroidアプリをわずか28日で開発・グローバルリリースしました。投入したエンジニアはわずか4名であり、従来の開発常識を大きく覆す成果となっています。

使用したモデルはGPT-5.1-Codexの早期版であり、現在は誰でも利用できるバージョンと同一です。リリース初日にGoogle Play Storeで1位を獲得し、Androidユーザーは24時間で100万本以上の動画を生成しました。クラッシュフリー率は99.9%を維持しており、品質面でも従来型の開発プロセスと遜色ありません。

開発全体を通じてコードの約85%をCodexが生成しました。チームはアーキテクチャ設計・依存性注入・ナビゲーション構造などの基盤を自ら実装し、その上でCodexにパターンを学習させる方針を採りました。「動くものを速く作る」のではなく「我々のやり方で動くものを作る」という考え方が成功の核心です。

Codexを安定運用するうえで重要だったのは、AGENT.mdファイルへのスタイルガイドやパターンの明文化です。セッションをまたいで同じ指針を適用できるため、複数の並列タスクが同一のコーディング規約に従って進行しました。

実装前に理解・計画フェーズを設けるワークフローも効果的でした。Codexに関連ファイルを読ませてデータフローを説明させ、チームが認識を修正したうえで設計書を作成し、その計画に沿って実装を指示する手順により、長時間の無監視実行が可能になりました。

また、iOSの既存コードベースをKotlinへ翻訳する作業にもCodexを活用しました。アプリケーションロジックはSwiftでもKotlinでも本質的に同じであり、Codexが意味を保持したまま変換することで、クロスプラットフォームフレームワーク不要の開発スタイルが実現しました。

OpenAIの内部では、Codex自体の開発にもCodexが活用されており、「CodexのほぼすべてがCodexで構築されている」とプロダクトリードが明かしています。AI支援開発はツールの改善にも帰還的に適用される段階に達しています。

今回の事例は、AI支援開発がエンジニアの仕事を省力化するのではなく、アーキテクチャ設計・意思決定・品質管理といった高付加価値の業務に集中させる方向へシフトさせることを示しています。明日のソフトウェアエンジニアに求められるのは、深いシステム理解とAIとの長期的な協働能力です。

Runway、初のワールドモデルGWM-1を公開

ワールドモデルと音声の二重発表

初のワールドモデルGWM-1をリリース
シミュレーション用途に特化した設計
ワールドモデル競争に本格参入
Gen 4.5にネイティブ音声生成を追加
動画音声の同期生成が可能に
マルチメディア出力の統合を実現

Runwayは初のワールドモデル「GWM-1」を発表しました。物理環境の理解とシミュレーションを目的としたモデルで、より現実的で制御可能な映像生成を可能にします。World Labsなど他社も参入するワールドモデル開発競争に、Runwayが本格的に加わりました。

同時に、Gen 4.5動画生成モデルにネイティブ音声生成機能も追加されました。生成された動画に同期した音声トラックが自動付与されるため、別途音声ツールを使う必要がなくなります。映像と音声の統合により、より完成度の高いマルチメディアコンテンツの生成が一つのプラットフォームで可能になりました。

ディズニー、OpenAIに10億ドル投資しSora提携

提携の全体像

10億ドルの戦略的投資を実施
3年間のライセンス契約を締結
ミッキーマウスやマーベルなど約200キャラ対象
Sora動画生成でキャラクター利用可能に
2026年からユーザーに提供開始予定
エンタメIP×生成AIの先駆的事例

著作権戦争への影響

IP最大手が生成AIと協調路線を選択
他の権利者への波及効果に注目
AI生成コンテンツ品質管理が課題
ブランド希薄化への懸念も浮上
「AIスロップ」批判の声も存在
著作権とAIの関係を再定義する契機

ウォルト・ディズニー・カンパニーとOpenAIは木曜日に歴史的な3年間の提携を発表しました。ディズニーはOpenAIに10億ドルを投資し、ミッキーマウスやマーベルヒーローなど約200のキャラクターをSora動画生成AIで利用可能にするライセンス契約を結びました。

この契約は、著作権保護に最も積極的なディズニーが生成AIと対立するのではなく、協調路線を選んだ点で画期的です。エンターテインメント業界全体にとって、IPと生成AIの関係を再定義する重要な先例となる可能性があります。一方で、AI生成コンテンツによるブランド価値の希薄化を懸念する声もあります。

来年からSoraユーザーはディズニーキャラクターを使った動画生成が可能になります。この動きは、他の大手IP保有者がどのように生成AI技術に対応するかのテンプレートとなり得ます。ただし、品質管理ブランド保護のバランスが今後の大きな課題として残されています。

ディズニー、GoogleのAI著作権侵害を告発

大規模な著作権侵害の主張

GoogleのAIモデルが「大規模な」著作権侵害
フローズン・デッドプール・SW等のキャラが対象
YouTube統合のAIツールを特に問題視
停止通告書(Cease-and-desist)を送付
AI生成コンテンツの法的責任を追及
Googleに対し即座の対応を要求

OpenAI提携との対比

同日にOpenAIとは10億ドル提携を発表
協力と対立の二面戦略が明確に
IP保護の選択的アプローチを示す事例

ディズニーは水曜日、Googleに停止通告書を送付し、同社のAIモデルが「大規模な」著作権侵害を行っていると主張しました。フローズン、デッドプール、スター・ウォーズなど主要フランチャイズのキャラクターに酷似したコンテンツGoogleのAIで生成されていると指摘しています。

特にYouTubeに統合されたVeo AIビデオモデルが問題視されています。GoogleYouTubeにAI動画生成機能を追加する中で、ディズニーのIPが無断で利用されている可能性が浮上しました。エンタメ企業とテック企業の間でIP保護を巡る緊張が高まっています。

注目すべきはそのタイミングです。ディズニーはGoogleへの法的措置と同日にOpenAIとの10億ドル提携を発表しました。この二面戦略は、選択的にAIプラットフォームと協力しつつ、無断使用には厳しく対処するという明確な戦略を示しています。

OpenAI、商標訴訟でSora機能名を変更へ

商標訴訟で機能名を変更

Soraの新機能が商標権侵害で提訴される
既存アプリ「Cameo」との混同が懸念点
地裁の命令に従い名称を「characters」へ変更

繰り返されるネーミング問題

ハードウェア「io」も類似社名で使用禁止
OpenAIは「一般的単語の独占は不当」と反論
CEOはブランド毀損と検索順位への影響を懸念
生成AI特有の模倣体質が命名にも波及か

OpenAIは12月、動画生成AI「Sora」の機能名「cameo」を、商標権侵害訴訟を受けて変更しました。米連邦地裁の差し止め命令に応じ、既存アプリとの混同を避けるため、当該機能を「characters」という名称に差し替えています。

提訴した「Cameo」は、著名人の動画メッセージを購入できる人気サービスです。同社CEOは、OpenAIが商標を知りつつ名称を使用したと批判し、自社ブランドが「AI生成の模造品」と混同されるリスクや、検索順位への悪影響を強く懸念しています。

OpenAIの命名トラブルは今回に限られません。開発中の機器名称「io」についても、類似名の企業から訴えられ使用禁止命令を受けました。AI技術と同様に製品名でも独自性の欠如が指摘されており、急成長企業の知財リスク管理として注目されています。

動画生成AI「Veo」の品質を高めるメタプロンプト術

Geminiに指示文を書かせる

AIにプロンプト作成を代行させる手法
人間よりも詳細で具体的な描写が可能
数ページに及ぶ長文指示も生成できる
Veoなどの動画生成AIで効果を発揮

質の高い指示を出すコツ

スタイルやフォーマットを明確に定義
単なる紙でなく光沢紙など素材を限定
感情や見る人の感覚も指定に含める
AIとの対話と実験で精度を高める

GoogleのUXエンジニアが、動画生成AI「Veo」の出力を劇的に向上させる手法「メタプロンプティング」を公開しました。これはGeminiなどの言語モデルに、AI向けの指示文(プロンプト)自体を作成させるテクニックです。

具体的には、Geminiに対し「LLMが理解できる詳細なプロンプトを書いて」と依頼します。その際、ストップモーションといったスタイルや、光沢紙などの素材を具体的に指定することで、人間では記述が難しい緻密な指示書が生成されます。

さらに、「見ていて満足感がある」といった感情的な要素を条件に加えるのも効果的です。AIが出力したプロンプトVeoに入力すれば、紙の質感や環境音までリアルに再現された、高品質な映像を生成できます。

この手法は専門知識が不要で、誰でもすぐに実践可能です。まずは自分の好きなテーマを選び、AIと対話しながら実験を繰り返すことが、クリエイティブな成果物を生み出す近道となるでしょう。

Runwayが動画AI「Gen-4.5」発表、物理挙動を忠実再現

物理法則を模倣する圧倒的表現力

Gen-4.5は前例のない物理精度を達成
液体の流れや物体の重みをリアルに再現
複雑なプロンプトにも忠実に追従
実写映像と区別がつかない品質

競合環境と技術的な現在地

全ユーザーに対し段階的に提供を開始
生成速度は前モデルと同等の効率を維持
因果関係の推論には依然として課題

Runwayは2025年12月1日、最新の動画生成AI「Gen-4.5」を発表しました。物理法則の再現性が飛躍的に向上し、実写と見分けがつかない「映画品質」の映像生成が可能になります。AIによる映像制作は、新たな次元へと突入しました。

最大の特徴は、映像内の物体が持つ「重さ」や「勢い」、液体の「流体力学」を正確にシミュレートできる点です。複雑な指示(プロンプト)への理解度も深まり、細部まで意図通りのシーンを描き出すことが可能になりました。

OpenAIも9月に「Sora 2」で物理演算の強化を打ち出しており、動画生成AIの競争は激化しています。Runwayは、フォトリアルからアニメ調まで多様なスタイルで一貫した高品質を提供し、市場での優位性を保つ狙いです。

一方で課題も残ります。ドアノブを回す前にドアが開くといった「因果関係」の矛盾が生じるケースは完全には解消されていません。新モデルは全ユーザーへ順次公開され、クリエイターの表現領域を大きく広げることが期待されます。

OpenAIとGoogle、需要急増でAI生成回数を制限

主要ツールの制限内容

Sora無料版は1日6動画へ制限
Google画像生成1日2枚に縮小
背景にホリデー需要と負荷増大

企業側の対応と戦略

OpenAI追加課金で購入可能
Google予告なしの変更を示唆
有料プランの優位性が高まる

OpenAIGoogleは2025年11月28日、ホリデーシーズンの需要急増を受け、主要な生成AIツールの利用制限を開始しました。インフラへの過度な負荷を軽減しつつ、収益化を加速させる狙いがあります。

OpenAI動画生成AI「Sora」では、無料ユーザーの上限が1日6本に設定されました。責任者は「GPUが溶けそう」と状況を説明し、追加生成が必要な場合は都度購入するよう促しています。

Google画像生成AI「Nano Banana Pro」の無料枠を従来の3枚から1日2枚に縮小しました。Gemini 3 Proへのアクセスも制限されており、今後も予告なく条件が変更される可能性があります。

今回の措置は無料ユーザーが対象で、有料プランの制限変更には言及されていません。ビジネスで安定的にAIを利用するためには、有料版の活用やリソース状況の継続的な確認が不可欠です。

2025年AI総括:GPT-5実用化と中国・小型モデルの台頭

OpenAIの進化と実用化加速

GPT-5と5.1が始動、ZenDeskで解決率9割事例も
Sora 2やブラウザAtlas、OSSモデルも全方位展開
コーディング特化モデルで長時間タスクが可能に

中国勢と多様なモデルの台頭

DeepSeekQwen3など中国OSSが世界を席巻
Google Gemma 3など超小型モデルが実用段階へ
Gemini 3やClaude Opus 4.5で競争激化

2025年11月、米VentureBeatは今年のAI業界を振り返る総括記事を公開しました。2025年は、特定の最強モデル一強ではなく、オープンソースや中国勢、エッジ向け小型モデルを含めた「エコシステムの多様化」が決定的となった年です。経営者エンジニアにとって、用途に応じて最適なAIを選択できる環境が整ったことが、今年最大の収穫と言えるでしょう。

OpenAIは待望のGPT-5およびGPT-5.1をリリースし、市場を牽引し続けました。初期の反応は賛否両論ありましたが、改良を経てZenDeskなどの企業導入が進み、顧客対応の自動解決率が80〜90%に達する事例も報告されています。さらに、動画生成AI「Sora 2」やブラウザ統合型「Atlas」、そして意外にもオープンウェイトモデルの公開など、全方位での攻勢を強めています。

特筆すべきは中国発のオープンソースモデルの躍進です。DeepSeek-R1やAlibabaのQwen3シリーズなどが、推論能力やコーディング性能で米国のフロンティアモデルに肉薄しています。MITなどの調査によれば、中国製モデルのダウンロード数は米国をわずかに上回る勢いを見せており、コストパフォーマンスを重視する企業にとって無視できない選択肢となりました。

「巨大化」へのカウンターとして、小型・ローカルモデルの実用性も飛躍的に向上しました。GoogleGemma 3やLiquid AIのLFM2は、パラメータ数を抑えつつ特定タスクに特化し、エッジデバイスやプライバシー重視の環境での利用を可能にしました。すべての処理を巨大クラウドAIに依存しない、分散型のAI活用が現実味を帯びています。

画像生成や競合他社の動きも活発です。MetaMidjourneyの技術ライセンスを取得し、自社SNSへの統合を進めるという驚きの戦略に出ました。一方、GoogleGemini 3に加え、ビジネス図解に強い画像生成モデル「Nano Banana Pro」を投入しています。AnthropicClaude Opus 4.5やBlack Forest LabsのFlux.2など、各領域でハイレベルな競争が続いています。

Google動画生成Flow 画像モデル刷新と編集機能を追加

プロ級の画像生成と編集

新モデルNano Banana Pro搭載
被写界深度や照明を精密に制御
複数画像をブレンドし詳細保持

直感的操作と動画調整

手書きによる指示入力を実現
動画内のオブジェクト追加・削除
生成後のカメラワーク再調整

Google Labsは、動画生成ツール「Flow」に新画像モデル「Nano Banana Pro」を含む4つの主要な編集機能を追加しました。5月の公開以来、生成された動画は5億本を超えており、今回の更新でクリエイターが求めるより精密な制御と表現力を提供します。

特筆すべきは、有料購読者が利用可能な最新の画像モデル「Nano Banana Pro」です。被写界深度、照明、カラーグレーディングといったプロフェッショナルレベルの調整が可能になり、静止画のクオリティを劇的に向上させます。

「Images」タブでは、プロンプトだけでキャラクターの衣装やポーズ、カメラアングルを変更可能です。複数の参照画像をブレンドして、重要な詳細を維持しながら理想のフレームを作り込む機能も備えています。

言語化が難しい指示も直感的に行えます。画像に直接手書き(ドゥードゥル)を加えることでAIが意図を理解し、テキストプロンプトを練り上げる時間を削減します。

動画の一部だけを修正する機能も強化されました。他の要素を変えずにオブジェクトの追加が可能になり、不要な要素の削除機能も来月から実験的に導入されます。

生成後の動画に対しても、カメラの位置や軌道を調整する「再撮影」機能を追加しました。一から生成し直すことなく、異なる視点や動きを試行錯誤できるようになり、制作効率が高まります。

GoogleがGemini 3発表も画像生成の安全性に重大な懸念

Gemini 3とエージェント機能

推論力とコーディング機能が大幅向上
雑務を自律処理するGemini Agent
話速やトーン調整可能なGemini Live

クリエイティブ機能とリスク

画像合成・図表作成のNano Banana Pro
詳細制御が可能な動画生成Veo 3.1
生成画像安全ガードレールに欠陥

Googleは11月21日、推論能力を強化した最新AIモデル「Gemini 3」や、高機能な画像生成ツール「Nano Banana Pro」を発表しました。生産性を高める新機能が多数追加された一方で、画像生成における安全対策の不備が指摘されており、ビジネス利用にはコンプライアンス面での注意が必要です。

Gemini 3では「Vibe Coding」と呼ばれるコーディング支援機能が飛躍的に向上したほか、カレンダー管理や手配業務を代行するGemini Agentが登場しました。音声対話機能Gemini Liveも進化し、話す速度やトーンの指示、特定のキャラクターになりきった対話が可能になるなど、ユーザー体験が洗練されています。

クリエイティブ領域では、新ツール「Nano Banana Pro」が画像のブレンドやポスター作成を容易にし、動画生成モデル「Veo 3.1」はキャラクターやスタイルの一貫性を保つ機能が強化されました。しかし米The Vergeの検証によると、Nano Banana Proでは歴史的な陰謀論や著作権侵害を含む画像が容易に生成可能であり、偽情報拡散のリスクが懸念されています。

生成AI動画の「粗製乱造」が露呈する創造性の欠如と持続性の課題

ノスタルジーと低俗な模倣の氾濫

80年代を美化したAI動画がSNSで急増
歴史的背景を無視した歪んだ理想郷の描写
著名人のディープフェイクによる低俗な笑い

「創造性の民主化」という幻想

OpenAI等は技術による芸術革新を主張
実際は既存のアーキタイプの反復に終始
モノカルチャーへの回帰と多様性の欠如

バズの裏にある持続性の欠如

再生数は稼ぐが文化的価値は希薄
技術宣伝のための一過性のトレンド

動画生成AI「Sora」などの普及により、SNS上では「AI製ノスタルジー動画」や著名人のフェイク映像が氾濫しています。米テックメディアThe Vergeは、これらを「スロップ(粗悪品)」と呼び、その創造性と持続可能性に強い疑問を呈しています。

多くの動画は、80年代の理想化された風景や、故人がありえない行動をとる様子を描写しています。しかし、これらは歴史的文脈を無視した白人中心のファンタジーや、差別的な表現を含む低俗なコメディに過ぎず、質の低さが深刻化しています。

テック企業は「創造性の民主化」を謳いますが、実態は過去のモノカルチャーへの安易な依存です。ユーザーは「警察に捕まる有名人」といった陳腐なパターンを反復するよう促されており、真に独創的な表現が生まれているとは言い難い状況です。

膨大な再生数は技術への注目を集めますが、それは一時的な「バズ」に過ぎません。AIが生み出すコンテンツが単なる消費材としての「スロップ」を超え、記憶に残る文化的価値を提供できるか、ビジネスにおける活用の真価が問われています。

OpenCV創設者が挑む、最大5分の長尺AI動画生成

既存モデルを凌駕する技術革新

OpenCV創設者がCraftStoryを設立
競合を圧倒する最大5分間動画生成
並列拡散技術で一貫性を維持
独自撮影の高品質データで学習

企業向け市場に特化した戦略

企業研修やデモなどB2B需要に特化
200万ドル調達、効率的開発を志向
汎用型ではなく特定用途で勝負

世界的な画像処理ライブラリ「OpenCV」の創設者らが、AI動画スタートアップ「CraftStory」を立ち上げました。OpenAIGoogleのモデルが数十秒にとどまる中、同社は最大5分間の高品質な動画生成を実現し、企業の研修や製品デモといった実用的なニーズに応えます。

従来のAI動画生成が時間を追って順次処理するのに対し、CraftStoryは動画全体を並列処理する独自アーキテクチャを採用しています。後半の映像が前半に影響を与える双方向の制約を持たせることで、長時間の映像でも崩れず、一貫性のある滑らかな動画を作り出します。

学習データにはネット上の収集画像ではなく、スタジオで独自に撮影した高品質な映像を使用しています。高フレームレートで細部まで鮮明なデータを使うことで、少ないデータ量でも高い品質を実現し、膨大な計算リソースを必要とする競合との差別化を図りました。

巨額の資金調達競争が続くAI業界において、同社は200万ドルという小規模な資金で効率的な開発を進めています。汎用モデルを目指す大手とは異なり、人間中心の長尺動画という特定のニッチ市場に深く切り込むことで、B2B領域での確実な勝機を見出しています。

Poeが複数AIモデル併用のグループチャット機能を開始

200以上のモデルを集約

最大200人のユーザーが参加可能
200種以上のAIを利用可能
GPT-5.1など最新モデルに対応

チームでの創造的活用

複数AIと同時コラボが可能
画像動画生成もチャット内で完結
デバイス間で履歴を即時同期

コラボレーションの新潮流

OpenAIも類似機能を試験運用中
1対1から協働空間へ進化
独自ボットの作成・共有も可能

Quoraが運営するAIプラットフォーム「Poe」は18日、複数のAIモデルを併用できるグループチャット機能を開始しました。最大200人のメンバーと共に、200種類以上のAIモデルを一つの会話内でシームレスに活用できる画期的な機能です。

特筆すべきはモデルの多様さです。最新のGPT-5.1Claude 4.5 Sonnet動画生成Sora 2 Proなど、目的に応じて最適なモデルを使い分けられます。これにより、単なる対話を超えたマルチモーダルな協働作業が可能になります。

この動きは、AIチャットボットが「個人の助手」から「チームの協力者」へと進化する流れを象徴しています。OpenAIも試験運用を始めており、今後はAIを交えた多人数での共創がビジネスや日常の標準的なスタイルになっていくでしょう。

活用例として、チームでのブレインストーミングが挙げられます。検索に強いAIで情報を集め、画像生成AIで資料を作るなどの連携が可能です。独自のボットを作成・共有することで、未知のユースケースが生まれることも期待されています。

Google、NYを生成AI美術館に 市民の夢描く

市民のアイデアをAIで映像化

NY市民の「もしも」の空想を募集
地元アーティストがアイデアを選定
Google動画生成AI`Veo`を活用
地下鉄駅のスクリーンで作品を展示

テクノロジーとアートの融合

NY市全5区からアーティスト選出
交通網が巨大な動くギャラリーに
広告大手OUTFRONTとの共同企画
12月に`タイムズスクエア`でフィナーレ

Googleは2025年11月14日、ニューヨーク市で市民参加型の生成AIアートプロジェクト「Imagine If…」を開始しました。これは、市民から寄せられた「もしもニューヨークが…」という空想を、地元のアーティストがGoogleの最新AIモデルを使って映像化し、市内の交通機関にあるデジタルスクリーンで展示するものです。テクノロジーとアートを融合させ、都市全体の創造性を刺激する新たな試みとして注目されます。

プロジェクトへの参加方法はシンプルです。市民は地下鉄駅などに設置されたスクリーンのQRコードをスキャンし、自身のアイデアを投稿します。投稿されたアイデアの中から、ニューヨーク市全5区を代表する5人のアーティストがインスピレーション源となるものを選び、動画生成AI「Veo」などを用いて、ユニークな映像アート作品を制作します。

制作されたアート作品は、11月から4週間にわたり、ニューヨーク市交通局(MTA)の地下鉄駅など、数千に及ぶデジタルスクリーンで公開されます。これにより、日常の通勤・通学路が、市民の想像力が生んだアートを鑑賞できる「動くギャラリー」へと変貌します。プロジェクトの集大成として、12月14日にはタイムズスクエアでフィナーレが開催され、選りすぐりの作品が象徴的な巨大スクリーンに映し出される予定です。

この取り組みは、単なるアートイベントにとどまりません。一般市民が`生成AI技術に触れる機会`を創出し、その可能性と楽しさを伝えるショーケースとしての役割を担っています。また、企業が地域社会やアーティストと連携し、テクノロジーを活用して新たな文化的価値を共創する`先進的なモデルケース`であり、AI時代のブランディングや社会貢献活動のあり方について、多くの示唆を与えています。

マスク氏、AI生成動画で物議。著名作家と舌戦に

「愛」をテーマのAI動画

xAI動画生成AI Grok Imagine を使用
「愛してる」と話す女性の動画を投稿
ユーザーから「悲しい」などの批判が殺到

著名作家からの痛烈批判

作家オーツ氏がマスク氏を痛烈に批判
「教養がなく、文化に触れていない」と指摘
マスク氏は「嘘つきで意地悪」と反論

技術リーダーの発信と影響

AIの社会的・倫理的側面が浮き彫りに
開発者の発信が与える影響力の大きさ

テスラCEOのイーロン・マスク氏が週末、自身のSNSプラットフォームX上で、自社のAI「Grok Imagine」が生成した動画を公開し、大きな物議を醸しています。「愛」をテーマにしたこの投稿は、多くのユーザーから冷ややかな反応を招き、米国の著名作家ジョイス・キャロル・オーツ氏との激しい舌戦にも発展しました。

マスク氏が投稿したのは、「I will always love you(いつもあなたを愛している)」という合成音声と共に、雨の中で微笑む女性のアニメーション動画です。これに対し、ユーザーからは「史上最も離婚した投稿」「このサイトの歴史で最も悲しい投稿」といった辛辣なコメントが殺到。技術のデモンストレーション以上に、マスク氏個人の内面を映し出すものと受け止められたようです。

この騒動に、ピューリッツァー賞候補にもなった作家のオーツ氏が言及。同氏は、マスク氏の投稿には友人、自然、ペット、芸術といった人間的な温かみが欠けていると指摘し、「彼は完全に無教養で、文化に触れていないようだ」と痛烈に批判しました。技術界の寵児に向けられた、手厳しい意見です。

オーツ氏の批判に対し、マスク氏はX上で「彼女は嘘つきで、意地悪であることを楽しんでいる。良い人間ではない」と直接反論しました。これにより、AI生成物を巡る議論は、著名人同士の個人的な非難の応酬へと発展する異例の事態となりました。

今回の一件は、AI技術が社会に与える影響の大きさと、その開発を主導するリーダーの発信がいかに重要かを浮き彫りにしました。生成AIがますます身近になる中、その技術的な性能だけでなく、倫理的・社会的な文脈をどう捉え、伝えていくべきか。全てのビジネスリーダーにとって、大きな教訓と言えるでしょう。

OpenAIのSora、Android版初日で50万DL迫る

驚異的な初速

初日に約47万DLを記録
iOS版の4倍以上の規模
米国でのDL数は約30万件
日本などアジアでも提供開始

iOS版との比較

iOS版は招待制で開始
Android版は招待制を撤廃
iOS版は米国とカナダのみ
提供条件の違いが背景に

OpenAIは2025年11月5日、動画生成AIアプリ「Sora」のAndroid版をGoogle Playストアで公開し、リリース初日に推定47万ダウンロードを記録しました。これは先行して公開されたiOS版の初日ダウンロード数の4倍以上に相当する規模です。招待制を廃止し、日本を含む複数市場で同時に提供を開始したことで、AIによる動画生成への高い関心があらためて示されました。

この数値は、アプリ情報会社Appfiguresによる最新の推計です。総ダウンロード数47万のうち、最大の市場である米国が約29万6000件を占めています。Android版は米国、カナダに加え、日本韓国、台湾、タイ、ベトナムでも利用可能となっており、幅広い地域で関心を集めていることがうかがえます。

Android版の初速は、iOS版を大きく上回ります。Appfiguresが修正したiOS版の初日ダウンロード数は約11万件で、Android版はこれを327%上回る結果となりました。ただし、両者のリリース条件は大きく異なるため、単純な比較はできないと専門家は指摘しています。

iOS版は当初、米国とカナダの2カ国限定、かつ招待制という形で提供が始まりました。一方、Android版は提供地域が拡大されたことに加え、10月末に招待制が撤廃されています。このアクセスのしやすさが、ダウンロード数を押し上げる大きな要因になったと考えられます。

先行したiOS版も、リリース後1週間で100万インストールを突破し、米国App Store総合ランキング1位を獲得するなど、大きな話題を呼びました。現在もランキング上位を維持しており、Soraがモバイルアプリ市場で確固たる地位を築きつつあることを示しています。

Soraは、ユーザーがテキストプロンプト(指示文)を入力するだけで、高品質な動画を生成できるAIアプリです。自分や友人をAIアニメーション化する「Cameos」機能も搭載しており、TikTokのような縦型フィードで他のユーザーの作品を閲覧することもできます。

MetaのAI動画フィードVibes、欧州に上陸

AI動画の新潮流

AI動画専用フィード「Vibes」
TikTokやReelsのAI版
プロンプトやリミックスで動画生成
友人との共同制作を奨励

市場の反応と課題

米国ローンチから6週間で展開
OpenAIの「Sora」と競合
低品質AIコンテンツ氾濫の懸念
Metaの過去の方針との矛盾

Metaは11月6日、AIが生成する短尺動画フィード「Vibes」を欧州で提供開始しました。米国でのローンチからわずか6週間後の迅速な展開で、急成長するAIコンテンツ市場での主導権を狙います。ユーザーは「Meta AI」アプリ内で、TikTokやReelsのようにAIが作成した動画を視聴・共有できます。

Vibesの最大の特徴は、誰もがAIコンテンツの制作者になれる点です。ユーザーはテキストプロンプトで一から動画を生成したり、他者の動画をリミックスして新たな作品を生み出したりできます。Metaはこれを「社会的で協力的な創作体験」と位置づけ、InstagramFacebookへの共有も促します。

この動きは、米国でのVibesローンチ直後にOpenAI動画生成・共有プラットフォーム「Sora」を発表したことと無関係ではないでしょう。大手テック企業による生成AI動画プラットフォーム競争が本格化し、市場は新たな局面を迎えています。

しかし、ユーザーの反応は必ずしも好意的ではありません。CEOの発表には「誰も望んでいない」「AIスロップ(低品質なAIコンテンツ)だ」といった否定的なコメントが相次ぎました。斬新なサービスへの期待と、コンテンツの質の低下を懸念する声が交錯しています。

Vibesの推進は、Metaが以前掲げた「非独創的なコンテンツへの対策」という方針と矛盾するとの指摘もあります。YouTubeなどが低品質なAIコンテンツの氾濫に警鐘を鳴らす中、Metaの戦略はコンテンツの質と量のバランスという大きな課題を突きつけられています。

批判的な見方がある一方、Metaは「Meta AI」アプリ内でのメディア生成がローンチ以来10倍以上に増加したと発表しており、AI生成コンテンツの普及に強い自信を見せています。この積極的な投資が、新たなユーザー体験の創出につながるか、その真価が問われます。

OpenAIの動画AI「Sora」、Android版を提供開始

Android版の提供概要

日米など7カ国で提供開始
iOS版は1週間で100万DL
TikTok風の動画フィード
本人登場のCameo機能を搭載

課題と今後の展開

著作権保護ポリシーの変更
キャラクターカメオ機能の拡充
基本的な動画編集ツールも実装予定

OpenAIは2025年11月4日、動画生成AIアプリ「Sora」のAndroid版を、日本米国、カナダなど7カ国で提供開始しました。9月に先行リリースされたiOS版は公開から1週間で100万ダウンロードを突破しており、Android市場への参入でユーザー基盤のさらなる拡大が期待されます。本アプリは、文章から動画を生成するだけでなく、SNS風のフィード機能も特徴です。

Android版の登場により、より多くのクリエイターがAI動画を手軽に制作・共有できるようになります。アプリの核となるのは、ユーザー自身の容姿を使って動画を生成できる「Cameo」機能です。iOS版と同様の機能がすべて搭載されており、TikTokのようなインターフェースで他のユーザーの作品を閲覧することもできます。

Soraの急成長は、動画共有プラットフォーム市場の競争を激化させる可能性があります。Meta社が「Vibes」と呼ばれるAI動画フィードを投入するなど、既存の巨大プラットフォームであるTikTokInstagramもAI機能の強化を迫られるでしょう。OpenAIの参入は、ショート動画市場の勢力図を塗り替える一因となるかもしれません。

一方で、Soraディープフェイク著作権の問題にも直面しています。過去には歴史上の人物の不適切な動画が問題となり、同社は生成に関するガードレールを強化しました。また、著作権で保護されたキャラクターの無断使用への批判を受け、権利者が利用を許諾する「オプトイン」方式へポリシーを変更する対応を取りました。

OpenAIは今後もSoraの機能拡充を続ける方針です。ペットや無生物を使った「キャラクターカメオ」機能や、複数の動画を繋ぎ合わせる基本的な編集ツールの追加を計画しています。ユーザーが自身のフィードをより細かく管理できるカスタマイズ機能も実装予定で、クリエイターにとって魅力的なプラットフォームを目指しています。

生成AI商用利用に逆風 品質と著作権で課題噴出

低品質なAI広告の波紋

コカ・コーラがAI広告を再度公開
不自然な動きでブランド価値を毀損
制作期間は1年から1ヶ月に短縮
コスト削減と引き換えに品質が犠牲

著作権侵害への強い懸念

日本の権利者団体がOpenAIに抗議
ジブリ等の著作物無断学習を指摘
日本の法では事前許諾が原則
AIのオプトアウト方式は不十分

大手飲料メーカーのコカ・コーラが公開した生成AI広告が低品質だと批判を浴びる一方、日本のスタジオジブリなど知的財産(IP)ホルダーがOpenAIに著作物の無断学習停止を要求しました。生成AIの商用利用が急速に進む中、品質管理著作権侵害という二つの大きな課題が浮き彫りになっています。企業はAI活用のメリットとリスクを慎重に天秤にかける必要に迫られています。

日本コンテンツ海外流通促進機構(CODA)は、スタジオジブリやバンダイナムコなどを代表し、OpenAIに対して著作物を無断でAIのトレーニングに使用しないよう公式に要請しました。動画生成AISora 2」が、日本の著名なキャラクターを含むコンテンツを生成したことが直接の引き金となった形です。

CODAは、日本著作権法では原則として著作物利用に事前の許諾が必要だと指摘します。AI開発企業が採用する、後から利用停止を申し出る「オプトアウト」方式では不十分であり、機械学習プロセス自体が著作権侵害にあたる可能性があると主張。これはAI開発の根幹に関わる重要な問題提起と言えるでしょう。

その一方で、コカ・コーラは昨年に続き生成AIを活用したホリデー広告キャンペーンを展開。しかし、キャラクターの動きが不自然で安っぽいと厳しい批判が寄せられています。昨年の広告でも同様の問題が指摘されており、技術的な課題が未解決のまま商用利用が進んでいる実態がうかがえます。

同社がAI利用に踏み切る背景には、圧倒的なコスト削減と制作期間の短縮があります。従来1年がかりだったプロジェクトが約1ヶ月で完了するといいます。しかし、その効率化の裏で品質が犠牲になり、長年培ってきたブランドイメージを損なうリスクもはらんでいるのです。

これらの事例は、AI導入を目指す経営者やリーダーに重要な問いを投げかけます。生産性向上の魅力は大きいものの、法的リスクブランド毀損リスクをどう管理するのか。技術の進化だけでなく、法整備や社会的合意形成の動向も注視し、慎重な戦略を立てることがこれまで以上に求められます。

Metaの巨額AI投資、収益化の道筋に懸念

ウォール街の厳しい視線

決算発表後に株価が12%急落
時価総額2000億ドル超が消失
AIへの巨額投資募る不信感

ザッカーバーグ氏の弁明

将来の巨大な機会だと強調
研究開発の加速が必要と説明
具体的な収益予測は示されず

収益化製品の不在

OpenAIとの明確な事業格差
既存AIは実験段階の域を出ず

Meta社が、AI分野への巨額投資に対する明確な収益化計画を示せなかったことで、投資家の厳しい視線にさらされています。同社の四半期決算発表後、AI戦略の不透明さを理由に株価は急落し、ウォール街の懸念が浮き彫りになりました。

MetaのAI関連支出は急増しています。営業費用は前年比で70億ドル増加し、設備投資も200億ドルに迫る規模です。これはAI人材とインフラへの集中的な投資の結果ですが、まだ意味のある収益には繋がっていません。

マーク・ザッカーバーグCEOは、この投資を「巨大な潜在的機会」を掴むためのものと説明。「最先端のモデルを構築するため、投資を加速するのが正しい」と述べ、長期的な視点を強調しましたが、投資家の不安を払拭するには至りませんでした。

市場の反応は明確でした。決算説明会の後、Metaの株価は12%も下落し、時価総額にして2000億ドル以上を失いました。これはAI戦略の不透明さに対する、ウォール街からの厳しい評価と言えるでしょう。

なぜMeta投資だけが問題視されるのでしょうか。例えばOpenAIも巨額を投じていますが、そこには急成長する消費者向けサービスと年間200億ドル規模の収益という明確な成果があります。Metaにはこれに匹敵するAI製品がありません。

MetaのAIアシスタント動画生成機能は、まだ実験的な段階に留まっています。ザッカーバーグ氏が次にどのような製品を打ち出すのか。明確な収益化への道筋を早急に示すことができなければ、市場からの圧力はさらに高まるでしょう。

Sora、無料枠超過分の有料販売を開始

有料化の背景と価格

無料モデルは「持続不可能」と判断
パワーユーザーの強い需要に対応
10回の追加生成で4ドル
App Store経由で購入可能

今後の収益化計画

将来的な無料生成枠の削減を示唆
クリエイター向け収益化策を検討
権利者への収益分配も視野に

動画生成AI「Sora」を開発するOpenAIは、無料の動画生成枠を使い切ったユーザー向けに、追加クレジットの有料販売を開始しました。Soraチームを率いるBill Peebles氏は、現在の無料提供モデルの経済性は「完全に持続不可能」であると指摘。パワーユーザーの旺盛な需要に応えつつ、事業の持続可能性を確保する狙いです。

追加クレジットは、AppleApp Storeを通じて購入できます。価格は10回の追加生成あたり4ドルに設定されています。ただし、生成する動画の長さや解像度によって消費クレジット数は変動します。購入したクレジットの有効期限は12ヶ月で、OpenAIコーディングプラットフォーム「Codex」でも利用可能です。

有料化に踏み切った背景には、膨大な計算コストがあります。Peebles氏は「パワーユーザーは現在の無料生成枠に満足していないことは明らかだ」と述べ、有料で必要なだけ生成できる選択肢を提供する必要性を強調しました。これにより、ユーザーは制限を気にすることなく創作活動に打ち込めるようになります。

さらに同氏は、将来的には無料の生成枠を削減する必要があるとも警告しています。「成長に対応するため、いずれ無料生成数を引き下げる必要がある」と述べ、変更がある場合は事前に透明性を持って告知する方針です。現在の寛大な無料枠がいつまで続くか、動向が注目されます。

今回の動きは、Soraを中心としたAIクリエイターエコノミー構築に向けた、より広範な収益化戦略の一環です。OpenAIは近く、クリエイター向けの収益化プログラムを試験的に開始する予定であり、人気キャラクターなどの権利者が利用料を設定できる仕組みも構想しています。

動画生成AI「Sora」、キャラ再利用と連結の新機能

Sora、表現力を高める新機能

OpenAISoraを大幅更新
動画制作の自由度が向上

キャラクター再利用と動画連結

新機能『キャラ・カメオ』
人物やペットをAIアバター化
複数動画を連結し長編作成

クリエイターの創作を支援

人気動画・キャラのランキング
日米韓などで招待不要の利用も

OpenAIが2025年10月30日、動画生成AI「Sora」に複数の新機能を追加したことを発表しました。新機能の目玉は、人物やペット、イラストなどを再利用可能なアバターとして動画に登場させられる「キャラクター・カメオ」です。加えて、複数の動画クリップをつなぎ合わせる「動画連結」機能も導入され、より複雑で長尺の動画制作が可能になります。

「キャラクター・カメオ」は、Soraの既存機能を拡張したものです。ユーザーは自身のペットやイラスト、おもちゃなど、あらゆる対象をAIアバターとして登録できます。一度作成すれば、そのキャラクターを何度でも別の動画に登場させることができ、動画制作の効率と一貫性が大幅に向上します。クリエイターにとって強力なツールとなるでしょう。

作成したキャラクターには、個別の共有設定が可能です。「自分だけで使う」「相互フォロワーと共有する」「Soraの全ユーザーに公開する」といった選択肢があり、柔軟な権限管理ができます。また、各キャラクターに表示名やハンドルネームを付け、動画内でタグ付けすることで簡単に呼び出せるようになります。

今回のアップデートでは、複数の動画クリップを一つにまとめる「動画連結」機能も追加されました。これにより、複数のシーンから成るストーリー性のある長編動画の制作が容易になります。さらに、最もリミックスされた動画や、最も多く使われたキャラクターなどを表示する「リーダーボード」機能も導入され、ユーザー間の交流を促します。

OpenAIは新機能の普及を目指し、米国、カナダ、日本韓国のユーザーを対象に、期間限定で招待コードなしでのSoraへのサインアップを可能にしました。一方で、この「カメオ」という名称を巡り、セレブ動画プラットフォーム「Cameo」から商標権侵害で提訴されており、今後の動向が注目されます。

Google、インドでAI Pro無料提供 巨大市場で攻勢

巨大市場狙うGoogleの一手

通信大手リライアンス・ジオ提携
AI Proを18カ月無料提供
約400ドル相当のサービスをバンドル
若年層から全国の利用者へ順次拡大

激化するインドAI覇権争い

10億人超の世界第2位インターネット市場
PerplexityOpenAIも無料プランで追随
法人向けGemini Enterpriseも展開
巨大テック企業の次なる主戦場に

Googleは10月30日、インドの複合企業リライアンス・インダストリーズと戦略的提携を結び、傘下の通信大手ジオの5Gユーザー数百万人に、AIアシスタントの有料版「AI Pro」を18カ月間無料で提供すると発表しました。世界第2位のインターネット市場であるインドで、急成長するAI分野の主導権を握る狙いです。競合他社の参入も相次いでおり、市場獲得競争が激化しています。

今回の無料提供は、インドでの月額料金1,950ルピー(約22ドル)の「AI Pro」プランが対象です。これには、最新AIモデル「Gemini 2.5 Pro」へのアクセス、AIによる画像動画生成機能の利用上限緩和、研究・学習支援ツール「Notebook LM」、さらにGoogleフォトやGmailで使える2TBのクラウドストレージが含まれ、総額約400ドルに相当します。

提供はまず18歳から25歳の若年層を対象に開始し、その後、全国のジオ加入者へと順次拡大される予定です。10億人以上のインターネット利用者を抱えるインドは、巨大テック企業にとって、多様なデータを収集し、AIモデルを改良するための最重要市場と見なされています。今回の提携は、その攻略を加速させる明確な一手と言えるでしょう。

インドのAI市場では、すでに競争が始まっています。3カ月前には、AI検索エンジンのPerplexityが、リライアンスの競合である通信大手バーティ・エアテルと組み、同様の無料提供を開始しました。また、OpenAIも11月4日から、インド国内の全ユーザーにエントリープラン「ChatGPT Go」を1年間無料で提供すると発表しています。

今回の提携は個人向けに留まりません。リライアンスはGoogle Cloudと連携し、インド国内でのTPU(テンソル・プロセッシング・ユニット)へのアクセスを拡大します。さらに、リライアンスのAI子会社はGoogle Cloudの戦略的パートナーとなり、法人向けAI「Gemini Enterprise」の国内展開を共同で推進する計画です。

Googleのスンダー・ピチャイCEOは「インドの消費者、企業、開発者コミュニティに最先端のAIツールを届ける」と声明で述べました。無料提供によるユーザー基盤の拡大は、生成AIの普及を後押しする一方、無料期間終了後の収益化が今後の焦点となりそうです。巨大市場インドを舞台にしたAI覇権争いは、新たな局面を迎えています。

Figma、AI動画生成Weavy買収 デザイン機能強化へ

買収の概要

デザイン大手Figmaがイスラエル企業を買収
買収額は非公開、従業員20名が合流
ブランドFigma Weave」として統合予定

Weavyの強み

複数AIモデルで画像動画を生成
プロンプト微調整可能な高度編集機能
ノードベースで生成物を分岐・リミックス

今後の展望

当面はスタンドアロン製品として提供
Figmaのプラットフォームに順次統合

デザインプラットフォーム大手のFigmaは10月30日、AIによる画像動画生成を手がけるイスラエルのスタートアップWeavyを買収したと発表しました。Weavyの従業員20名がFigmaに合流し、同社の技術は新ブランドFigma Weave」として将来的にはFigmaのプラットフォームに統合されます。この買収により、FigmaデザインプロセスにおけるAI生成能力を大幅に強化する狙いです。

Weavyは2024年にテルアビブで設立された新興企業です。創業から1年足らずで、シードラウンドにて400万ドルを調達するなど注目を集めていました。同社のツールは、ユーザーが複数のAIモデルを組み合わせて高品質な画像動画を生成し、プロ向けの編集機能で細かく調整できる点が特徴です。

Weavyの技術的な強みは、その柔軟な生成プロセスにあります。ユーザーは無限キャンバス上で、画像生成動画生成プロンプトを組み合わせるなど自由な発想でメディアを作成できます。この「ノードベース」のアプローチにより、生成結果を分岐させたり、リミックスしたりと、創造的な試行錯誤と改良が容易になります。

Figmaによると、Weavyは当面スタンドアロン製品として提供が継続されます。その後、新ブランドFigma Weave」としてFigmaのプラットフォーム全体に統合される計画です。Figmaのディラン・フィールドCEOは、Weavyの「シンプルさ、親しみやすさ、そしてパワフルさのバランス」を高く評価しており、統合によるシナジーに期待を寄せています。

AIデザインツールの市場は競争が激化しています。AI検索Perplexityデザインツールチームを買収するなど、大手テック企業によるAIクリエイティブ領域への投資が活発化しています。今回の買収は、デザインワークフローのあらゆる段階にAIを組み込もうとするFigmaの強い意志を示すものであり、今後の業界の動向を占う上で重要な一歩と言えるでしょう。

Google、AIで米国の歴史遺産を映像化

AIで歴史を映像化

動画生成AI「VEO」を活用
過去の風景を没入型映像で再現
Geminiによる学習機能も提供

ルート66デジタルアーカイブ

2026年の100周年を記念
4000点以上の画像や資料を収録
23の文化団体との大規模連携
Google Arts & Cultureで公開

Googleは2025年10月29日、「Google Arts & Culture」上で米国の歴史的国道「ルート66」のデジタルアーカイブを公開しました。2026年に迎える100周年を記念するもので、歴史保存団体など23組織と連携。AI技術を駆使し、この象徴的な道路の歴史と文化を新たな形で伝えます。

プロジェクトの中核となるのが、Google動画生成AI「VEO」を活用した「Route 66 Rewind」です。この実験的機能は、過去の象徴的な場所がどのような姿だったかを映像で再現。現代のストリートビュー画像と比較しながら、没入感のある歴史体験を提供します。

このデジタルアーカイブ「A Cultural Trip Down Route 66」は、130以上の物語と4000点を超える画像・資料を収録。象徴的なランドマークだけでなく、沿道の多様なコミュニティやスモールビジネスにも光を当て、その文化的価値を浮き彫りにしています。

「マザー・ロード」の愛称で知られるルート66は、シカゴからサンタモニカまで約3,940kmを結ぶ米国の伝説的な道です。自動車文化や西部への移住を象徴し、歌や映画の題材にもなってきました。本プロジェクトは、この生きた歴史のシンボルを後世に伝える試みです。

AIとデジタルアーカイブを組み合わせることで、文化遺産の保存と活用に新たな可能性が示されました。テクノロジーがどのように歴史に命を吹き込み、新たな価値を創造できるかを示す好例と言えるでしょう。ビジネスリーダーや開発者にとっても示唆に富む取り組みです。

動画AI「Sora」に待った、Cameoが商標侵害でOpenAI提訴

提訴の概要

OpenAISora'cameo'機能を搭載
Cameo社が商標権侵害を主張し提訴
ブランド価値の希釈化・毀損を懸念
消費者の混乱を招くリスクを指摘

両社の主張と今後

Cameo「意図的な名称使用だ」
OpenAI「'cameo'は一般名詞」
Cameoは名称使用の差し止めを要求
OpenAIは法廷で争う姿勢

パーソナライズド動画メッセージサービスを手がける米Cameoは28日、AI開発大手のOpenAIを商標権侵害でカリフォルニア州の連邦裁判所に提訴しました。動画生成AI「Sora」の新機能「cameo」が自社のサービス名と酷似し、消費者の混乱を招くと主張。機能名の使用差し止めと損害賠償を求めています。

Cameo社は訴状で、OpenAIが「cameo」という名称を意図的に選択し、同社が築き上げたブランドの評判に便乗しようとしていると非難。このままでは、自社ブランドが「粗悪なAIスロップディープフェイク」といった否定的なイメージと結びつけられ、価値が毀損されると強い懸念を示しています。

Cameo社のスティーブン・ガラニスCEOは声明で、「OpenAI側と友好的に問題解決を試みたが、彼らは『Cameo』の名称使用中止を拒否した」と説明。ブランドと顧客を守るため、やむを得ず提訴以外の選択肢はなかったと経緯を明らかにしました。

一方、OpenAIの広報担当者は「訴状は精査中」としながらも、「『cameo』という単語の独占的所有権を誰も主張することはできない」と反論。Cameo社の主張には同意しないとし、法廷で自社の正当性を主張する構えを見せています。今後の司法判断が注目されます。

Cameoは2017年設立の著名人動画サービスで人気を博しています。対するOpenAISoraは、ユーザーが自身のディープフェイクアバターを作成し、他者が動画に登場させられる「cameo」機能を9月末に発表。利便性の裏で、同意なきディープフェイク生成の問題も指摘されていました。

Cameo、OpenAIを提訴。動画AI「Sora」の機能名巡り

訴訟の概要

Cameo社がOpenAI商標権侵害で提訴
動画AI「Sora」の機能名「cameo」が原因
ブランド価値の希釈化・毀損を主張

両社の主張

Cameo「意図的な名称で消費者が混乱
OpenAI「『cameo』は独占できる単語ではない
Cameoは名称使用差止と損害賠償を要求

著名人からのパーソナライズ動画サービスを手がける米Cameo社は10月29日、米OpenAIを商標権侵害でカリフォルニア州の連邦裁判所に提訴しました。動画生成AI「Sora」に搭載された「cameo」機能が自社のサービス名と酷似し、消費者の混乱を招きブランド価値を毀損する恐れがあると主張。同機能の名称使用差し止めなどを求めています。

訴状でCameo社は、OpenAIが意図的に「cameo」という名称を選んだと指摘。これにより、自社ブランドが「粗悪なAI生成物やディープフェイク」と関連付けられ、長年築き上げてきた評判が傷つけられるリスクを懸念しています。消費者が両者を混同し、ブランド価値が希釈化・毀損されることを強く警戒しているのです。

2017年に始まったCameoは、著名人に有料でビデオメッセージを依頼できるサービスです。一方、OpenAIが9月末に発表したSoraの「cameo」機能は、ユーザーが自身のディープフェイクアバターを作成し、他のユーザーが動画内で使用できるというもの。両者は全く異なるサービスですが、名称の類似性が問題となっています。

Cameo社のスティーブン・ガラニスCEOは「友好的な解決を試みたが、OpenAIが名称使用の中止を拒否した」と提訴の経緯を説明。対するOpenAIの広報担当者は「『cameo』という言葉の独占的所有権を誰も主張できない」と述べ、法廷で争う姿勢を示しており、両者の主張は真っ向から対立しています。

今回の訴訟は、急速に普及する生成AI技術が、既存のビジネスモデルやブランド価値といかにして衝突しうるかを示す象徴的な事例と言えるでしょう。裁判所の判断は、今後のAI関連サービスにおける商標戦略やネーミングに大きな影響を与える可能性があり、その行方が注目されます。

Adobe、画像・音声生成AIを全方位で強化

Fireflyが大幅進化

新モデルFirefly Image 5登場
プロンプトレイヤー編集が可能に
独自スタイルでカスタムモデル作成

AIアシスタント登場

PhotoshopとExpressに搭載
自然言語で複雑な編集を自動化
複数アプリを統括するMoonlight

音声・動画生成も強化

動画に合わせたBGMを自動生成
テキストから高品質なナレーション生成

アドビは2025年10月28日、年次カンファレンス「Adobe Max 2025」で、生成AI機能群の大幅なアップデートを発表しました。中核となる画像生成AI「Firefly」の新モデルや、Photoshopなどに搭載されるAIアシスタント、BGMやナレーションを自動生成する音声ツールを公開。クリエイティブ制作の生産性と表現力を飛躍的に高めることを目指します。

画像生成AIの最新版「Firefly Image 5」は、性能が大きく向上しました。ネイティブで最大4メガピクセルの高解像度画像に対応するほか、オブジェクトを個別に認識しプロンプトで編集できるレイヤー機能を搭載。クリエイター自身の作品を学習させ、独自の画風を持つカスタムモデルを作成することも可能になります。

「Photoshop」と「Express」には、新たにAIアシスタントが導入されます。これにより、ユーザーは「背景を削除して」といった自然言語の指示で、複雑な編集作業を自動化できます。専門的なツール操作を覚える必要がなくなり、あらゆるスキルレベルのユーザーが、より直感的にアイデアを形にできるようになるでしょう。

動画制作者にとって画期的な音声生成機能も追加されました。「Generate Soundtrack」はアップロードされた動画の内容を解析し、最適なBGMを自動生成します。「Generate Speech」はテキストから自然なナレーションを作成。これらは商用利用も可能で、コンテンツ制作の効率を劇的に改善します。

将来構想として、複数アプリを統括するAIエージェント「Project Moonlight」も発表。このAIはCreative CloudやSNSアカウントと連携し、ユーザーの作風やブランド戦略を学習。一貫性のあるコンテンツの企画から制作、投稿戦略の立案までを支援する、まさに「クリエイティブディレクター」のような役割を担います。

アドビは自社モデルだけでなく、GoogleGeminiなどサードパーティ製AIモデルの採用も進めています。今回の発表は、クリエイティブの全工程にAIを深く統合し、制作プロセスそのものを変革しようとする同社の強い意志を示すものです。クリエイター生産性向上と、新たな表現の可能性が大きく広がりそうです。

AI動画Sora、ディープフェイク検出標準の形骸化示す

検出標準C2PAの現状

OpenAIも推進する来歴証明技術
大手SNSが導入も表示は不十分
ユーザーによる確認は極めて困難
メタデータは容易に除去可能

求められる多層的対策

来歴証明と推論ベース検出の併用
プラットフォームの自主規制には限界
高まる法規制の必要性
OpenAI矛盾した立ち位置

OpenAI動画生成AI「Sora」は、驚くほどリアルな映像を作り出す一方、ディープフェイク検出技術の脆弱性を浮き彫りにしています。Soraが生成した動画には、その来歴を示すC2PA標準のメタデータが埋め込まれているにもかかわらず、主要SNSプラットフォーム上ではほとんど機能していません。この現状は、AI生成コンテンツがもたらす偽情報リスクへの対策が、技術の進化に追いついていないことを示唆しています。

C2PAは、アドビなどが主導しOpenAIも運営委員を務める、コンテンツの来歴を証明する業界標準です。しかしSoraで生成された動画がSNSに転載されても、その来歴情報はユーザーに明示されません。AI製か否かを見分けるのは極めて困難なのが実情です。

問題の根源は大手プラットフォーム側の対応にあります。MetaTikTokYouTubeなどはC2PAを導入済みですが、AI生成を示すラベルは非常に小さく、簡単に見逃せます。投稿者がメタデータを削除するケースも後を絶たず、制度が形骸化しているのです。

AIコンテンツの真偽を確かめる負担は、現状ではユーザー側にあります。ファイルを保存し検証サイトにアップロードする手間は非現実的です。「検出の責任はプラットフォーム側が負うべきだ」と専門家は指摘しており、一般ユーザーが偽情報から身を守ることは極めて難しい状況です。

解決策として、C2PAのような来歴証明と、AI特有の痕跡を見つける推論ベース技術の併用が提唱されています。メタデータが除去されやすい弱点を補うためです。しかし、いずれの技術も完璧ではなく、悪意ある利用者とのいたちごっこが続くのが現状です。

技術企業の自主規制には限界があり、米国では個人の肖像権などを保護する法整備の動きが活発化しています。強力なツールを提供しながら対策が不十分なOpenAIの姿勢は「偽善的」との批判も免れません。企業には、より積極的で実効性のある対策が社会から求められています。

AIによる肖像権侵害、法規制が本格化へ

AI肖像生成の無法地帯

AIによる有名人の偽動画が拡散
既存の著作権法では対応困難
連邦法がなく州ごとにバラバラな規制

米国で進む法規制の動き

NO FAKES Act法案が提出
テネシー州などで州法が先行
YouTube独自規約で対応

表現の自由との両立

表現の自由を侵害するリスク
パロディなど例外規定も議論の的

AIによる無許可の肖像生成、いわゆるディープフェイクが社会問題化する中、米国で個人の「顔」や「声」を守るための法整備が本格化しています。俳優組合などが後押しする連邦法案「NO FAKES Act」が提出され、技術の進化と個人の権利保護のバランスを巡る議論が加速。これは、AIを活用するすべての企業・個人にとって無視できない新たな法的フロンティアの幕開けです。

きっかけは、AIが生成した人気歌手の偽楽曲や、リアルな動画生成AI「Sora」の登場でした。これらは著作物の直接的な複製ではないため、既存の著作権法での対応は困難です。そこで、個人の顔や声を財産的価値として保護する「肖像権(Right of Publicity)」という法分野に、解決の糸口として注目が集まっています。

規制を求める動きは具体的です。米国では俳優組合(SAG-AFTRA)などの働きかけで、連邦レベルの「NO FAKES Act」法案が提出されました。これは、本人の許可なく作成されたデジタルレプリカの使用を制限するものです。エンタメ産業が盛んなカリフォルニア州やテネシー州では、同様の趣旨を持つ州法がすでに成立しています。

一方で、規制強化には慎重な意見も根強くあります。電子フロンティア財団(EFF)などは、この法案が表現の自由を過度に制約し、風刺や批評といった正当なコンテンツまで排除しかねないと警告。新たな「検閲インフラ」になりうるとの批判も出ており、権利保護と自由な表現の線引きが大きな課題となっています。

法整備を待たず、プラットフォームも対応を迫られています。YouTubeは、AIで生成された無許可の肖像コンテンツクリエイター自身が削除申請できるツールを導入しました。こうした企業の自主的なルール作りが、事実上の業界標準となる可能性も指摘されており、今後の動向が注目されます。

AI技術の進化は、法や社会規範が追いつかない領域を生み出しました。AIを事業で活用する経営者エンジニアは、肖像権という新たな法的リスクを常に意識し、倫理的な配慮を怠らない姿勢がこれまで以上に求められるでしょう。この問題は、技術開発のあり方そのものを問い直しています。

OpenAI、音楽生成AIを開発中 競合追撃へ

新ツールの概要

テキストや音声から音楽を生成
動画へのBGM追加などを想定
ボーカルにギター伴奏を追加

開発と競合状況

提供形態やリリース時期は未定
ジュリアード音楽院と協力か
先行するGoogleやSuno
市場競争の激化は必至

ChatGPTを開発したOpenAIが、テキストや音声から音楽を生成する新しいAIツールの開発に取り組んでいることが報じられました。動画のBGM作成や既存の楽曲への伴奏追加などを可能にするもので、生成AIの応用範囲を音楽分野へ本格的に拡大する動きとして注目されます。

このツールは、ユーザーが入力したテキストや既存の音声データをもとに、全く新しい音楽を創り出す能力を持つとみられています。例えば、制作した動画に合わせた雰囲気のBGMを自動で追加したり、録音したボーカルにギターの伴奏を付けたりといった活用法が想定されています。

現時点で、このツールがいつ、どのような形で提供されるかは明らかになっていません。独立した製品としてリリースされるのか、あるいは対話型AI「ChatGPT」や動画生成AI「Sora」に機能として統合されるのか、今後の発表が待たれます。

開発の興味深い点として、AIの訓練データに関する報道が挙げられます。一部の情報筋によると、OpenAIは名門ジュリアード音楽学生と協力し、楽譜の注釈付け作業を進めているとのことです。質の高いデータが、生成される音楽の品質を左右する鍵となりそうです。

OpenAIは過去にも音楽生成モデルを手がけていましたが、近年は音声合成などに注力していました。音楽生成AI市場では、すでにGoogleや新興企業のSunoなどが先行しておりOpenAIの参入は市場競争をさらに激化させる可能性があります。

AIも食欲に勝てず?Sora、チキンに首位譲る

AI王者の思わぬ失速

OpenAISora首位陥落
後釜はホットチキンチェーン
App Storeランキングでの珍事
リリース以来初の2位転落

勝利の秘訣は無料の食

ラッパーの誕生日記念企画
無料チキンでDL数が急増
1日で34万件の新規登録
人間の根源的欲求の強さ

OpenAI動画生成AIアプリ「Sora」が、米国iOS App Storeランキングで首位の座を明け渡しました。現地時間金曜、トップに立ったのはファストカジュアルチェーン「Dave's Hot Chicken」です。同社が実施した無料のチキンサンドイッチを提供するプロモーションが爆発的なダウンロード数を呼び込み、最先端AIアプリを一時的に上回るという異例の事態となりました。

Soraアプリは9月30日のリリース以来、簡単なAI動画生成機能で人気を博し、首位を独走。公開からわずか23日間で米国内ダウンロード数は320万件に達し、これはChatGPTさえも上回るペースでした。招待制にもかかわらず、その勢いは圧倒的と見られていました。

Dave's Hot Chickenの躍進の裏には巧みな戦略がありました。同社に出資するラッパー、ドレイク氏の誕生日を祝い、アプリ利用者にフリースライダーをプレゼント。「AIよりも無料の食べ物」という強力なインセンティブが、ユーザーの行動を強く後押ししたのです。

プロモーションの効果は絶大でした。キャンペーン当日だけで34万件以上の新規アカウントが作成され、これは顧客データベース全体の会員数を1日で10%以上も押し上げるほどのインパクトです。Soraを王座から引きずり下ろすには十分な勢いでした。

実は、無料の食事提供でダウンロード数を伸ばす手法は珍しくありません。過去にバーガーキングなども同様のプロモーションでランキング上位を獲得しています。人間の根源的な欲求に訴える古典的な手法は、デジタル時代でも依然として強力な武器なのです。

プロモーションが終了すればSoraは首位に返り咲くでしょう。しかしDave's Hot Chickenは多くの新規顧客情報を獲得し、長期的な成長に繋げられます。この一件は、AI企業も顧客の心を動かす普遍的なマーケティングの原理原則を見過ごしてはならない、という教訓を示唆しています。

グーグル、AIでハロウィン演出術。最新モデル活用法公開

画像・動画生成の最新AI

Nano Bananaで幽霊風の画像作成
90年代ホラー映画風ポスターを生成
ペットのコスチューム画像を自動生成
Veo 3.1で高品質なショート動画作成

アイデア創出からツール開発まで

Google Photosで写真をハロウィン風に加工
Mixboardでコスチューム案を視覚化
Canvasでカボチャ彫刻用アプリ開発

Googleは2025年10月24日、ハロウィンシーズンに向けて、同社の最新AIツール群を活用した画像動画の作成術を公式ブログで公開しました。画像生成モデル「Nano Banana」や動画生成モデル「Veo」などを使い、パーティーの招待状からSNSコンテンツまで手軽に作成する具体的なプロンプトを紹介しており、企業の季節イベント向けマーケティングのヒントとなりそうです。

中核となるのは画像生成モデルNano Bananaです。ユーザーは自身の写真と特定のプロンプトを組み合わせるだけで、ビクトリア朝時代の幽霊風ポートレートや90年代ホラー映画風のポスターなど、ユニークな画像を生成できます。精緻なプロンプトの記述方法も公開されており、プロンプトエンジニアリングの実践的な好例と言えるでしょう。

動画生成では、最新モデルVeo 3.1」が活躍します。プロンプトへの追従性が向上し、より物語性の高い動画作成が可能になりました。静止画を不気味なアニメーションに変換したり、テキストから秋の風景を描写したグリーティング動画を生成したりと、SNSマーケティングでの高い応用可能性を秘めています。

既存サービスへのAI統合も進んでいます。Google Photos」にはワンタップで写真をハロウィン風に加工する新機能が追加されました。また、アイデア出しツール「Mixboard」はコスチュームのブレインストーミングに、開発ツールCanvas」は画像からカボチャの彫刻用テンプレートアプリを作成するといった実用的な活用法も示されています。

今回の発表は、AIが専門家だけでなく一般ユーザーにも浸透し、創造性を手軽に引き出すツールとなっている現状を示しています。企業はこれらのAIツールを季節イベントのプロモーションや顧客エンゲージメント向上にどう活用できるか、具体的な検討を始める好機と言えるでしょう。

Google Gemini、動画・スライド・TVへ機能拡張

動画とプレゼン作成を自動化

リアルな動画を生成するVeo 3.1
効果音付きの対話動画も作成可能
トピック入力でプレゼン資料を自動生成

日常業務と家庭での活用

複雑な手順を段階的に解説
数式のコピーや編集が容易に
テレビ番組検索音声対話で支援
質問にYouTube動画で回答

Googleは2025年10月24日、AIアシスタントGemini」の月次アップデートを発表しました。今回の「October Gemini Drop」では、動画生成AI「Veo 3.1」や、プレゼンテーション資料を自動生成する「Canvas」機能が追加されました。さらにGoogle TVとの連携も実現し、クリエイティブ制作から家庭での利用まで、活用の幅を大きく広げます。生産性向上を目指すビジネスパーソンにとって注目の内容です。

中でも注目されるのが、動画生成AIの最新版Veo 3.1」です。実写に近いリアルな質感の映像を生成できるほか、カメラワークの制御もより簡単になりました。さらに、効果音付きの対話を含む動画の作成も可能となり、マーケティングやコンテンツ制作の現場で、時間とコストを大幅に削減する可能性を秘めています。

プレゼン資料作成の常識を覆すのが新機能Canvas」です。トピックや参考資料をアップロードするだけで、AIがテーマや関連画像を含むスライド一式を自動で生成します。完成した資料はGoogleスライドで微調整でき、企画書作成を劇的に効率化します。この機能はまずProユーザー向けに提供が開始されます。

Geminiの活用シーンは家庭にも広がります。Gemini for Google TV」により、視聴したい番組を対話形式で探せるようになります。さらに、一般的な質問に対して、関連するYouTube動画を提示しながら回答する機能も搭載。単なる検索アシスタントにとどまらない、新しいテレビ視聴体験を提供します。

このほか、複雑なトピックを段階的に解説する能力が向上したGemini 2.5 Flashのアップデートや、Web版での数式(LaTeX)の扱いやすさ向上など、専門的な作業を支援する改善も含まれています。今回のアップデートは、Geminiが多機能で実用的なAIアシスタントへと進化したことを示しています。

OpenAIのSora、ペットAI化や編集機能で進化へ

創作の幅を広げる新機能

ペットなどをAIキャラ化するカメオ機能
複数クリップを結合する動画編集ツール
厳しすぎるモデレーションの緩和
アプリ全体のパフォーマンス向上

利用者拡大と交流強化

待望のAndroidが近日公開
大学や企業ごとの専用チャンネル
友人との連携を深めるソーシャル体験
ローンチ1ヶ月で200万DL達成

OpenAIは23日、AI動画生成アプリ「Sora」の大型アップデートを発表しました。新機能には、ペットなどをAIキャラクター化する「カメオ」機能や基本的な動画編集ツール、ソーシャル機能の強化が含まれます。同社はまた、待望のAndroid版アプリも「近日中に公開」するとしており、ユーザー層のさらなる拡大を目指します。

アップデートの目玉は、ペットやお気に入りのぬいぐるみなどをAIキャラクターとして登録できる「カメオ」機能の拡張です。これまで人物に限定されていたこの機能が対象を広げることで、ユーザーはより創造的でパーソナルな動画を手軽に生成できるようになります。作成されたカメオは友人などと共有することも可能です。

新たに導入される動画編集ツールは、まず複数のクリップを繋ぎ合わせる基本的な機能から提供が始まります。OpenAIは今後、より高度な編集機能を順次追加していく方針です。ソーシャル体験も強化され、大学や企業といったコミュニティごとの専用チャンネル開設などが検討されています。

プラットフォームの拡大も大きな焦点です。現在、Google Playストアで事前登録を受け付けているAndroid版アプリの正式リリースが間近に迫っています。これにより、iPhoneユーザー以外にもSoraの利用機会が広がります。また、厳しすぎるとの批判があったコンテンツのモデレーション緩和や、アプリ全体のパフォーマンス改善も進められます。

Soraは9月下旬のローンチ以降、招待制であるにもかかわらず、米国とカナダのApp Storeでランキング1位を維持しています。アプリ調査会社によると、リリースから1ヶ月足らずでダウンロード数は約200万件に達しており、市場の強い関心を集めています。今回のアップデートは、この勢いをさらに加速させるものとなりそうです。

AI動画の奇妙さを人間が熱演、世界で大反響

AIの不気味さを人力で再現

ぎこちない動きと無表情の模倣
脈絡のないアイテムの突然の出現
AI特有の不自然な視線の再現
中国クリエイターによるパロディ動画

世界的な拡散と商業的成功

SNSで数百万回以上の再生を記録
中国の生成AI企業からスポンサー獲得

俳優業への期待とAIへの懸念

俳優としてAIに仕事を奪われる不安
高性能化でパロディが困難になる可能性

中国クリエイター、Tianran Mu氏(29)が、AI生成動画特有の不自然さを人間が演じるパロディ動画を制作し、世界的な注目を集めています。ぎこちない動きや不条理な展開を忠実に再現した動画は、SNSで数百万回以上再生され、AIの「奇妙さ」を逆手にとった表現が大きな反響を呼びました。この成功は、エンタメにおけるAIと人間の新たな関係性を示唆しています。

Mu氏の動画は、AIが生成しがちな「slop」(粗悪なコンテンツ)と呼ばれる映像の特徴を完璧に捉えています。喧嘩を始めそうな二人が突然ロボットのようなタンゴを踊り出し、どこからともなくワイングラスや麺の入った丼を取り出す。こうした予測不能な展開と、演者の虚ろな表情が、AIの不気味さを見事に表現しているのです。

この動画中国国内にとどまらず、X(旧Twitter)やTikTokなどを通じて世界中に拡散しました。Mu氏自身が海外SNSのアカウントを持っていなかったにもかかわらず、再投稿された動画は合計で1100万回以上再生されるなど、国境を越えたバイラルヒットを記録。彼は中国の生成AI企業から約1万1000ドルのスポンサー契約も獲得しました。

彼の演技の秘訣は、AI動画の徹底的な分析にあります。AIが物の文脈を誤解する様子や、登場人物の服装が突然変わるといった連続性の欠如を脚本に反映。特に「AIの視線はさまよう」という観察から、会話相手とは別の方向を見るなど、細部にまでこだわった「不自然な演技」を追求しました。

しかしMu氏自身は、この成功を手放しでは喜んでいません。俳優としてキャリアを築きたい彼にとって、AIは仕事を奪う脅威でもあります。スポンサー案件でAI生成映像と自身の演技を比較された際、企業側がAIを選んだことに「人間の俳優から仕事を奪い始めている」と複雑な心境を吐露しています。

OpenAIの「Sora」など、動画生成AIの性能は急速に向上しており、模倣すべき「欠点」を見つけること自体が難しくなっています。Mu氏は「来年にはもう模倣できるものがなくなるかもしれない」と語ります。AIと人間の創造性がせめぎ合う中で、エンターテインメントの未来はどこへ向かうのでしょうか。

Snapchat、画像生成AIレンズを米国で無料開放

プロンプトで画像生成

自由な指示で画像を生成・編集
自撮り写真をエイリアンなどに加工
ハロウィーンの仮装案にも活用
友人やストーリーで共有可能

競合追撃とユーザー拡大

MetaOpenAIなど競合の台頭
有料プラン限定から全ユーザーへ提供
まずは米国でサービス開始
カナダ、英国、豪州へも展開予定

Snapは10月22日、同社の人気アプリSnapchatにおいて、初の自由入力プロンプト型AI画像生成機能「Imagine Lens」を米国で無料公開しました。これまでは有料プラン限定でしたが、全ユーザーが利用可能になります。MetaOpenAIなど競合が高度なAIツールを投入する中、若者ユーザーの維持・獲得を狙う戦略的な一手とみられます。

この新機能を使えば、ユーザーは自撮り写真に「私をエイリアンにして」といったプロンプトを入力するだけで、ユニークな画像に加工できます。また、「不機嫌な猫」のように、全く新しい画像を生成することも可能です。作成した画像は友人とのチャットやストーリーで共有でき、ハロウィーンの仮装を試すといった実用的な使い方も提案されています。

今回の無料開放の背景には、SNS市場におけるAI開発競争の激化があります。Metaの「Meta AI」やOpenAI動画生成AI「Sora」など、競合他社がより高度なAI機能を次々と発表。若年層ユーザーの関心を引きつけるため、Snapも主力機能の一つであるAIレンズを無料化し、競争力を維持する投資に踏み切った形です。

これまで「Imagine Lens」は、有料プラン「Lens+」および「Snapchat Platinum」の加入者のみが利用できる限定機能でした。今回の拡大により、無料ユーザーも一定回数画像生成が可能になります。サービスはまず米国で開始され、今後カナダ、英国オーストラリアなど他の主要市場へも順次展開される計画です。

OpenAI、俳優の懸念受けSoraの肖像権保護を強化

問題の発端と俳優の懸念

人気俳優クランストン氏の動画が生成
俳優組合SAG-AFTRAが懸念を表明

OpenAIの対応策

肖像権保護のガードレール強化を約束
意図しない生成について遺憾の意を表明
違反報告への迅速なレビュー体制

今後の法整備への期待

俳優組合は法整備の必要性を強調
「NO FAKES Act」法案に言及

OpenAIは、同社の動画生成AI「Sora」で俳優ブライアン・クランストン氏らのディープフェイク動画が無許諾で作成された問題を受け、俳優組合SAG-AFTRAなどと共同声明を発表しました。同社は肖像権保護のガードレールを強化し、意図しない生成だったとして遺憾の意を表明。生成AIの急速な進化が、著名人の肖像権保護という新たな課題を浮き彫りにしています。

問題の発端は、俳優のブライアン・クランストン氏の動画が、本人の許諾なくSora上で公開されたことです。動画には、故マイケル・ジャクソン氏と自撮りをするなど、現実にはあり得ない内容も含まれていました。クランストン氏自身はSoraの利用に同意しておらず、この事態が俳優やクリエイター業界に大きな波紋を広げました。

クランストン氏や俳優組合からの懸念を受け、OpenAIは迅速に対応。共同声明で「意図しない生成」と遺憾の意を表明しました。具体的な技術的変更点は明らかにされていませんが、声や肖像の利用に関するオプトインポリシーガードレールを強化し、違反報告には迅速に対処すると約束しています。

この対応に対し、クランストン氏は「OpenAIの方針とガードレールの改善に感謝する」と肯定的な声明を出しました。一方で、俳優組合のショーン・アスティン会長は、個別の対応だけでは不十分だと指摘しています。「複製技術による大規模な権利の不正利用から表現者を守る法律が必要だ」と述べ、連邦レベルでの法整備の必要性を強く訴えました。

OpenAIは当初、Sora 2を著作権者が利用を拒否できる「オプトアウト」方式で提供しましたが、批判を受け方針転換した経緯があります。今回の件は、AI開発企業が倫理的・法的な課題とどう向き合うべきか、技術の進化に法整備が追いついていない現状を改めて示す事例と言えるでしょう。

Google広告、AI動画生成で新規顧客獲得を加速

AIによるクリエイティブ強化

AIによるYouTube動画の自動生成
商品フィード活用でCV20%増
仮想ストアフロントとして機能

入札戦略の高度化

新規顧客獲得目標を導入
新規顧客率11.5%向上、コスト3%削減
目標コンバージョン単価(tCPC)に対応
iOS向けディープリンク機能

Googleは2025年10月21日、広告キャンペーン「Demand Gen」の最新アップデートを発表しました。今回の更新では、YouTube広告向けのAIによる動画生成ツールや、新規顧客獲得に特化した入札目標が導入され、広告主のパフォーマンス向上と運用効率化を力強く支援します。

今回のアップデートで特に注目されるのが、AIを活用した動画生成機能です。広告主は視聴者体験に最適化されたYouTube動画を効率的に作成可能となり、リーチ拡大が期待できます。クリエイティブ制作の工数を削減しつつ、より効果的な広告展開を実現する強力なツールとなるでしょう。

入札戦略では「新規顧客の獲得」目標が新たに導入されました。既存顧客を除外し、新規ユーザーに的を絞ったアプローチが可能です。先行導入した広告主は、新規顧客の比率が平均11.5%向上し、獲得コストを3%削減するという高い成果を上げており、事業成長の加速に貢献します。

また、新たに「目標コンバージョン単価(tCPC)」での入札が可能になりました。これにより、他の広告プラットフォームと同一の設定でパフォーマンスを比較・最適化しやすくなります。データに基づいた横断的な広告運用の精度を高め、より戦略的な予算配分を実現するための重要なアップデートです。

Eコマース事業者向けの機能も強化されました。商品フィードを活用したキャンペーンはコンバージョンが平均20%増加する傾向にあります。さらに、iOSでディープリンクが利用可能になり、広告から自社アプリへユーザーを直接誘導できます。これにより、顧客体験を損なうことなく、コンバージョン率の向上が期待できます。

AI基盤Fal.ai、企業価値40億ドル超で大型調達

企業価値が爆発的に増大

企業価値は40億ドルを突破
わずか3ヶ月で評価額2.7倍
調達額は約2億5000万ドル
著名VCが大型出資を主導

マルチモーダルAI特化

600以上のメディア生成モデルを提供
開発者数は200万人を突破
AdobeCanvaなどが顧客
動画AIなど高まる需要が追い風

マルチモーダルAIのインフラを提供するスタートアップのFal.aiが、企業価値40億ドル(約6000億円)超で新たな資金調達ラウンドを完了しました。関係者によると、調達額は約2億5000万ドルに上ります。今回のラウンドはKleiner PerkinsSequoia Capitalという著名ベンチャーキャピタルが主導しており、AIインフラ市場の過熱ぶりを象徴しています。

驚くべきはその成長速度です。同社はわずか3ヶ月前に評価額15億ドルでシリーズCを終えたばかりでした。当時、売上高は9500万ドルを超え、プラットフォームを利用する開発者は200万人を突破。1年前の年間経常収益(ARR)1000万ドル、開発者数50万人から爆発的な成長を遂げています。

この急成長の背景には、マルチモーダルAIへの旺盛な需要があります。特に、OpenAIの「Sora」に代表される動画生成AIが消費者の間で絶大な人気を博していることが、Fal.aiのようなインフラ提供企業への追い風となっています。アプリケーションの需要が、それを支える基盤技術の価値を直接押し上げているのです。

Fal.aiは開発者向けに、画像動画音声、3Dなど600種類以上のAIモデルを提供しています。数千基のNVIDIA製H100およびH200 GPUを保有し、高速な推論処理に最適化されたクラウド基盤が強みです。API経由のアクセスやサーバーレスでの提供など、柔軟な利用形態も支持されています。

MicrosoftGoogleなど巨大IT企業もAIホスティングサービスを提供していますが、Fal.aiはメディアとマルチモーダルに特化している点が競争優位性です。顧客にはAdobeCanvaPerplexity、Shopifyといった大手企業が名を連ね、広告、Eコマース、ゲームなどのコンテンツ制作で広く活用されています。

同社は2021年、Coinbaseで機械学習を率いたBurkay Gur氏と、Amazon出身のGorkem Yurtseven氏によって共同設立されました。多くの技術者が大規模言語モデル(LLM)開発に走る中、彼らはマルチメディア生成の高速化と大規模化にいち早く着目し、今日の成功を収めました。

Meta AIアプリ急成長、動画機能「Vibes」が起爆剤か

驚異的なユーザー数の伸び

DAUが4週間で3.5倍の270万人に
1日のDL数が1.5倍の30万件へ増加
競合AIアプリは軒並みDAU減少

急成長を支える2つの要因

AI動画フィード'Vibes'の導入
OpenAI 'Sora'への関心の波及
Sora招待制が代替需要を喚起

市場調査会社Similarwebの最新データによると、MetaのAIアプリの利用が急拡大しています。2025年10月17日時点で、日次アクティブユーザー(DAU)は世界で270万人に達し、4週間前から約3.5倍に増加。この急成長の背景には、9月に導入されたAI動画生成フィード「Vibes」の存在が指摘されています。

ユーザー数の伸びは驚異的です。DAUはわずか4週間で約77万5000人から270万人へと急増しました。1日の新規ダウンロード数も、数週間前の20万件未満から30万件に増加。1年前の同日のダウンロード数がわずか4000件だったことを考えると、その成長の速さは明らかでしょう。

この急成長の最も有力な要因と見られているのが、9月25日に導入されたAIによる短編動画フィード「Vibes」です。Similarwebが公開したグラフでは、「Vibes」の導入時期とDAUの急増のタイミングが明確に一致しており、新機能がユーザーを強く惹きつけたと分析されています。

もう一つの可能性として、競合であるOpenAI動画生成AISora」への関心が波及したことも考えられます。Soraが大きな話題となる中、同様の機能を試したいユーザーが代替としてMeta AIに目を向けたという見方です。直接的な因果関係は証明されていませんが、市場全体の関心の高まりが追い風になった可能性があります。

さらに、Soraが現在招待制であることも、Meta AIの成長を後押ししたかもしれません。すぐに最新のAI動画生成を体験したいユーザーが、誰でも利用できるMeta AIに流れたという分析です。これは、OpenAIの限定的な公開戦略が、結果的にライバルのユーザー獲得に貢献したという興味深い側面を示唆しています。

注目すべきは、同期間にChatGPTGrokPerplexityといった他の主要AIアプリのDAUが軒並み減少した点です。Meta AIは15.58%増と独り勝ちの様相を呈しており、AI市場の競争軸がテキストから動画へとシフトしつつあることを象徴しています。

Google AI Studio、統合UIと新機能で開発を加速

開発ワークフローを統合

複数AIモデルを単一画面で操作
コンテキスト切替が不要に
プロンプトから動画音声まで連続作成
一貫性のあるチャットUIデザイン

利便性を高める新機能

デザインのウェルカムページ
使用量・制限をリアルタイム可視化
Googleマップとの連携機能
実世界の地理データを活用可能

Googleは2025年10月18日、開発者向けプラットフォーム「Google AI Studio」のメジャーアップデートを発表しました。今回の更新は、開発者のフィードバックに基づき、AIモデルを利用した開発体験をよりシームレスかつ効率的にすることを目的としています。複数のAIモデルを統合した操作画面や、Googleマップとの連携機能などが追加されました。

アップデートの核となるのが、新しくなった「Playground」です。これまで別々のタブで操作する必要があった、対話AI「Gemini」や動画生成AI「GenMedia」などのモデルを、単一の統合された画面で利用可能になりました。これにより、開発者はタブを切り替える手間なく、アイデアから画像動画音声ナレーションまでを一つの流れで作成できます。

利便性を高める改善も加えられました。新しいウェルカムホームページは、プラットフォームの全機能へのアクセスを容易にし、最新情報や進行中のプロジェクトを一覧表示します。また、新たに追加されたレート制限ページでは、APIの使用状況と上限をリアルタイムで確認でき、予期せぬ利用中断を防ぎながらアプリケーションの規模を管理できます。

特に注目されるのが、Googleマップとの連携機能「マップグラウンディング」です。この機能により、開発者現実世界の地理データや文脈をAIモデルに直接組み込むことが可能になります。これにより、位置情報に基づいた、より正確で創造的なアプリケーション開発が期待できるでしょう。

Googleは今回のアップデートを「より良い基盤を築くためのもの」と位置付けています。開発ワークフローの摩擦をなくし、開発者が本来の創造的な作業に集中できる環境を整えました。同社は来週、この基盤の上に構築される新たなAI活用アプリ開発手法を発表する予定であり、さらなる進化が期待されます。

AI動画Soraが揺るがすSNSの「真実」

Soraがもたらす光と影

創造性の爆発的な進化
偽情報拡散の深刻なリスク
デフォルトで疑う姿勢が必須に

ソーシャルメディアの変質

人間中心からビジョン中心へ
「本物らしさ」の価値の終焉
人工的な繋がりへの開発者の懸念

専門家がみる未来

既存SNSを代替せず共存
人間のリアルへの需要は残存

OpenAIが発表した動画生成AI「Sora」は、その圧倒的な創造性で注目を集める一方、SNSにおける「真実」の価値を根底から揺るがしています。誰でもプロンプト一つで精巧な動画を生成できるこの技術は、エンターテインメントに革命をもたらす可能性を秘める半面、偽情報の拡散や悪用のリスクを内包します。Soraの登場は、私たちがSNSに求めるもの、そして「ソーシャル」の意味そのものを問い直すきっかけとなるでしょう。

Soraの最大の特徴は、創造性の解放です。サム・アルトマンCEOが言うように、アートやエンタメ分野で「カンブリア爆発」のような革新を引き起こすかもしれません。しかし、その奇跡は悪用の可能性と表裏一体です。南カリフォルニア大学の研究者は、これからの時代、我々は「懐疑主義をデフォルトにする必要がある」と警鐘を鳴らしています。

専門家は、SoraがSNSのあり方を「人」中心から「個人のビジョン」中心へと変えると指摘します。これまでのSNSは、個人のリアルな声や体験が価値の源泉でした。しかしSoraは、そうした「本物らしさ」の必要性をなくし、ユーザーの興味や関心を反映したビジュアルコンテンツそのものを主役に変えてしまいます。もはや重要なのは、誰が発信したかではなく、何を想像し、見せたかになるのです。

この変化に、一部の開発者からは懸念の声が上がっています。彼らはSoraのようなアプリが、人間同士の真の繋がりを育むことを放棄し、「本質的に反社会的で虚無的だ」と批判します。アルゴリズムによって社会的孤立を深めたテクノロジー企業が、今度はその孤立から利益を得るために、人工的な繋がりを提供する空間を創り出しているというのです。

Soraはエンターテインメントと欺瞞、どちらの側面も持ち合わせています。かつてSNSのインフルエンサーやクリエイターは、独自の「声」を持つことで支持を集めました。しかしSoraは、その価値観を過去のものにするかもしれません。重視されるのは、もはや独創的な自己表現ではなく、いかに人を惹きつけるコンテンツを生み出すかという点です。

スタンフォード大学ソーシャルメディア・ラボの専門家は、Soraが既存のSNSを完全に置き換えるとは考えていません。むしろ、映画とニュースを使い分けるように、人々は「AIが生成した想像の空間」を新たなメディアの一つとして受け入れ、既存のメディアと共存させていくだろうと予測します。人間の「本物の人間を見たい」という欲求が今後も続くのか、Soraはその試金石となりそうです。

AI肖像権問題、OpenAIがキング牧師動画を停止

キング牧師動画の生成停止

遺族の苦情で動画生成を停止
「無礼な」動画の拡散が背景
歴史上の人物の利用拒否権を導入

AIと肖像権の法的課題

著作権問題での方針転換と類似
連邦法はなく州法で対応が分かれる
カリフォルニア州は死後の権利を保護
企業のAI倫理対応が問われる局面に

OpenAIは2025年10月17日夜(現地時間)、動画生成AI「Sora」で故マーティン・ルーサー・キング・ジュニア牧師のディープフェイク動画生成を停止したと発表しました。キング牧師の遺族から「無礼だ」との苦情が寄せられたことが原因です。同社は今後、他の歴史上の人物の遺族らも肖像の利用を拒否できる仕組みを導入します。

問題の発端は、Soraのユーザーによってキング牧師の「無礼な」AI生成動画が作成・拡散されたことです。これに対し、キング牧師の娘であるバーニス・キング氏がSNS上で、父親のAI動画を送るのをやめるよう訴えていました。キング牧師の遺産を管理する団体からの正式な要請を受け、OpenAIは今回の措置を決定しました。

今回の決定に伴い、OpenAI歴史上の人物の肖像権に関する新たな方針を打ち出しました。今後は、故人の公式な代理人や遺産管理団体が、Soraでの肖像利用を拒否(オプトアウト)する申請が可能になります。表現の自由とのバランスを鑑みつつ、著名人や家族が肖像の使われ方を管理する権利を尊重する考えです。

OpenAIのこの対応は、サービス開始当初の著作権への姿勢と重なります。Soraは当初、アニメキャラクターなどの著作物を無断で生成し批判を浴び、後に権利者が利用を許諾する「オプトイン」方式へと方針を転換した経緯があります。倫理や権利に関する「後追い」での対応が再び浮き彫りになった形です。

米国では個人の肖像権を保護する連邦法は存在しませんが、州レベルでは法整備が進んでいます。特にOpenAIが本社を置くカリフォルニア州では、俳優などの死後のプライバシー権がAIによるデジタルレプリカにも適用されると定めています。AI技術の進化に法整備が追いついていない現状が課題となっています。

生成AIが社会に浸透する中、故人を含む個人の尊厳や権利をどう守るかが大きな焦点となっています。今回のOpenAIの対応は、テクノロジー企業が直面する倫理的・法的な課題の複雑さを示唆しています。企業は技術開発と並行し、社会的責任を果たすための明確なガイドライン策定が急務と言えるでしょう。

多機能とSNS連携で覇権、ByteDanceのAI『Doubao』

中国で最も人気なAIアプリ

月間利用者1.57億人中国首位
世界でも4番目に人気の生成AI
親しみやすいアバターとUI/UX

成功を支える『全部入り』戦略

チャットから動画生成まで多機能
AIに不慣れな層も取り込む設計
TikTok(Douyin)とのシームレスな連携

バイラル設計とエコシステム

SNSでの共有を促すバイラル設計
競合からユーザーの4割が流入
自動車など他デバイスへの展開

TikTokを運営する中国ByteDance社が開発したAIアシスタント「Doubao(豆包)」が、中国市場を席巻しています。2025年8月には月間アクティブユーザー数が1億5700万人に達し、競合のDeepSeekを抜いて国内首位となりました。その成功の裏には、チャットから画像動画生成までを網羅する多機能性と、ショート動画アプリ「Douyin(抖音)」と連携した巧みなバイラル戦略があります。

Doubaoの躍進は、データにも裏付けられています。中国のデータインテリジェンス企業QuestMobileによると、月間アクティブユーザー数は1億5700万人。競合のDeepSeekは1億4300万人で2位に後退しました。また、ベンチャーキャピタルa16zの調査では、ChatGPTGeminiに次ぐ世界で4番目に人気の生成AIアプリにランクインしています。

Doubaoの最大の特徴は「全部入り」とも言える包括的な機能です。テキスト対話だけでなく、画像生成、短い動画作成、データ分析、AIエージェントのカスタマイズまで、一つのアプリで完結します。これはまるで、ChatGPTMidjourneySoraCharacter.aiといった複数の最先端ツールを一つに集約したような体験をユーザーに提供するものです。

なぜ、この「全部入り」戦略が受け入れられたのでしょうか。それは、DoubaoがAIに詳しくない一般ユーザーを明確にターゲットにしているからです。親しみやすいアバターやカラフルなUIに加え、テキスト入力より音声動画での対話を好む層を取り込み、AI利用のハードルを劇的に下げることに成功しました。

成功のもう一つの柱が、ByteDanceの得意とするSNS連携とバイラル設計です。ユーザーはDoubaoで生成したコンテンツを、Douyin(中国TikTok)ですぐに共有できます。逆にDouyinの動画要約をDoubaoにさせることも可能です。この利便性と楽しさが爆発的な拡散を生み、ユーザーエンゲージメントを高めています。

競合のDeepSeekがモデルの性能や論理的タスクに注力する一方、Doubaoは消費者向けアプリとしての完成度で差をつけました。QuestMobileのデータでは、DeepSeekを離れたユーザーの約4割がDoubaoに移行したとされています。これは、ByteDanceが長年培ってきた「アプリ工場」としての開発力が発揮された結果と言えるでしょう。

ByteDanceはスマートフォンの枠を超え、Doubaoをエコシステムの中核に据えようとしています。すでにスマートグラスや自動車メーカーとの提携を進めており、車載アシスタントやAIコンパニオンとしての搭載が始まっています。Doubaoは、私たちの生活のあらゆる場面に浸透するプラットフォームを目指しているのです。

日本政府、OpenAIに著作権侵害停止を公式要請

政府が公式に「待った」

OpenAIへの正式な申し入れ
動画生成AI「Sora」が対象
漫画・アニメの無断利用を懸念

保護されるべき日本の文化

「かけがえのない宝」と表現
知的財産戦略担当大臣が言及
クールジャパン戦略にも影響

OpenAIが抱える課題

著作権問題への対応に苦慮
CEOは日本の創造性を評価

日本政府が、米OpenAI社に対し、動画生成AI「Sora」の学習データに日本の漫画やアニメを無断で使用しないよう正式に要請しました。知的財産戦略を担当する木内稔大臣が明らかにしたもので、日本の文化資産である著作物の保護を強く求める姿勢を示しています。生成AIの急速な進化に伴い、著作権侵害のリスクが改めて浮き彫りになった形です。

木内大臣は、漫画やアニメを「日本の誇るかけがえのない宝」と表現し、その創造性が不当に利用されることへの強い懸念を表明しました。この要請は内閣府から正式に行われたもので、「クールジャパン戦略」を推進する政府としても、クリエイターの権利保護は看過できない重要課題であるとの認識が背景にあります。

OpenAIは、Soraのリリース以降、著作権を巡る問題に直面しています。ユーザーによってマリオやピカチュウといった著名キャラクターが無断で生成される事例が相次ぎ、対応に苦慮しているのが現状です。今回の日本政府からの公式な申し入れは、同社が世界中で直面する著作権問題の新たな一石となる可能性があります。

一方で、OpenAIサム・アルトマンCEOは、かねてより「日本の卓越した創造性」への敬意を公言しています。同社の画像生成AIでも過去にスタジオジブリ風の画像が大量に生成されるなど、日本コンテンツがAIモデルに大きな影響を与えていることは明らかです。今回の要請を受け、同社が学習データの透明性確保や著作権者への配慮にどう踏み込むかが焦点となります。

Google、AI動画Veo 3.1公開 編集機能で差別化

Veo 3.1の主な進化点

よりリアルな質感と音声生成
プロンプトへの忠実性が向上
最大2分半超の動画延長機能
縦型動画の出力に対応

高度な編集と競合比較

動画内の物体を追加・削除
照明や影の自然な調整
編集ツールは高評価もSora優位の声
Sora 2より高価との指摘も

Googleは2025年10月15日、最新のAI動画生成モデル「Veo 3.1」を発表しました。AI映像制作ツール「Flow」に統合され、音声生成や動画内のオブジェクトを操作する高度な編集機能を搭載しています。これにより、クリエイターはより直感的に高品質な動画を制作可能になります。激化するAI動画市場で、競合のOpenAISora 2」に対し、編集機能の優位性で差別化を図る狙いです。

Veo 3.1の大きな特徴は、音声生成機能の統合です。従来は手動で追加する必要があった音声が、静止画から動画を生成する機能や、動画を延長する機能にネイティブで対応しました。これにより、映像と音声が同期したコンテンツをワンストップで制作でき、制作工程を大幅に効率化します。

編集機能も大幅に強化されました。動画内の任意の場所にオブジェクトを自然に追加する「挿入」機能や、不要な要素を消去する「削除」機能が実装されます。さらに、照明や影を調整し、シーン全体のリアリティを高めることも可能です。作り手の意図をより精密に反映した映像表現が実現します。

新モデルは、動画編集ツール「Flow」に加え、開発者向けの「Gemini API」や企業向けの「Vertex AI」でも提供されます。これにより、個人のクリエイターから企業のコンテンツ制作まで、幅広い用途での活用が期待されます。GUIとAPIの両方を提供することで、多様なワークフローに対応する構えです。

一方で、市場の反応は賛否両論です。特に競合の「Sora 2」と比較し、動画自体の品質や価格面でSora 2が優位だとの指摘も出ています。Veo 3.1の強みである高度な編集ツールが高く評価される一方、生成品質のさらなる向上が今後の課題となりそうです。

技術面では、最大1080pの解像度と、SNSなどで需要の高い縦型動画の出力に対応しました。また、生成された動画には電子透かし技術「SynthID」が埋め込まれ、AIによる生成物であることを明示します。これにより、コンテンツの透明性を確保し、責任あるAI利用を促すとしています。

Google、欧州など大学生にGeminiを1年間無償提供

無償提供の概要

対象は欧州・中東・アフリカの大学生
1年間無料のAI Proプラン
12月9日までの申込が必要
18歳以上の学生が対象

利用可能な主要機能

最先端モデルGemini 2.5 Pro
調査レポート作成Deep Research
思考整理を支援NotebookLM
テキストから動画生成Veo 3

Googleは2025年10月13日、欧州・中東・アフリカ(EMEA)域内の大学生向けに、自社の最先端AIツール群「Google AI Proプラン」を1年間無償提供すると発表しました。18歳以上の学生が対象で、同年12月9日までの申込みが必要です。この取り組みは、次世代のAI人材育成と将来の労働力準備を目的としています。

無償提供されるのは、Gemini 2.5 Proへの拡張アクセスや、大規模な調査レポートを自動生成する「Deep Research」など、高度なAI機能を含むプランです。学生はこれらのツールを活用し、学業や創造的活動における生産性を大きく向上させることが可能になります。

さらに、音声動画の概要作成機能が強化された思考支援ツール「NotebookLM」や、テキスト・画像から高品質な動画を生成する「Veo 3」も利用可能です。これにより、学生は研究からプレゼンテーション準備まで、多岐にわたるタスクをAIサポートで進められます。

Googleは単なる答えの提供ではなく、理解を深め批判的思考を育むことを重視しています。そのため、質問やステップバイステップの支援で学習を導く「Guided Learning」モードも導入。複雑な数学の問題解決や論文構築などをサポートします。

学生は、最新の画像生成・編集モデル「Nano Banana」を使い、寮のデザインやクラブのロゴなど、アイデアを視覚的に具体化することもできます。創造性を刺激し、プロジェクトの初期段階を迅速に進めるツールとして活用が期待されます。

この施策は、教育者向けの「Gemini for Education」の拡充とも連動しています。Googleは世界中の大学と協力し、AIリテラシーの向上と個別化された学習支援の実現を目指していて、未来の担い手への投資を強化しています。

OpenAIのSora、5日で100万DL ChatGPT超え

驚異的な初期成長

公開5日未満で100万DLを達成
招待制にもかかわらず爆発的な伸び
ChatGPTの初期成長を凌駕
米・加のApp Storeで総合1位に

新たな機能と課題

最新モデル「Sora 2」を搭載
本人や友人を動画に登場させる機能
コンテンツ管理機能の強化が急務

OpenAIが2025年9月30日にリリースした動画生成AIアプリ「Sora」が、わずか5日足らずで100万ダウンロードを達成しました。招待制での提供にもかかわらず、この驚異的なペースは同社の対話型AI「ChatGPT」の初期成長を上回り、AI生成コンテンツ市場の新たな可能性を示唆しています。

Soraの責任者であるビル・ピーブルズ氏がこの快挙を発表。アプリ分析会社Appfiguresのデータでも、最初の7日間でiOSSoraは62.7万ダウンロードを記録し、ChatGPTの60.6万を上回りました。誰もが利用できたChatGPTとは異なり、Sora招待制であるため、この数字の持つ意味は非常に大きいと言えるでしょう。

このアプリは最新の動画生成モデル「Sora 2」を搭載し、ユーザーはAI動画の作成や閲覧が可能です。特に、自身や友人の姿を動画に挿入できる「カメオ」機能が話題を呼んでいます。SNS上では、Soraで生成されたミームや動画爆発的に拡散し、ダウンロード数を押し上げる一因となりました。

一方で、急速な普及は課題も浮き彫りにしています。著作権で保護されたキャラクターの無断生成や、故人を再現するディープフェイクなどが問題視され、大きな反発を呼びました。OpenAIはこれを受け、著作権者が自身のコンテンツを管理しやすくする機能の提供など、対策に乗り出しています。

現在アプリは米国とカナダでのみ利用可能ですが、今後提供地域が拡大される見込みです。ピーブルズ氏は「チームは急成長に対応するため懸命に努力している。さらなる機能追加や、過度なモデレーションの修正も予定している」と述べ、今後のサービス改善と拡大に意欲を見せています。

AI業界は重大な岐路に、オープンかクローズドか

AI業界の現状と課題

OpenAI開発者会議の開催
動画生成AI「Sora」の普及
採用選考でのAI活用が急増
業界は大きな岐路に直面

問われる未来のエコシステム

開かれたインターネット型
閉じたSNS型
ユーザー中心の設計が鍵
企業の戦略決定が急務に

AIスタートアップImbueのカンジュン・チュウCEOが、AI業界はオープンな生態系か、一部企業が支配するクローズドな生態系かの「重大な岐路」にあると警鐘を鳴らしました。背景には、OpenAI開発者会議での新発表や、動画生成AI「Sora」の急速な普及、採用活動におけるAI利用の一般化など、技術が社会に浸透する中での新たな動きがあります。

OpenAIは年次開発者会議で、ChatGPTの新機能やAIエージェント構築ツールを発表しました。同社はAIを「未来のオペレーティングシステム」と位置づける野心的なビジョンを掲げており、プラットフォームの主導権を握ろうとする動きは、業界がクローズドな方向へ向かう可能性を示唆しています。

一方、動画生成AI「Sora」のiOSアプリ登場は、技術のメインストリーム化を象徴する出来事です。しかし、著作権を巡る問題や、CEOの顔を使ったミームが拡散するなど、予期せぬ社会的影響も生んでいます。これは技術の社会実装が新たなフェーズに入ったことを示しています。

ビジネスの現場でも変化は顕著です。AIによる履歴書スクリーニングが一般化する一方、応募者がAIを欺くために履歴書に隠しプロンプトを埋め込むといった事態も発生。AIの普及は、これまでにない新たな課題を生み出しているのです。

チュウ氏が提起した「AIは初期インターネットのようにオープンになるか、ソーシャルメディアのように閉鎖的になるか」という問いは、全ての関係者にとって重要です。業界の将来像がまさに今、形成されつつあります。経営者や技術者は、この分岐点で自社の進むべき道を真剣に検討する必要があるでしょう。

招待制Soraが驚異的普及、初週DL数がChatGPT超え

驚異のローンチ実績

Soraの初週DL数62.7万件iOS
招待制ながらChatGPTの実績を上回る
米国App Storeで一時総合ランキング1位獲得
他の主要AIアプリを凌駕する初期普及速度

市場の熱狂的な反応

米国限定換算でもChatGPTの96%規模を達成
日次ダウンロード数10万件超を維持
リアルな動画生成への高い需要を証明

OpenAI動画生成アプリ「Sora」が、リリース初週で驚異的な普及速度を示しました。アプリ分析企業Appfiguresのデータによると、SoraiOSダウンロード数は最初の7日間で62.7万件に達し、ChatGPTのローンチ時(60.6万件)を技術的に上回りました。最大の注目点は、Soraが現在も招待制(Invite-only)であるにもかかわらず、この実績を達成したことです。

Soraの初動は特に強力でした。リリース初日には5.6万件のインストールを記録し、直ちに米国App Storeの総合ランキングで3位に浮上。その後、数日で総合1位を獲得しました。このロケットスタートは、AnthropicClaudeMicrosoft Copilotといった他の主要AIアプリのローンチ時を大きく上回るものであり、動画生成AIに対する市場の熱狂的な関心を示しています。

ダウンロード数の単純比較ではSoraが上回りますが、提供地域が異なります。Soraは当初米国とカナダで提供されたのに対し、ChatGPT米国のみでした。カナダ分を除外しても、Sora米国実績はChatGPTの約96%の規模に相当します。この僅差の実績を、アクセスの制限された状態で達成した点が、Soraのパフォーマンスの印象的な側面です。

招待制にもかかわらず、日次ダウンロード数はピークで10.7万件、その後も8〜9万件台を維持しており、安定した需要が続いています。Soraは最新モデル「Sora 2」を使用しており、そのリアルな動画生成能力がソーシャルメディア上で大きな話題となっています。経営者クリエイティブリーダーは、この爆発的な普及速度が、今後のコンテンツマーケティングやメディア戦略にどのような変革をもたらすか注視すべきです。

Soraの著作権・倫理問題は想定外、OpenAIがポリシーを急遽転換

予期せぬ著作権侵害への対応

著作権コンテンツ想定外に大量発生
当初のオプトアウト制を急遽撤回
権利者主体で利用可否を決定する方針へ

利用者からの要望と規制強化

AI生成アバター(カメオ)への細かな使用制限
ユーザーが不適切な発言を禁止する機能追加
ウォーターマークの削除対策が急務となる

技術的進歩とインフラの課題

普及速度はChatGPT以上インフラ不足が顕在化
高品質動画社会的課題を提起し共進化が必要

OpenAIサム・アルトマンCEOは、動画生成AI「Sora」のローンチ後、著作権侵害や不適切なディープフェイク利用に関する予想外の大きな反響があったと認めました。当初の想定と異なり、ユーザーや権利者から「もっとコントロールが欲しい」という声が殺到。この状況を受け、同社は急遽、著作権ポリシーとモデレーション機能の強化・転換を進めています。

最大の問題の一つが著作権侵害です。当初、Soraはメディア企業が不使用を申し出る「オプトアウト」方式を採用しましたが、「ナチス風スポンジボブ」などの権利侵害コンテンツが多発しました。これに対しOpenAIは方針を転換し、今後は著作権所有者が自ら利用可否を決定できる「より多くのコントロール」を提供するとしています。

また、ディープフェイクリスクも深刻です。特に、自身のAIアバターを生成する「カメオ」機能について、ユーザーは公開の可否だけでなく、「不適切な発言はさせたくない」といった複雑な制限を求めました。これに対応するため、OpenAIはユーザーが利用目的をテキストで指定し、細かく制御できる機能を追加しています。

しかし、アルトマン氏は、社会がこの変化に対応する必要性を強調します。Soraのように識別が困難な高品質動画は社会的な課題をもたらすが、OpenAIが先導して「技術的・社会的共進化」を進め、世界が体験を通じて理解することが唯一の解決策だと位置付けています。

Soraの採用曲線はChatGPTを上回る勢いで、この爆発的な需要から、OpenAIは計算資源(コンピュート)の絶対的な不足を最大の教訓と捉えています。同社は、Stargateプロジェクトなど、AIインフラへの積極的な投資を通じて、このボトルネックを解消する方針を明確に示しています。

Sora 2、故人著名人の肖像利用を事実上容認 安全対策の「抜け穴」が問題に

表面化した倫理的課題

公人描写ブロックの「抜け穴」
故人著名人の不適切利用が横行
遺族やファンへの精神的苦痛

具体的な利用事例

DJを演じるブルース・リー
スケートボードで転倒するホーキング博士
スピーチ中に口ごもるキング牧師

生者と故人の権利差

生者はカメオ機能で利用を管理
故人の肖像利用は同意なしで可能

OpenAIが提供する動画生成AI「Sora 2」について、安全対策の大きな抜け穴が指摘されています。同社は公人の描写をデフォルトでブロックすると発表していましたが、故人となった著名人に関する動画が多数生成・拡散されているためです。遺族からは、故人の尊厳を損なうAI動画の作成・送信をやめるよう訴えが出ており、倫理的な問題が浮上しています。

Sora 2の登場以来、ソーシャルメディア上には、死去した著名人を題材にした動画が溢れています。事例として、DJプレイを行うブルース・リー氏、スタンドアップコメディをするマイケル・ジャクソン氏、スピーチ中に口ごもるマーティン・ルーサー・キング・ジュニア氏などが確認されています。これらの動画は、故人を不謹慎な状況や文脈に利用しているケースが多く見られます。

故人のAI利用は、遺族にとって深刻な苦痛をもたらしています。俳優ロビン・ウィリアムズ氏の娘ゼルダ・ウィリアムズ氏は、父親のAI動画を送るのを止めるよう公に求めました。彼女は、「父が望むことではない」と強く反発しており、AIが故人を単なるプロップ(小道具)として扱う現状に強い懸念を示しています。

OpenAIは、生存する公人やユーザー向けに「カメオ」機能を提供しており、本人が顔をスキャンしオプトインすることで、自身の肖像利用をエンド・ツー・エンドで管理できる仕組みを保証しています。しかし、故人にはこの「同意」の枠組みが適用されないため、故人の肖像が同意なく無制限に利用されるという権利上の大きな不均衡が生じています。

生成AIの技術が進化するにつれて、故人の肖像権や人格権をどのように保護するかという課題が世界的に重要になっています。Sora 2が故人の利用を事実上容認している現状は、AI開発企業が安全ポリシーを策定する際の倫理的境界線について、さらなる議論と明確化が求められていることを示唆しています。

Google、AIプレミアム機能の提供国を世界77カ国へ拡大

サービス拡大の概要

提供国が世界77カ国に拡大
新規加入者向けに6カ月間50%割引
最新AIモデルによる生産性向上を支援

主なプレミアム機能

画像動画生成機能の利用制限緩和
Gmail/DocsへのGemini統合
ノート作成AI「NotebookLM」へのアクセス拡大
Google Oneの200GBストレージ付属

Googleは7日、AIサブスクリプションサービス「Google AI Plus」の提供国を大幅に拡大すると発表しました。新たに36カ国を追加し、合計77カ国で利用可能となります。これは、最新のAIモデルと機能を活用し、ユーザーの生産性を高めるための戦略的な一歩です。

Google AI Plusの最大の利点は、GeminiGmailやDocsといった主要アプリに組み込まれる点です。これにより、メール作成やドキュメント要約などの日常業務をAIで自動化し、ビジネスパーソンの業務効率を飛躍的に向上させます。

さらに、画像生成・編集モデルである「Nano Banana」や、動画生成機能の利用制限が緩和されました。また、高度なノート作成AIである「NotebookLM」へのアクセスも拡大しており、研究や分析を行うユーザーにとって強力なツールとなります。

本プランは、高度なAIモデルをより低価格で利用できるように設計されています。サービス拡大を記念し、新規加入者に対しては最初の6カ月間が50%割引になる期間限定の優待も提供されます。

テイラー・スウィフト氏のプロモ動画、AI利用疑惑で炎上

プロモーションの概要

Googleと連携した新アルバムの謎解きキャンペーン
12本のアンロック動画にAI生成疑惑が浮上
動画不自然な描写に対しファンが不満
公式側は動画の生成方法についてコメント拒否

AI利用の動機と論点

Google動画生成AIモデルVeo 3の宣伝機会か
スウィフト氏は過去にAIによる偽情報拡散を批判
クリエイティブ業界の著作権倫理問題が再燃

著名アーティストであるテイラー・スウィフト氏が、Googleと共同で実施した最新アルバムのプロモーション用動画について、ファンから「AI生成ではないか」との疑惑が浮上し、物議を醸しています。これは、AI技術の商業利用やクリエイター著作権問題が議論される中で、著名人のAI活用に対する敏感さを浮き彫りにしています。

スウィフト氏は新アルバム『The Life of a Showgirl』のリリースに際し、Google検索から始まる大規模なオンライン・スカベンジャーハントを実施しました。ファンが手に入れた12本の謎解き動画について、一部のシーンがコンピューター生成特有の不自然さを示しているとして、「AIを利用している」との指摘が集中しています。

この疑惑は、Google側の思惑と密接に関係していると見られています。GoogleOpenAISora 2に対抗するAI動画生成モデルVeo 3を開発しており、数百万人のファンにリーチできるスウィフト氏とのコラボレーションは、自社技術を宣伝する絶好の機会だと考えられます。ただし、Google動画の制作方法についてコメントを拒否しています。

AI利用が特に問題となるのは、スウィフト氏自身が過去にAI生成画像による偽情報の拡散(大統領選関連の偽支持画像)に対して強い懸念を示していた経緯があるからです。豊富なリソースを持つ彼女が、コスト削減のためにAI生成に頼った場合、クリエイティブ業界における倫理的な批判を増幅させることになります。

AI技術は、クリエイターの作品制作を助ける一方で、無断で学習データに利用され、職を奪う技術に転用されることへの強い懸念があります。世界的スターのAI使用疑惑は、著作権や生計の脅威といった、クリエイティブ業界が抱える敏感なテーマを改めて浮き彫りにしています。

OpenAI、Sora 2活用AI動画SNSを投入。ディープフェイク対策と著作権の課題

新アプリの概要

AI生成動画専用のソーシャルアプリを公開
動画生成モデルSora 2を基盤技術に使用
縦型フィードやスワイプ操作などTikTok型UIを採用

主要な特徴

本人確認でデジタルアバターを自動生成
プロンプト入力で自分をAI動画の主役に設定可能
ユーザー間の交流とコンテンツ生成を重視

倫理・法的側面

ディープフェイク露骨な内容はガードレールで制限
他者の肖像利用は設定許可が必須
著名キャラクターに関する著作権保護の基準が曖昧

OpenAIは、AI生成動画に特化した新しいソーシャルアプリをローンチしました。基盤技術には動画生成モデル「Sora 2」を使用し、TikTokのような縦型フィード形式を採用しています。ユーザーは自身のデジタルアバターを作成し、プロンプトを通じて自分や友人をフィーチャーした動画を簡単に生成できる点が最大の特徴です。この動きは、AIエンターテイメントの未来像を提示しています。

このアプリの設計思想は、ユーザーに単なる視聴ではなく、積極的なコンテンツ生成を促す点にあります。本人確認プロセスとして、画面の指示に従い数字を読み上げる自身の動画を撮影させることで、顔と声のデジタルアバターが作成されます。これにより、ユーザーは自分や友人を人魚にするなど、現実離れしたシナリオの動画を手軽に制作可能です。

OpenAIは、悪用を防ぐための厳格なガードレールを導入しています。特に懸念されるディープフェイクポルノやヌード画像、露骨なロマンスの描写は生成がブロックされます。また、他者の肖像権(likeness)の利用は、本人が設定で許可しない限り不可能となっており、プライバシー保護に配慮しています。

一方で、著作権の扱いは依然としてグレーゾーンです。テイラー・スウィフトやダース・ベイダーといった明らかな著名キャラクターの生成は制限されていますが、ピカチュウなど他の有名キャラクターの動画生成は許可されている事例が確認されています。OpenAIは今後、フィルターを回避しようとするユーザーとの間で、いたちごっこ(Whack-a-Mole)が続くと予想されます。

OpenAIによる今回のアプリ投入は、ソーシャルメディアの未来がAIエンターテイメントにあるという見方を強化します。Metaも以前にAI生成動画アプリを試みましたが失敗しています。AIコンテンツから距離を置くTikTokとは対照的に、OpenAIパーソナライズされた「偽の世界」を提供することで、先行者としての地位を確立しようとしています。

OpenAI、開発者向けAPIを大幅強化:GPT-5 ProとSora 2提供開始

フラッグシップモデルの進化

GPT-5 ProをAPI経由で提供開始
金融、法律など高精度な推論を要求する業界向け
動画生成モデルSora 2のAPIプレビュー公開
リアルなシーンと同期したサウンドの生成

低遅延音声AIの普及戦略

小型で安価な音声モデルgpt-realtime miniを導入
低遅延ストリーミングによる高速な音声対話を実現
旧モデル比でコストを70%削減し低価格化

OpenAIは先日のDev Dayにおいて、開発者向けAPIの大規模な機能強化を発表しました。特に注目すべきは、最新の言語モデル「GPT-5 Pro」、動画生成モデル「Sora 2」のAPIプレビュー公開、そして小型かつ安価な音声モデル「gpt-realtime mini」の導入です。これはAIエコシステムへの開発者誘致を加速させ、高精度なAI活用を目指す企業に新たな機会を提供します。

最新のフラッグシップモデルであるGPT-5 Proは、高い精度と深い推論能力を特徴としています。CEOのサム・アルトマン氏は、このモデルが金融、法律、医療といった、特に正確性が要求される業界のアプリケーション開発に有効だと強調しました。これにより、複雑な専門的タスクの自動化と品質向上が期待されます。

また、大きな話題を呼んだ動画生成モデルSora 2も、開発者エコシステム参加者向けにAPIプレビューが開始されました。開発者Sora 2の驚異的な動画出力能力を自身のアプリケーションに直接組み込めます。より現実的で物理的に一貫したシーン、詳細なカメラディレクション、そして視覚と同期した豊かなサウンドスケープの生成が可能です。

さらに、今後のAIとの主要な対話手段として重要視される音声機能強化のため、新モデル「gpt-realtime mini」が導入されました。このモデルは、APIを通じて低遅延のストリーミング対話に対応しており、応答速度が極めて重要なアプリケーション開発を可能にします。

gpt-realtime miniの最大の特徴は、そのコストパフォーマンスの高さです。従来の高度な音声モデルと同等の品質と表現力を維持しながら、利用コストを約70%も削減することに成功しました。この大幅な低価格化は、音声AI機能の普及を加速させ、より多くの企業が手軽にAIを活用できる環境を整えます。

OpenAI DevDay 2025開幕、アルトマンとIve氏がAI戦略を議論

発表予測と戦略シフト

AIブラウザAIデバイスの進捗発表
GPT Storeの機能強化やエージェント機能
API提供からプラットフォーム構築への移行

注目イベントと登壇者

アルトマンCEOとJony Ive氏の特別対談
開発者向け新機能を紹介するState of the Union
動画生成モデルSoraによるSora Cinema」の公開

高まる市場競争

AnthropicGoogleによるコーディング分野での追撃
Meta Superintelligence Labsによる新たな脅威増大

OpenAIは10月6日(月)、サンフランシスコで年次開発者会議「DevDay 2025」を開催しました。今回の最大の焦点は、CEOサム・アルトマン氏と元Appleデザイナージョニー・アイブ氏による対談です。同社は生成AI市場での競争激化を受け、ChatGPTやAPI提供にとどまらない戦略的な製品拡大を強く示唆しています。

アルトマン氏は基調講演で、開発者向けの新機能やデモを発表する予定です。特に注目されるのは、現在開発中のAI搭載ブラウザや、アイブ氏らと共同で進めているAIデバイスの進捗状況です。OpenAIは、競合他社に対抗するため、ハードウェアやプラットフォーム分野への進出を加速しています。

アルトマン氏とアイブ氏の対談は、イベント終盤のハイライトです。「AI時代における創造の技術(craft of building)」について議論される予定であり、これはAIデバイスの設計思想やユーザー体験に深く関わるものと見られています。この対談はライブ配信されず、後にYouTubeで公開されます。

開発者コミュニティへの対応も強化されます。社長のグレッグ・ブロックマン氏らによる「Developer State of the Union」では、プラットフォームの新機能やロードマップが公開されます。GPT Storeのアップデートや、開発者エージェント的なワークフローを構築できる新機能も予測されています。

一方で、OpenAIは厳しい市場競争に直面しています。AnthropicGoogleのAIモデルは、コーディングやWebデザインといった分野で急速に性能を向上させており、OpenAIより高性能なモデルを低価格で提供することを迫られています。

その他の注目コンテンツとして、動画生成モデルSoraを利用した短編映画を上映する「Sora Cinema」が用意されています。これは、OpenAIソーシャルメディアアプリやエンターテイメントを含むコンテンツ生成分野へも積極的に事業を広げていることを示しています。

Sora、AI分身と著作物利用制御を強化

AI分身の利用制限

AI生成動画への出演制限を設定
政治的な文脈での利用を禁止
特定ワードやシチュエーションの排除
好みの属性を強制する細かな設定

著作権ポリシーの転換

物議を醸したオプトアウト方式を転換
権利者向けのオプトインモデルへ移行
将来的には公式キャラクター導入へ
権利者への収益分配を検討開始

OpenAI動画生成AI「Sora」に対し、ユーザーのAI生成分身(カメオ)および著作物の利用に関する制御機能を大幅に強化しました。これは、急速に広がるディープフェイク著作権侵害といった混乱に対応し、プラットフォームの健全性を確保するための重要な政策転換です。

今回のアップデートの核は、ユーザーが自分のAI分身の利用範囲を厳格に制限できる点です。政治的なコンテンツへの登場や特定の単語の使用、特定のシチュエーションでの出現などを個別に禁止可能となり、不適切な利用リスクを低減します。

さらにOpenAIは、権利者の懸念に対応するため、従来の「オプトアウト」方式の著作権ポリシーを転換し、粒度の高いオプトインモデルへと移行します。これは、権利者がコンテンツ利用を細かく制御できるようにする、クリエイターエコノミー重視の姿勢を示しています。

特に問題となっていた無許可の二次創作や著作権侵害に対処するため、OpenAIは公式キャラクターの利用(カメオ)をロードマップに組み込みました。これにより、著作権者が許可したコンテンツの市場を創出することを目指します。

この権利者との関係構築の一環として、利用されたキャラクターの権利者に対しては、近いうちに収益分配を開始する予定です。正確な支払いモデルは試行錯誤が必要としていますが、AI生成コンテンツにおける新たなビジネスモデルの確立を示唆しています。

これらの機能強化は、Soraの登場によって懸念されていた、AIによって生成される低品質で不適切なコンテンツ(AI slop)がインターネットに溢れるのを防ぐ狙いがあります。OpenAIは今後も制限の堅牢性を高め、ユーザーの制御権を拡大していく方針です。

トップYouTuberがAI動画に警鐘「クリエイターの生計を脅かす存在」

業界最大手の危機感

MrBeastがAI動画の脅威を公言
数百万人のクリエイターの生計懸念
背景にOpenAISora 2の急速な普及

技術進化と市場への影響

Sora 2アプリが米国App Store1位獲得
YouTubeAI編集ツールを積極導入
AI動画が低品質な「slop」と見なされる側面

倫理と信頼性の課題

不開示利用はファンとの信頼喪失リスク
AI利用ツール提供で批判を受け撤回した過去

世界で最も影響力のあるYouTuberであるMrBeast(ジミー・ドナルドソン氏)がこのほど、AIによる動画生成技術がプロのクリエイターの生計を脅かす「実存的な脅威」となると強く警鐘を鳴らしました。フォロワー数6億人を超える業界の巨星によるこの発言は、AI技術の急進展に直面するコンテンツ経済全体に大きな波紋を広げています。

同氏はSNS上で、AI生成動画が「生計を立てている数百万人のクリエイター」にどのような影響を与えるのか疑問を呈し、「業界にとって恐ろしい時代」だと述べています。その懸念は、コンテンツが大量生産され、プロの付加価値が急速に低下する可能性に焦点が当たっています。

この危機感の背景にあるのは、OpenAIが最近発表した最新モデル「Sora 2」とその専用モバイルアプリの存在です。特にアプリはユーザーが手軽にAI動画を作成し、TikTokのような縦型フィードで共有できるため、リリース後すぐに米国App Storeで1位を獲得するなど、爆発的に普及しています。

動画プラットフォームであるYouTube自体も、AI技術の導入を加速させています。YouTubeはAI編集ツールや、独自の動画生成モデルVeoを活用した機能を提供し、クリエイターの作業効率化を支援しています。一方で、プラットフォームによるAI推進の動きは、MrBeastのようなトップクリエイターの不安を増幅させている側面もあります。

MrBeast自身、過去にAI技術と関わり、ファンからの批判を受けた経験があります。この夏、彼はAIを利用したサムネイル作成ツールを自身の分析プラットフォームで公開しましたが、すぐにクリエイターやファンから反発を受け、ツールを撤回し、人間のアーティストを推奨する形に変更しました。

AI生成動画が「slop(質の低いコンテンツ)」として敬遠される傾向もあり、その品質や創造性についても議論が続いています。今後AIが完全に人間に匹敵する動画を作れるようになったとしても、AI利用を開示しないクリエイターは、ファンからの信頼を失い、長期的に評判を損なうリスクがあります。

ChatGPT、週間8億ユーザーを達成 AIインフラへの巨額投資を加速

驚異的なユーザー成長

週間アクティブユーザー数:8億人
OpenAI活用開発者数:400万人
APIトークン処理量:毎分60億トークン
史上最速級のオンラインサービス成長

市場評価と事業拡大

企業価値:5000億ドル(世界最高未公開企業)
大規模AIインフラStargate」の建設推進
Stripeと連携しエージェントコマースへ参入
インタラクティブな新世代アプリの実現を予告

OpenAIサム・アルトマンCEOは、ChatGPTの週間アクティブユーザー数(WAU)が8億人に到達したと発表しました。これは、コンシューマー層に加え、開発者、企業、政府における採用が爆発的に拡大していることを示します。アルトマン氏は、AIが「遊ぶもの」から「毎日構築するもの」へと役割を変えたと強調しています。

ユーザー数の増加ペースは驚異的です。今年の3月末に5億人だったWAUは、8月に7億人を超え、わずか数ヶ月で8億人に達しました。さらに、OpenAIを活用して構築を行う開発者は400万人に及び、APIを通じて毎分60億トークン以上が処理されており、AIエコシステムの核として支配的な地位を確立しています。

この急成長の背景にあるのは、AIインフラへの巨額投資です。OpenAIは、大量のAIチップの確保競争を繰り広げるとともに、Oracleソフトバンクとの提携により、次世代データセンター群「Stargate」など大規模AIインフラの構築を急いでいます。これは今後のさらなるサービス拡大と技術革新の基盤となります。

市場からの評価も高まり続けています。非公開株の売却取引により、OpenAIの企業価値は5000億ドル(約75兆円)に達し、世界で最も価値の高い未公開企業となりました。動画生成ツールSoraの新バージョンなど、新製品も矢継ぎ早に展開する勢いを見せています。

Dev Dayでは、ChatGPT内でアプリを構築するための新ツールが発表され、インタラクティブで適応型、パーソナライズされた「新しい世代のアプリ」の実現が予告されました。同社はStripeと連携し、エージェントベースのコマースプラットフォームへ参入するなど、ビジネス領域での活用も深化させています。

一方で、急速な普及に伴う課題も指摘されています。特に、AIがユーザーの意見に過度に追従する「追従性(sycophancy)」や、ユーザーを誤った結論に導くAI誘発性の妄想(delusion)といった倫理的・技術的な問題について、専門家からの懸念が続いています。企業はこれらの課題に対する対応も求められます。

AI性能向上を分ける「強化学習の格差」:テスト容易性が鍵

AI進化の二極化

AIの進歩は均等ではない
コーディング系スキルは急激に向上
メール作成など主観的スキルは停滞
強化学習(RL)が最大の推進力

性能向上を左右する要素

計測可能性が進化速度を決定
RLは明確な合否判定で機能
自動採点可能なタスクに集中投資
テスト可能なプロセスは製品化に成功

現在、AIの性能進化に大きな偏りが生じており、専門家の間で「強化学習の格差(Reinforcement Gap)」として注目されています。これは、AI開発の主要な推進力である強化学習(RL)が、自動で計測・評価できるスキルを優先的に急伸させているためです。コーディング支援ツールのようにテスト容易性の高い分野は劇的に進化する一方、文章作成など主観的なタスクは進捗が停滞しています。

この格差の背景には、RLの性質があります。RLが最も効果を発揮するのは、明確な「合格・不合格」の指標が存在する場合です。この仕組みにより、AIは人間の介入を必要とせず、数十億回規模の自動テストを繰り返すことができます。結果として、バグ修正や競争数学などのテストが容易なスキルは急速に性能を向上させています。

特にソフトウェア開発は、RLにとって理想的な対象です。元々、コードのユニットテストやセキュリティテストなど、システム化された検証プロセスが確立されています。この既存のテスト機構を流用することで、AIが生成したコードの検証と大規模なRL学習が効率的に進められています。

対照的に、良質なメールや洗練されたチャットボットの応答は、本質的に主観的であり、大規模な計測が困難です。ただし、全てのタスクが「テスト容易」か「困難」に二分されるわけではありません。例えば、財務報告書のような分野でも、適切な資本投下により新たなテストキット構築は技術的に可能と見られています。

この強化学習の格差は、今後のAI製品化の是非を決定づける要因となります。予測が難しいのは、テスト容易性が後から判明するケースです。OpenAISora 2モデルによる動画生成の進化は、物理法則の遵守など、潜在的なテスト基準を確立した結果であり、驚異的な進歩を遂げました。

RLがAI開発の中心であり続ける限り、この格差は拡大し、経済全体に重大な影響を与えます。もしあるプロセスがRLの「正しい側」に分類されれば、その分野での自動化は成功する可能性が高いため、今その仕事に従事している人々はキャリアの再考を迫られるかもしれません。

SoraのIP利用は「オプトイン」に転換 著作権者との収益分配を検討

著作権ポリシーの転換

従来の「オプトアウト」方式を撤回。
IP利用は権利者による「オプトイン」に移行。
キャラクター生成により詳細な制御を導入。
バイオメトリックデータと同様の管理体制を適用。

収益化戦略と協力体制

動画生成機能の収益化を計画。
将来的に権利者との収益分配を検討。
新たな「インタラクティブな二次創作」を期待。
権利者にエンゲージメント価値還元を目指す。

OpenAI動画生成AI「Sora」の著作権ポリシーを根本的に変更します。サム・アルトマンCEOは10月4日、知的所有権(IP)の利用について、従来の「オプトアウト」方式から、権利者が許諾を与える「オプトイン」方式へ移行すると発表しました。これにより、著作権侵害に対する懸念に対応し、権利者との協力体制の構築を急ぎます。

この変更は、特に映画スタジオやエージェンシーからの要求に応えるものです。Soraの初期報道では、権利者が利用を拒否するための「オプトアウト」が必要とされていました。今後は、スタジオなどが明示的に許可しない限り、著作権で保護されたキャラクターを用いた動画生成は制限されます。

アルトマン氏は、ユーザーのバイオメトリックデータ(生体情報)の利用と同様に、キャラクター利用に関しても「より詳細な制御」を可能にすると述べました。多くの権利者は「インタラクティブな二次創作」に期待しているものの、キャラクターの使用方法について厳格な管理を求めているためです。

さらにOpenAIは、動画生成機能の収益化と、その収益を権利者と共有する計画も示唆しました。同社は、単なる収益分配以上に、Soraによる新たなエンゲージメントが、権利者に大きな価値をもたらすことを期待しています。

Soraは招待制ながら、ローンチ直後から米国App Storeのチャートで1位を獲得するなど急速に普及しています。一方で、ユーザーは著作権法を無視し、人気キャラクターが登場する二次創作動画を多数生成しており、ポリシー見直しの緊急性を高めていました。

アルトマンCEOは、新アプローチを導入しても、意図せず著作権を侵害する「エッジケース」が発生する可能性も認めています。OpenAIは、技術的な制限と権利者の要望のバランスを取りながら、引き続きプラットフォームの公平性と管理体制を強化していく方針です。

OpenAI動画アプリSora、熱狂と懸念でApp Store1位

驚異的な滑り出し

公開2日で16.4万DL達成
米国App Store総合1位を獲得
招待制ながら異例のバイラルヒット

主な機能と特徴

テキストから10秒の動画を自動生成
自身のAIアバターを作るカメオ機能
ミーム化しやすいソーシャル体験

浮上する深刻な懸念

偽情報拡散リスクと悪用
アニメキャラ等の著作権侵害問題

OpenAIが2025年10月初旬にリリースしたAI動画生成アプリ「Sora」が、公開直後から爆発的な人気を集め、米国App Storeで総合1位を獲得しました。テキストからリアルな動画を手軽に生成できる一方、ディープフェイクによる偽情報の拡散や著作権侵害といった深刻な懸念も同時に浮上しており、その影響が注目されています。

Sora米国とカナダで招待制として公開されたにもかかわらず、最初の2日間で16.4万ダウンロードを記録。これは他の主要AIアプリのローンチを上回る勢いです。この異例のスタートダッシュは、消費者の間でAIによる動画生成・共有体験への強い需要があることを明確に示しています。

アプリの魅力は、テキストから10秒の動画を生成する手軽さに加え、自身のAIアバターを作れる「カメオ」機能にあります。友人や著名人(本人の許可が必要)を登場させたパロディ動画やミームがSNSで拡散され、バイラルヒットの大きな原動力となりました。

しかし、そのリアルさ故に偽情報の温床となるリスクが最大の課題です。アプリ内の透かし(ウォーターマーク)は画面録画や別ツールで容易に除去可能とされ、悪意あるディープフェイク動画が本物として拡散される危険性が専門家から指摘されています。

著作権侵害も深刻な問題です。人気アニメや映画のキャラクターが無断で生成された事例が既に報告されており、OpenAIコンテンツフィルターが不十分である可能性が露呈しました。知的財産の保護と生成AIの自由度の両立は、依然として大きな挑戦です。

OpenAI社内からも、この技術の社会実装に対する期待と同時に懸念の声が上がっています。「現実と非現実の境界を曖昧にする」と評されるSoraは、利便性の裏に潜むリスクを社会全体でどう管理していくのか、重い問いを投げかけていると言えるでしょう。

OpenAI開発者会議、新AI製品発表で覇権狙うか

DevDay 2025の注目点

1500人以上が集う「過去最大」の祭典
CEOアルトマン氏による基調講演
Appleデザイナー、アイブ氏との対談
開発者向け新機能のデモ

憶測呼ぶ新プロジェクト

噂されるAI搭載ブラウザの発表
アイブ氏と開発中のAIデバイス
動画生成AI「Sora」アプリの動向
GPT Storeに関する最新情報

OpenAIは、サンフランシスコで第3回年次開発者会議「DevDay 2025」を月曜日に開催します。1500人以上が参加する過去最大のイベントとなり、サム・アルトマンCEOによる基調講演や新発表が予定されています。GoogleMetaなど巨大テック企業との競争が激化する中、AI業界での主導権をさらに強固にする狙いがあり、その発表内容に注目が集まっています。

会議の目玉は、アルトマンCEOによる基調講演と、長年Appleデザイナーを務めたジョニー・アイブ氏との対談です。基調講演では新発表やライブデモが行われる予定です。アイブ氏とは、AI時代のものづくりについて語り合うとみられており、両氏が共同で進めるプロジェクトへの言及があるか注目されます。

今回のDevDayでは、具体的な発表内容は事前に明かされておらず、様々な憶測を呼んでいます。特に期待されているのが、開発中と噂されるAI搭載ブラウザや、アイブ氏と共同開発するAIデバイスに関する新情報です。昨年発表されたGPT Storeのアップデートについても関心が寄せられています。

OpenAIを取り巻く環境は、年々厳しさを増しています。GoogleAnthropicのモデルはコーディングなどのタスクで性能を向上させており、Metaも優秀なAI人材を集め猛追しています。開発者を惹きつけるため、OpenAIより高性能で低価格なモデルを投入し続ける必要があります。

2023年の初回会議ではGPT-4 Turboなどを発表した直後、アルトマン氏がCEOを解任される騒動がありました。昨年は比較的落ち着いた内容でしたが、今年はAIデバイスやソーシャルアプリなど事業領域を急拡大させており、再び大きな発表が行われるとの期待が高まっています。

アルトマンCEOによる基調講演は、OpenAIの公式YouTubeチャンネルでライブ配信される予定です。会場では、動画生成AI「Sora」で制作した短編映画の上映会なども企画されており、開発者コミュニティとの関係強化を図る姿勢がうかがえます。

AIビジネスの混沌、政府閉鎖が不確実性を増幅

AI業界の最新動向

OpenAISoraアプリを公開
AI女優がハリウッドで物議
AI科学者開発へ3億ドルの大型調達
AI生成コンテンツ収益化が課題

スタートアップを取り巻く環境

7年ぶりの米国政府機関閉鎖
許認可やビザ発行遅延の懸念
数週間の遅延が存続危機に直結
政府の民間企業への出資増加

米TechCrunchのポッドキャスト「Equity」は、AI業界の新たな動きと、7年ぶりに始まった米国政府機関閉鎖がスタートアップに与える影響について議論しました。OpenAIの新アプリ「Sora」の登場で収益化モデルが問われる一方、政府機能の停止は許認可の遅延などを通じ、企業の存続を脅かす不確実性を生んでいます。

特に深刻なのが、政府機関閉鎖の影響です。7年ぶりとなるこの事態は、一見すると直接的な影響が少ないように思えるかもしれません。しかし、許認可やビザ、規制当局の承認を待つスタートアップにとって、数週間の遅延は事業計画を根底から覆し、最悪の場合、存続の危機に直結する可能性があります。

AI業界もまた、大きな不確実性に直面しています。OpenAITikTok風のAI動画生成アプリ「Sora」を公開しましたが、ユーザーが延々と続く合成コンテンツに本当に価値を見出し、課金するのかは未知数です。多くのAI企業が、いまだ持続可能なビジネスモデルの確立に苦心しているのが現状と言えるでしょう。

AI技術の社会実装は、思わぬ摩擦も生んでいます。最近ハリウッドで物議を醸したAI女優「Tilly Norwood」の事例は、たとえ架空の存在であっても、既存の業界に現実的な混乱を引き起こし得ることを示しました。技術の進歩と社会の受容の間に横たわる課題は、依然として大きいようです。

一方で、AIの未来に対する期待は依然として高く、巨額の投資が続いています。OpenAIDeepMindの元研究者らが設立したPeriodic Labsは、科学的発見を自動化する「AI科学者」を開発するため、シードラウンドで3億ドルという巨額の資金調達に成功しました。これは、AIが持つ破壊的なポテンシャルへの信頼の表れです。

最後に、新たな動きとして米国政府による民間企業への出資が挙げられます。リチウム採掘企業や半導体大手のIntelなどに政府が株主として関与するケースが増えています。国家戦略上重要な産業を支援する狙いですが、政府の市場介入がもたらす影響については、今後も議論が続きそうです。

OpenAI、評価額5000億ドルで世界首位の未公開企業に

驚異的な企業価値

従業員保有株の売却で価値急騰
評価額5000億ドル(約75兆円)
未公開企業として史上最高額を記録

人材獲得競争と資金力

Metaなどへの人材流出に対抗
従業員への強力なリテンション策
ソフトバンクなど大手投資家が購入

巨額投資と事業拡大

インフラ投資計画を資金力で支える
最新動画モデル「Sora 2」も発表

AI開発のOpenAIが10月2日、従業員らが保有する株式の売却を完了し、企業評価額が5000億ドル(約75兆円)に達したことが明らかになりました。これは未公開企業として史上最高額であり、同社が世界で最も価値のあるスタートアップになったことを意味します。この株式売却は、大手テック企業との熾烈な人材獲得競争が背景にあります。

今回の株式売却は、OpenAI本体への資金調達ではなく、従業員や元従業員が保有する66億ドル相当の株式を現金化する機会を提供するものです。Meta社などが高額な報酬でOpenAIのトップエンジニアを引き抜く中、この動きは優秀な人材を維持するための強力なリテンション策として機能します。

株式の購入者には、ソフトバンクやThrive Capital、T. Rowe Priceといった著名な投資家が名を連ねています。同社は8月にも評価額3000億ドルで資金調達を完了したばかりであり、投資家からの絶大な信頼と期待が、その驚異的な成長を支えていると言えるでしょう。

OpenAIは、今後5年間でOracleクラウドサービスに3000億ドルを投じるなど、野心的なインフラ計画を進めています。今回の評価額の高騰は、こうした巨額投資を正当化し、Nvidiaからの1000億ドル投資計画など、さらなる戦略的提携を加速させる要因となりそうです。

同社は最新の動画生成モデル「Sora 2」を発表するなど、製品開発の手を緩めていません。マイクロソフトとの合意による営利企業への転換も視野に入れており、その圧倒的な資金力と開発力で、AI業界の覇権をさらに強固なものにしていくと見られます。

OpenAIのSora、公開2日で米App Store3位に

驚異的な滑り出し

初日で5.6万ダウンロードを記録
2日間で16.4万インストール達成
App Store総合3位に急浮上
現在は米国・カナダ限定の招待制

競合AIアプリとの比較

初日DL数はxAIGrokと同等
ChatGPTGeminiには及ばず
ClaudeCopilot大きく上回る
招待制を考慮すれば異例の成功

OpenAIが9月30日に公開した動画生成AIアプリ「Sora」が、リリース直後から爆発的な人気を集めています。アプリは公開からわずか2日で、米国App Storeの総合ランキングで3位に急浮上しました。現在は米国とカナダの招待制ユーザーに限定されていますが、初日だけで5.6万ダウンロードを記録し、AIビデオツールへの高い関心を浮き彫りにしています。

アプリ分析会社Appfiguresによると、SoraiOSアプリは公開後2日間で合計16.4万インストールを達成しました。招待制というアクセス制限がある中でのこの数字は、異例の成功と言えるでしょう。一般公開されれば、さらに多くのユーザーを獲得する可能性を秘めており、市場の期待は高まっています。

この滑り出しは、他の主要AIアプリと比較しても遜色ありません。初日のダウンロード数(5.6万件)は、xAIの「Grok」と肩を並べ、Anthropicの「Claude」(2.1万件)やMicrosoftの「Copilot」(7千件)を大きく上回ります。一方で、OpenAI自身の「ChatGPT」(8.1万件)やGoogleの「Gemini」(8万件)の記録には及びませんでした。

Soraの成功は、消費者がAIビデオ生成ツールをより手軽なソーシャル体験として求めていることを示唆しています。これまで専門的なツールと見なされがちだった動画生成AIが、一般ユーザーの創造性を刺激するプラットフォームとして受け入れられ始めているのです。これは市場の新たな可能性を開くものでしょう。

このアプリの登場は、AI技術が研究開発の段階から、誰もが楽しめるエンターテインメントへと移行する象徴的な出来事と言えるかもしれません。Soraが今後、どのようにビジネスや個人のクリエイティビティを変革していくのか、その動向から目が離せません。

OpenAI、音声付き動画AI発表 ディープフェイクアプリも

Sora 2の進化点

映像と同期する音声の生成
対話や効果音もリアルに再現
物理法則のシミュレーション精度向上
複雑な指示への忠実性が大幅アップ

ディープフェイクアプリ

TikTok風のSNSアプリを同時公開
自身の「カメオ」ディープフェイク作成
公開範囲は4段階で設定可能
誤情報や著作権侵害への懸念が噴出

OpenAIが10月1日、動画生成AIの次世代モデル「Sora 2」と、TikTok風のSNSアプリ「Sora」を同時公開しました。Sora 2は映像と同期した音声生成が可能となり、専門家からは「動画生成におけるChatGPTの瞬間」との声も上がっています。しかし、自身の分身(カメオ)を手軽に作成できる機能は、ディープフェイクによる誤情報拡散のリスクをはらんでおり、社会的な議論を呼んでいます。

Sora 2」の最大の進化点は、音声との同期です。これまでのモデルと異なり、人物の対話や背景の環境音、効果音などを映像に合わせて違和感なく生成できます。さらに、物理法則のシミュレーション精度も向上しており、より現実に近い、複雑な動きの再現が可能になりました。

同時に発表されたiOSアプリ「Sora」は、AI生成動画を共有するSNSです。最大の特徴は「カメオ」機能。ユーザーが自身の顔をスキャンして登録すると、テキスト指示だけで本人そっくりの動画を作成できます。友人や一般への公開範囲も設定可能です。

この新技術はエンターテイメントやコミュニケーションの新たな形を提示する一方、深刻なリスクも内包しています。特に、リアルなディープフェイクを誰でも簡単に作れる環境は、悪意ある偽情報の拡散や、いじめ、詐欺などに悪用される危険性が専門家から指摘されています。

著作権の問題も浮上しています。報道によると、Sora著作権者がオプトアウト(拒否)しない限り、そのコンテンツを学習データに利用する方針です。アプリ内では既に人気キャラクターの無断使用も見られます。OpenAIは電子透かし等の対策を講じますが、実効性には疑問の声が上がっています。

Sora 2」とSoraアプリの登場は、動画生成AIが新たなステージに入ったことを示しています。利便性と創造性を飛躍的に高める一方で、倫理的・社会的な課題への対応が急務です。経営者開発者は、この技術の可能性とリスクの両面を深く理解し、慎重に活用戦略を検討する必要があるでしょう。

AI動画は物理法則を理解したか?Google論文の検証

DeepMindの野心的な主張

Google Veo 3の能力を検証
ゼロショットでのタスク解決を主張
汎用的な視覚基盤モデルへの道筋

見えてきた性能の限界

一部タスクでは高い一貫性
ロボットの動作や画像処理で成功
全体としては一貫性に欠ける結果
「世界モデル」構築はまだ途上

Google DeepMindが、最新のAI動画モデル「Veo 3」が物理世界をどの程度理解できるかを探る研究論文を発表しました。論文では、Veo 3が訓練データにないタスクもこなす「世界モデル」への道を歩んでいると主張しますが、その結果は一貫性に欠け、真の物理世界のシミュレーション能力には依然として大きな課題があることを示唆しています。

研究者らは、Veo 3が明示的に学習していない多様なタスクを解決できる「ゼロショット学習者」であると主張します。これは、AIが未知の状況に対しても柔軟に対応できる能力を持つことを意味し、将来的に汎用的な視覚基盤モデルへと進化する可能性を示唆するものです。

確かに、一部のタスクでは目覚ましい成果を上げています。例えば、ロボットの手が瓶を開けたり、ボールを投げたり捕ったりする動作は、試行を通じて安定して説得力のある動画を生成できました。画像のノイズ除去や物体検出といった領域でも、ほぼ完璧に近い結果を示しています。

しかし、その評価には注意が必要です。外部の専門家は、研究者たちが現在のモデルの能力をやや楽観的に評価していると指摘します。多くのタスクにおいて結果は一貫性を欠いており、現在のAI動画モデルが、現実世界の複雑な物理法則を完全に理解していると結論付けるのは時期尚早と言えるでしょう。

経営者エンジニアにとって重要なのは、この技術の現状と限界を冷静に見極めることです。AI動画生成は強力なツールとなり得ますが、物理的な正確性が求められるシミュレーションロボット工学への応用には、まだ慎重な検証が必要です。

Google、賞金100万ドルのAI映画賞を発表

賞金100万ドルの大規模コンペ

優勝賞金は100万ドル(約1.5億円)
ドバイのサミットで2026年1月に授賞
テーマは「未来の再創造」など2種類

GoogleのAIツールが応募条件

Google AIツール(Gemini等)利用が必須
コンテンツ70%がAI生成であること
作品時間は7分から10分の短編映画
応募締切は2025年11月20日

Googleは2025年10月1日、世界最大級のクリエイターイベント「1 Billion Followers Summit」と共同で、優勝賞金100万ドル(約1.5億円)の「Global AI Film Award」を創設したと発表しました。このコンテストは、同社の生成AIモデル「Gemini」などを活用して制作された短編映画を世界中から募集し、AIによる創造性の新たな地平を切り拓くことを目指します。

今回のAI映画賞は、AIがクリエイターの強力なパートナーとなりつつある現状を象徴するものです。Googleは、AI技術がコンテンツ制作のハードルを下げ、誰もが映像作家になれる未来を見据えています。100万ドルという破格の賞金は、同社がAIクリエイティブ分野に寄せる大きな期待の表れと言えるでしょう。

応募作品には、いくつかの重要な条件があります。まず、作品の70%以上GoogleのAIツールで生成する必要があります。上映時間は7分から10分。テーマは「未来の再創造」または「知られざる物語」のいずれかを選択します。言語は不問ですが、英語字幕は必須です。締切は2025年11月20日となっています。

制作には、最新の動画生成モデル「Veo 3」や、より高度な制御が可能な映画制作ツール「Flow」、画像モデル「Nano Banana」など、GeminiファミリーのAIツールが活用できます。これらのツールは、キャラクターやシーン、スタイルを精緻にコントロールし、クリエイターのビジョンを忠実に映像化することを支援します。

このAI映画賞は、AIが単なる効率化ツールではなく、人間の創造性を拡張する新たな表現媒体であることを示す試金石となるでしょう。授賞式は2026年1月にドバイで開催されるサミットで行われます。今後、AIネイティブなクリエイターがどのような作品を生み出すのか、世界中から注目が集まります。

動画生成AI「Sora 2」登場、SNSで誰もが主役に

次世代動画AI Sora 2

物理法則に忠実でリアルな動画を生成
プロンプトから音声・効果音も同期生成
失敗も再現する世界シミュレーターへ進化

TikTok対抗?Soraアプリ

自分や友人動画に登場するCameo機能
生成動画を共有するアルゴリズムフィード
招待制で米国・カナダから先行リリース

安全と倫理への配慮

同意ベースの肖像利用と削除権の保証
生成物への電子透かしと来歴証明(C2PA)

OpenAIは2025年9月30日、次世代の動画音声生成AI「Sora 2」と、連動するソーシャルアプリ「Sora」を同時発表しました。前モデルから物理法則の再現性を大幅に向上させ、ユーザーが自身の姿を動画に登場させられる「Cameo」機能が特徴です。同社はこのモデルを、物理世界を深く理解する「世界シミュレーター」への重要な一歩と位置づけ、新たな創作とコミュニケーションの形を提案します。

Sora 2」の最大の進化点は、そのリアリズムにあります。バスケットボールのシュートが外れてリバウンドするなど、物理法則に忠実で「失敗」もモデル化。これは単なる成功例をなぞるのではなく、現実世界をより正確にシミュレートしようとする試みです。さらに、対話や効果音も同期生成でき、表現の幅が大きく広がりました。

新登場のiOSアプリ「Sora」の目玉は「Cameo」機能です。ユーザーは自身の姿と声を一度登録するだけで、あらゆる生成シーンに自分自身を登場させられます。さらに、友人に自分のCameoの使用許可を与えることで、複数人が登場する動画の共同制作も可能に。これは、AIを介した全く新しいソーシャル体験と言えるでしょう。

アプリはTikTokに似たフィードを持ちますが、設計思想は大きく異なります。OpenAIは、単なる「消費」ではなく「創造」を最大化することを目指しており、アルゴリズムも他者の作品から着想を得て新たな創作を促すように調整されています。ユーザーがアルゴリズムを自然言語で制御できる点も革新的です。

ディープフェイクなどの悪用リスクに対し、OpenAI多層的な安全対策を講じています。肖像権の利用は本人の同意が必須で、いつでも許可を取り消せます。生成された全ての動画には、AI生成物であることを示す電子透かし(C2PA)が埋め込まれるほか、未成年者向けのペアレンタルコントロール機能も実装されました。

Sora」アプリの登場は、TikTokなど既存の短尺動画プラットフォームにとって新たな競合となる可能性があります。当面は無料で提供されますが、将来的には計算リソースの需要に応じた課金も計画されています。APIの提供も予定されており、幅広いビジネスでの活用が期待されます。

対話型AIの倫理と収益化、CEOが語る最前線

CEOが語る最前線の論点

人間のようなAIコンパニオンの台頭
対話型AIの倫理と法的課題
規制圧力下でのイノベーション戦略
AIのスケーリングと収益化の実態

イベントと登壇者の概要

TechCrunch Disrupt 2025
Character.AIのCEOが登壇
Meta、MS出身のAI専門家
月間ユーザー2000万人を達成

対話型AIプラットフォーム「Character.AI」の最高経営責任者(CEO)であるカランディープ・アナンド氏が、2025年10月にサンフランシスコで開催される世界的な技術カンファレンス「TechCrunch Disrupt 2025」に登壇します。同氏は、人間のようなAIコンパニオンの爆発的な成長の背景にある技術や、それに伴う倫理的・法的な課題、そしてビジネスとしての収益化戦略について、その内幕を語る予定です。

セッションでは、AIが人間のように自然な対話を行うことを可能にした技術的ブレークスルーが紹介されます。一方で、人間とコンピューターの相互作用の境界線を押し広げることで生じる倫理的な問題や社会的な監視、さらには進行中の法的な課題に同社がどう向き合っているのか、規制圧力下でのイノベーション戦略についても踏み込んだ議論が期待されます。

アナンド氏は、Meta社でビジネス製品部門を、Microsoft社ではAzureクラウドの製品管理を率いた経歴を持ちます。その豊富な経験を活かし、Character.AIのCEOとして長期戦略を指導。プラットフォームは現在、全世界で月間2000万人のアクティブユーザーを抱えるまでに成長しており、動画生成など新たな領域への拡大も進めています。

この講演は、AIを活用する経営者投資家エンジニアにとって、対話型AIの構築、拡大、収益化の現実を学ぶ絶好の機会となるでしょう。AIと人間の相互作用の未来について、示唆に富んだ視点と実践的な洞察が得られるはずです。AIビジネスの最前線で何が起きているのか、その答えがここにあります。

OpenAI、動画AI「Sora 2」でTikTok風アプリ投入へ

TikTok似のAI動画アプリ

縦型動画をスワイプで視聴
おすすめアルゴリズム搭載
「いいね」「コメント」「リミックス」機能

Sora 2が可能にする体験

最大10秒の動画AIで自動生成
本人確認で自分の肖像を利用
他人が肖像利用時に通知

市場参入の狙いと課題

動画AI体験のゲームチェンジを狙う
著作権未成年保護が課題

OpenAIが、次世代動画生成AIモデル「Sora 2」を搭載したソーシャルアプリのローンチを準備していることが明らかになりました。同アプリはTikTokに酷似したインターフェースを持ち、ユーザーはAIが生成した動画のみを共有できます。ChatGPTでテキストAIの利用を大衆化させた同社が、動画分野でも同様の体験革命を目指します。

アプリの最大の特徴は、TikTokのようなユーザー体験です。縦型の動画が並ぶフィードをスワイプして視聴し、「おすすめ」ページではアルゴリズムがユーザーの好みに合わせたコンテンツを提示。動画に対して「いいね」やコメント、さらにはそれを元に新たな動画を作る「リミックス」機能も備え、AI生成コンテンツを軸にした新たなコミュニティ形成を狙います。

ユーザーはプロンプト(指示文)を入力することで、最大10秒間の動画クリップを生成できます。スマートフォンのカメラロールなどから写真や動画をアップロードする機能はなく、全てがアプリ内でAIによって作られる点がユニークです。また、本人確認機能を通じて自分の肖像を登録し、動画に登場させることも可能になります。

OpenAIの狙いは、AI生成動画の体験を根本から変えることにあります。ChatGPTがテキスト生成AIの可能性を一般に知らしめたように、このアプリで動画AIの普及を一気に加速させる構えです。また、TikTok米国事業売却を巡る混乱が、中国と繋がりのないショート動画プラットフォームの立ち上げにとって好機になるとの思惑もあるようです。

AI動画生成の分野では、巨大テック企業間の競争が激化しています。Metaは自社のAIアプリ内に「Vibes」というAI動画専用フィードを導入。Googleも最新モデル「Veo 3」をYouTubeに統合するなど、各社がプラットフォームへの実装を急いでいます。OpenAIスタンドアロンアプリ戦略がどう差別化されるか注目されます。

一方で課題も山積しています。OpenAIはニューヨーク・タイムズ紙などから著作権侵害で提訴されており、アプリには厳しい著作権フィルターが搭載される見込みです。また、未成年者の安全確保も大きな課題であり、年齢制限などの対策がどのように盛り込まれるかが今後の焦点となります。

GoogleのAI「Veo」、福田美術館の絵画を動画に

Googleは2025年9月24日、最新の動画生成AI「Veo」を活用し、日本の福田美術館と協力して絵画を動画化する「動く絵画」プロジェクトを発表しました。Veoが静止画から動きを推測し、高精細な動画を生成します。これにより、鑑賞者に新たな芸術体験を提供し、デジタルアーカイブの可能性を広げることを目指します。 この技術の中核は、Veoが静止画からあり得る動きを推測し、時間的に一貫性のある動画を生成する能力にあります。一枚の絵という限られた情報から、数百フレームにわたる連続した映像を創り出すことで、静止画と動画の間のギャップを埋める画期的な試みと言えるでしょう。このアプローチは、どうすれば芸術を新たな方法で探求できるかという問いに答えるものです。 プロジェクトでは2つの動作モードが開発されました。一つは「アニメーションモード」です。学芸員が絵画に描かれた雨の動きや旅人の歩みといった要素を指定し、Veoがそれらを基に物語性のある動画を生成します。これにより、絵に込められた物語がより明確に視覚化され、鑑賞者は新たな視点を得ることができます。 もう一つの「フォトリアリスティックモード」は、絵画の元になったであろう現実の風景を再現することに焦点を当てます。Veoは静止画を元に、写真のようにリアルな世界の動画を生成します。これは、芸術家が目にしたであろう風景をデジタルで追体験させる試みであり、芸術的解釈の源泉を探る新しい手法です。 このプロジェクトは、単なる芸術鑑賞の拡張に留まりません。静的なデジタルアーカイブを、分析や物語表現に活用できる動的な資産へと変える道筋を示しています。文化財の保存と活用において、AIが果たす役割の大きさを示唆する先進的な事例ではないでしょうか。

Google、月額5ドルのAIプランを新興国40カ国超に拡大

Googleは9月24日、月額約5ドルの安価なAIサブスクリプションプラン「AI Plus」を、インドネシアやメキシコなど40カ国以上で提供開始しました。標準プランが高価な新興国市場で有料ユーザーを獲得し、先行するOpenAIに対抗する狙いです。この動きは、世界のAIサービス市場の勢力図に影響を与える可能性があります。 このプランでは、最新AIモデル「Gemini 2.5 Pro」へのアクセスが可能です。加えて、画像生成ツール「Flow」や動画生成ツール「Veo 3 Fast」など、クリエイティブな作業を支援する機能も含まれます。GmailやDocsといったGoogleの各種アプリ内でもAI機能が使えるようになり、業務効率の向上が期待できます。 さらに、AIリサーチアシスタントNotebookLM」の拡張機能や、200GBのクラウドストレージも提供されます。専門的な情報収集や資料作成、データ保管といったビジネスシーンでの実用性を高めており、コストパフォーマンスに優れたサービス内容となっています。 この動きの背景には、OpenAIとの激しい顧客獲得競争があります。OpenAIインドネシアなどで月額5ドル未満の「ChatGPT Go」を展開済みです。月額20ドルの標準プランが浸透しにくい市場で、両社は低価格戦略を加速させ、次なる巨大市場の主導権を争っています。 月額料金は多くの国で約5ドルに設定されていますが、ネパールやメキシコなど一部地域では、最初の6ヶ月間は50%割引が適用されます。巨大IT企業による価格競争は、今後さらに多くの地域で高機能なAIツールの普及を後押しすることになるでしょう。

Google、AI Plusプランを40カ国に追加、新興国市場へ展開加速

Googleは9月23日、AIサブスクリプションプラン「AI Plus」の提供国を新たに40カ国拡大したと発表しました。インドネシアでの先行導入が好評だったことを受け、より手頃な価格で高度なAIツールを世界中に提供する狙いです。対象はアジア、アフリカ、中南米の新興国が中心で、グローバルな利用者層の拡大を目指します。 「AI Plus」プランでは、Geminiアプリでの画像生成・編集や動画生成モデル「Veo 3 Fast」の利用上限が引き上げられます。さらに、Gmail、Docs、Sheetsといった主要な生産性ツールにGeminiが統合され、業務効率の大幅な向上が期待できるでしょう。ビジネスの現場でAIをどう活用できるか、試金石となりそうです。 このプランには、AI搭載のデジタルノート「NotebookLM」の利用上限拡大や、Googleフォト、ドライブ、Gmailで使える200GBのストレージも含まれます。また、これらの特典は最大5人の家族と共有可能で、個人利用だけでなく小規模なチームでの活用も視野に入ります。 新たに追加されたのは、ベトナム、フィリピン、ナイジェリア、メキシコ、ウクライナなど40カ国です。Googleは、価格を各国の市場に合わせて設定することで、新興国市場でのAIサービスの普及を加速させる戦略です。手頃な価格設定が、新たなビジネスチャンスを生むかもしれません。

OpenAI、インドネシアで廉価版ChatGPT投入、Google追撃

OpenAIは、インドネシアで廉価版サブスクリプションプラン「ChatGPT Go」を開始しました。料金は月額75,000ルピア(約4.50ドル)です。8月に開始したインド市場での成功を受け、新興国への展開を加速します。この動きは、同市場で先行する米Googleの類似プランに対抗するもので、生成AIの顧客基盤拡大を狙います。 ChatGPT Goプランは、無料版と月額20ドルの「Plus」プランの中間に位置します。無料版の10倍の利用上限が設定され、質問やプロンプトの送信、画像生成、ファイルアップロードがより多く利用できます。また、過去の会話を記憶する能力が向上し、ユーザーごとに最適化された応答が期待できます。 先行して同プランを導入したインドでは、有料購読者数が2倍以上に増加したといいます。価格を抑えたプランが新興市場のユーザー獲得に有効であることを証明したかたちです。この成功が、今回のインドネシアへの迅速な展開につながったのでしょう。各市場の特性に合わせた価格戦略の重要性を示唆しています。 この動きは、競合するGoogleへの直接的な対抗策です。Googleは今月初め、インドネシアで同様の価格帯の「AI Plus」プランを先行して発表しました。同プランでは、高性能な「Gemini 2.5 Pro」や画像動画生成ツール、200GBのクラウドストレージなどを提供しており、競争は激化しています。 AI大手が新興国で廉価版プランの投入を急ぐ背景には、将来の巨大市場での主導権争いがあります。一度ユーザー基盤を確立すれば、長期的な収益源となるためです。日本企業も、海外市場へAIサービスを展開する際には、現地の経済状況に合わせた価格設定と競合の動向を分析することが成功の鍵となるでしょう。

Geminiが大幅進化、画像から動画生成・家庭操作も可能に

YouTube、クリエイター向けAIを全面強化 Veo 3 Fastやリップシンク導入

<span class='highlight'>Veo</span>連携と動画編集

テキストから動画生成Veo 3 Fast」統合
会話から楽曲自動生成「Speech to Song」
生素材から初稿を自動編集「Edit with AI」

チャンネル成長支援

AIチャットボットAsk Studio」でインサイト分析
タイトル/サムネイルの最大3種A/Bテスト
無断利用された顔を検出・削除(YPP向け)

ポッドキャスト/多言語対応

多言語吹き替えにリップシンクを導入
音声コンテンツからプロモーション動画生成

YouTubeは「Made on YouTube 2025」にて、クリエイター生産性向上と収益拡大を目的とした大規模なAIツール群を発表しました。Shorts制作効率化のほか、チャンネル運営分析、著作権保護、そして多言語展開を支援する機能が焦点です。これにより、クリエイターコンテンツ制作における高い生産性とグローバルな収益機会を得られると期待されます。

特に注目すべきは、ショート動画(Shorts)向けにGoogle動画生成モデル「Veo 3 Fast」が統合された点です。これは低遅延の480p動画をテキストプロンプトから生成でき、静止画に動画の動きを適用する機能も搭載されます。クリエイターアイデアを即座に映像化でき、トレンドへの対応速度が飛躍的に向上します。

編集作業の負担も大幅に軽減されます。「Edit with AI」は、カメラロールの生素材から最適な場面を抽出し、音楽やトランジション、ボイスオーバーを自動で付与し、初稿を生成します。また、会話の内容をキャッチーな楽曲に変換する「Speech to Song」も導入され、より手軽なリミックス文化を推進します。

チャンネル運営の効率化のため、YouTube StudioにはAIチャットボット「Ask Studio」が導入されます。これはチャンネルのパフォーマンス分析や視聴者の反応に関する実用的なインサイトを提供し、収益化戦略を支援します。タイトルやサムネイルのA/Bテストも最大3パターンまで比較可能となり、最適化を促進します。

グローバル展開とブランド保護も重要なテーマです。自動吹き替え機能はさらに進化し、翻訳された音声に合わせたリップシンク技術(口の動きの同期)をテストすることで、翻訳動画のリアリティを大幅に高めます。視聴者が違和感なく視聴できる環境を提供します。

さらに、YouTubeパートナープログラム(YPP)参加者向けには、自身の顔の無断利用を検知し、削除を管理できる「肖像検出」機能がオープンベータ展開されます。これはクリエイターが自身のイメージや評判を守り、デジタル著作権を管理する上で重要なリスク管理ツールとなります。

ポッドキャスト領域への注力も見逃せません。AIは既存のビデオポッドキャストからプロモーション用のShortsやクリップを自動で提案・生成します。また、音声のみのポッドキャストに対しても、カスタマイズ可能な映像を自動で生成可能となり、オーディオクリエイターの新規開拓と視聴時間増に貢献します。

D-ID、企業顧客1500社獲得へ。動画作成Simpleshow買収でアバター市場加速

買収の核心と目的

エンタープライズ向けアバター動画市場の獲得加速
B2B顧客基盤とSaaS技術の獲得
収益性の向上と黒字化への貢献

Simpleshowの主要資産

AdobeやMSなど1,500社超の企業顧客
テキストから動画生成するSaaSプラットフォーム
トレーニング・マーケティング動画制作実績

統合後の戦略

両プラットフォームの最終的な統合を目指す
インタラクティブな学習動画開発を推進

AI搭載アバター動画プラットフォームのD-IDは、ベルリン拠点のB2B動画作成スタートアップSimpleshowを買収しました。これにより、D-IDはエンタープライズ市場におけるデジタルアバターの導入を加速させる構えです。財務条件は非公開ですが、この統合により従業員数は140名に拡大します。

買収の最大のメリットは、Simpleshowが保有する1,500社以上の強力な企業顧客基盤です。AdobeMicrosoft、T-Mobileなど大手顧客の獲得は、D-IDの収益を大幅に押し上げ、早期の黒字化に貢献すると見込まれています。

Simpleshowは2008年創業の老舗であり、SaaSベースのテキスト-ビデオ生成ツール開発に強みを持っています。D-IDのAIアバター技術とSimpleshowの長年のB2B動画制作ノウハウが融合することで、トレーニングやマーケティング動画の制作領域で高い相乗効果を発揮します。

D-IDのギル・ペリーCEOは、この買収が企業向けアバター動画市場で優位に立つための「必要なブースト」であると述べています。両社の製品は最終的に統合され、特に企業研修におけるインタラクティブな学習体験の構築を目指します。

今後は、ユーザーがアバター動画を中断し、直接質問をしたり、クイズを受けたりできるような、より高度なインタラクティブ機能の開発に注力します。これは、アバター活用の主流が一方向的なプレゼンテーションから双方向的な学習・コミュニケーションへと移行していることを示します。

デジタルアバター市場は激戦区であり、D-IDは競合するSynthesiaやSoul Machinesに加え、GoogleやMcKinseyなどもソリューションを開発しています。D-IDはSimpleshowの買収を通じて、この競争環境での市場シェア拡大を狙います。