無料で更新通知を受け取る
マルチモーダルに関する記事一覧
画像
記事数: 464件
PaddleOCR 3.5、Transformers推論に対応
AI生成論文が査読を圧倒、ArXivは1年間の投稿禁止措置
動画
記事数: 377件
Cosmos動画生成モデルのLoRA微調整手法を公開
OpenAIブロックマンが製品統括、ChatGPTとCodex統合へ
音声
記事数: 364件
Alexa PlusがAIポッドキャスト生成に対応
Runway、動画生成から世界モデルへ大転換
音楽
記事数: 98件
AI4モデルにラジオ局を任せた結果、全局が破綻
AIが「自分専用アプリ」時代を切り開く