クラウドサービス(インフラ)に関するニュース一覧

OllamaがApple MLX対応、Macでのローカル推論を大幅高速化

MLX対応の概要

Apple MLXフレームワーク対応開始
Ollama 0.19プレビューで提供
Qwen3.5-35Bモデルのみ対応
Apple Silicon搭載Mac・RAM32GB以上が必要

性能改善と圧縮技術

キャッシュ性能の向上を実現
Nvidia NVFP4圧縮形式に対応
メモリ使用効率の大幅改善

ローカルLLM需要の高まり

OpenClawGitHubで30万スター突破
クラウドAPIの料金・制限への不満が背景

ローカルLLM実行ツールOllamaは、Appleが開発したオープンソースの機械学習フレームワークMLXへの対応を発表しました。これにより、Apple Silicon搭載Macでの大規模言語モデルの推論性能が大幅に向上します。

今回の対応はOllama 0.19のプレビュー版として提供されており、現時点で対応モデルはAlibabaのQwen3.5-35Bパラメータ版のみです。利用にはApple Silicon搭載Macに加え、最低32GBのRAMが必要とされています。

MLX対応に加え、キャッシュ性能の改善やNvidiaNVFP4モデル圧縮形式への対応も同時に発表されました。NVFP4はモデルのメモリ使用量を大幅に削減する技術で、より効率的な推論環境の構築が可能になります。

ローカルモデル実行への関心は急速に高まっています。OpenClawGitHubで30万スター以上を獲得し、中国を中心に世界的な注目を集めています。研究者やホビイスト以外の層にもローカルLLMの活用が広がりつつあります。

背景には、Claude CodeChatGPT Codexなどのクラウドサービスにおけるレート制限や高額なサブスクリプション費用への開発者の不満があります。OllamaはVisual Studio Codeとの統合も拡充しており、ローカル開発環境の充実を進めています。

米上院がデータセンターの電力使用量の報告義務化を要求

エネルギー報告の義務化

ウォーレン・ホーリー両議員がEIAに書簡
年次エネルギー使用量の包括的開示を要求
EIAが任意パイロット調査を開始
AI計算と一般クラウド消費電力の区別も要求

規制強化の動き加速

サンダース議員らがDC建設モラトリアム法案提出
ワーナー議員はDC課税で雇用支援を提案
バージニア州が税優遇廃止を検討
複数州でDC建設一時停止法案が審議中

エリザベス・ウォーレン上院議員(民主)とジョシュ・ホーリー上院議員(共和)は2026年3月26日、米エネルギー情報局(EIA)に対し、データセンター電力使用量に関する包括的な年次報告を義務化するよう求める書簡を送付しました。

両議員は、電力需要が急増する中で標準化されたデータの欠如が送電網計画に重大なリスクをもたらすと指摘しています。現在、連邦機関でデータセンター電力使用量を個別に収集している組織はなく、各社の自主開示に依存している状況です。

EIAは同日、テキサス州・ワシントン州・バージニア州の約200社を対象とした任意のパイロット調査を開始すると発表しました。ただし両議員が求めているのは、より広範な義務的報告であり、AI計算と一般クラウドサービスの消費電力の区別など詳細な情報収集を含みます。

一方、マーク・ワーナー上院議員(民主・バージニア州)は、データセンターへの課税によりAIによる雇用喪失対策の財源を確保する構想を提示しました。看護師育成やAIスキル向上プログラムへの充当を想定しており、バージニア州ヘンリコ郡がDC税収で手頃な住宅プロジェクトを開始した先例を挙げています。

NBCニュースの世論調査では、AIに対する否定的な見方が46%に達し、肯定的な26%を大きく上回っています。バージニア州では年間約20億ドルに上るデータセンター向け税優遇の廃止提案が浮上しており、他州にも波及する可能性があります。

前日にはバーニー・サンダース上院議員とAOC下院議員がデータセンター建設の全面モラトリアム法案を提出しており、ニューヨーク州でも3年間の建設一時停止法案が検討されるなど、全米で規制強化の動きが加速しています。ワーナー議員はモラトリアムには反対の立場で、中国との競争を理由に挙げています。

AmazonとGoogleがAIインフラ競争をリード、AWSクラウド収益も急伸

CAPEX競争の実態

AmazonGoogleAI設備投資でトップ
AWS収益が高成長を継続
Google CloudもAI需要で加速
設備投資合戦の「賞品」は何かを分析
AIインフラへの数百億ドル規模投資

クラウド業界の構造変化

AIトレーニング需要が需要を牽引
GPU供給不足への対策投資
中小クラウドとの競争力格差拡大

TechCrunchは2026年2月5日、AmazonGoogleがAI設備投資(CAPEX)競争を主導しているが、その「賞品」は何なのかを分析した。

AWSはAI関連クラウドサービスへの旺盛な需要を背景に高い収益成長を維持しており、Amazonの主要収益エンジンとしての地位を固めている。

GoogleのCloud部門も同様にAI需要により加速成長しており、データセンター建設への巨額投資が続く。

TechCrunchの分析では、CAPEXの「賞品」は単なるクラウド市場シェアではなく、AI時代の基盤インフラ支配権であるとされる。

MicrosoftMetaも数百億ドル規模の設備投資を行っており、AIインフラ競争の敗者は将来のAIサービス競争力を失うリスクがある。

AIクラウドRunPodがARR1.2億ドル達成、Redditの投稿から4年で快挙

成長の軌跡

Reddit1投稿からスタート
設立4年ARR1.2億ドル達成
急拡大するAI需要を取り込む
スタートアップ向けに特化

市場における位置づけ

AWS・Azureとの差別化成功
低コストGPUで競争優位
AI企業のインフラ需要を満たす
次の資金調達への期待高まる
上場も視野に入る水準

RunPodはAIアプリのホスティングプラットフォームで、わずか4年でARR(年換算売上高)1.2億ドルを達成しました。創業者のZhen LuとPardeep Singhが、Redditへの一投稿から事業を始めたという異色の創業ストーリーが話題を呼んでいます。

同社はGPUクラウドサービスを提供しており、AWS・Azureよりも低コストなGPUリソースを求めるAIスタートアップや研究者に支持されています。

生成AIブームによるGPU需要急増の恩恵を直接受けており、収益成長が急加速しています。同様のAIインフラビジネスへの投資家の関心も高まっています。

AIモデル学習・推論の需要が今後も継続すると見られる中、代替インフラプロバイダーとしてのRunPodの存在感は一層高まりそうです。

AI巨額投資がアダ、オラクル株価が25%急落

巨額AI投資への懸念

OpenAI向け巨額投資
過去1ヶ月で株価25%下落
競合を上回る下落率
社債価格も大幅に下落

投資家が抱く不安

資本集約的な事業モデル
クラウド事業の出遅れ
AIの将来性への疑問

米ソフトウェア大手オラクルが、AIへの巨額投資を巡りウォール街の懸念を招いています。特にChatGPTを開発するOpenAIとの提携を背景とした投資計画が投資家心理を冷え込ませ、最近のハイテク株売りで同社株は大きな打撃を受けています。

オラクル株は過去1ヶ月で25%も下落しました。これは巨大テック企業の中で最悪のパフォーマンスで、メタの下げ幅の約2倍に相当します。9月にOpenAIとの提携で得た時価総額2500億ドル以上の上昇分が帳消しになった形です。

なぜ市場はこれほど懸念するのでしょうか。その理由は、オラクルの戦略が従来のクラウドサービスとは異なる資本集約的な事業モデルだからです。売上高は大きく見えますが、データセンターなどへの莫大な先行投資が必要で、利益率が低いと専門家は指摘します。

さらに、この戦略はOpenAIの成功に大きく依存する「オール・イン(全賭け)」に近いと見られています。OpenAIのような赤字のAIスタートアップが期待に応えられなかった場合、オラクル投資が裏目に出るリスク投資家は重く見ています。

オラクルが競合に比べクラウド事業への参入で出遅れたという背景も懸念を増幅させています。後発であるが故に、AIという新分野で一気に巻き返しを図る積極策が、かえって投資家には高リスクな賭けと映っているのです。

今回の株価下落は、オラクル固有の問題だけではありません。ウォール街全体で、巨大テック企業によるAIへの過大な評価と巨額の設備投資が、本当に見合うリターンを生むのかという懐疑的な見方が強まっていることも背景にあります。

グーグル、テキサス州に400億ドル投資 AIインフラ強化へ

400億ドルの巨大投資

2027年までの400億ドル投資計画
2郡に新データセンター建設

エネルギーと人材への投資

3000万ドルのエネルギー基金設立
太陽光・蓄電池プラントを併設
1700人以上の電気技師を育成

米国のAI覇権が狙い

テキサス州の労働力と基盤を支援
米国AIリーダーシップを維持

Googleは2025年11月14日、テキサス州に2027年までに400億ドル(約6兆円)投資すると発表しました。この投資は、急増する需要に対応するため、AIとクラウドの新たなインフラを構築することが目的です。米国の技術的優位性を維持する狙いがあります。

投資の中核をなすのは、アームストロング郡とハスケル郡での新しいデータセンターキャンパスの建設です。これにより、GoogleクラウドサービスやAIモデルの処理能力が大幅に向上します。15年以上にわたり拠点を置くテキサス州での事業をさらに拡大する形です。

Googleインフラの責任ある成長を掲げ、エネルギー問題にも積極的に取り組みます。新たに3000万ドルのエネルギーインパクト基金を設立するほか、電力開発会社との電力購入契約を通じて6200メガワット以上の新エネルギーを確保します。

特に注目すべきは、ハスケル郡の新データセンターの一つが、新しい太陽光発電・蓄電池プラントと並行して建設される点です。これは、再生可能エネルギーを活用し、事業運営に伴う環境負荷を軽減する同社の姿勢を明確に示しています。

インフラ建設を支える人材育成も重視します。専門団体と協力し、2030年までに1700人以上の見習いを含む電気技師を育成する計画です。これにより、州内の熟練労働者のパイプラインが倍増する見込みです。

今回の巨額投資は、テキサス州の労働力とインフラを支援するだけでなく、米国がAI分野で世界をリードするための技術的屋台骨を確保するという国家的な戦略の一環と位置づけられています。

NVIDIA、卓上AIスパコン発表 初号機はマスク氏へ

驚異の小型AIスパコン

1ペタフロップスの演算性能
128GBのユニファイドメモリ
Grace Blackwellチップ搭載
価格は4,000ドルから提供

AI開発を個人の手に

最大2000億パラメータのモデル実行
クラウド不要で高速開発
開発者や研究者が対象
初号機はイーロン・マスク氏へ

半導体大手NVIDIAは2025年10月14日、デスクトップに置けるAIスーパーコンピュータ「DGX Spark」を発表しました。ジェンスン・フアンCEO自ら、テキサス州にあるSpaceXの宇宙船開発拠点「スターベース」を訪れ、初号機をイーロン・マスクCEOに手渡しました。AI開発の常識を覆すこの新製品は、15日から4,000ドルで受注が開始されます。

DGX Sparkの最大の特徴は、その小型な筐体に詰め込まれた圧倒的な性能です。1秒間に1000兆回の計算が可能な1ペタフロップスの演算能力と、128GBの大容量ユニファイドメモリを搭載。これにより、従来は大規模なデータセンターでしか扱えなかった最大2000億パラメータのAIモデルを、個人のデスク上で直接実行できます。

NVIDIAの狙いは、AI開発者が直面する課題の解決にあります。多くの開発者は、高性能なPCでもメモリ不足に陥り、高価なクラウドサービスデータセンターに頼らざるを得ませんでした。DGX Sparkは、この「ローカル環境の限界」を取り払い、手元で迅速に試行錯誤できる環境を提供することで、新たなAIワークステーション市場の創出を目指します。

この卓上スパコンは、多様なAI開発を加速させます。例えば、高品質な画像生成モデルのカスタマイズや、画像の内容を理解し要約する視覚言語エージェントの構築、さらには独自のチャットボット開発などが、すべてローカル環境で完結します。アイデアを即座に形にできるため、イノベーションのスピードが格段に向上するでしょう。

DGX Sparkは10月15日からNVIDIAの公式サイトやパートナー企業を通じて全世界で注文可能となります。初号機がマスク氏に渡されたのを皮切りに、今後は大学の研究室やクリエイティブスタジオなど、世界中のイノベーターの元へ届けられる予定です。AI開発の民主化が、ここから始まろうとしています。

OpenAI、評価額5000億ドルで世界首位の未公開企業に

驚異的な企業価値

従業員保有株の売却で価値急騰
評価額5000億ドル(約75兆円)
未公開企業として史上最高額を記録

人材獲得競争と資金力

Metaなどへの人材流出に対抗
従業員への強力なリテンション策
ソフトバンクなど大手投資家が購入

巨額投資と事業拡大

インフラ投資計画を資金力で支える
最新動画モデル「Sora 2」も発表

AI開発のOpenAIが10月2日、従業員らが保有する株式の売却を完了し、企業評価額が5000億ドル(約75兆円)に達したことが明らかになりました。これは未公開企業として史上最高額であり、同社が世界で最も価値のあるスタートアップになったことを意味します。この株式売却は、大手テック企業との熾烈な人材獲得競争が背景にあります。

今回の株式売却は、OpenAI本体への資金調達ではなく、従業員や元従業員が保有する66億ドル相当の株式を現金化する機会を提供するものです。Meta社などが高額な報酬でOpenAIのトップエンジニアを引き抜く中、この動きは優秀な人材を維持するための強力なリテンション策として機能します。

株式の購入者には、ソフトバンクやThrive Capital、T. Rowe Priceといった著名な投資家が名を連ねています。同社は8月にも評価額3000億ドルで資金調達を完了したばかりであり、投資家からの絶大な信頼と期待が、その驚異的な成長を支えていると言えるでしょう。

OpenAIは、今後5年間でOracleクラウドサービスに3000億ドルを投じるなど、野心的なインフラ計画を進めています。今回の評価額の高騰は、こうした巨額投資を正当化し、Nvidiaからの1000億ドル投資計画など、さらなる戦略的提携を加速させる要因となりそうです。

同社は最新の動画生成モデル「Sora 2」を発表するなど、製品開発の手を緩めていません。マイクロソフトとの合意による営利企業への転換も視野に入れており、その圧倒的な資金力と開発力で、AI業界の覇権をさらに強固なものにしていくと見られます。

マイクロソフト、イスラエル軍へのクラウド提供停止 パレスチナ人監視利用で

マイクロソフトは2025年9月25日、イスラエル国防省の一部門に対し、クラウドサービス「Azure」と一部AIサービスの提供を停止したと発表しました。内部調査の結果、同社の技術がパレスチナ人の通話データを監視・保存するために利用されていたことが判明したためです。この決定は「民間人の大量監視を助長しない」という同社の原則に基づくもので、大手テック企業が国家の利用方法を問題視し、契約を打ち切る異例の対応となります。 同社のブラッド・スミス副会長はブログで「我々はこの原則を世界中の国で適用してきた」と強調しました。顧客のプライバシー保護のため通常は利用内容を確認できませんが、8月の英ガーディアン紙の報道が調査のきっかけになったと説明。報道がなければ問題を認識できなかったとし、その重要性を認めました。 問題視されたのは、イスラエル軍の諜報部門「ユニット8200」による利用です。同部門はパレスチナ人の通話データを監視・収集し、その膨大なデータをAzureのクラウドストレージに保管していたと報じられていました。マイクロソフトは、この利用が標準的な利用規約に違反すると判断しました。 この問題を巡り、マイクロソフトは社内外から厳しい批判にさらされていました。イスラエルとの契約に反対する従業員による抗議活動が頻発し、幹部のオフィスでの座り込みや、抗議を理由とした従業員の解雇といった事態にも発展していました。今回の決定は、こうした圧力も背景にあるとみられます。 今回の決定は、AIやクラウドを提供する企業が、技術の利用方法についてより強い倫理的責任を負うことを示唆します。顧客が国家機関であっても、倫理規定に反すればサービスを停止するという厳しい姿勢は、他のテック企業にも影響を与える可能性があります。技術の意図せぬ利用リスクをどう管理するかが、今後の大きな課題となるでしょう。

Nvidia追撃のGroqが7.5億ドル調達 AI推論特化LPUで69億ドル評価へ

資金調達と企業価値

新規調達額は7.5億ドルを達成
ポストマネー評価額69億ドルに到達
1年間で評価額2.8倍に急伸
累計調達額は30億ドル超と推定

技術的優位性

NvidiaGPUに挑む独自チップLPUを採用
AIモデル実行(推論)特化の高性能エンジン
迅速性、効率性、低コストを実現
開発者200万人超が利用、市場浸透が加速

AIチップベンチャーのGroqは先日、7億5000万ドルの新規資金調達を完了し、ポストマネー評価額69億ドル(約1兆円)に到達したと発表しました。これは当初予想されていた額を上回る結果です。同社は、AIチップ市場を支配するNvidiaGPUに対抗する存在として、推論特化の高性能なLPU(言語処理ユニット)を提供しており、投資家の高い関心を集めています。

Groqの核となるのは、従来のGPUとは異なる独自アーキテクチャのLPUです。これは、AIモデルを実際に実行する「推論(Inference)」に特化して最適化されており、推論エンジンと呼ばれます。この設計により、Groqは競合製品と比較して、AIパフォーマンスを維持または向上させつつ、大幅な低コストと高効率を実現しています。

Groqの技術は開発者や企業向けに急速に浸透しています。利用する開発者の数は、わずか1年で35万6000人から200万人以上へと急増しました。製品はクラウドサービスとして利用できるほか、オンプレミスのハードウェアクラスターとしても提供され、企業の多様なニーズに対応できる柔軟性も強みです。

今回の調達額は7.5億ドルですが、注目すべきはその評価額の伸びです。Groq評価額は、2024年8月の前回の資金調達時(28億ドル)からわずか約1年で2.8倍以上に膨らみました。累計調達額は30億ドルを超えると推定されており、AIインフラ市場における同社の将来性に、DisruptiveやBlackRockなどの大手が確信を示しています。

創業者のジョナサン・ロス氏は、GoogleTensor Processing Unit(TPU)の開発に携わっていた経歴を持ちます。TPUGoogle CloudのAIサービスを支える専門プロセッサであり、ロス氏のディープラーニング向けチップ設計における豊富な経験が、Groq独自のLPU開発の基盤となっています。

GV、CI/CDのBlacksmithに再投資 ベアメタル活用で開発を加速

異例の速さで資金調達

GVがわずか4ヶ月で追加投資
シリーズAで1000万ドルを調達完了
ARR(年間収益)は350万ドルに急増

開発速度を革新する技術

CI/CD処理にベアメタルを採用
処理速度を最大2倍に高速化
計算コストを最大75%の大幅削減

継続的インテグレーション・デリバリー(CI/CD)を提供するスタートアップBlacksmithは、シードラウンドからわずか4ヶ月で、Google Ventures(GV)主導のシリーズAラウンドを実施し、1000万ドル(約15億円)を調達しました。AI駆動のソフトウェア開発が加速する中、コードのリリース速度を劇的に高める同社の実績と市場拡大の可能性が評価され、GVは異例の速さで追加投資を決定しました。

Blacksmithの成長は目覚ましいものがあります。今年2月にわずか4人のチームでARR(年間経常収益)100万ドルを達成しましたが、現在は従業員8名体制でARRは350万ドルに急増しています。顧客数も700社を超えており、この短期間での確かな実績が、GVが短期間で大規模な追加投資を決断する決め手となりました。

同社の最大の強みは、従来のCI/CDプロセスが抱える高コストで予測不可能なテスト実行の課題を解消した点です。一般的なクラウドサービスをレンタルするのではなく、高性能なゲーミンググレードのCPUをベアメタル環境で活用しています。これにより、同社はリソースの経済性を完全に制御しています。

この独自のアプローチの結果、Blacksmithは顧客企業に対し、処理速度を最大2倍に高め、計算コストを最大75%削減できると主張しています。導入も容易であり、既存のコードを一行変更するだけで切り替えが完了します。これにより、企業は数分以内にコードの出荷プロセスを高速化することが可能です。

Blacksmithは、主にエンジニアを500人以上抱える大規模な開発チームをターゲットとしています。同サービスはGitHub Actionsと連携し、テスト分析や深い可視化機能を提供することで、既存のCI/CDプラットフォームを補完します。AIエージェントの普及は開発市場を広げ、同社の成長を後押ししています。

創業者は、Cockroach LabsやFaireなどの企業で大規模な分散システムを構築した経験を持ちます。CIにおけるビルドやユニットテストの非効率性を痛感した経験が、このサービス開発の原点です。今回のシリーズAには、Cockroach LabsのCEOら既存投資家も再参加しています。

AIで人事業務を変革。msgがBedrock活用し高精度な人材配置を実現

導入の背景と目的

HRデータが非構造化・断片化
候補者マッチングやスキル分析の非効率
人員配置・人材育成の迅速化が急務

Bedrock活用の仕組み

AWS BedrockによるLLM駆動のデータ連携
ハイブリッド検索アプローチで精度向上
SaaSソリューションmsg.ProfileMapの中核機能

経営インパクトと実績

マニュアル検証作業を70%以上削減
高確度な統合提案の精度95.5%達成

ドイツのITサービス企業msgは、Amazon Bedrockを導入し、人事部門におけるデータ連携(ハーモナイゼーション)の自動化に成功しました。これにより、従業員のスキルや能力に関する断片的なデータを高精度で統一。手作業による検証負荷を70%以上削減し、人材配置や育成計画の精度を大幅に向上させています。

多くの企業が直面するのは、HRデータが非構造化文書やレガシーシステムに散在し、フォーマットが不整合である点です。このデータの「不協和音」が、候補者マッチングやスキルギャップ分析を妨げていました。msgは、この課題を解決するため、スケーラブルで自動化されたデータ処理基盤の構築を目指しました。

msgのスキル・能力管理SaaS「msg.ProfileMap」は、多様な入力データを抽出し、AI駆動の調和エンジンに送ります。ここではAmazon BedrockのLLMが活用され、異なるテキスト記述であっても意味的な一致性(セマンティック・エンリッチメント)を確保。重複を防ぎ、一貫性のあるデータへと変換します。

このAI駆動のデータ調和フレームワークは高い効果を発揮しました。社内テストでは、高確率で統合すべき推奨概念について95.5%という高精度を達成しています。また、外部の国際的なベンチマーク(OAEI 2024 Bio-ML)においてもトップクラスのスコアを獲得し、その汎用性の高さを証明しました。

msgがAmazon Bedrockを選定した主な理由は、低遅延な推論実行、柔軟なスケーリング、および運用上のシンプルさです。サーバーレスな完全マネージド型サービスであるため、インフラ管理のオーバーヘッドが不要。消費ベースの課金体系がSaaSモデルに適し、迅速な拡張を可能にしました。

さらに、Bedrockは欧州連合(EU)のAI法やGDPR(一般データ保護規則)などの厳格なコンプライアンス要件を満たす上で重要な役割を果たしました。msgの事例は、複雑なインフラを構築せずに、生成AIとクラウドサービスを組み合わせることで、高精度かつコンプライアンス対応可能なプラットフォームが実現することを示しています。