大手メディアがWayback Machineを遮断、ネットの記録喪失危機

遮断の広がりと背景

23の主要ニュースサイトがクローラー遮断
NYT・USA Today・Redditが対象
AI学習データ流用への懸念が主因
Guardianはアクセス制限で実質排除

記者・市民社会の反発

EFF等が100人超のジャーナリスト署名を集約
事実確認や調査報道に不可欠と訴え
法的証拠としての利用にも影響
Internet Archive側は対話を継続
詳細を読む

米国の大手メディア企業が相次いでInternet ArchiveのWayback Machineによるウェブページ保存を遮断しており、インターネット上の公共記録の保全が危機に瀕しています。AI検出スタートアップOriginality AIの分析によれば、ニューヨーク・タイムズやUSA Today系列など23の主要ニュースサイトがクローラーをブロックしており、Redditも同様の措置を取っています。

遮断の主な理由は、AI企業がInternet Archiveのデータを大規模言語モデルの学習に無断利用することへの懸念です。NYT広報は「Internet Archive上のTimes記事がAI企業によって著作権法に違反する形で利用されている」と主張しています。一方、USA Today側は「特定のブロックではなく、すべてのスクレイピングボットを遮断する全社方針の一環」と説明しています。

これに対し、電子フロンティア財団(EFF)やFight for the Futureなどの団体が100人超のジャーナリストの署名を集め、Wayback Machineの価値を訴える公開書簡をInternet Archiveに提出しました。署名者にはレイチェル・マドー氏やテイラー・ローレンツ氏らが名を連ねています。書簡は「地方紙の廃刊が進む中、デジタル報道の記録保全はInternet Archiveに委ねられつつある」と指摘しています。

Wayback Machineは30年の歴史を持ち、1兆ページ以上のウェブアーカイブを保有する代替不可能な公共インフラです。調査報道の事実確認、法廷での証拠引用、行政データの変更追跡など多岐にわたる用途で利用されてきました。実際にUSA Todayは自社がクローラーを遮断する一方、ICEの拘留データ追跡にWayback Machineを活用した調査報道を公開しており、矛盾が浮き彫りになっています。

Internet Archiveのマーク・グラハム氏はNYTなどとの対話を継続中としつつ、「公開ウェブの囲い込みが進むことで、社会が世界の実態を把握する能力が損なわれている」と警鐘を鳴らしています。近年の著作権訴訟や音楽出版社との和解を経てなお、メディア遮断という新たな脅威が同組織の存続的課題となっています。