Internet Archiveは4年ごとにアメリカ政府のウェブサイトを丸ごと保存しており2024年から2025年にかけて500TB以上アーカイブ

Internet Archiveは4年ごとにアメリカ政府のウェブサイトを丸ごと保存しており2024年から2025年にかけて500TB以上アーカイブ #ニュース・社会・コラム
🕸️ Internet Archive、アメリカ政府ウェブサイトを500TB超アーカイブ – 2024/2025年版

🕸️ Internet Archive、アメリカ政府ウェブサイトを500TB超アーカイブ – 2024/2025年版

ウェブアーカイブサービス「Wayback Machine」を運営する Internet Archive は、アメリカ大統領の任期満了ごとに政府のウェブサイトをアーカイブする「End of Term Web Archive」プロジェクトを実施しています。2024年から2025年にかけての今回、500TB以上のデータを収集し、1億を超えるウェブページを保存したことを発表しました。

この記事では、プロジェクトの概要や保存されるコンテンツの種類、保存されたページを閲覧する方法についてわかりやすく解説します。🔍

🏛️ End of Term Web Archiveとは?

End of Term Web Archive(通称:EOT Archive) とは、アメリカ大統領の任期終了時に政府のウェブサイトを網羅的にアーカイブするプロジェクトです。
この取り組みは、政権交代時に政策や政府機関の公式記録が 削除・変更されるリスク から、国民のために記録を残すことを目的としています。

🔹 これまでの実施年

  • 2008年(ブッシュ→オバマ)
  • 2012年(オバマ再選)
  • 2016年(オバマ→トランプ)
  • 2020年(トランプ→バイデン)
  • 2024年(バイデン→次期大統領)

🌐 保存対象となるウェブサイトの範囲

  • 🇺🇸 政府公式サイト(.gov/.milドメインなど)
  • 🧑‍⚖️ 立法・行政・司法機関のウェブサイト
  • 📱 政府公式SNS(X、Facebookなど)

⚠️ 地方自治体のサイトや .com ドメインを使用する一部の政府関連サイトは保存対象外です。

ジョー・バイデン前大統領政権が2025年1月20日に終了するのを受けて、Internet Arciveを含む各種機関はこれまでと同様にウェブサイトの保存を開始。Internet Archiveなどが「保存すべき」と判断したウェブサイトは以下から確認可能で、記事作成時点で1万1311件のURLが登録されています。Nomination Tool: Project URL Nominationhttps://digital2.library.unt.edu/nomination/eth2024/

🗂️ 今回の成果:2024/2025年版のアーカイブ

Internet Archiveは、2025年2月6日に次の実績を報告しました:

  • 🖥️ 収集済みデータ量500TB以上
  • 📄 保存ウェブページ数1億ページ超
  • ⚙️ 進捗状況:プロセスの 3分の2 が完了

Wayback Machineディレクターの マーク・グラハム 氏は、次のようにコメントしています:

「政府の記録や成果に国民がいつでもアクセスできることは非常に重要です。政府が公開した情報の多くは、健康、安全、教育などの面で国民に恩恵をもたらすものです。」

政府機関の名前といったキーワードやURLを入力して「SEARCH」をクリック。

ウェブページの一覧が表示されるので、目的のページをクリックすると保存されたページを閲覧することが可能です。

📑 保存されるデータの種類

End of Term Web Archiveでは、以下のような多様なコンテンツが保存されます:

🖼️ 画像ファイル:JPEG、PNG、GIFなど
📝 文書ファイル:PDF、CSV、Excel
🎞️ 動画・音声:マルチメディアコンテンツ
🗺️ 地理データ:GeoJSON形式など
🌐 HTMLファイル:ウェブサイトのHTMLデータ

これにより、政府のウェブサイトが閉鎖・変更されても、過去の情報を正確に確認することが可能です。

🔍 保存データの閲覧方法

実際にアーカイブされたウェブページは、 Wayback Machine で誰でも閲覧できます。

💻 手順ガイド

  1. Wayback Machine のトップページへアクセス 👉 Wayback Machine
  2. 検索バー下の「Collection Search」をクリック
  3. ドロップダウンメニューから「End of Term (US Gov 2024)」を選択
  4. キーワードやURLを入力して「SEARCH」をクリック

これで、2024/2025年版のアーカイブに保存された政府関連サイトの一覧が表示されます。

🎯 保存対象のサイトリストを確認する

End of Term Web Archiveに登録された保存対象サイトは、以下の公式ページで確認可能です:
🔗 Nomination Tool: Project URL Nomination


🧩 このプロジェクトが重要な理由

アメリカ政府のウェブサイトは、政権交代の際に内容が書き換えられたり、削除されたりすることが少なくありません。

📜 例1:オバマ政権からトランプ政権への交代時、気候変動に関するページが削除され、大きな議論となりました。
📜 例2:トランプ政権からバイデン政権への交代時には、移民政策関連のページが大幅に更新されました。

こうした政府の記録は、将来の政策分析や歴史研究にとって重要な情報です。Internet Archiveは、これらのデータを「未来の世代に向けた公共財」として提供し続けています。


🌏 Internet Archiveとは?

Internet Archive は1996年に設立された非営利団体で、世界中のウェブサイトを記録し、アーカイブする活動を行っています。
代表的なサービス「Wayback Machine」では、インターネット上のあらゆるページを過去の状態で閲覧可能です。

🔍 その他の活動

  • 電子書籍アーカイブ:デジタル図書館の運営
  • 音楽・動画保存:過去の映像や音声資料を保存
  • 歴史的資料の保存:アルバなどの国と連携して文化財をアーカイブ

🎯 まとめ:アーカイブは未来への橋渡し

End of Term Web Archive は、アメリカ政府のウェブコンテンツを未来に残すための重要なプロジェクトです。
インターネット上の情報は常に変わり続けますが、Internet Archiveの活動によって、過去の政策や発言の記録が未来の世代に受け継がれます。

🔹 政府の透明性と情報アクセスの確保
🔹 歴史的記録の保存と分析への貢献
🔹 政策の変更や進展を正確に追跡可能

今後の政権交代に伴い、さらに多くのデータがアーカイブされる予定です。
興味がある方は、ぜひ Wayback Machine でインターネットの「時間旅行」を体験してみてください。🕰️✨

🔗 Wayback Machine公式サイトhttps://archive.org/web

コメント

タイトルとURLをコピーしました