Internet Archive Wayback Machineの使い方 ~Webサイトの過去のキャッシュを閲覧する~

広告
eyecatch

Internet Archive Wayback Machine は世界中のサイトの過去のデータを保存しているサービスです。誤って自分が運営しているサイトのデータを削除してしまった場合にも Wayback Machine を探すことでデータが見つかるかもしれません。また取得しようとしているドメインで過去にどんなサイトが運営されていたのかを調べたい場合にも便利です。ここでは Internet Archive Wayback Machine の使い方について解説します。

(2020 年 01 月 22 日公開 / 2020 年 01 月 22 日更新)

指定したURLで過去に公開されていたページを閲覧する

Internet Archive Wayback Machine を利用する次の URL へアクセスして下さい。

https://archive.org/web/

指定したURLで過去に公開されていたページを閲覧する(1)

閲覧したい URL を画面上部のテキストボックスに入力し、その後で「BROWSE HISTORY」をクリックして下さい。

指定したURLで過去に公開されていたページを閲覧する(2)

日付を選択する画面が表示されます。「Saved 183,373 times between November 20, 1996 and January 22, 2020.」と表示されており、このサイトのデータを初めて取得したのが 1996年11月20日 で、 2020年1月22日 までの期間に 183,373 回データを取得したことが分かります。

指定したURLで過去に公開されていたページを閲覧する(3)

いつ保存されたデータを閲覧したいのか日付を指定します。例として 2004 年の個所をクリックして下さい。

指定したURLで過去に公開されていたページを閲覧する(4)

画面下部に 2004 年のカレンダーが表示されます。カレンダーの中で青い丸が表示されているところがデータを取得した日付です。

指定したURLで過去に公開されていたページを閲覧する(5)

それでは 2004年5月10日 に取得されたデータを閲覧してみます。 5月10日 の個所にマウスを合わせてください。時刻が 3 つ表示されました。 5月10日 はこの 3 つの時間でそれぞれデータが保存されています。

指定したURLで過去に公開されていたページを閲覧する(6)

それではこの中から 21:46:48 をクリックします。

指定したURLで過去に公開されていたページを閲覧する(7)

指定した URL で指定した日時に公開されていたページを保存したデータが表示されました。

指定したURLで過去に公開されていたページを閲覧する(8)

このように指定したサイトの過去のデータを閲覧することができます。ただし閲覧できるのはデータが取得されている場合で、手動でデータを保存していない場合は自動的に取得されたデータしか閲覧することはできません。

なおリンクなども自動的に保存されたデータへのリンクへ書き換えられています。リンク先のデータも保存されている場合にはリンクをクリックすると、保存されたリンク先のデータが表示されます。(ただし同じ日のアーカイブとは限りません)。

指定したURLで過去に公開されていたページを閲覧する(9)

指定したURLで過去に公開されていたページを閲覧する(10)

現在指定したURLで公開しているページを手動で保存する

Internet Archive では世界中のサイトのデータを定期的にクロールしてアーカイブ(保存)していますが、どのタイミングでサイトのデータが保存されるのかは分かりません。そこで任意のタイミングでサイトのデータを保存する機能が用意されています。

サイトのデータを保存するには、 Wayback Machine のサイトの右下にある「Save Page Now」のブロックで行います。

現在指定したURLで公開しているページを手動で保存する(1)

保存したいサイトの URL を入力し、「SAVE PAGE」をクリックして下さい。

現在指定したURLで公開しているページを手動で保存する(2)

オプションが表示されます。オプションの意味については公式サイト上で見つけられなかったので詳細は不明です。「Save outlinks」はリンク先を保存する、「Save error pages」はエラーとなった場合も保存する、「Save screen shot」はスクリーンショットとして保存する、といった意味ではないかと思います。今回はそのまま「SAVE PAGES」をクリックしました。

現在指定したURLで公開しているページを手動で保存する(3)

指定した URL の保存が完了しました。

現在指定したURLで公開しているページを手動で保存する(4)

保存したデータを確認したい場合には画面に表示されている URL をクリックしてください。

現在指定したURLで公開しているページを手動で保存する(5)

保存されたデータを閲覧することができます。

現在指定したURLで公開しているページを手動で保存する(6)

保存されたデータは Wayback Machine のトップページから URL と日付を指定すれば誰でも閲覧できます。

保存されている自分のサイトのデータを削除する

Wayback Machine に保存されている自分のサイトのデータを削除して欲しい場合、公式サイトには次のように記述されています。

https://help.archive.org/hc/en-us/articles/360004651732-Using-The-Wayback-Machine

How can I exclude or remove my site's pages from the Wayback Machine?

You can send an email request for us to review to info@archive.org with the URL (web address) in the text of your message.

記載されているメールアドレス宛にデータを削除したいサイトの URL を記述したメールを送信すればいいようです。ただサイトの運営者以外からは受け付けられないと思いますので、メール送信後に別途認証などが行われるのではないかと思います。

-- --

Internet Archive Wayback Machine を使って指定した URL の過去に公開されていたページを参照したり、指定した URL で現在公開されている内容を保存する方法について解説しました。

( Written by Tatsuo Ikura )

関連記事 (一部広告含む)
Profile
profile_img

著者 / TATSUO IKURA

初心者~中級者の方を対象としたプログラミング方法や開発環境の構築の解説を行うサイトの運営を行っています。