Googleはインターネットをバックアップしなくなる:キャッシュされたウェブページは死んだ

Googleはインターネットをバックアップしなくなる:キャッシュされたウェブページは死んだ

Google は今後、インターネット全体のバックアップを保持しなくなります。Google 検索の「キャッシュされた」リンクは長い間、ダウンしたウェブサイトや変更されたウェブサイトを読み込むための代替手段でしたが、現在、同社はそれらを廃止しています。Googleの「検索連絡係」であるダニー・サリバン氏は、X投稿でこの機能の削除を認め、この機能は「昔、ページの読み込みに頼ることができなかった時代に人々がページにアクセスできるようにするためのものだった」と述べた。最近では状況は大幅に改善されました。したがって、引退することが決定されました。」

この機能は 12 月以降、一部の人に表示されたり消えたりを繰り返しており、現在、Google 検索にはキャッシュ リンクが表示されません。今のところ、ボタンがなくても、「https://webcache.googleusercontent.com/search?q=cache:」にアクセスしてウェブサイトの URL を入力するか、「cache:」と入力するだけで、独自のキャッシュ リンクを構築できます。 Google 検索に URL を追加します。今のところ、Ars Technicaのキャッシュされたバージョンはまだ動作しているようです。キャッシュされたサイトに関する Google のサポート ページはすべて削除されました。

キャッシュされたリンクは、Google のページのすべての検索結果の横にあるドロップダウン メニューの下に存在していました。Google Web クローラーは、新しい Web ページや更新された Web ページを探してインターネットを探索する際に、表示されているものすべてのコピーを保存します。これにより、Google はすぐに、おそらく数え切れないほどのペタバイトのデータを使用して、基本的にインターネット全体のバックアップを取得するようになりました。Google は現在コスト削減の時代にあり、Google がキャッシュ データの削除を開始できると仮定すると、おそらく多くのリソースを解放できるでしょう。

キャッシュされたリンクは、Web サイトがダウンしている場合やすぐに変更された場合に役立ちますが、「 Google Bot 」Web クローラーが Webをどのように閲覧しているかについて、長年にわたって洞察を得ることができました。ページは必ずしも期待どおりにレンダリングされるわけではありません。以前は、ページはテキストのみでしたが、Google ボットは徐々にメディアや JavaScript などのその他の豊富なデータについて学習しました (現在、特化した Google ボットが大量にあります)。Google Bot の詳細の多くは SEO スパマーから隠すために秘密に包まれていますが、キャッシュされたページがどのようなものかを調査することで多くのことを学ぶことができます。2020 年に Google はデフォルトでモバイルに切り替えたため、たとえば、以前にキャッシュされた Ars リンクにアクセスすると、モバイル サイトが表示されます。ウェブサイトを運営していて、そのサイトが Google Bot からどのように見えるかについて詳しく知りたい場合は、自分のサイトに限りますが、Search Console からそれを行うことができます

キャッシュされたサイトの消滅は、Internet Archive が世界中の Web ページのアーカイブと変更を追跡するという大きな負担を負うことを意味します。

Posted on
News

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です