caching - インターネットからキャッシュされた Web データ (Google Cache、Wayback Machine など) を使用する

Question

Google Cache を使用して、他の Web サイトの Web ページにアクセスしなくてもアクセスできるようにしたいと考えています。

このようなクエリを実行http://webcache.googleusercontent.com/search?q=cache:<URL without SCHEME>すると、データを取得できます。

私は次のことを見つけました/仮定します（質問0.それらのいずれかが間違っている場合は修正してください）：

質問 1. Google のキャッシュには最近クロールされたページしか表示されないことはわかっていますが、このデータがどれくらい古いかについて何か考えはありますか?

質問 2. その Web サイトにアクセスしたすべてのヒットを Google キャッシュに移動する予定がある場合、問題はありますか (Web サイトがキャッシュされており、古いページがほとんどなくても問題ないと仮定します)?

質問 3. Wayback Machine はデータを提供しますが、データのクロールと表示の間に大きな遅延があります。最近アーカイブされたデータ (Wayback マシンや Google キャッシュなど) を取得できるディレクトリはありますか?

score 2 · Accepted Answer

Googleのキャッシュには最近クロールされたページしか表示されないことは知っていますが、このデータがどれくらい古い可能性があるかについて何か考えはありますか？

URLでcache：演算子を使用します

そのウェブサイトにヒットしたすべてのヒットをGoogleキャッシュに移動する予定がある場合、問題はありますか（ウェブサイトがキャッシュされていて、古いページがほとんどなくても問題ないと仮定します）。

最近アーカイブされたデータを取得できるディレクトリはありますか？

URLでtbs=qdr：クエリパラメータを使用します

score 0 · Accepted Answer

質問 3 については、以前はすべての Wayback Machine の Web キャプチャが 6 か月前のものでしたが、それは 2012 年にはすでに真実ではなくなり、2016 年の現在では非常に真実ではありません。新しいコンテンツがたくさんあります。

2 に答える 2