Google キャッシュ内で検索しようとしているので、次のクエリを起動する必要があります。
http://webcache.googleusercontent.com/search?q=cache:news.ycombinator.com/news+hacker+news
ページからタイムスタンプなどのコンテンツを取得します。しかし、curl (ruby) を使用してこれを行うと、権限が拒否されたというエラーが表示されます。つまり、スクレイピングがブロックされており、これは予期されていたことです。
では、Google キャッシュ (API または何らかの回避策のスクレイピング) を検索し、タイムスタンプなどの情報を抽出する方法はありますか?