堅牢で普遍的な方法で Web サイトの年齢 (ホスト/ドメイン登録の年齢ではない) を判断する方法を知りたいです。
例として、このサイトを取り上げます。
ほとんどの場合、年齢/日付 (この場合は 2011 年 12 月 21 日) がサイトに表示されますが、ページからこの情報を取得する一般的な方法はありません (ページの META タグにある可能性があります)。 、ヘッダー...)
見出しをググると、Google は年齢を表示します (最初の結果; 灰色; したがって、Google はこの情報を何らかの方法で抽出しました)。
http://i.stack.imgur.com/BcXwo.png [これを画像として埋め込む権限がありません]
横に、同じニュースを掲載した他のサイトがあり (報道機関からのものだと思います)、Google はそれらのサイトの年齢も表示しますが、テキストでの出現にもかかわらず、最後のサイトの年齢は表示しません (最初の行; 12 月 21 日水曜日) 、2011)。
Q1)普遍的な方法で年齢を決定する方法は?
Q2) Google はどのようにそれを行うのですか? URL がインデックスに表示されたのはちょうどその時ですか? では、最終結果の日付がないのはなぜですか?
Q3)実際にGoogleから取得する以外に方法がない場合、いくつかのドメインに対してどのように自動的に取得できますか? 多数の自動化されたリクエストの後、Google はそれ以上のリクエストの送信をブロックまたは防止します。Google カスタム検索 API を調べましたが、データが結果に表示されません。
ありがとう!