厳密に普遍的ではない方法があっても、ページを「スクレイピング」せずにこれを行いたいと思います。いろいろ調べてみたところ、ヘッダーから最終更新日を取得できることがわかりましたが、多くのサイトでは返される日付が過去数秒であるため、これはほとんど役に立たないことがわかりました。これは、ページの小さな変更 (コメントなど) が原因のようです。
2 に答える
2
サイトがアトム フィードを提供しているかどうかを確認します。公開日が表示されている必要があります。たとえば、質問のフィードには次のものがあります。
# removed stuff
<entry>
# trimmed some more stuff
<author>
<name>Hassan</name>
<uri>https://stackoverflow.com/users/377628</uri>
</author>
<link rel="alternate" href="https://stackoverflow.com/questions/19384363/is-there-a-way-to-check-the-day-an-article-was-published-on-an-arbitrary-website" />
<published>2013-10-15T14:52:55Z</published>
<updated>2013-10-15T14:52:55Z</updated>
# more stuff here
于 2013-10-15T14:57:45.693 に答える