1

厳密に普遍的ではない方法があっても、ページを「スクレイピング」せずにこれを行いたいと思います。いろいろ調べてみたところ、ヘッダーから最終更新日を取得できることがわかりましたが、多くのサイトでは返される日付が過去数秒であるため、これはほとんど役に立たないことがわかりました。これは、ページの小さな変更 (コメントなど) が原因のようです。

4

2 に答える 2

2

サイトがアトム フィードを提供しているかどうかを確認します。公開日が表示されている必要があります。たとえば、質問のフィードには次のものがあります。

    # removed stuff
    <entry>
        # trimmed some more stuff
        <author>
            <name>Hassan</name>
            <uri>https://stackoverflow.com/users/377628</uri>
        </author>
        <link rel="alternate" href="https://stackoverflow.com/questions/19384363/is-there-a-way-to-check-the-day-an-article-was-published-on-an-arbitrary-website" />
        <published>2013-10-15T14:52:55Z</published>
        <updated>2013-10-15T14:52:55Z</updated>
        # more stuff here
于 2013-10-15T14:57:45.693 に答える