3

これは、API への直接アクセスが利用できないことを前提としています。私はすべての投稿をリクエストしているので、RSS が役立つかどうかはわかりません。

年と月ごとにループして各 html ファイルをダウンロードするが、次の URL を年と月のペアごとに変更する単純なシステムを考えました。これは、ワードプレスとブロガーのブログで機能します。

http://www.lostincheeseland.com/2011/05    

しかし、Blogger が提供する次の検索機能を使用して、すべてのブログを返す方法はありますか? 私はそれをいじってみましたが、ドキュメントはまばらなようです。

http://www.lostincheeseland.com/search?updated-max=2012-08-17T09:44:00%2B02:00&max-results=6

私が考慮していない他の方法はありますか?

4

1 に答える 1

5

あなたが探しているのはサイトマップです。

まず、ボットを書いているので、ブログのrobots.txtファイルを確認するのがマナーです。見よ、そこにサイトマップが記載されていることがよくあります。Google ブログの例を次に示します。

User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /search
Allow: /

Sitemap: http://googleblog.blogspot.com/feeds/posts/default?orderby=UPDATED

この場合、サイトマップ URL にアクセスして xml サイトマップを取得できます。

Wordpress の場合も同様ですが、標準で組み込まれていないため、すべてのブログにあるわけではありません。WordPress でこれらのサイトマップを作成する最も一般的な方法であるこのプラグインをご覧ください。たとえば、私のブログではこれを使用しており、サイトマップは/sitemap.xml (標準の場所) にあります。

要するに:

  • robots.txt を確認する
  • 存在する場合は、サイトマップの URL に従ってください
  • それ以外の場合は、/sitemap.xml を確認してください

また 、良きインターネット市民になりましょう!ボットを作成する場合は、必ず robots.txt ファイルに従ってください (blogspot で明示的に使用しない/searchように指示されているように!)

于 2012-09-05T21:59:22.627 に答える