1

通常の URL を持っている場合、Blogger ブログからコメントを取得する方法を探していました。html をスクレイピングすることで blogID を取得できることは知っていますが、これはやや不愉快ですが、標準的な取得方法がいくつかあります。問題は、投稿の URL とブログ ID しかわからない場合、特定の投稿のコメントを取得する方法を見つけることができなかったことです。私が知る限り、HTML から postID を確実にスクレイピングすることはできず、単一の投稿のコメントを取得するには postID が必要なようです。

また、blogID API 呼び出しの最新の投稿の取得は、投稿が最新の 10 または 15 のいずれかである場合にのみ役立ちます。したがって、それが少し古い投稿である場合、おそらくそのオプションは使用できません。これを行う適切な方法を知っている人はいますか?私は主に Java ソリューションを探していますが、別の言語のソリューションがあれば、喜んで Java に移植します。

4

1 に答える 1

1

この質問は頻繁に尋ねられ、ほとんど答えられないように思われるので、私は自分の調査結果を文書化したかっただけです。

基本的に、単一のブロガーURLのコメントを取得するには、postIDが必要です。postIDをお持ちの場合は、BloggerAPIを使用できます。投稿のURLしかない場合は、デフォルトの投稿コメントフィードを探して、ある程度信頼できるオプションが1つしかないようです。これを見つけるには、フォームのhtmlタグを探す必要があります

特に、このために機能するJava正規表現は次のとおりです。

Pattern p = Pattern.compile("http://.*/feeds/[0-9]+/comments/default");

このリンクタグが存在しない場合、ブログにはDisqus、Echo、IntenseDebateなどのサードパーティのコメントシステムがインストールされている可能性があります。

于 2010-08-07T00:02:14.550 に答える