1

Sina Weibo は中国のマイクロブログ Web サイトで、この Web サイトの各ユーザーのブログ投稿数を取得するスクレイピング プロジェクトを行っています。

ウェブサイトの URL: http://blogus.sina.com/gb/hotbloger/#top

このページでは、すべてのユーザーのリストを表示できます。各ユーザーをクリックすると、対応するブログ ページにリダイレクトされます。各ユーザーの投稿数を (日付と時刻を確認して) 取得したいと考えています。

詳細APIを取得するためのAPIを提供しています: http://open.weibo.com/wiki/API%E6%96%87%E6%A1%A3/en

しかし、これらの指定された詳細を取得するための API 呼び出しが見つかりません。詳細を取得する他の方法はありますか?または、ウェブサイトを直接スクレイピングできますか? 助けてください。

4

1 に答える 1

0

API メソッドを使用して、ユーザーに関する情報を取得できます2/users/show

たとえば、あなたが言及したページの最初のリンクは次のとおりです。

http://redirect.sina.com/blogus/u/blog.sina.com.cn/u/1763875377

これは、ユーザー ID 1763875377 のページへのリダイレクトです。したがって、 を呼び出すだけhttps://api.weibo.com/2/users/show.json?uid=1763875377で、特にこのユーザー ( ) の投稿数が返されます"statuses_count":1583

/2/users/countsエンドポイントを使用して、複数のユーザーの投稿数を一度に取得することもできます。

これらの呼び出しを認証して実行するには、アクセス トークンが必要です (基本的には、アプリケーションを Weibo に登録する必要があります)。

于 2014-06-12T14:04:43.167 に答える