1

Twitter検索APIでページング+next_pageの目的は何ですか?-予想どおり、データを中心にピボットすることはありません。

検索APIを試していると、次のクエリが時間の経過とともに変化することに気付きました。このURLは、検索API「next_page」から返されました。

http://search.twitter.com/search.json?page=3&max_id=192123600919216128&q=IndieFilmLove&rpp=100&include_entities=1

トレンドトピックで更新を押すと、ページが一定ではないことに気付くでしょう。

トレンドトピックの15ページすべてを繰り返すと、各ページの最初の数項目で重複が発生します。

データを集約している場合、ページング変数+next_pageは役に立たないようです。ページ1は、トレンドトピックの数分でページ3になります。したがって、新しいデータがページを押し下げているため、各ページの1〜3個のアイテムが重複することになります。

これを回避する唯一の方法は、ここで説明するようにnext_pageやページングパラメータを使用 しないことです。

https://dev.twitter.com/discussions/3809

既存の結果セットから最も古いIDをmax_idとして渡します。私はページを渡しません。

データを集約するのに適したアプローチはどれですか?

next_pageを使用できますが、この15ページの実行ですでに処理されているステータスをスキップします。

また

max_idのみを使用し、すでに処理されたものをスキップします

==============

4

1 に答える 1

2

http://dev.twitter.com/docs/working-with-timelinesの Working with Timelines ドキュメントで、Twitter はタイムラインをページごとにステップスルーするよりも、max_id パラメータを使用してカーソルを移動することを推奨しています。

于 2013-01-10T02:34:18.373 に答える