twitter - Twitter検索API+ページング+max_id+ next_page

Question

Twitter検索APIでページング+next_pageの目的は何ですか？-予想どおり、データを中心にピボットすることはありません。

検索APIを試していると、次のクエリが時間の経過とともに変化することに気付きました。このURLは、検索API「next_page」から返されました。

http://search.twitter.com/search.json?page=3&max_id=192123600919216128&q=IndieFilmLove&rpp=100&include_entities=1

トレンドトピックで更新を押すと、ページが一定ではないことに気付くでしょう。

トレンドトピックの15ページすべてを繰り返すと、各ページの最初の数項目で重複が発生します。

データを集約している場合、ページング変数+next_pageは役に立たないようです。ページ1は、トレンドトピックの数分でページ3になります。したがって、新しいデータがページを押し下げているため、各ページの1〜3個のアイテムが重複することになります。

これを回避する唯一の方法は、ここで説明するようにnext_pageやページングパラメータを使用しないことです。

https://dev.twitter.com/discussions/3809

既存の結果セットから最も古いIDをmax_idとして渡します。私はページを渡しません。

データを集約するのに適したアプローチはどれですか？

next_pageを使用できますが、この15ページの実行ですでに処理されているステータスをスキップします。

また

max_idのみを使用し、すでに処理されたものをスキップします

==============

score 2 · Accepted Answer

http://dev.twitter.com/docs/working-with-timelinesの Working with Timelines ドキュメントで、Twitter はタイムラインをページごとにステップスルーするよりも、max_id パラメータを使用してカーソルを移動することを推奨しています。

twitter - Twitter検索API+ページング+max_id+ next_page

1 に答える 1

Related

Reference