Twitterサーバーが受信するツイートの総数に対するTwitterサンプルAPIから取得するツイートの数の比率を知っている人はいますか?サンプルAPIから読み取ったデータに基づいて分析を行っており、Twitterサーバーによって処理される実際のワークロードを見積もりたいと思います。APIから取得するツイートの数は時間の経過とともに変化することがわかりました。ですから、パーセンテージサンプルのようなものだと思います。手がかりは大歓迎です。
ありがとう
Twitterサーバーが受信するツイートの総数に対するTwitterサンプルAPIから取得するツイートの数の比率を知っている人はいますか?サンプルAPIから読み取ったデータに基づいて分析を行っており、Twitterサーバーによって処理される実際のワークロードを見積もりたいと思います。APIから取得するツイートの数は時間の経過とともに変化することがわかりました。ですから、パーセンテージサンプルのようなものだと思います。手がかりは大歓迎です。
ありがとう
サンプルストリーム/statuses/sample
は、すべてのツイートの約1%を返します。Twitterは、毎秒1,000ミリ秒のうち10ミリ秒のウィンドウ内に作成されたツイートのみを配信することにより、ツイートをサンプリングします。詳細が必要な場合は、私のブログ投稿を読むことができます:http: //blog.falcondai.com/2013/06/666-and-how-twitter-samples-tweets-in.html
Twitter Spritzer(基本的には昔ながらのストリーミングAPI)がリリースされたとき、それはおそらくすべてのツイートの約1〜2%でした。現在のStreamingAPIの使用に基づいて、現在1%を超えていて、おそらくそれよりも少ない場合は驚きます。ドキュメントによると、「Twitterのストリーミング量は一定ではありません」が、APIによって出力される量が実際のツイートの割合に比例するかどうかについては言及していません。
2015年2月2日、TwitterはストリーミングAPIのサンプルレートを1%にリセットする意図を発表しました(意図せずに高くなりました)。
パブリックストリーミングAPIサンプルエンドポイント(別名POSTステータス/フィルターおよびGETステータス/サンプル)は、いつでもパブリックツイートボリュームの約1%で平準化されることを目的としています。
過去の構成の不整合により、ストリーミングAPIを介して配信されるツイートの量がこれらのパラメーターを超えた可能性がある期間がありました。
この通知は、今後数週間で、パブリックストリーミングAPIに変更を加えて、意図した1%の容量でツイートの量を再調整することを示しています。
このプロットは、一般的なツイートストリームに対するリセットの影響を示しています。
これは私が https://brightplanet.com/2013/06/25/twitter-firehose-vs-twitter-api-whats-the-difference-and-why-should-you-care/で見つけたものです。これがお役に立てば幸いです。
調査によると、TwitterのStreaming APIを使用すると、ユーザーはツイートの1%から40%以上までをほぼリアルタイムで受信できると予測されています。
ウェブページの下部に彼らが引用した研究への参照があります。