4

Twitter Streaming API(v1.1)への接続を開くnode.jsアプリケーションを構築しています

複数のキーワード(ハッシュタグと単語)を別々のクエリとしてフィルタリングしたいと思います。私の当初のアイデアは、複数のパブリックストリームを持つことでした。

ただし、アプリケーションごとおよびIPアドレスごとにTwitterストリーミングAPIへのオープン接続は1つしかできないこと、およびTwitterは、必要なものを取得するための創造的なソリューションを考え出すことを推奨していることを理解しています。

だから私の質問はこれです:

statuss / sample (1%だと思います)を使用するなど、フィルターなしでストリーミングし、カスタムjavascriptを使用して出力をフィルター処理する場合、フィルター処理のAPIメソッド(つまり、track ='twitter ')。

編集:私はこれを説明する図を作成しました:

ここに画像の説明を入力してください

ご覧のとおり、2つの出力が同じになるかどうかを知りたいです。両方の出力が事実上同じフィルターであるにもかかわらず、一方のソースが1%のサンプルであり、もう一方のソースが100%のサンプルであるが、そこから1%のツイートしか配信していないため、これらは発生しないと思われます。

それで、誰かが両方の出力が同じであるかどうかを明確にすることができますか?

ありがとうございました。

4

3 に答える 3

2

私の調査結果で私の質問に答えたいと思います。

私は同じ時間枠で両方を並べてテストし、カスタムフィルター方式は複数のフィルターをサポートしているものの、興味深い十分な視覚化を作成するのに十分なツイートを提供しないと結論付けました。

並行フィルターでもっと面白いものを得る唯一の方法は他の方法を調べることだと思いますが、それが不可能かどうか疑問に思っています。多分サードパーティと。

視覚化追跡のスクリーンショット「バラクオバマ」を添付しました。左側はカスタムフィルター、右側はステータス/フィルターです。

ここに画像の説明を入力してください

于 2013-01-17T16:15:35.583 に答える
2

TwitterストリーミングAPIルールによると、追跡するキーワードがグローバルトラフィック全体の1%を超えない場合、すべてのデータを受信します(ネットワークの問題などにより一部のツイートが失われる可能性がありますが、重要ではありません)。これはガーデンホースと呼ばれます(ファイアホースはすべてのデータを提供する特別なフィルターですが、 http://datasift.com/などのサードパーティを通じて有料サービスとして提供されます)

したがって、ツイートがパブリックストリームでフィルタリングされる場合、キーワードセットが広すぎない限り、それもカスタムフィルターの一部になります。

カスタムフィルターを使用すると、複数の検索キーワードを追跡できます。キーワードセットが広すぎるために一部のデータが欠落している場合、Twitterは欠落しているデータの量を示す追跡制限通知を送信します。

カスタムフィルターを使用して、ストリームから取得したものと、Twitterからの同じキーワードの結果として取得したものを分析することをお勧めします。また、Twitterからトラック制限の通知を受け取り始めたら、キーワードセットをチャンクに分割し、さまざまなマシンから実行してさまざまなストリーマーを介してストリーミングを開始します。

フィルタストリーミングの詳細は以下のとおりです(公式ウェブサイトhttps://dev.twitter.com/docs/api/1.1/post/statuses/filterから取得)

1つ以上のフィルター述部に一致するパブリックステータスを返します。ほとんどのクライアントがストリーミングAPIへの単一の接続を使用できるようにする複数のパラメーターを指定できます。GET要求とPOST要求の両方がサポートされていますが、パラメーターが多すぎるGET要求により、URLの長さが長すぎるために要求が拒否される可能性があります。長いURLを避けるために、POSTリクエストを使用してください。

デフォルトのアクセスレベルでは、最大400のトラックキーワード、5,000のフォローユーザーID、および25の0.1〜360度のロケーションボックスが許可されます。Streaming APIへの高度なアクセスが必要な場合は、ここでTwitterデータのパートナープロバイダーを調べる必要があります。

于 2013-01-03T20:49:21.603 に答える
1

statuses/filterAPIは、によって返されたツイートではなく、すべてのツイートに対して機能します。statuses/sampleツイートIDを確認することでわかります。サンプルのツイートはすべて、特定の時間枠からのものです。filterしたがって、ミリ秒の解像度の作成時間から、それがの外のツイートを返すことは間違いなくわかりますsample

ツイートIDからの作成時間とサンプルツイートの時間枠の詳細については、次の投稿を参照してください:http: //blog.falcondai.com/2013/06/666-and-how-twitter-samples-tweets-in。 html

于 2013-06-20T17:00:11.997 に答える