2

数日前、happn.inがツイート(twitter.comのメッセージ)をグループ化して地域ごとに分析するサービスを提供しているのを見ました。いくつかの都市では、トレンド用語のリストが表示されます。

彼らがこれをどのように行うかを正確に知ることはできないことを私は知っていますが、多分あなたは私を助けることができます:私もこれをどのように行うことができますか?私にはいくつかのアプローチがあります。それらの1つは役に立ちますか?

  • アプローチ1

REST API public_timelineを使用して、毎回すべてのツイートを確認してください。パターンとフィッティングの場所のリストを作成します。たとえば、「ニューヨーク」と「NY」は「ニューヨークシティ」に移動し、「ロサンゼルス」と「LA」は「ロサンゼルス」に移動します。パターン、あなたは次のツイートを続けます。

  • アプローチ2

Search APIジオコード機能を使用します(例:「http://search.twitter.com/search.atom?geocode=##LAT##%2C##LONG##%2C##radius##km」)。残念ながら、結果が信頼できる/良いかどうかはわかりません!?

  • アプローチ3

ロケーションフィールドに都市名があるユーザーをフォローし、RESTAPIのfriends_timelineを分析します

他にアイデアはありますか?

あなたが私を助けてくれることを願っています。前もって感謝します!

4

3 に答える 3

4

アプローチ1-パブリックタイムラインに繰り返しクエリを実行しても、すべてのツイートが表示されるわけではありません。ツイートが多すぎます。最近のものを20個取得し、Twitterサーバーはそれらを一時的にキャッシュするため、ハンマーで叩き続けても同じ結果が得られます。更新をプッシュするXMPPフィードがありますが、アクセスを申請する必要があります。

アプローチ2およびアプローチ3-これらのいずれの場合でも、ユーザーが真実の情報を提供することに依存しています。ユーザーがそれを省略したり嘘をついたりするのを妨げるものは何もありません。

アプローチに関係なく、繰り返しクエリを実行する場合は、APIの制限にも注意する必要があります。全員がデフォルトで取得する100ではなく、20,000リクエスト/時間を提供するホワイトリストに登録されたアカウントを申請することを検討してください。

そうは言っても、2と3の方が1よりも良い結果が得られます。「firehose」xmppフィードにアクセスし、場所または地理コードを使用すると、おそらく最良の結果が得られます。それでも、100%信頼できる完全情報を取得することはおそらくないでしょうが、それがおそらく最善の方法です。

gnip.comもご覧ください。彼らはツイッターの消防ホースにアクセスでき、どういうわけかあなたのためにそれをフィルタリングして再パッケージ化できると私は信じています。私は彼らのサービスについてあまり知らないことを告白しますが、それは私のやることリストに載っています。あなたはこれにお金を払わなければならないかもしれません。

于 2009-06-08T20:35:47.830 に答える
1

happn.inは実際には本当に単純です:

都市ごとに異なるユーザー(つまり、その都市の人々をフォローするhappn_in_ny)があり、そのユーザーの友達のタイムラインを使用して分析します。

于 2009-06-04T20:34:21.010 に答える
1

最初の2つを組み合わせて実行できます。

http://search.twitter.com/search?q=near%3ANYC+within%3A15mi(彼らの例が言うように)&geocode = whatever_NY_geocode_may_be

于 2009-06-12T02:34:02.237 に答える