0

に関連する Twitter アカウントを見つけるように依頼されましたDominican Republic(このプロジェクトは投票に関係していました)。一部の Twitter アカウントにはアカウントに関連付けられた GeoSpatial データが含まれているため、これは奇妙な要求でした。それが正確かどうかはわかりません。

私は関連しているとわかっているキーワードを手で検索することになり#dominican#washingtonheights彼らの友人やフォロワーに飛び乗って、探していた人々を見つけました.


より一般的には:

特定のトピックに関連する Twitter アカウントを検索するにはどうすればよいですか? 特定のトピックに関連するハッシュタグを識別するようにボットをトレーニングするにはどうすればよいでしょうか? そして、それらのキーワードを検索できます。


@Moderators : これはコーディングに関する質問ではありません。より良い StackExchange を考えられる場合は、これを移行してください!

4

1 に答える 1

0

あなたはすでに特定のトピックを持っているので、私は彼に次のことを提案します:

  1. すでに言及したこれらのハッシュタグを使用して、いくつかのアカウントを手動で取得します。
  2. これらのアカウントの X 件のツイートを取得する
  3. これらのツイートの自然言語処理を行って、キーワードの新しいアイデアを取得します。

この/類似のコンテキストで使用したいくつかのもの:

  • tf-idf + NMF を使用してトピックを取得し、コンポーネントで並べ替えて、ユーザーが話しているトピックを取得します (ユーザーは複数のトピックを持つことができます)。
  • ある種のクラスタリング (ここでの最大の問題は、データの予備性が高いため、PCA がオプションになる可能性があります)
  • ワードネットなどを使って類似キーワードを集める
于 2013-11-08T09:52:24.437 に答える