2

Twitter 検索で取得した特定のツイートのコレクションからトレンド トピックを特定する必要がある Java アプリケーションを実行しています。Web で検索しているときに、特定の時間、つまり正確な瞬間に多数の言及がある場合に、トピックがトレンドであるとアルゴリズムが定義していることがわかりました。したがって、トピックが頻繁に変わるように減衰計算が必要です。ただし、別の疑問があります。

Twitter は、ツイート内の特定の用語が TT であるべきかどうかをどのように判断しますか? たとえば、ほとんどの TT はハッシュタグまたは固有名詞であることがわかりました。これは意味がありますか?それとも、すべての単語を分析して頻度を決定しますか?

誰かが私を助けてくれることを願っています!ありがとう!

4

2 に答える 2

1

Twitter以外は誰も知らないと思いますが、ハッシュタグが大きな役割を果たしているようですが、他にも要因があります. テキスト全体をマイニングするには、必要以上に時間がかかり、誤検知が多すぎると思います。

Mashable の興味深い記事は次のとおりです。

http://www.sparkmediasolutions.com/pdfs/SMS_Twitter_Trending.pdf

-ラルフ・ウィンターズ

于 2011-04-08T18:23:31.603 に答える
0

あなたはミームの追跡に興味があるかもしれません.私が思い出したように、それは固有名詞で興味深いことをしますが、基本的にはストリーム内のトピックがますます人気がなくなるにつれて識別します:

Eddiでは、ソーシャル ステータス ストリームのトピックベースのインタラクティブなブラウジング

于 2011-04-10T15:25:47.177 に答える