0

初心者のテキストマイナーとして、私は本当に私の本当のニーズに基づいて、グラフマイニングに関するアドバイス/ガイドラインを求めたいと思っています。最初の入力キーワードからキーワード関連のグラフを作成します。

トピックが比較的大きいことはわかっているので、まずTwitterでやりたいと思います。「調査」と「市場」というキーワードのツイートコーパスを収集しました。そのコーパスからマイニングして、「調査」または「市場」に関連するキーワードのグラフを作成したいと思います。

NodeXLとNLTKを使用してみましたが、やりたいことができませんでした。

4

1 に答える 1

3

あなたの目標が何であるかはよくわかりませんが、ここにいくつかの提案があります。
作成できるグラフのタイプにはいくつかのオプションがあります。

  • 一方にツイート、もう一方にキーワードを含む 2 部グラフを作成できます。
  • 頂点がつぶやきで、エッジが一般的な用語を表すネットワークを構築できます
  • または、頂点がキーワードであり、エッジがキーワードが同じツイートに表示されたことを表すネットワークを構築できます。
それはすべて、何を発見しようとしているかによって異なります。

いくつかの提案については、http://www.kdnuggets.com/websites/twitter-analytics-data-mining.htmlをご覧ください。

IEEEおよび/またはACMによって発行されたTwitterのグラフベースのマイニングに関する優れた論文も多数あります

于 2012-11-06T04:53:23.090 に答える