-2

Webからいくつかのテキストをマイニングするためのアプリケーションを実行しようとしていますが、テキストマイニングを実行するための最良の方法がわかりません。

この質問で私が知りたいのは、テキストマイニングを実行し、ドキュメントで情報検索を行うために最もよく使用される手法/アルゴリズム(インデックス作成用ではない)について知っていることです。

4

3 に答える 3

7

テキストマイニングはかなり広い用語であり、大まかに言って、テキストに適用される機械学習を意味します。一般的な手法には、k -meansクラスタリング、単純ベイズおよび線形SVM分類、tf-idfベクトル化、SVD(テキストに適用される場合はLSAと呼ばれる)、潜在的ディリクレ割り当てが含まれます。したがって、「テキストマイニング」を実行することは、「情報検索」を実行することと同じように、ほぼすべてを意味する可能性があります。

この分野の優れた入門書については、 BingLiuの著書「WebDataMining」を参照してください。

于 2011-11-05T12:02:22.867 に答える
0

クラスター分析は、テキストマイニングで最もよく使用される手法だと思います。

于 2011-11-05T01:54:54.000 に答える
-4

最も基本的なテキストマイニング手法は正規表現です。

于 2011-11-06T09:57:45.310 に答える