nlp - テキストマイニングの基本的なアルゴリズムは何ですか？

Question

Webからいくつかのテキストをマイニングするためのアプリケーションを実行しようとしていますが、テキストマイニングを実行するための最良の方法がわかりません。

この質問で私が知りたいのは、テキストマイニングを実行し、ドキュメントで情報検索を行うために最もよく使用される手法/アルゴリズム（インデックス作成用ではない）について知っていることです。

score 7 · Accepted Answer

テキストマイニングはかなり広い用語であり、大まかに言って、テキストに適用される機械学習を意味します。一般的な手法には、k -meansクラスタリング、単純ベイズおよび線形SVM分類、tf-idfベクトル化、SVD（テキストに適用される場合はLSAと呼ばれる）、潜在的ディリクレ割り当てが含まれます。したがって、「テキストマイニング」を実行することは、「情報検索」を実行することと同じように、ほぼすべてを意味する可能性があります。

この分野の優れた入門書については、 BingLiuの著書「WebDataMining」を参照してください。

score 0 · Accepted Answer

クラスター分析は、テキストマイニングで最もよく使用される手法だと思います。

score -4 · Accepted Answer

-4

最も基本的なテキストマイニング手法は正規表現です。

于 2011-11-06T09:57:45.310 に答える

nlp - テキストマイニングの基本的なアルゴリズムは何ですか？

3 に答える 3

Related

Reference