私は文書分類に関するプロジェクトを行うことに興味があり、これに関連するテキスト マイニングの理論的な部分に役立つ可能性のある本、または分類された文書 (サブカテゴリを含む) を使用したトレーニング データからデータへの移行プロセスを説明する記事の例を探しています。ドキュメントのクラスを予測するシステム。入手可能な (かなり高価な!) タイトルがいくつかあるようですが、これらは小規模で非常に具体的なトピックに関する記事を含む会議議事録です。テキスト マイニングに関するプロジェクトの優れた理論的基礎を提供するデータ マイニングの文献から、具体的にはドキュメントの分類やこのプロセスの概要を説明した記事を提案してくれる人はいますか?
1 に答える
1
Christopher D. Manning、Prabhakar Raghavan、Hinrich Schütze は、無料の情報検索の本を持っています。第 13 章 - テキスト分類と Naive Bayesを試してください。
Manning と Schütze のnlp bookの関連サイト、特にテキスト分類の章へのリンクも参照してください。
Fabrizio Sebastiani は、テキスト分類に関する有用なチュートリアル(PDF)とテキスト分類のための機械学習のレビュー論文(PDF) を書きました。
于 2011-03-09T14:33:19.307 に答える