インターネット上のドキュメントの分析に使用します。
3342 次
2 に答える
5
または、Rにはテキストマイニングに使用できる多くのツールがあり、RPy2を使用してPythonと簡単に統合できます。
CRANの自然言語処理ビューをご覧ください。特に、tm
パッケージを見てください。関連するリンクは次のとおりです。
- Journal of Statistics Computingのパッケージに関する論文:http://www.jstatsoft.org/v25/i05/paper。このペーパーには、 2006年のR-develメーリングリスト(https://stat.ethz.ch/pipermail/r-devel/ )ニュースグループの投稿の分析の良い例が含まれています。
- パッケージのホームページ:http ://cran.r-project.org/web/packages/tm/index.html
- 紹介ビネットを見てください:http://cran.r-project.org/web/packages/tm/vignettes/tm.pdf
さらに、RはHTMLまたはXMLを解析するための多くのツールを提供します。およびパッケージを使用した例については、この質問を参照してRCurl
XML
ください。
于 2009-10-31T17:00:20.127 に答える
3
NLTKが不十分である理由、またはフレームワークを「最良」と見なすために必要な機能について詳しく教えてください。
それにもかかわらず、組み込みのshlex字句解析ライブラリがあります。
このテーマに関する最近の本、Pythonによる自然言語処理もあります。少なくともその一部がNLTKをカバーしているようです。
また、 awaretek Webサイトにあるこのチュートリアルとライブラリのリストも参照してください。これは、 NLQ.pyフレームワークも示しています。
Pythonによる自然言語処理http://ecx.images-amazon.com/images/I/41NBqj7NyGL._BO2.jpg
于 2009-10-28T13:18:34.437 に答える