0

インターネット上のドキュメントの分析に使用します。

4

2 に答える 2

5

または、Rにはテキストマイニングに使用できる多くのツールがあり、RPy2を使用してPythonと簡単に統合できます。

CRANの自然言語処理ビューをご覧ください。特に、tmパッケージを見てください。関連するリンクは次のとおりです。

さらに、RはHTMLまたはXMLを解析するための多くのツールを提供します。およびパッケージを使用した例については、この質問を参照してRCurlXMLください。

于 2009-10-31T17:00:20.127 に答える
3

NLTKが不十分である理由、またはフレームワークを「最良」と見なすために必要な機能について詳しく教えてください。

それにもかかわらず、組み込みのshlex字句解析ライブラリがあります。

このテーマに関する最近の本、Pythonによる自然言語処理もあります。少なくともその一部がNLTKをカバーしているようです。

また、 awaretek Webサイトにあるこのチュートリアルとライブラリのリストも参照してください。これは、 NLQ.pyフレームワークも示しています。

Pythonによる自然言語処理http://ecx.images-amazon.com/images/I/41NBqj7NyGL._BO2.jpg

于 2009-10-28T13:18:34.437 に答える