python - NLTKの他に、Pythonに最適な情報検索ライブラリは何ですか？

Question

インターネット上のドキュメントの分析に使用します。

score 5 · Accepted Answer

または、Rにはテキストマイニングに使用できる多くのツールがあり、RPy2を使用してPythonと簡単に統合できます。

CRANの自然言語処理ビューをご覧ください。特に、tmパッケージを見てください。関連するリンクは次のとおりです。

さらに、RはHTMLまたはXMLを解析するための多くのツールを提供します。およびパッケージを使用した例については、この質問を参照してRCurlXMLください。

score 3 · Accepted Answer

NLTKが不十分である理由、またはフレームワークを「最良」と見なすために必要な機能について詳しく教えてください。

それにもかかわらず、組み込みのshlex字句解析ライブラリがあります。

このテーマに関する最近の本、Pythonによる自然言語処理もあります。少なくともその一部がNLTKをカバーしているようです。

また、 awaretek Webサイトにあるこのチュートリアルとライブラリのリストも参照してください。これは、 NLQ.pyフレームワークも示しています。

2 に答える 2