2

私はテキストの単純化に関するプロジェクトを進めています。スタンフォード パーサーなどのテキストのパーサーを提供するオープン ソースがいくつかあります。機械学習を使用してテキストを解析できるパーサーがあるかどうか疑問に思っています!

4

1 に答える 1

1

OpenNLPは、このための非常に優れたオープン ソース ライブラリです。このライブラリをトレーニングして、MaxEnt などの多くの特定の機械学習アルゴリズムを使用して、ニーズに固有のモデルを生成できます。この議論も見ることができます。

OpenNLP には Apache ライセンスが適用されますが、 LingPipeという別のツールも同様の機能を提供しますが、ライセンスは異なります。

Mahoutは機械学習用の優れたライブラリでもありますが、そのためには、他のパーサーまたは独自の実装を使用してテキストから特徴を抽出する必要があります。Mahout には、学習のための機能が必要です。

チュートリアル: 1. OpenNLP チュートリアル 2. LingPipe チュートリアル

于 2012-07-08T04:22:48.670 に答える