5

テキスト分析を行い、エンティティを抽出するライブラリを探しています。

エンティティのタイプ/分類は重要ではありません。重要なのは価値のあるものの識別です。この場合のエンティティユニバースは無限であり、固定辞書に制限されていません。

それを行うWebサービスがいくつかあるようです(NERDではこれらのWebサービスの結果を比較できます:http://nerd.eurecom.fr/documentationこれは非常に便利です)が、私はローカルを探していますライブラリであり、リモートでホストされるサービスではありません。私はJavaまたは.NETを好みますが、それが優れたライブラリである場合は、それが記述されている言語をすべて学習します。

同様のトピックに関する古いスレッドはほとんどなく、この分野での新しい開発や、低レベルのNLPライブラリの上に構築されたライブラリを見つけることを望んでいました。

まともな仕事をする良い図書館について誰か知っていますか?

4

3 に答える 3

3

次のホストされたエンティティ識別サービスを調査しましたが、使用したことはありません。

オープンカレー

AlchemyAPI

于 2012-12-02T05:04:49.127 に答える
1

Perl に慣れている場合は、いくつかの言語タガー/品詞タガーが利用可能です ( Lingua::TreeTaggerLingua::BrillTaggerが (Google 経由で) 思い浮かびます)。

于 2012-12-02T23:11:06.987 に答える
0

NLTKと Pythonを使用できます。NLTK を使用して NER を実行する例については、この質問を参照してください。

于 2013-03-19T18:59:36.210 に答える