27

Java用のシンプルだが「十分な」名前付きエンティティ認識ライブラリ(および辞書)を探しています。電子メールとドキュメントを処理し、名前、場所、住所、日付などの「基本情報」を抽出しようとしています。

私は周りを見回してきましたが、ほとんどは重い側にあり、完全な NLP のようなプロジェクトのようです。

推奨事項はありますか?

4

4 に答える 4

23

同様の問題に対する私の以前の回答の1つを見たいと思うかもしれません。

それ以外では、軽量の NER システムのほとんどは、使用するドメインに大きく依存しています。たとえば、生物医学の NER システムに関するツールや論文はたくさんあります。以前の投稿 (NER を実行したい場合の主な推奨事項は既に記載されています) に加えて、検討したいツールがいくつかあります。

もう 1 つ注意してください。入力のトークン化なしでは逃げられません。自然言語のトークン化は少し複雑です。そのため、両方を行うツールボックスを使用することをお勧めします。

于 2008-10-09T19:28:34.410 に答える
1

ところで、私は最近、私が探していた機能を備えていると思われるOpenCalaisに出くわしました。

于 2008-12-23T21:15:22.443 に答える
0

Alchemy APIも試してみてください。オープンカレーに似ています。

于 2011-04-27T20:42:32.750 に答える
0

NLP 文法については、 http://code.google.com/p/graph-expression/およびhttp://gate.ac.uk/を確認できます。

于 2011-04-28T07:06:17.593 に答える