テキスト分析を行い、エンティティを抽出するライブラリを探しています。
エンティティのタイプ/分類は重要ではありません。重要なのは価値のあるものの識別です。この場合のエンティティユニバースは無限であり、固定辞書に制限されていません。
それを行うWebサービスがいくつかあるようです(NERDではこれらのWebサービスの結果を比較できます:http://nerd.eurecom.fr/documentationこれは非常に便利です)が、私はローカルを探していますライブラリであり、リモートでホストされるサービスではありません。私はJavaまたは.NETを好みますが、それが優れたライブラリである場合は、それが記述されている言語をすべて学習します。
同様のトピックに関する古いスレッドはほとんどなく、この分野での新しい開発や、低レベルのNLPライブラリの上に構築されたライブラリを見つけることを望んでいました。
- LuceneIndexのフィード中の無料ツールによるエンティティの抽出/認識
- Luceneエンティティの抽出
- Luceneでエンティティ抽出を行うにはどうすればよいですか
- https://stackoverflow.com/questions/tagged/named-entity-extraction
- https://stackoverflow.com/questions/tagged/named-entity-recognition
まともな仕事をする良い図書館について誰か知っていますか?