重複の可能性:
Java : 優れた自然言語処理ライブラリはありますか
Java での NLP のライブラリについて誰か教えてもらえますか? 適切に文書化されている場合は本当にいいでしょう。lingpipe で作業しようとしましたが、完全には理解できません。
重複の可能性:
Java : 優れた自然言語処理ライブラリはありますか
Java での NLP のライブラリについて誰か教えてもらえますか? 適切に文書化されている場合は本当にいいでしょう。lingpipe で作業しようとしましたが、完全には理解できません。
Stanford-NLPを試す必要があります。品詞タガーのような NLP 用の多くのユーティリティとライブラリがあり、それらはすべて使いやすく、理解しやすいものです。
今はおそらく少し遅れていますが、プロジェクトを進めたに違いないと思います。しかし、とにかくこのブログをチェックすることができます。Java を使用した nlp に関する一連の投稿があります。Stanford-NLPは、他の人が示唆しているように、使用するのに最適なライブラリです。
ライブラリのほとんどは、字句解析フェーズ (文の分割、トークン化、POS タグ付け、解析など) で役立つため、コードを最初から作成する必要はありません。ではごきげんよう !
これらは、使用できる NLP 用の他の 2 つのライブラリです。
Stanford NLP Group は、洗練された深い言語モデリングとデータ分析を、NLP に対する革新的な確率論的および機械学習アプローチと効果的に組み合わせています。
jRubyを使用してApacheOpenNLPを試してみました。それは非常に素晴らしくて堅実ですが、当時私はこれを十分に文書化して書いていません。OpenNLPを試す場合は、次の記事を読むことをお勧めします。
OpenNLPのドキュメントはここにあります。
これは、OpenNLPを使用して名前付きエンティティ認識を行う私のプロジェクトのコードです。jRubyで書かれています。コードはHerokuで実行され、ファイルシステムに書き込むことができないため、OpenNLPモデルはデータベースに保存されます。
実際には、静かで優れたNLP ツール リストがあります。ドイツ語ですが、Google 翻訳で動作するはずです。しかし、それでもいくつかリストします:
最高の英語が必要な場合は、スタンフォードを使用しますが、GPL v2. それほど人気のない言語の場合は、Treetagger の方が優れています (機能するためには、より小さなトレーニングコーパスが必要なだけです)。たとえば、ドイツ語のテキストで TreeTagger を使用するとより良い結果が得られます。調査はもうわかりませんが、必要な場合は検索できます。OpenNLP は他のツールほど優れていませんが、Apache License v2 の下にあるため、これも考慮する必要があります。