1

トークン化、文検出、さまざまなタグ付け (Name Entity Recognition、POS タグ付けなど) などの一般的なタスクを実行する自然言語処理ツールを選択したいと考えています。私の質問には2つの部分があります:

  1. 自然言語処理ツールを選択する基準は何ですか?
  2. (UIMA、LingPipe、Lucene、Gate、Stanford) の中で、これらの基準をよりよく満たしているのはどれですか?

あなたの提案は何ですか?

4

1 に答える 1

2

いくつかの一般的な基準:

  1. 提供されたモデルでいくつのタスクを実行できますか (たとえば、ツールにはスペイン語のトークン化やタンパク質 NER などのタスクのモデルが含まれていますか?)
  2. 不足しているツールを簡単に追加できます。

ところで、私はNLTKあなたのリストに加えたいと思います。

于 2013-09-18T12:36:20.197 に答える