次のサンプル単語に対して正しい結果を返す十分な大きさのレンマタイザーデータベースを知っていますか?
geese: goose
plantes: //not found
Wordnetの形態素解析器は、次の誤った結果をもたらすため、十分ではありません。
geese: //not found
plantes: plant
次のサンプル単語に対して正しい結果を返す十分な大きさのレンマタイザーデータベースを知っていますか?
geese: goose
plantes: //not found
Wordnetの形態素解析器は、次の誤った結果をもたらすため、十分ではありません。
geese: //not found
plantes: plant
MorphAdornerはこれで優れているようですが、それでも「植物」に対して誤った結果が見つかります
plantes: plante
geese: goose
たぶん、MorphAdornerを使用してレンマ化を行い、その結果をWordNetと照合したいと思うかもしれません。WordNet APIを使用すると、最初にを呼び出してレンマ化を実行せずfindtheinfo_ds
にルックアップを実行できます。これにより、最初にMorphAdornerのようなレンマタイザーを使用できます。(見出語を使用したい場合は、morph
別途電話findtheinfo_ds
して、返ってきた見出語を呼び出す必要があります。)
一方、私はこの目的のためにMorphAdornerを見るのに約5秒しか費やしませんでした。他の外部リソースを使用せずに、誤った「植物」の答えを排除する方法があるかもしれません。