3

短いオランダ語のテキストからキーワードを抽出したいと思います。このライブラリまたは私が使用できるライブラリのAPIはありますか?

それらがオランダ語で利用できない場合は、それらを自分で抽出する方法に関するヒントもありがたいです。私はすでに、品詞のタガーとレンマタイザーを介してテキストを実行することによって、それを自分で試しました。しかし、それ以降、まともなキーワードを抽出するのは非常に難しいと思います。TF-IDFは役に立ちません。テキストが短すぎて良い結果が得られません。

私はJavaが好きですが、他の言語の実装も大歓迎です。

4

1 に答える 1

2

これは、RapidMiner を使用したテキスト マイニングに関する私のビデオ シリーズです。TF-IDF などを簡単に取得する方法を示します。

http://vancouverdata.blogspot.ca/2010/11/text-analytics-with-rapidminer-loading.html

于 2012-10-18T19:11:02.830 に答える