単語間の意味的類似性を計算するために WS4J API を使用しています。
ILexicalDatabase db = new NictWordNet();
RelatednessCalculator lin = new Lin(db);
RelatednessCalculator wup = new WuPalmer(db);
String w1 = "science";
String w2 = "university";
System.out.println(lin.calcRelatednessOfWords(w1, w2));
System.out.println(wup.calcRelatednessOfWords(w1, w2));
問題は、この API が、プロジェクトのディレクトリに配置する必要がある次の構成ファイルに依存していることです (私/resources
はこの目的で使用します)。
jaw.jaw.conf
similarity.conf
wordnet folder
さらに、このライブラリが Maven リポジトリで利用できないのは残念です。
上記のファイルをローカル プロジェクトのフォルダーに配置しないようにする方法はありますか? これらのファイルは 100Mb 以上を占有します....
ライブラリ DISCO もチェックしましたが、WS4J ほど強力ではないようです。