wordnet を使用して、2 つの単語間の類似度の測定値を計算しています。andを使っedu.mit.jwi_2.1.4.jar
てedu.sussex.nlp.jws.beta.11.jar
いますが、resnik 測定で「りんご」と「バナナ」という単語を計算すると、8,4 です。なぜ1より大きいのですか?
public class test {
String dir = "C:/Program Files (x86)/WordNet";
JWS ws = new JWS(dir,"2.1");
/**
* @param args
*/
public void testResnikSimilarity() {
Resnik jcn = ws.getResnik();
System.out.println("Resnik");
// all senses
TreeMap scores1 = jcn.res("apple", "banana", "n"); // all senses
//TreeMap scores1 = jcn.jcn("apple", 1, "banana", "n");
// fixed;all
//TreeMap scores1 = jcn.jcn("apple", "banana", 2, "n");
// all;fixed
for(String s : scores1.keySet())
System.out.println(s + "\t" + scores1.get(s));
// specific senses
System.out.println("\nspecific pair\t=\t" + jcn.res("apple", 1, "banana",
1, "n") + "\n");
// max.
System.out.println("\nhighest score\t=\t" + jcn.max("apple", "banana",
"n") + "\n\n\n");
}
}