1

ここのツールを使用して意味的類似性を実行していますが、

次の結果が得られましたが、正しく解釈できません。

apple#n#1,banana#n#1    0.04809463683080774
apple#n#1,banana#n#2    0.13293629283742603
apple#n#2,banana#n#1    0.0
apple#n#2,banana#n#2    0.0

コードは次のとおりです。

URL url = new URL ( "file" , null , "dictionary/3.0/dict" );
        IDictionary dict = new Dictionary ( url ) ;
        dict.open () ;

        // look up first sense of the word " dog "
        IIndexWord idxWord = dict . getIndexWord ( "dog" , POS.NOUN ) ;
        IWordID wordID = idxWord . getWordIDs () . get (0) ; // 1 st meaning
        List <IWordID> wordIDs = idxWord.getWordIDs();


        JWS ws= new JWS ("dictionary", "3.0");


        TreeMap <String,Double> scores1 = ws.getJiangAndConrath().jcn("apple", "banana", "n");
        for (String s:scores1.keySet())
            System.out.println(s+"\t"+scores1.get(s));
4

2 に答える 2

1

NLTKドキュメントから:

Jiang Conrathの類似性は、Least Common Subsumer(最も具体的な祖先ノード)の情報コンテンツ(IC)と2つの入力Synsetの情報コンテンツ(IC)に基づいて、2つの単語の感覚がどれほど類似しているかを示すスコアを返します。この関係は、式1 /(IC(s1)+ IC(s2)-2 * IC(lcs))で与えられます。

結果0は、2つの概念がまったく関連していないことを意味します。1に近い結果は、非常に密接な関係を意味します。

于 2013-03-07T20:09:27.273 に答える
0

Url 変数に問題があるため、LeacockAndChodorow アルゴリズムの実行を担当する Java で記述されたコード ソースを提供してもらえますか?

于 2013-03-31T19:18:03.400 に答える