Lesk を使用して、2 つの単語 (「家」と「家」など) の類似性を見つけようとしています。
ここで与えられた lesk 値を見つけるためのデモ コードを実行しました。また、ここでオンライン ws4j デモを使用して値を見つけました。
どちらも異なる値を与えます。
WS4Jで指定されたデモコードを実行することによる値:
WUPALMER = 0.4
JIANGCONRATH = 0.08467941109843881
LEACOCKCHODOROW
= 1.1349799328389845 LIN
=
0.16528546101187536
Resnik =
0.1692001111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111111116
オンラインデモによる値:
wup( home#n#8 , house#n#10 ) = 1.0000
jcn( home#n#8 , house#n#10 ) = 12876699.5
lch( home#n#8 , house#n#10 ) = 3.6889
lin( home#n#8 , house#n#10 ) = 1.0000
res( home#v#1 , house#v#2 ) = 9.0735
path( home#n#8 , house#n#10 ) = 1.0000
lesk( home#n#8 , house#n#10 ) = 1571
hso( home#n#8 , house#n#10 ) = 16
両方とも同じ ws4j を使用しているのに、これら 2 つの間に大きな違いがあるのはなぜですか?? デモコードに問題はありますか??