特定の概念に関連する概念を取得するために、spread-activation を使用しています。
「ロンドン」と「パリ」の類似度を計算したい場合、次のような 2 つのベクトルを取得します。
vector for 'Paris':
Paris : 1.0
City : 0.9
Capital : 0.7
France : 0.6
Europe : 0.5
...
vector for 'London':
London : 1.0
City : 0.9
England : 0.9
United Kingdom : 0.8
Europe : 0.5
...
問題は、ベクトルの長さが異なる可能性があることです。この状況で使用できる類似性尺度は何ですか? 私の知る限り、余弦測度は同じサイズのベクトルにのみ適用できます。
これらのパッケージを見つけました: SimMetrics: http://staffwww.dcs.shef.ac.uk/people/S.Chapman/simmetrics.html および COLT: http://nlp.stanford.edu/nlp/javadoc/colt-docs /overview-summary.html
私のシナリオでそれらをどのように使用できますか?
ありがとう!ムロン