0

特定の概念に関連する概念を取得するために、spread-activation を使用しています。

「ロンドン」と「パリ」の類似度を計算したい場合、次のような 2 つのベクトルを取得します。

vector for 'Paris':
Paris : 1.0
City : 0.9
Capital : 0.7
France : 0.6
Europe : 0.5
...

vector for 'London':
London : 1.0
City : 0.9
England : 0.9
United Kingdom : 0.8
Europe : 0.5
...

問題は、ベクトルの長さが異なる可能性があることです。この状況で使用できる類似性尺度は何ですか? 私の知る限り、余弦測度は同じサイズのベクトルにのみ適用できます。

これらのパッケージを見つけました: SimMetrics: http://staffwww.dcs.shef.ac.uk/people/S.Chapman/simmetrics.html および COLT: http://nlp.stanford.edu/nlp/javadoc/colt-docs /overview-summary.html

私のシナリオでそれらをどのように使用できますか?

ありがとう!ムロン

4

1 に答える 1

0

割り当てられていないすべての値をデフォルトで 0 に設定して、一致するベクトルを取得し、任意の距離メトリックを使用できます。ただし、いくつかの属性は他の属性よりも適切な関連性を示す可能性が高いため、さまざまな属性に重みを付ける何らかの方法が必要になる場合があります。

また、ロンドンはパリよりもどの程度「ヨーロッパ」ですか?

于 2011-04-14T16:54:54.707 に答える