2 つの単語の意味的類似性を計算しようとしています。私は Wordnet ベースの類似性測定、つまり Resnik 測定 (RES)、Lin 測定 (LIN)、Jiang および Conrath 測定 (JNC)、および Banerjee および Pederson 測定 (BNP) を使用しています。
そのために、nltk と Wordnet 3.0 を使用しています。次に、異なる尺度から得られた類似値を結合したいと考えています。これを行うには、類似度の値を正規化する必要があります。これは、0 から 1 の間の値を与える尺度もあれば、1 より大きい値を与える尺度もあるからです。
だから、私の質問は、さまざまな尺度から得られた類似値をどのように正規化するかです。
私が実際にやろうとしていることの詳細: 私には一連の言葉があります。単語間のペアワイズ類似度を計算します。セット内の他の単語と強く相関していない単語を削除します。