キー = テキスト、値 = 整数の 2 つの行列を比較したいのですが、どちらもキーは同じですが、値は異なります。1 つの値は関連性であり、もう 1 つはキーが発生した頻度のカウンターです。データを相互に関連付けて、最も意味のあるキーを見つけるにはどうすればよいですか?
私は、次のような関連性係数とカウントを持つ 100 語を言いましょう。
$relevance['google'] = 1000;
$relevance['yahoo'] = 1300;
$count['google'] = 4
$count['yahoo'] = 2
同じ配列があるかどうかを確認したくありません。キーは同じですが、値が異なることはわかっています。値を正規化して、値を比較して相関関係を見つけたいと考えています。つまり、yahoo は google よりも重要であると言えます。関連性または数だけで並べ替えて、手動でデータを調べるのではなく。
データの正規化のようなもの: ($val*min)/(max-min) で 0 から 1 までの $relevance 値を持ち、$count についても同じです。その後、カウントと関連性の両方の値を追加しますか?