-1

Web ページにタグ クラウドとして表示したい単語のリストがあります。各単語には、単語がタグ クラウドに表示される大きさを決定する対応する「重み」があります。

この配列には、各単語がドキュメントのタグ付けに使用された回数が含まれており、これらの値を各単語の重み付けとして使用したいとします。

int [] ints = new int[] { 1, 2, 4, 3, 2, 1, 4, 2, 1000};

重み付けの範囲を指定された範囲内にして、レンダリング コードが処理する予測可能な数値セットを持つようにしたいのですが、これらの整数を単純に正規化したくはありません。

これが発生した場合、タグ クラウド内の 1 つのアイテムが非常に大きくなり、他のすべてのタグは小さくなります。ある程度の多様性を維持しながら、すべての整数を限られた範囲に絞り込む方法を探しています。

では、最終的な大きな値が他の値を無意味にしないように、セットを変換するにはどうすればよいでしょうか?

4

1 に答える 1

2

対数を使用してデータを前処理し、数値のスケールを下げます。データ値に基づいて対数の底を選択します。タグ クラウドの目的では、log to base 2 を使用するのが私の意見では最も理想的です。ログを見つけたら、結果の数値を正規化します。

于 2013-02-06T14:37:59.377 に答える