2

PRNGではなく、ある種のセンサーまたはロギングデータなど、何らかのソースからのシーケンスpf番号N1 , N2 , N3が与えられた場合、このように処理すると仮定しても安全ですか?...

Nn/ B = Qn Rem Mn

シーケンスQよりエントロピーが少ないシーケンスになりますMか?

注:とのB両方が同じサイズの範囲であると仮定します。QM


これは、ほとんどの現実世界のデータ セットがソースに関係なく、対数分布を持っているという観測に関連しています。1 で始まる数字は、9 で始まる数字よりもはるかに一般的です。しかし、これは下位の部分についてはほとんど語っていません。

これをテストするための楽しい方法 (そしてシステム管理者のコンピューターを停止させて怒らせる方法) として、これを bash で実行します。

 ll -R 2>/dev/null | grep -v -e "^\./" | sed "s/[-rdwxlp]*\W*[0-9]*\W*[a-z]*\W*[a-z]*\W*\([0-9]\).*/\1/" | sort | uniq -c

ファイルサイズの最初の桁のヒストグラムを取得します。

4

1 に答える 1

1

これは、シーケンスによって異なります。たとえば、[1 * 7 = 7, 3 * 7 = 21, 6 * 7 = 42 ... (2 * N - 1) * 7] と B = 7 を取ります。Qn は [1, 3, 6, ... 2 * N - 1] であり、Mn は常に 0 になります。通常、Q のエントロピーは、いくつかのビットをシフトするようなものであるため、小さくなりますが、常にこのようになるとは限りません。

そしてもちろん、これは特に (P)RNG からのデータには機能しません。Qn の範囲は Mn の範囲と同じであり、両方の数値が (ほぼ) 均等に分散されるためです。

于 2009-05-31T22:07:08.520 に答える