次の文字列があるとします。
q8GDNG8h029751
DNS
stackoverflow.com
28743.8.4.919
q7Q5w5dP012855
Martin_Luther
0000000100000000-0000000160000000
1344444967\.962
ExTreme_penguin
明らかに、それらのいくつかは、私たちの脳によって、情報を含む文字列、人間にとって何らかの「意味」を持つ刺し傷として分類できます。一方で、"q7Q5w5dP012855" のような文字列は、コンピュータだけが意味を持つコードです。
私の質問は、文字列が実際に何かを伝えることができる確率を計算できますか?
頻度分析や大文字の計算などを考えていますが、もっと「科学的」なものがあると便利です。