英語のすべての文字には出現率があり、これらはパーセンテージです。
A B C D E F G H I
.0817 .0149 .0278 .0425 .1270 .0223 .0202 .0609 .0697
J K L M N O P Q R
.0015 .0077 .0402 .0241 .0675 .0751 .0193 .0009 .0599
S T U V W X Y Z
.0633 .0906 .0276 .0098 .0236 .0015 .0197 .0007
呼び出されるリストは、次のletterGoodness
ように事前定義されています。
letterGoodness = [.0817,.0149,.0278,.0425,.1270,.0223,.0202,...
文字列の「良さ」を見つける必要があります。たとえば、「I EAT」の良さは、.0697 + .1270 + .0817 + .0906=.369です。これは大きな問題の一部ですが、大きな問題を解決するにはこれを解決する必要があります。私はこのように始めました:
def goodness(message):
for i in L:
for j in i:
したがって、任意の文字の出現率を取得する方法を見つけるだけで十分です。手伝って頂けますか?文字列には大文字とスペースのみが含まれます。