この質問を正確に表現する方法がわからないので、例を次に示します。
string1 = "THEQUICKBROWNFOX" string2 = "KLJHQKJBKJBHJBJLSDFD"
string1 を string2 よりも高くスコア付けする関数と、他の何百万もの意味不明な文字列が必要です。スペースがないことに注意してください。これは単語単位ではなく、文字単位の関数です。
90 年代に、私は Delphi でトライグラム スコアリング関数を作成し、Huck Finn のトライグラムを入力しました。コードを C または Python に移植するか、スタンドアロン ツールに組み込むことを検討していますが、もっと効率的な方法があるはずです。今までに。これを何百万回も行うので、速度は素晴らしいです。Reverend.Thomas Beyse() Python ライブラリを試し、すべて大文字の文字列でトレーニングしましたが、単語間にスペースが必要なようで、[] のスコアが返されます。いくつかのマルコフ連鎖ライブラリを見つけましたが、それらも単語間にスペースが必要なようでした。私の理解では、なぜそうなのかわかりません...
とにかく、私は多くの暗号解読を行っているので、将来的にはスペースと句読点を使用するスコア関数が役立つでしょうが、今は ALLCAPITALLETTERS だけが必要です。
助けてくれてありがとう!