これは、例を使用して説明するのが最適です。段落を考えると:
The longest string in this paragraph is not the shortest string in the paragraph because it is the longest string in the paragraph
一致する部分文字列の順序を最初に頻度で、次に長さでリストしたいので、この場合はリストする必要があります(大文字と小文字を区別しません)
The longest string inthe paragraphis not the shortest string inbecauseit isthis
上記は、部分文字列を出現頻度の順にリストしたもので、その後に長さが続くため、The longest string in2 回繰り返され、最も長い部分文字列になります。 is not the shortest string inは よりも長いですがthe paragraph、the paragraph2 回繰り返されるため、最初にリストされます。
更新 (AlexC と MattBurland による観察に基づく):
スペース文字などinの部分文字列が他の部分文字列よりも多く出現する場合でも、それらが出現 * 長さよりも長い部分文字列に既に含まれている場合は、それらをリストするべきではありません。例えば、 inは 3 回で 6 文字 (末尾のスペースを含めると 9 文字) になりますが、9 文字は よりも短いためthe paragraph、記載されていません。これが理にかなっていると思いますか?