これは、例を使用して説明するのが最適です。段落を考えると:
The longest string in this paragraph is not the shortest string in the paragraph because it is the longest string in the paragraph
一致する部分文字列の順序を最初に頻度で、次に長さでリストしたいので、この場合はリストする必要があります(大文字と小文字を区別しません)
The longest string in
the paragraph
is not the shortest string in
because
it is
this
上記は、部分文字列を出現頻度の順にリストしたもので、その後に長さが続くため、The longest string in
2 回繰り返され、最も長い部分文字列になります。 is not the shortest string in
は よりも長いですがthe paragraph
、the paragraph
2 回繰り返されるため、最初にリストされます。
更新 (AlexC と MattBurland による観察に基づく):
スペース文字などin
の部分文字列が他の部分文字列よりも多く出現する場合でも、それらが出現 * 長さよりも長い部分文字列に既に含まれている場合は、それらをリストするべきではありません。例えば、 in
は 3 回で 6 文字 (末尾のスペースを含めると 9 文字) になりますが、9 文字は よりも短いためthe paragraph
、記載されていません。これが理にかなっていると思いますか?