10万個の文字列を互いに比較しようとしています。問題のサイズ (つまり、セット内の #strings) をこれ以上減らすことはできません。レーベンシュタイン比を使って比較しています。ratio が 0.9 より大きい場合、2 つの文字列をリストに格納します。私の質問は、ランタイムの最適化についてです。0.9 が私の基準なので、この値を Levenshtein.ratio() に渡し、否定的な場合に早期終了を期待する方法はありますか? 早期に終了する方法があれば、ランタイムを節約できます。完全な距離を計算する前に比率を早期に取得することは、レーベンシュタイン アルゴリズムで実現可能ですか。
例えば
import Levenshtein
Levenshtein.ratio('lot of runtime','why not an early exit in this case by taking the intended ratio')
次のようなものがありますか:
Levenshtein.ratio('lot of runtime','why not an early exit in this case by taking the intended ratio', 0.9)