CPV (共通調達語彙) コードのかなり長い文字列を検索する必要があります。
現時点では、単純な for ループと str.find() でこれを行っています
問題は、CPV コードがわずかに異なる形式でリストされている場合、このアルゴリズムはそれを見つけられないことです。
文字列内のコードのさまざまな繰り返しをすべて検索する最も効率的な方法は何ですか? 最大 10,000 個の CPV コードをそれぞれ再フォーマットし、各インスタンスに str.find() を使用するだけですか?
異なるフォーマットの例は次のとおりです。
30124120-1
301241201
30124120 - 1
30124120 1
30124120.1
等
ありがとう :)