できればPythonで、N文字の長さのターゲット文字列に最も近い既存の文字列のN文字の長さの部分文字列を見つけるのに役立つアルゴリズムを探しています。
ターゲット文字列、つまり 4 文字の長さを次のように考えます。
targetString -> '1111'
これが私が利用できる文字列であると仮定します(「最適な配置」マッチングのために、この部分文字列を生成します):
nonEmptySubStrings -> ['110101']
上記の 4 文字の部分文字列:
nGramsSubStrings -> ['0101', '1010', '1101']
targetString に最も近い文字列を選択する「マジック関数」を作成/使用したい:
someMagicFunction -> ['1101']
いくつかの例:
nonEmptySubStrings -> ['101011']
nGramsSubStrings -> ['0101', '1010', '1011']
someMagicFunction -> ['1011']
nonEmptySubStrings -> ['10101']
nGramsSubStrings -> ['0101', '1010']
someMagicFunction -> ['0101', '1010']
この「マジック関数」はよく知られている部分文字列の問題ですか?
私は本当に分を見つけたいです。部分文字列として targetString を持つようにするための nonEmptySubStrings の変更の数。