私は0と1から構築されたシーケンスを持っています。どういうわけか、ターゲットストリングからの距離を測定したいと思います。しかし、ターゲット文字列は不完全です。
私が持っているデータの例。ここで、xはターゲット文字列です。ここで、[0]は少なくとも1つの出現を意味します'0'
。
x =11[0]1111[0]1111111[0]1[0]`, the length of x is fixed and eaquel to length of y.
y1=11110111111000000101010110101010111
y2=01101000011100001101010101101010010
all y's have the same length
それが実際に文字列のセットとして解釈される可能性があることは簡単にわかりx
ますが、このセットは非常に大きい可能性があります。単にそのセットからサンプリングして最小編集距離の平均を取る必要があるかもしれませんが、やはり計算上の問題が大きすぎます。
私はアルゴを理解しようとしましたが、私は積み重ねられています、それは次のようになります:x-ターゲット文字列-ファジーなもの、
y-2番目の文字列-固定Cx1、Cy1-xおよびyの1の数Gx1、Gy1-ベクトルのリスト、各リストの長さは、指定されたシーケンスの1のグループの数に等しい。
Gx1 [i] i番目のベクトル、
Gx1 [i] =(i番目のグループの最初のもの、i番目のグループの長さ)
Gx1とGy1の長さが同じである場合、各グループに追加または削除するものの数はわかりますが、単純な追加と削除で最小距離が得られるかどうかわからないため、問題があります。