6

次のようなマッチング プログラムに 2 つの文字列を使用しています。

string s1= 5-4-6-+1-+1+1+3000+12+21-+1-+1-+1-+2-3-4-5-+1-+10+1-+1-+;
string s2= 6-+1-+1+1+3000+12+21-+1-+1-+1-+1-+1-+1+1-+1-+;

そして、各部分文字列を各 "+" の間で個別に比較し、各文字列で発生する一致の数である一致率を計算する Regex 一致関数を作成します。たとえば、この例では、次の一致があります。

6

1

1

1

3000

12

21

1

1

1

--

1

--

1

1

この例では、一致率は 13*100/15=87% です。

現在は以下の関数を使用していますが、最適化されておらず、正規表現を使用した方が速いと思います。

public double MatchPercent(string s1, string s2) {
    int percent=0;
    User = s1.Split('+').ToArray();
    Policy = s2.Split('+').ToArray();

    for (int i = 0; i < s1.Length - 2; i++) {
        int[] U = User[i].Split('-').Where(a => a != "").Select(n => 
                      Convert.ToInt32(n)).Distinct().ToArray();
        int[] P = Policy[i].Split('-').Where(a => a != "").Select(n => 
                      Convert.ToInt32(n)).Distinct().ToArray();
        var Co = U.Intersect(P);
        if (Co.Count() > 0) {
            percent += 1;
        }
    }
    return Math.Round((percent) * 100 / s1.Length );
}
4

1 に答える 1

2

より良い解決策は、Levenshtein Word Distance アルゴリズムです。いくつかの C# サンプル:

一致する文字からパーセンテージを計算することもできます。

于 2013-06-12T08:06:38.007 に答える