2 つの文字列があるとします。
"SomeTextHereThatIsTheSource"
"SomeTextHereThatIsCloseToTheSourceButNotTheSame"
テキストのどの部分が同じかを知るための巧妙な.netの方法はありますか(最初から)。
したがって、この例では、結果は次のようになります。
"SomeTextHereThatIs"
TakeWhile を使用できます。
string MatchFromStart(string s1, string s2)
{
if (s1 == null || s2 == null) return "";
var matchingArray = s1.TakeWhile((c, i) => { return i < s2.Length && c == s2[i]; });
return String.Join("", matchingArray);
}
それを使用するには:
string s1 = "SomeTextHereThatIsTheSource";
string s2 = "SomeTextHereThat";
string s3 = "SomeTextHereThatIsCloseToTheSourceButNotTheSame";
Console.WriteLine(MatchFromStart(s1, s2)); // SomeTextHereThat
Console.WriteLine(MatchFromStart(s2, s1)); // SomeTextHereThat
Console.WriteLine(MatchFromStart(s3, s1)); // SomeTextHereThatIs
Console.WriteLine(MatchFromStart("", s1)); // (blank string)
Console.WriteLine(MatchFromStart(s3, "")); // (blank string)
Console.WriteLine(MatchFromStart(null, s1)); // (blank string)
Console.WriteLine(MatchFromStart(s2, null)); // (blank string)
短い文字列をループしてfor
、文字ごとに比較するのが最善の策です。それもおそらく最速でしょう。
// str1 is shorter or equal in length to str2:
for(int i=0; i < str1.Length; i++)
{
if(str1[i] == str2[i])
continue;
return i;
}
一致する長さを決定するために単純な while ループを使用します。
int len = 0;
while (len < s1.Length && len < s2.Length && s1[len] == s2[len]) {
len++;
}
両方の文字列の最小長を事前に決定すると、少し改善できます
int minLength = Math.Min(s1.Length, s2.Length);
int len = 0;
while (len < minLength && s1[len] == s2[len]) {
len++;
}
これは最も最適化されていないかもしれませんが、 astring
も であるという事実を利用して、かなりクリーンな方法でそれを行う方法を次に示しIEnumerable<char>
ます。
static string CommonPrefix(string string1, string string2) {
var length = Enumerable.Zip(string1, string2, (a, b) => a == b).TakeWhile(a => a).Count();
return string1.Substring(0, length);
}