あなたが私を助けてくれることを願っています。
次のような行を含む 135.000 行の長さの txt ファイルがあります111706469;1972WE;26;Wel
。
プログラムが行うべきことは、すべての行をその前にあるすべての行と比較して、80% 以上類似しているかどうかを調べ、元の行の行番号を示すことです。
このように私が自分でなんとかしたこと。
if (rows.Length > 1) {
for (int rowIndex = 1; rowIndex < rows.Length; rowIndex++)
{
string cols = rows[rowIndex];
bool Dubbel = false;
for (int DupIndex = 0; DupIndex < rowIndex; DupIndex++)
{
string SearchDup = rows[DupIndex];
decimal ComparisonResult = Compare(cols, SearchDup);
if (ComparisonResult > 80)
{
cols += ";" + DupIndex;
Dubbel = true;
break;
}
}
Console.WriteLine(rowIndex + ";" + cols);
}
}
これは、プログラムが配列項目ごとに何度も配列を通過する必要があることを意味します。私の質問は、これを行うためのより速い/より良い方法はありますか?
あなたが私に与えることができるどんな助けでも大歓迎です。