TStringList で大量のテキスト操作を行う必要があるアプリがあります。基本的に、区切り文字でテキストを分割する必要があります。たとえば、1000 文字の単一行があり、この区切り文字がこの行で 3 回発生する場合、3 行に分割する必要があります。区切り文字には複数の文字を含めることができます。たとえば、'[test]' のようなタグにすることができます。
このタスクを実行するために 2 つの異なるアプローチで 2 つの関数を作成しましたが、どちらも大量のテキスト (通常は 2 メガバイト以上) では遅くなります。
この目標をより速く達成するにはどうすればよいですか?
ここに両方の関数があり、どちらも 2 つのパラメーターを受け取ります。元の tstringlist である「lines」と区切り文字である「q」です。
function splitlines(lines : tstringlist; q: string) : integer;
var
s, aux, ant : string;
i,j : integer;
flag : boolean;
m2 : tstringlist;
begin
try
m2 := tstringlist.create;
m2.BeginUpdate;
result := 0;
for i := 0 to lines.count-1 do
begin
s := lines[i];
for j := 1 to length(s) do
begin
flag := lowercase(copy(s,j,length(q))) = lowercase(q);
if flag then
begin
inc(result);
m2.add(aux);
aux := s[j];
end
else
aux := aux + s[j];
end;
m2.add(aux);
aux := '';
end;
m2.EndUpdate;
lines.text := m2.text;
finally
m2.free;
end;
end;
function splitLines2(lines : tstringlist; q: string) : integer;
var
aux, p : string;
i : integer;
flag : boolean;
begin
//maux1 and maux2 are already instanced in the parent class
try
maux2.text := lines.text;
p := '';
i := 0;
flag := false;
maux1.BeginUpdate;
maux2.BeginUpdate;
while (pos(lowercase(q),lowercase(maux2.text)) > 0) and (i < 5000) do
begin
flag := true;
aux := p+copy(maux2.text,1,pos(lowercase(q),lowercase(maux2.text))-1);
maux1.add(aux);
maux2.text := copy(maux2.text,pos(lowercase(q),lowercase(maux2.text)),length(maux2.text));
p := copy(maux2.text,1,1);
maux2.text := copy(maux2.text,2,length(maux2.text));
inc(i);
end;
finally
result := i;
maux1.EndUpdate;
maux2.EndUpdate;
if flag then
begin
maux1.add(p+maux2.text);
lines.text := maux1.text;
end;
end;
end;