アラビア語のテキストを含む utf-8 でエンコードされたファイルがあり、検索する必要があります。
私の問題は分音記号です。それらをスキップして検索するにはどうすればよいですか?
そのテキストを Internet Explorer にロードした場合 (もちろん HTML でテキストを変換する場合)、IE はそれらの分音符号をスキップしますか?
何か助けはありますか?
Edit1 : 検索は、次のコードで簡単に実行されます。
var m1 : TMemo; //contains utf-8 data)
m2 : TMemo; // contains results
...
m2.lines.BeginUpdate;
for s in m1.Lines do
begin
if pos(eSearch.Text,s)>0 then
begin
m2.Lines.Add(s);
end;
end;
m2.Lines.EndUpdate;
Edit2 : Unicode データの例:
分音符号のない文字のみを検索すると、単語 قُلْ は見つかりません。