「発音区別符号のアクセントを組み合わせた形に強制することによって、この文字列を正規化する」と言えるようにしたいと思います。
詳細:
私のコードはC#で開発されていますが、問題が言語固有であるとは思われません。
私のデータには2つの問題があります(1)発音区別符号がこのデータの基本文字の前にあります(Unicode形式のDまたはKDの基本文字の後に続く必要があります)。(2)私のデータのアクセント発音区別符号はギリシャ語のTonos(U + 0384)ですが、正規化するにはフォーム(U + 0301)を組み合わせる必要があります。
これをプログラムで実行したいと思います。このタイプの操作はよく知られているはずですが、C#グローバリゼーションメソッドではサポートが見つかりませんでした(正規化メソッドはありますが、発音区別符号を強制的に結合形式にする方法はありません)。