これは難しい質問の 1 つです。
Farsi
またはのように聞こえるPersian
言語で、単語の場所に応じて 4つの異なる形で書かれています。簡略化のため、これからは YAと呼びます。ی
y
i
ی
この画像を見てください
すべての YA 文字は赤で塗られ、最初の単語 YA はその前の文字 (右、ペルシア語では右から左) に付けられ、最後は自由ですが、最後の YA (3 番目の単語、一番左の赤い文字) ) は左右どちらからも自由です。
この長い話をしたので、文字列の一部が長い YA (ポイントのない YA) で終わるか、短い YA (その下に 2 つのポイントがある YA) で終わるかを調べたいと思います。
ie تحصیلداری
(3 番目の単語) は長い YA で終わりますが、تحصیـ
3 番目の単語の一部である部分は短い YA で終わりません。
質問: どのتحصیلداری
Unicode で終わるとどのように言うことができますか? 単純な文字列 "تحصیلداری" しかありませんが、その文字を Unicode に変換するにはどうすればよいですか?
ユニコードやってみた
string unicodes = "";
foreach (char c in "تحصیلداری")
{
unicodes += c+" "+((int)c).ToString() + Environment.NewLine;
}
MessageBox.Show(unicodes);
結果 :
しかし、結局のところ、残念ながらすべての YA が同じ Unicode を持っています。
悪いニュース: YA は一例ですが、実際の例です。他にもYAのような外見の異なるキャラクターが十数人います。
追加情報:ユニコードに関するこの便利なリンク
を使用すると、さまざまなYAのユニコードが見つかりました