最近、C# を使用してヘブライ語の単語の句読点を識別できるかどうかという考えが頭に浮かびました。ヘブライ語には、次のような句読点がいくつかあります。
יוּעָדוּ
もちろん、通常は単語に句読点を付けないので、次のように表示されます。
יועדו
C# を使用してこのような単語の句読点を識別する方法はありますか?
最近、C# を使用してヘブライ語の単語の句読点を識別できるかどうかという考えが頭に浮かびました。ヘブライ語には、次のような句読点がいくつかあります。
יוּעָדוּ
もちろん、通常は単語に句読点を付けないので、次のように表示されます。
יועדו
C# を使用してこのような単語の句読点を識別する方法はありますか?
Python では、シーケンスは次のように解析されます。
>>> a = unicode('יוּעָדוּ', 'utf-8')
>>> b = unicode('יועדו', 'utf-8')
>>> a
u'\u05d9\u05d5\u05bc\u05e2\u05b8\u05d3\u05d5\u05bc'
>>> b
u'\u05d9\u05d5 \u05e2 \u05d3\u05d5'
(わかりやすくするためにスペースを追加しました。)
句読点がはっきりと目立っていることがわかります。これらを探す AC# 正規表現は、おそらくあなたが行きたい方向です。