C# で絵文字に一致する正規表現が必要です。問題があるとすれば、それは Windows 8 タッチ キーボードの文字です。
3 に答える
Emoji-to-Unicode 標準があるようです:
http://en.wikipedia.org/wiki/Emoji#Emoji_in_the_Unicode_standard
したがって、おそらくそれぞれの Unicode 範囲に一致させることができます。たとえば、U+1F30x から U+1F5Fx までの範囲を一致させるには、etc を使用できます[\u1F30-\u1F5F]
。
それらを表すためにユニコードコード値をプラグインできるはずです:
Regex regEx = new Regex(@"\uXXXX\uYYYY");
XXXX
およびは、探しYYYY
ている文字の Unicode 値です (もちろん、ニーズに合わせて正規表現を変更します)。
この問題には Unicode General Categories と Named Blocks を使用し、受け入れられた回答の下の短いコメントで説明しました。
✅ と一致させようとしていて、この質問を見ました。しかし、答えは私の問題を解決しませんでした。最後に、これを正規表現パターンに使用しました
\p{So}
名前付きブロックと Unicode 一般カテゴリの詳細については、Microsoft 正規表現ヘルプ トピックを参照してください。
BasicLatin、ExtendedLatin、Arabic、Cyrilic などにさまざまな名前を使用できます。またS
、通貨記号や数学記号など、ファミリに一致するより具体的な記号も使用できます。