c# - 中国語で英語の単語を見つけるには正規表現が必要です

Question

中国語から英語のテキストを検索し、そのクラスを追加するには、正規表現が必要です。

例: 入力

<p>当然，你要学习&lt;a href='#' target='_blank'>“&lt;b>Megento</b>”&lt;/a></p>

出力は次のようになります。

<p>当然，你要学习&lt;a href='#' target='_blank'>“&lt;b><span class="english">Megento</span></b>”&lt;/a></p>

score 0 · Accepted Answer

.NET 正規表現は、Unicode 文字の範囲に基づいて照合できます ( Unicode カテゴリまたは Unicode ブロック:\p{}を参照してください)。たとえば、正規表現\p{IsBasicLatin}はに一致xしますが、Ǝ(U+018E: ラテン大文字を逆にした E) には一致しません。

したがって、これを使用して要素のテキストコンテンツを一致させることは非常に可能です。

ただし、HTML 自体を解析するために正規表現を使用しないでください。HTML パーサーを使用して HTML を処理してから、正規表現を使用してテキストコンテンツを調べます。

c# - 中国語で英語の単語を見つけるには正規表現が必要です

1 に答える 1

Related

Reference