中国語から英語のテキストを検索し、そのクラスを追加するには、正規表現が必要です。
例: 入力
<p>当然,你要学习<a href='#' target='_blank'>“<b>Megento</b>”</a></p>
出力は次のようになります。
<p>当然,你要学习<a href='#' target='_blank'>“<b><span class="english">Megento</span></b>”</a></p>
中国語から英語のテキストを検索し、そのクラスを追加するには、正規表現が必要です。
例: 入力
<p>当然,你要学习<a href='#' target='_blank'>“<b>Megento</b>”</a></p>
出力は次のようになります。
<p>当然,你要学习<a href='#' target='_blank'>“<b><span class="english">Megento</span></b>”</a></p>
.NET 正規表現は、Unicode 文字の範囲に基づいて照合できます ( Unicode カテゴリまたは Unicode ブロック:\p{}
を参照してください)。たとえば、正規表現\p{IsBasicLatin}
は に一致x
しますが、Ǝ
(U+018E: ラテン大文字を逆にした E) には一致しません。
したがって、これを使用して要素のテキスト コンテンツを一致させることは非常に可能です。
ただし、HTML 自体を解析するために正規表現を使用しないでください。HTML パーサーを使用して HTML を処理してから、正規表現を使用してテキスト コンテンツを調べます。