0

中国語から英語のテキストを検索し、そのクラスを追加するには、正規表現が必要です。

例: 入力

<p>当然,你要学习&lt;a href='#' target='_blank'>“&lt;b>Megento</b>”&lt;/a></p>

出力は次のようになります。

<p>当然,你要学习&lt;a href='#' target='_blank'>“&lt;b><span class="english">Megento</span></b>”&lt;/a></p>
4

1 に答える 1

0

.NET 正規表現は、Unicode 文字の範囲に基づいて照合できます ( Unicode カテゴリまたは Unicode ブロック:\p{}を参照してください)。たとえば、正規表現\p{IsBasicLatin}は に一致xしますが、Ǝ(U+018E: ラテン大文字を逆にした E) には一致しません。

したがって、これを使用して要素のテキスト コンテンツを一致させることは非常に可能です。

ただし、HTML 自体を解析するために正規表現を使用しないでください。HTML パーサーを使用して HTML を処理してから、正規表現を使用してテキスト コンテンツを調べます。

于 2013-09-05T08:47:59.380 に答える