太字や斜体などの html スタイルのマークアップを独自のカスタム マークアップ形式に変換しようとしています。
<b>太字</b> ---> * 太字 *
そのため、太字のタグは折り返しの星などに変換されます。
これを行う最も簡単/最良/最速の方法は何ですか? 文字列を手動で解析するのは簡単ですが、正規表現はどうでしょうか?
私はC#.NET 3.5を使用しています:)
HTML がまったく複雑な場合 (ネストされたタグ、タグの不一致など) は、HTML Agility Packを使用して解析することをお勧めします。これに RegEx を使用したい場合は、必ず Jeff のブログに従ってください -彼らは StackOverflow の HTML 解析に RegEx を使用しています。
これはそれを行う必要があります:
s = Regex.Replace(s, "<b>(.*?)</b>", "*$1*");
他の太字タグの中に太字タグのような奇妙なものがない限り。