0
4

1 に答える 1

1

正規表現を使用して、HTML リンクのように見える文字列から何でも削除できます。結果は入力に大きく依存しますが、空の文字列に置き換えると、かなり遠くまで行くことができます。</?a\b[^>]*>

いずれにせよ、正規表現で HTML を処理するのはくだらないし、アドホックです。入力データセットが限られており、よく知られており、使い捨ての 1 回限りの変換コードを作成するだけでよい場合は、くだらないアドホックで十分かもしれません。

長期間使用することを意図したコードを開発している場合は、使用可能な HTML パーサー ( Python 用のBeautifulSoupまたは.NET用の HTML Agility Packが思い浮かびます) の 1 つを必ず調べて、HTML を処理するだけでなく、構造化された方法で行うだけでなく、作業中に修正することもできます。

于 2010-03-15T18:06:39.187 に答える