0

私は実際にhtmlの文字列を持っています。そして、xmlparserを使用して解析したいと思います。pbは、私の文字列の一部のタグが正しくないということです。特に<img />タグ。したがって、最後のを見逃しているので、これらのタグを置き換える必要があります/。すべてのタグを取得して、最後にimgを追加したいと思います。/そのためには、文字列を解析するために、次のテキストに置き換える<imgまで、テキスト内のすべてを見つける必要があります。>/>

誰でも私を助けることができますか?

ありがとう

4

1 に答える 1

3

あなたはあらゆる種類のトラブルを求めています。タスクにより適したライブラリを試してください。BeautifulSoupそれはあなたが望むものかもしれないように見えます。

を使用することに完全に固執している場合は、最初にHTMLをクリーンアップするためxmlparserに使用することをお勧めします。BeautifulSoup参照: 誤ってネストされた/閉じられていないHTMLタグを修正するにはどうすればよいですか?

于 2012-05-23T18:40:37.040 に答える