0

HTML文字列があり、段落記号を置き換えようとしています。^p編集>検索対象: >置換>すべて置換を選択することで、これを単語で手動で行うことができます^s。私の質問は、Pythonでhtml文字列を使用してこれを行うにはどうすればよいですか?

sample_html_string = "<html>
                  <title>
                  Hello
                  </title>
                  </html>"

correct_html_string = "<html><title>Hello</title></html>"

タグとタグre.subを含むより複雑なhtml文字列があり、フォーマットを維持したいので、この問題は単純に解決されません。lip

4

1 に答える 1

2

あなたはこのようにすることができます:

>>> import re
>>> re.sub('\s+', '', sample_html_string)
'<html><title>Hello</title></html>"'

それはすべてのスペース文字を置き換え、あなたの例のために完全に機能します

段落記号を置き換える必要がある場合(つまり、そう\nですか?)、組み込みを使用できますreplace

>>> sample_html_string.replace('\n', '')
于 2012-08-06T05:43:51.593 に答える