1

Pythonの正規表現を使用して、</html>タグの後のすべてを取得し、文字列に入れたいと思います。そこで、Pythonでそれを行う方法を理解しようとしましたが、それを機能させることができませんでした。誰かがこのばかげた単純なタスクを実行する方法を私に説明できますか?

4

3 に答える 3

6

正規表現なしでこれを行うことができます:

text[text.find('</html>')+7:]
于 2012-10-04T21:41:14.907 に答える
2
m = re.match(".*<\html>(.*)",my_html_text_string)
print m.groups()

またはさらに良い

print my_html_string.split("</html>")[-1]
于 2012-10-04T21:40:49.183 に答える
1
import re

text = 'foo</html>bar'
m = re.search('</html>(.*)', text)
print m.group(1)
于 2012-10-04T21:42:53.950 に答える