re.sub、python 2.7 を使用して、html ファイル内のテキストのチャンクを「xxx」に置き換えようとしています。スペースや改行のない基本的な文字列でのみ動作させることができます。このコードは、置き換えるものを何も見つけません。DOTALL などを試しましたが、何も機能しません。ファイル全体を印刷するだけです。re.search の使用に成功しましたが、これは機能しません。
コード:
print re.sub(r'table\sstyle\=(.+)script', r'xxx', text, re.S)
検索中です (テキスト):
<table style="background-color: #ecddb0">
<tbody>
<TR>
<TD>
<style type="text/css">
body {
background-color: #ffffff;
margin: 0px;
padding: 0px 0 0 0px;
</style>
<script type="text/javascript