HTMLテキストの大規模なデータセットがあり、タグ内に不要な、場合によっては複数の<br>改行が含まれていることがよくあります。<li>
例えば:
<li>Some string here<br></li><br><li>Another string here<br><br></li><br>
間に<br>表示されるこれらを削除し、タグの外側を含む他のすべてを保持したいと思います。上記のテキストは次のようになります。<li></li><br><li>
<li>Some string here</li><br><li>Another string here</li><br>
phpのpreg_replace()(またはpythonのre.sub())でこれを行うための正規表現は何ですか?