BeautifulSoupには、連続する<br>
タグを閉じるためのロジックがありますが、これは私が望んでいることを完全には実行しません。例えば、
>>> from bs4 import BeautifulSoup
>>> bs = BeautifulSoup('one<br>two<br>three<br>four')
HTMLは次のようにレンダリングされます
one
two
three
four
文字列のリストに解析したいのですが['one','two','three','four']
。BeautifulSoupのタグを閉じるロジックは、すべての<br>
要素を要求するとネストされたタグを取得することを意味します。
>>> bs('br')
[<br>two<br>three<br>four</br></br></br>,
<br>three<br>four</br></br>,
<br>four</br>]
私が望む結果を得る簡単な方法はありますか?