42

を使用してテキストを抽出しようとしていますBeautifulSoup。私はget_text()この目的のために関数を使用しています。

私の問題は、テキストに</br>タグが含まれていて、それらを終了行に変換する必要があることです。これどうやってするの?

4

7 に答える 7

5

正規表現でうまくいくはずです。

import re
s = re.sub('<br\s*?>', '\n', yourTextHere)

お役に立てれば!

于 2012-09-22T17:05:57.637 に答える