BeautifulSoup を使用して Web パーサーを作成しています。で生成された行のリストを作成し、行ごとbs.findAll(text=True)
に分割してそこにロジックを適用します。html_payload
任意の Web ページです。
これまでのところ、コードは機能しますが、あまりきれいではなく、もっと優れたエレガントな書き方があるに違いないと考えさせられます。
data_to_parse = BeautifulSoup(html_payload)
lines_to_parse = []
d = data_to_parse.findAll(text=True)
for line in d:
for line2 in line.strip().split('\n'):
if line2:
lines_to_parse.append(line2)
for line in lines_to_parse:
pass # here's where I start analyzing results
これを解決するより良い方法を提案できる人はいますか?