Web ページからデータを解析していますが、テーブルに不要なキャリッジ リターンが含まれていることがあり、問題が発生しています。改行を削除したいのですが、単純な strip() が機能しません。
次のコードがあります。
html = """
<table>
<tr>
<td>
Commercial, financial and agricultural</td>
<td>
791
</td>
</tr>
</table>
"""
soup = BeautifulSoup(''.join(html))
table = soup.find('table')
rows = table.findAll('tr')
for tr in rows:
rowdata = ''
columns = tr.findAll('td')
for td in columns:
cell = ''.join(td.findAll(text=True))
cell.strip()
rowdata = rowdata+'|'+cell
print rowdata
出力は次のとおりです。
|
Commercial, financial and agricultural|
791
出力を次のようにしたい: |商業、金融、農業|791
ストリップ関数が改行を削除しないのはなぜですか?