あなたにとって小さな問題:-)
私はBeautifulSoupを使用してHTMLページのテーブルのコンテンツを解析しています。問題は、出力ファイルのすべての行(CSV / EXCEL)の間に、空白行が表示されることです...これはHTMLテーブル(非常に大きい)の例です。
<tr><td class="normaltext" valign="TOP">Tesco - United Kingdom </td>
<td class="normaltext" valign="TOP">CO</td>
<td class="normaltext" valign="TOP">Unknown </td>
<td class="normaltext" align="center" valign="top">lol</td></tr>
<tr><td colspan="5"><hr></td></tr>
<tr><td class="normaltext" valign="TOP">Tesco - United Kingdom </td>
<td class="normaltext" valign="TOP">CO</td>
<td class="normaltext" valign="TOP">Unknown </td>
<td class="normaltext" align="center" valign="top">lol</td></tr>
<tr><td colspan="5"><hr></td></tr>
すべての<tr>には次のようなものがあります:<tr> <td colspan = "5"> <hr> </ td> </ tr>つまり、CSV/Excelシートに空白行が追加されます。すべての情報をExcelシートに取り込みたいのですが、すべての行の間に空白行がありません...
これが私が使用するスクリプトです:
rows = tableau[3].findAll('tr')
for tr in rows:
cols = tr.findAll('td', attrs={'class' : 'normaltext'})
y = 0
x = x + 1
for td in cols:
texte_bu = td.text
texte_bu = texte_bu.encode('utf-8')
texte_bu = texte_bu.strip()
ws.write(x,y,td.text)
y = y + 1
私の出力ファイルのすべての行の間にこの*空白の役に立たない行のリブを取得するためのヒントを私に与えることができる人に大いに感謝します:)