0

以下のようなリストがあり、これを Excel または CSV 形式の複数の行に変換する必要があります。

<tr>
<th>Name</th>
<th>Address1</th>
<th>City</th>
<th>State</th>
<th>Zip</th>
</tr>

<tr>
<th>John</th>
<th>111 Michigan</th>
<th>Chicago </th>
<th>IL</th>
<th>60661</th>
</tr>

望ましい結果:

Name   Address1       City   State  Zip
John  111 Michigan   Chicago  IL    60661
4

3 に答える 3

0

Beautiful Soupを使用して HTML を解析し、行ごとに列の値を出力します。

于 2013-10-22T21:27:43.270 に答える
0

私はbeautifulSoup4を使用してみましたが、結果として最初の行しか取得できません。行が空白になる場合の残り

from bs4 import BeautifulSoup

soup = BeautifulSoup(open("CofATX.txt"))
table = soup.find('table')

rows = table.findAll('tr')

for tr in rows:
    cols = tr.findAll('th')
for th in cols:
    text = ''.join(th.text.strip())
    print text + "|",
print

私が得ている結果は Name | アドレス1 | 都市 | 状態 | Zip行が空白の場合は残り

于 2013-10-23T16:47:09.197 に答える