python - BeautifulSoupとPythonを使用してこのHTMLを解析するのに助けが必要

Question

BeautifulSoupを使用して解析したい次のHTMLがあります。

<tr class="TrGameOdd">
  <td align="center">
    <a href="Schedule.aspx?WT=0&amp;lg=778&amp;id=,1583114">
      <img border="0" src="/core/engine/App_Themes/Global/images/plus.gif">
    </a>
  </td>
  <td align="left">Oct 20</td>
  <td>777</td>
  <td align="left" colspan="2">Cupcakes</td>
  <td align="right">7+3
    <input type="checkbox" value="0_1583114_-3440" name="text_">
  </td>
  <td align="right">a199
    <input type="checkbox" value="2_1583114_-199.5_-110" name="text_">
  </td>
</tr>

このような行はたくさんありますが、私はそれから詳細を必要とするだけです。たとえば、777, Cupcakes, 7+3, -3440, a199これらすべてを解析したいと思います。どうすればいいですか？並べて印刷したいのですが、解析したいこれらの行がいくつかあるので、印刷するときは次のようになります。

777 Cupcakes 7+3 -3440
X X X X
X X X X
etc

score 2 · Accepted Answer

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(html)
trs = soup.find("tr",{"class":"TrGameOdd"})

for tr in trs:
   tds = tr.findAll("td")

   print tds[1].string # Oct 20
   print tds[2].string # 777
   print tds[3].string # Cupcakes
   ...

続行する必要があります http://www.crummy.com/software/BeautifulSoup/bs4/doc/

python - BeautifulSoupとPythonを使用してこのHTMLを解析するのに助けが必要

1 に答える 1

Related

Reference