python - BeautifulSoup - 抽出番号

Question

Web をスクレイピングする方法を学ぼうとしていますが、コードを機能させるのに問題があります。抽出したい数値は、以下のコードから 77.80 です。私が抱えている問題は、情報 (場所) を見つけるのに十分なほどユニークなものを見つけることです。正しいコードを教えてください。前もって感謝します！

    </td>

            <td class="small">&nbsp;&nbsp;</td>

                    <td align="center" nowrap  valign="center" class="small">
                    <a alt="Utvald" class="small" href="javascript:QT('/se/skandia/funds/chosen.aspx?tab=5&cid=0P0000T35O&lang=SV&curiso=SEK&country=SE&clientattributes=8&lastpage=Sök fond&LastPageURL=/se/skandia/quickrank/index.aspx?tab=RSLTS|lang=SV|univ=SE1|country=SE|curiso=SEK|mec=|cat=-1|search=|sortby=Custom_4|sortorder=ASC|PageNo=1|Firstletter=','0P0000T35O','600')"  onmouseout="status=''; return true"><img src="../read/im/sigillsvartsmall_FFFFFF.gif" border="0" alt="Utvald av Skandia" height="12" width="9"/></a>
                </td>

            <td class="small">&nbsp;&nbsp;</td>

                <td align="right" nowrap  valign="top" class="small">
                    77.80                           
                </td>

            <td class="small">&nbsp;&nbsp;</td>

                <td align="right" nowrap  valign="top" class="small">
                    <!--<img src="../read/im/valueSEK.gif" align="texttop" height="10" width="22">-->
                    SEK
                </td>

            <td class="small">&nbsp;&nbsp;</td>

                <td align="right" nowrap  valign="top" class="small">
                    1.4
                </td>

            <td class="small">&nbsp;&nbsp;</td>

                <td align="right" nowrap  valign="top" class="small">
                    0.5
                </td>

            <td class="small">&nbsp;&nbsp;</td>

                <td align="right" nowrap  valign="top" class="small">
                    2.7
                </td>

            <td class="small">&nbsp;&nbsp;</td>

                <td align="right" nowrap  valign="top" class="small">
                    6.6
                </td>

score 2 · Accepted Answer

必要なテキストを見つける方法は次のとおりです。これは、とtdを持っている最初のものを探すだけです。class='small'valign='top'

soup = BeautifulSoup(s)
tds = soup.find_all('td', attrs={'class': 'small', 'valign': 'top'})
the_td = tds[0].text.strip()

python - BeautifulSoup - 抽出番号

1 に答える 1

Related

Reference