1

ここと同じように.renderContents、その値で検索したい: Beautiful Soup [Python] and the extracting of text in a table

サンプル HTML:

<table>
    <tr>
            <td>
                     This is garbage
            </td>
            <td>
            <td class="thead" style="font-weight:normal">       
                <!-- status icon and date -->
                <a name="post1"><img class="inlineimg" src="img.gif" alt="Old" border="0" title="Old"></a>
                19-11-2010, 04:25 PM

                <!-- / status icon and date -->             
            </td>
            <td>
                     This is garbage
            </td>
    </tr>
</table>

私が試したこと:

soup.find_all("td", text = re.compile('(AM|PM)'))[0].get_text().strip()

ただし、このアプリケーションではtextパラメーターがfind_all機能しないようです。IndexError: list index out of range

私は何をする必要がありますか?

4

1 に答える 1

1

タグ名をまったく指定せず、目的のテキスト ノードを検索させます。私のために働く:

soup.find(text=re.compile('(AM|PM)')).strip()
于 2015-10-30T04:50:42.137 に答える