1

私は次のhtmlを持っています:

<html lang="en-US" xml:lang="en-US" xmlns="http://www.w3.org/1999/xhtml">
<body>
<title>CATe - hj1612</title>
</td></tr></table>
</td></tr></table></td><td><img src="icons/arrowredright.gif"/></td><td align="center">
<input name="keyt" type="hidden" value="a3dvl"/>
<input type="submit" value="View"/><br/>or<br/>
<input type="reset" value="Reset"/>
</td>
</tr>
</body>
</html>

の値を取得しようとしていますkeyt。をそのままhtml使用してBeautifulSoupいます。

soup = BeautifulSoup(html)

soup.findそして、私はあなたがidlikeで使用できることを知っていますsoup.find(id="randomid")

bodyタグではないので動作しません...結果として、通常の方法soup.find(name="keyt") を使用すると思いますのでif substring in string:

for line in soup.find_all('input'):
    if "keyt" in line:
        print line

しかし、この方法はうまくいかないようです。私はpythonが初めてなので、助けを借りて正しい方向を指していただければ幸いです

4

2 に答える 2

1

奇妙な HTML があります。HEAD タグが閉じられていない、td、テーブルが開かれていない。スープがそれをどのように解析できるか、想像さえできません。

于 2013-10-19T13:52:33.963 に答える