Python で特定のコメントを見つけることができません<!-- why -->
。私の主な理由は、2 つの特定のコメント内のすべてのリンクを見つけることです。パーサーのようなもの。私はこれを試しましたBeautifulsoup
:
import urllib
over=urlopen("www.gamespot.com").read()
soup = BeautifulSoup(over)
print soup.find("<!--why-->")
しかし、うまくいきません。regex
を使用する必要があるかもしれないと思いますBeautifulsoup
。
助けてください。
例: このような HTML コードがあります
<!--why-->
www.godaddy.com
<p> nice one</p>
www.wwf.com
<!-- why not-->
編集: 2 つのコメントの間に、タグなどの他のものが存在する可能性があります。
そして、すべてのリンクを保存する必要があります。