Python を使用して Web ページから広告の URL を取得する方法はありますか? たとえば (http://www.quiltingboard.com/resources/) 上部と右側の広告の URL を取得したいと考えています。それは可能ですか?
質問する
74 次
2 に答える
1
任意の pythons html パーサーを使用できます。私のお気に入りはlxml
、高速だからですが、外部依存関係が必要です...
さらに、任意のサイトで広告を探している場合は、おそらく追加ドメインのリストが必要になります。
于 2012-11-02T22:59:26.553 に答える
0
あなたの最善の策は、Beautiful Soup (PyPI 名beautifulsoup4
) を使用することです。これは、ページから必要なものを取得するための優れたインターフェイスを提供します。ドキュメントはこちら. 組み込みのものからhtml5lib
またはまで、いくつかの異なる HTML/XML パーサーを使用できますlxml
。
于 2012-11-02T23:32:59.300 に答える