0

Python を使用して Web ページから広告の URL を取得する方法はありますか? たとえば (http://www.quiltingboard.com/resources/) 上部と右側の広告の URL を取得したいと考えています。それは可能ですか?

4

2 に答える 2

1

任意の pythons html パーサーを使用できます。私のお気に入りはlxml、高速だからですが、外部依存関係が必要です...

さらに、任意のサイトで広告を探している場合は、おそらく追加ドメインのリストが必要になります。

于 2012-11-02T22:59:26.553 に答える
0

あなたの最善の策は、Beautiful Soup (PyPI 名beautifulsoup4) を使用することです。これは、ページから必要なものを取得するための優れたインターフェイスを提供します。ドキュメントはこちら. 組み込みのものからhtml5libまたはまで、いくつかの異なる HTML/XML パーサーを使用できますlxml

于 2012-11-02T23:32:59.300 に答える