9

ページに広告があるかどうかを判断しようとしているアプリケーションを書いています。これは現在、Pythonを使用したSeleniumWebdriverを介したブラウザ駆動を使用しています。

iframe内にはかなりの量の広告が存在することがわかり、各フレーム内を確認するためのループを作成しました

browser = webdriver.Chrome()
browser.get("http://cnn.com")

all_iframes = browser.find_elements_by_tag_name("iframe")

for iframe in all_iframes:
   browser.switch_to_frame(iframe)
   print(browser.page_source)
   browser.switch_to_default_content()

browser.quit()

ページ上(ページ上のiframeの内外の両方)に広告があるかどうかを判断するために複数のページで使用できる、一貫して検出されたタグまたはタグパラメーターがあるかどうか疑問に思っています。各フレーム内でダブルクリック、アドテック、アドブレードなどのインスタンスを探す必要がありますか?

または、ページごとにチェックするためのさまざまなルールを生成する必要がありますか?

広告がページにどのように表示されるかを知っている人はいますか?ありがとう。

4

1 に答える 1

9

広告サーバーで検索できます。

http://pgl.yoyo.org/as/serverlist.php?hostformat=adblockplus

他のプロジェクトを見て、それらが同じタスクを実行する方法を確認すると便利です。

http://adblockplus.org/en/source

于 2012-11-16T19:39:34.113 に答える