ページに広告があるかどうかを判断しようとしているアプリケーションを書いています。これは現在、Pythonを使用したSeleniumWebdriverを介したブラウザ駆動を使用しています。
iframe内にはかなりの量の広告が存在することがわかり、各フレーム内を確認するためのループを作成しました
browser = webdriver.Chrome()
browser.get("http://cnn.com")
all_iframes = browser.find_elements_by_tag_name("iframe")
for iframe in all_iframes:
browser.switch_to_frame(iframe)
print(browser.page_source)
browser.switch_to_default_content()
browser.quit()
ページ上(ページ上のiframeの内外の両方)に広告があるかどうかを判断するために複数のページで使用できる、一貫して検出されたタグまたはタグパラメーターがあるかどうか疑問に思っています。各フレーム内でダブルクリック、アドテック、アドブレードなどのインスタンスを探す必要がありますか?
または、ページごとにチェックするためのさまざまなルールを生成する必要がありますか?
広告がページにどのように表示されるかを知っている人はいますか?ありがとう。