私は現在研究プロジェクトを行っており、Web ページの html にアクセスできる広告を識別する良い方法を見つけようとしています。
AdBlockから始めるのは良い考えかもしれないと思いました. AdBlock は広告がユーザーに表示されないようにするプログラムなので、おそらく広告として識別するためのメカニズムを備えています。
AdBlockPlus のソース コードをダウンロードしましたが、すべてのファイルで完全に迷ってしまいました。この検出メカニズムをどこから探し始めたらよいかわからないので、どこから始めればよいかアドバイスがあれば教えてください。または、以前に AdBlock を扱ったことがあり、それに精通している場合は、追加情報をいただければ幸いです。
たとえば、Adblock を使用するために Web ページを実際のブラウザーでレンダリングする必要がある場合、Web ページの読み込みを自動化するプログラムがあるため、これは問題にはなりませんが、これが原因かどうかを判断する方法がわかりません。 AdBlockはそもそもそうします。
注: AdBlock は Python と Perl で書かれています :)
ありがとう!