私のコーディング経験はPythonです。特定のアドレス(nytimes.comなど)を検出し、ページをロードしてから、htmlに続くアドレスの末尾を削除して(これにより、1か月あたり20ページビューの制限をバイパスできます)、FirefoxでPythonコードを実行してリロードする簡単な方法はありますか? ?
質問する
123 次
2 に答える
1
あなたの最善の策は、以前に提案されたようにセレンを使用することです。これがあなたがそれをすることができる方法の小さな例です。基本的に、コードは制限に達しているかどうかをチェックし、制限に達している場合はCookieを削除してページを更新し、読み続けられるようにします。Cookieを削除すると、アドレスを継続的に編集しなくても、さらに10件の記事を読むことができます。それは技術的な部分です、あなたはあなた自身で法的な意味を考慮しなければなりません。
from selenium import webdriver
browser=webdriver.Firefox()
browser.get('http://www.nytimes.com')
if browser.find_element_by_xpath('.//*[contains(.,"You’ve reached the limit of 10 free articles a month.")]'):
browser.delete_all_cookies()
browser.refresh()
于 2012-11-30T09:10:53.963 に答える
0
Selenium を使用すると、Firefox やその他の Web ブラウザーを Python で簡単に完全に制御できます。これを達成するには、数行のコードしかありません。この回答SeleniumとPythonを統合する方法には、実際の例があります
于 2012-11-30T07:10:41.420 に答える