私はいくつかのWebスクレイピングを行っており、JavaScriptリンクをクリックする必要があり、Pythonと機械化の方法を理解できないことを除いて、プロジェクトはほぼ完了しています。
ページの 1 つで、JavaScript リンクのリストが表示され、それらを順番にたどり、データをスクレイピングして繰り返したいと思います。mechanize が javascript で動作しないことは知っていますが、回避策を知っている人はいますか? リンクを分離するために使用するコードは次のとおりです。
for Auth in iterAuths:
Auth = str(Auth.contents[0]).strip()
br.find_link(text=Auth)
するとbr.follow_link(text=Auth)
、エラーが発生しますurllib2.URLError: <urlopen error unknown url type: javascript>
。
もしそうならprint br.click_link(text=Auth')
、それは次のように印刷されますRequest for javascript:SendThePage('5660')
JavaScriptリンクを通過するだけです。誰でも助けることができますか?