問題タブ [firefox-marionette]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
745 参照

python-2.7 - Selenium + Geckodriver のトラブルシューティング

Python で Selenium を使用して Firefox gecko ドライバーを使用してフォーラムの投稿タイトルをスクレイピングしていますが、理解できない障害にぶつかりました。

フォーラムから数年分の過去の投稿タイトルをこすり取ろうとしていますが、私のコードはしばらくの間正常に動作します。私は座って約 20 ~ 30 分間動作するのを見ましたが、本来の動作を正確に実行します。しかし、その後スクリプトを開始して就寝し、翌朝目を覚ますと、約 22,000 件の投稿が処理されていることがわかりました。私が現在スクレイピングしているサイトには、1 ページあたり 25 の投稿があるため、クラッシュする前に ~880 の個別の URL を通過しました。

クラッシュすると、次のエラーがスローされます。

最初、私のコードは次のようになりました。

私も試しました:

3 つのシナリオすべてで同じエラーが発生しますが、それはかなり長い間正常に実行されていた後であり、なぜ失敗したのかを判断する方法がわかりません。

数百の URL が正常に処理された後にこのエラーが発生する理由を特定するにはどうすればよいですか? または、この多くのページを処理するために、Selenium/Firefox で従わないベスト プラクティスがありますか?

0 投票する
1 に答える
276 参照

python - Python firefox-マリオネットのタイムアウト

私は以下を実行しました:

そしてFirefoxが起動し、コマンドラインが再び利用可能になります。次の応答はありません。

… 1491228343089 マリオネット情報 ポート 2828 でリッスン中

ここに文書化されているように。

Python を使用して marionette を実行するときは、次のように実行します。

そして戻ってください:

他の誰かがこれを経験しましたか?私は何を間違っていますか?