私はスクレイピーとパイソンを使ってウェブクロールをしたいと思っています。私は、インターネットからSeleniumをscrapyで使用しているコード例をいくつか見つけました。
私はあまり知りませんがselenium
、いくつかの Web タスクを自動化することだけは知っています。ブラウザが実際に開いて何かをします。しかし、実際のブラウザを開きたくないのですが、コマンドラインからすべてを実行したいのです。
セレンとスクレイピーでそれを行うことはできますか
更新: PhantomJS は廃止され、Firefox や Chrome などのヘッドレス ブラウザーを直接使用できるようになりました。
代わりに PhantomJS を使用してください。
browser = webdriver.PhantomJS()
セレンv2.32.0でできます。
少なくともLinuxでは、PyVirtualDisplayでセレンを使用できます。
from pyvirtualdisplay import Display
from selenium import webdriver
display = Display(visible=0, size=(1024, 768))
display.start()
browser = webdriver.Chrome()