“scrapyjs”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

1024 参照

python - ScrapyJS のインストール - Python の初心者

このスクレイピーアドオン (またはそれが何であるか) を使用しようとしています: Scrapyjs。

ただし、インストール手順はなく、Python は初めてです。私が見逃している基本的なものはありますか？これをスクレイピープロジェクトと統合するにはどうすればよいですか。

注: ミドルウェアバージョンではなく、Scrapy ダウンロードハンドラーを使用することをお勧めします。（間違っている場合は修正してください）。

2015-01-02T09:17:41.050

0 投票する

0 に答える

661 参照

python - ScrapyJs Javascript が有効になっていません

JavaScript コードを含む Web サイトと、JavaScript コードで準備された Web サイトのコンテンツをクロールしようとしています。

Scrapy と Splash をインストールしました。

スプラッシュはこのコードで実行されています

ウェブサイトのコードを取得しようとすると、render.html に「Javascript が有効になっていません。ブラウザで JavaScript を有効にしてください」と表示されます。

すべての設定はOKです。

私は一度ウェブサイトをうまくスクラップしました。その後、「お使いのブラウザで Javascript が有効になっていません」というエラーが表示されます。

問題の解決に役立つ場合、これはページをレンダリングしたときのスプラッシュ出力です。

何が問題なのか理解できませんでした。何か助けはありますか？

さらに詳しい情報

仮想マシンを削除しました。IPアドレスが変更され、再試行しました。初めて結果を出すことに成功。しかし、2 回目のリクエストでは何も取得できませんでした。Web サイトが私の IP アドレスをブロックしていると思います。

python web-crawler scrapy scrapy-spider scrapyjs

2015-08-21T08:14:10.453

0 投票する

1 に答える

2412 参照

python - スプラッシュによる Scrapyjs クロール onclick ページの使用

次のようなJavaScriptを使用するページからURLを取得しようとしています

これは、scrapyjs をスプラッシュで使用した私のコードです

私が書くなら

それが動作します

ページ内のテキストを処理できるようですが、URLを取得できませんgo1()

内部の URL を取得したい場合はどうすればよいですかgo1()

ありがとう！

python scrapy splash-screen scrapyjs

2016-01-28T04:40:24.183

0 投票する

1 に答える

5041 参照

javascript - Scrapyjs + スプラッシュクリックコントローラーボタン

こんにちは、Scrapyjs + Splash をインストールしました。次のコードを使用します

これまでのところ正常に動作しますが、ID も実際の href も持たないコントローラーの「前へ」ボタンをクリックしたいと思います。

私は試してみました

そしてその

しかし、どちらも成功しませんでした。

javascript scrapy splash-screen scrapyjs

2016-03-01T10:23:06.193

0 投票する

2 に答える

2762 参照

python - Splashを使用してJavascriptで生成されたフォームへのScrapy POST

フォームに投稿するだけのはずの次のスパイダーがあります。私はそれを機能させることができないようです。Scrapy で実行すると、応答が表示されません。誰かが私がこれでどこが間違っているのか教えてもらえますか?

これが私のスパイダーコードです：

私が得るのは、次のような応答です。

私が得るべきものは、次のような結果です:

mydealer_search_page()を Splash に置き換えると、次のようになります。

次の警告が表示されます。

inspect_response()そして、プログラムは my in my process()functionに到達する前に終了します。

エラーは、スプラッシュがまだサポートされていないことを示しPOSTています。Splashこのユースケースで機能しますか、それとも使用する必要がありますSeleniumか?

python web-scraping scrapy splash-screen scrapyjs

2016-03-13T09:53:21.250

0 投票する

1 に答える

924 参照

scrapy - クリックイベントの後に、スプラッシュ+スクレイピーjs +スクレイピーから、イールドリクエストなしでhtmlソースコードを取得するにはどうすればよいですか?

セレンphantomjsを使用して動的Webサイトのスクレイピングをscrapyjsに変更しようとしています。しかし問題は、スプラッシュでクリックイベントを記述する場合、yield リクエストが必要になることです。yield リクエストを与えると、最初のページがレンダリングされます。そのため、ソースコードではクリックイベントの変更は見られません。つまり、Web ページを再レンダリングする必要はありません。セレンで可能です。スプラッシュで利用できる同じ機能はありますか?

scrapy splash-screen scrapyjs

2016-03-28T13:17:10.813

0 投票する

3 に答える

4183 参照

python - ScrapyJS - ページの読み込みを適切に待つ方法は?

ScrapyJS と Splash を使用してフォーム送信ボタンのクリックをシミュレートしています

を実行した後splash:runjs(js)、結果を取得~~しよsplash:wait(5)~~うとしています。splash:wait_for_resumeこれは常に機能するとは限りません (ネットワーク遅延)。より良い方法はありますか?

python scrapy scrapyjs

2016-04-04T10:30:44.080

0 投票する

1 に答える

7279 参照

python-2.7 - python-requests でスプラッシュを使用するには?

このようなリクエストでスプラッシュを使用したい

しかし、私はこのエラーがあります

これがscrapy.Requestで機能することは知っていますが、リクエストで使用したい

python-2.7 scrapy python-requests splash-screen scrapyjs

2016-05-06T09:11:24.323

0 投票する

1 に答える

1186 参照

python - スクレイピーとスプラッシュでJavaScriptを使用して同じページを再帰的にクロールする

次のページに移動するための JavaScript を含むサイトをクロールしています。スプラッシュを使用して、最初のページで JavaScript コードを実行しています。でも2ページ目まで行けました。しかし、私は 3,4,5.... ページに行くことができません。1 ページだけでクロールが停止します。

私がクロールしているリンク: http://59.180.234.21:8788/user/viewallrecord.aspx

コード：

私はスクレイピーとスプラッシュの両方の初心者です。優しくしてください。ありがとうございました

python scrapy web-crawler scrapy-splash scrapyjs

2016-11-07T09:42:32.020

問題タブ [scrapyjs]

Reference