問題タブ [scrapy-splash]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

559 問題

0 投票する

0 に答える

150 参照

django - Scrapy-splash で DDS を構成します。エラー: ベースオブジェクトがありません

LS、

Django-Dynamic-Scraper をインストールしました。そして、スプラッシュ経由で Javascript をレンダリングしたいと思います。そのため、scrapy-splash をインストールし、docker スプラッシュイメージをインストールしました。下の画像は、docker コンテナーにアクセスできることを示しています。

スプラッシュドッカーコンテナ

それにもかかわらず、DDS 経由でテストすると、次のエラーが返されます。

実行時:

DDS 管理ページを構成し、チェックボックスをオンにして JavaScript をレンダリングしました。

管理者構成

私はスクレイピースプラッシュからの設定に従いました：

DDS/scrapy-splash を正しく設定すると、必要な引数がスプラッシュ Docker コンテナーに送信されてレンダリングされると思いますが、これは当てはまりますか?

私は何が欠けていますか？スプラッシュスクリプトを使用してスパイダーを調整する必要がありますか?

2016-10-25T17:36:46.143

0 投票する

2 に答える

6359 参照

scrapy - スクレイピースプラッシュは無限スクロールをどのように処理しますか?

Webページを下にスクロールして生成されたコンテンツをリバースエンジニアリングしたい。問題は url にありhttps://www.crowdfunder.com/user/following_page/80159?user_id=80159&limit=0&per_page=20&screwrand=933ます。screwrandパターンに従っていないように見えるため、URL の反転は機能しません。Splashを使った自動レンダリングを検討しています。Splash を使用してブラウザのようにスクロールするには? どうもありがとう！2 つのリクエストのコードは次のとおりです。

ブラウザコンソールに表示される ajax リクエスト

scrapy scrapy-splash splash-js-render

2016-10-30T02:56:35.007

0 投票する

1 に答える

1186 参照

python - スクレイピーとスプラッシュでJavaScriptを使用して同じページを再帰的にクロールする

次のページに移動するための JavaScript を含むサイトをクロールしています。スプラッシュを使用して、最初のページで JavaScript コードを実行しています。でも2ページ目まで行けました。しかし、私は 3,4,5.... ページに行くことができません。1 ページだけでクロールが停止します。

私がクロールしているリンク: http://59.180.234.21:8788/user/viewallrecord.aspx

コード：

私はスクレイピーとスプラッシュの両方の初心者です。優しくしてください。ありがとうございました

python scrapy web-crawler scrapy-splash scrapyjs

2016-11-07T09:42:32.020

0 投票する

3 に答える

1369 参照

javascript - Splash HTTP レンダリングサービスで外部 JavaScript リソースを動的にロードする

現在、リクエストをレンダリングするヘッドレスブラウザとしてSplash HTTP APIを使用しています。ページの読み込みが完了した後、ページがレンダリングされる前に、ページコンテキスト内でカスタム Javascript コードを評価できるエンドポイントrender.html を js_sourceと共に使用しています。

ページの読み込み後にjQueryを読み込むなど、外部リソースに追加のリクエストを行う必要があります。

問題は、そのようにすることによって、オブジェクトがページコンテキスト内で使用可能にならないことです。スクリプトは、レンダリングされた最終的な HTML ソースの HEAD 要素内に追加されているように見えます。

以下で説明する両方のメソッドを使用してコールバックを設定して、jQueryのメソッドにアクセスする前にスクリプトが読み込まれるようにしました。ただし、コールバックは両方のシナリオで呼び出されません。

前述のスクリプトをChromeのコンソールで実行すると、必要な処理が実行され、すぐに jQuery リソースがページコンテキスト内で使用できるようになります。

javascript jquery html scrapy-splash

2016-12-06T16:59:50.227

0 投票する

2 に答える

1773 参照

python - Scrapy:フォームリクエストを生成して何も出力しませんか?

私はウェブサイトをスクラップするためのスパイダーを書いています:

最初の URL www.parenturl.com は parse 関数を呼び出します。そこから、parse2 関数へのコールバックがある URL www.childurl.com を抽出し、dict を返します。

質問 1) dict 値を、解析関数で親 URL から抽出した他の 7 つの値と共に mysql データベースに格納する必要がありますか? (response_url は何も出力しません)

python web scrapy scrapy-spider scrapy-splash

2016-12-16T08:21:37.933

1 2 3 4 5 6 7 8 9 10

問題タブ [scrapy-splash]

django - Scrapy-splash で DDS を構成します。エラー: ベース オブジェクトがありません

scrapy - スクレイピースプラッシュは無限スクロールをどのように処理しますか?

python - スクレイピーとスプラッシュでJavaScriptを使用して同じページを再帰的にクロールする

javascript - Splash HTTP レンダリング サービスで外部 JavaScript リソースを動的にロードする

python - Scrapy:フォームリクエストを生成して何も出力しませんか?

Reference

django - Scrapy-splash で DDS を構成します。エラー: ベースオブジェクトがありません

javascript - Splash HTTP レンダリングサービスで外部 JavaScript リソースを動的にロードする