問題タブ [scrapyd]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
365 参照

python - 個々のhxs.selectが機能している間、空のスクレーパー出力?

メインファイル

アイテムファイル

私が実行したときの出力:スクレイピークロールブロガーx -o items.json -t json

生成された出力ファイルは空で、個々の hxs.select ステートメントは、scrapy シェルで試したときに正常に動作します。私がしている愚かなことはありますか?

0 投票する
2 に答える
147 参照

python-2.7 - ScrapyDeploy-Lは何も返しません

Scrapyプロジェクトをデプロイしようとしていますが、行き詰まっています

私は間違いなく作業プロジェクトといくつかのスパイダーを持っています:

スクレイプリストを実行すると、すべてのスパイダーのリストが表示されます。

私はscrapy.cfgファイルを次のように変更しました。

それから私はします:

したがって、すべてが正常であるように見えますが、次のステップでは、利用可能なプロジェクトが表示されません。

直接入力してみました:

しかし、それは役に立ちませんでした。

私が間違っていることを提案しますか?

0 投票する
0 に答える
973 参照

scrapy - Scrapy: .aspx ページのクロールに問題がある

.aspx ページをクロールしようとしていますが、存在しないページにリダイレクトされます。これを解決するために、'dont_merge_cookies': True および 'dont_redirect': True を設定して、start_requests を上書きしようとしましたが、"'Response' オブジェクトに属性 'body_as_unicode' がありません" というエラーが表示され、応答クラス タイプが表示されます。 「scrapy.http.response.Response」です。

これが私のコードです:

0 投票する
1 に答える
161 参照

iis - IISでScrapyを実行する

IISサーバーがあり、その上にASP.NETMVCアプリケーションがあります。MVCアプリケーションは、スクレイピングされたデータを中心に展開します。IISでScrapy(Pythonで構築されたツール)を実行する方法はありますか?IISでPHPとWordPressを実行する方法と同様です。

0 投票する
2 に答える
1651 参照

amazon-s3 - Feed Exporter を使用して Scrapyd から Amazon S3 にアイテムを保存する

Amazon S3 で Scrapy を使用するのは非常に簡単で、次のように設定します。

  • FEED_URI = 's3://MYBUCKET/feeds/%(名前)s/%(時間)s.jl'
  • FEED_FORMAT = 'jsonlines'
  • AWS_ACCESS_KEY_ID = [アクセスキー]
  • AWS_SECRET_ACCESS_KEY = [秘密鍵]

すべてがうまく機能します。

しかし、Scrapyd はその設定をオーバーライドし、アイテムをサーバーに保存するようです (Web サイト内のリンクを使用)。

「items_dir =」設定を追加しても何も変わらないようです。

どのような設定で機能しますか?

編集: 関連する可能性のある追加情報 - Scrapy-Heroku を使用しています。

0 投票する
1 に答える
3346 参照

scrapy - Scrapyd を使用する利点は何ですか?

スクレイピードキュメントは次のように述べています:

Scrapy には「Scrapyd」と呼ばれる組み込みサービスが付属しており、JSON Web サービスを使用してプロジェクトをデプロイ (別名、アップロード) し、スパイダーを制御できます。

適合性にscrapydを使用する利点はありますか?

0 投票する
3 に答える
942 参照

scrapy - Scrapyd アイテムを json 形式で保存する方法

scrapydにアイテムを保存しようとしていJSON fileます。実際には、デフォルトで項目を json ファイルに保存しますが、次のようにします: File_1:

そして、スクレイピークロールでスパイダーを実行すると、 Spidername -o fileName -t json

次のようなアイテムを保存します: File_2:

File_1 の貼り付け内容を jsonParser にコピーしようとする、予想されるというエラーが表示されます[ が、File_2 は正常に動作します。Scrapyd を使用してアイテムを適切な JSON 形式で保存する方法を教えてもらえますか

0 投票する
1 に答える
300 参照

python - freeBSDにscrapydをインストールする方法

freeBSDにscrapydをインストールしようとしていますが、次のエラーが発生します:

このコマンドを使用してスクレイピーをインストールしました:

freeBSDにscrapydをインストールする方法を教えてください。

0 投票する
1 に答える
589 参照

python - Scrapy デプロイが機能しなくなった

私はscrapydを使用してscrapyプロジェクトをデプロイしようとしていますが、エラーが発生しています...

以前はプロジェクトを適切にデプロイできましたが、今はそうではありません.....しかし、スクレイピークロールスパイダーネームを使用してクロールスパイダーを使用する場合、問題はありません...誰か助けてください....