問題タブ [scrapinghub]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

176 問題

0 投票する

0 に答える

102 参照

python - Scraping Hub Periodic Script / IOError No such file or directory

定期的なスクリプトを実行して、プロジェクト内の json ファイルに接続しようとしています。これを試しました ( https://support.scrapinghub.com/support/solutions/articles/22000200416-deploying-non-code-files ) が、うまくいきません。スクレイピングハブからインポートされた構造が大きく異なります。このファイルを呼び出す必要があるまで、スクリプトは正常に機能しています。

私が得たエラーは次のとおりです。

これで setup.py ：

どうもありがとうございました。

2018-05-20T17:47:40.510

0 投票する

0 に答える

142 参照

web-scraping - Scrapy 0 ページがクロールされましたが、目に見える問題はありませんか?

Portia を使用してスパイダーを作成し、scrapy プロジェクトとしてダウンロードしました。スパイダーは正常に実行されますが、ログに次のように表示されます: Scrapy Crawled 0 pages (at 0 pages/min) and also get's saves. ただし、200 応答でクロールされたすべてのページも表示され、最後にデータのバイトが表示されます。

スパイダーコード

パイプラインコード クロール時にアイテムを json 行に書き込む openSpider および closeSpider 関数を追加しました。jl ファイルが作成されるため、機能すると思います。

パイプラインが機能するように、設定コード も設定でパイプラインを有効にします。

スパイダーを実行すると、次のログが作成されます。

アイテムを集めない理由がわかりません。最初に 0 個のアイテムがクロールされ、次にページに対して 200 件の成功応答が表示されたと言いました。ありがとうございました

web-scraping scrapy scrapy-spider scrapinghub portia

2018-07-24T04:32:35.080

1 2 3 4 5 6 7 8 9 10

問題タブ [scrapinghub]

python - Scraping Hub Periodic Sc​​ript / IOError No such file or directory

web-scraping - Scrapy 0 ページがクロールされましたが、目に見える問題はありませんか?

Reference

python - Scraping Hub Periodic Script / IOError No such file or directory