“scrapyd”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1083 参照

python - ScrapyプロジェクトをscrapydにデプロイするときにHTTPCACHEが機能しない

Scrapyd で HTTPCACHE を使用しようとすると、次のエラーが発生します。

[scrapy] WARNING: Disabled Httpcache Middlware: unable to find scrapy.cfg file to infer project data dir

2011-06-28T17:53:02.910

0 投票する

1 に答える

877 参照

scrapy - Scrapy サーバーのセットアップ

AWSでscrapydサーバーをセットアップしようとしていて、ローカルマシンからアクセスしようとしています. これまでのところ、scrapyd をリモートマシンで実行することができました。

私はそれが実行されていることを知っていstart scrapydますstart: Job is already running: scrapyd。

ローカルマシンからアクセスできるようにするには、どうすればよいですか?

scrapy scrapyd

2011-12-17T10:46:00.347

0 投票する

2 に答える

4259 参照

python - ScrapyのScrapydがスパイダーのスケジュール設定で遅すぎる

Scrapydを実行していますが、4つのスパイダーを同時に起動すると奇妙な問題が発生します。

私はすでにScrapydの次の設定を持っています：

Scrapydがスケジュールどおりにスパイダーを同時に実行しないのはなぜですか？

python scrapy scrapyd

2012-02-06T14:34:22.773

0 投票する

3 に答える

1972 参照

python - スパイダー内のScrapydjobid値

FrameworkScrapy-Scrapydサーバー。

スパイダー内でjobid値を取得するのに問題があります。

http：// localhost：6800 / schedule.jsonにデータを投稿した後、応答は次のようになります。

しかし、プロセス中に現在のスパイダー内でこのジョブIDを使用する必要があります。これは、開いている{jobid}.logファイルまたはその他の動的な理由で使用できます。

しかし、私はタスクが完了した後にのみこのjobidを見る:(ありがとう！

python scrapy scrapyd

2012-03-11T04:28:07.537

0 投票する

1 に答える

486 参照

python - クローラープロセスが予期せず終了する

クローラープロセスが予期せず終了するという問題に直面しています。

私はスクレイピー 0.14 を使用していますが、0.12 にも問題がありました。

Scrapyd ログには、次のようなエントリが表示されます: プロセスが死亡しました: exitstatus=None スパイダーログには、データベースステータスによって示されるスパイダークローズ情報も表示されません。

他の誰かが同様の状況に直面しましたか? これらのプロセスが消えた理由、アイデア、提案をどのように追跡できますか?

python scrapy scrapyd

2012-04-12T19:25:23.610

0 投票する

2 に答える

7328 参照

python - Scrapyd を使用して一度に複数の Scrapy Spider を実行する

私は、多数のサイト (おそらく数百) をスクレイピングしたいプロジェクトにスクレイピーを使用しており、サイトごとに特定のスパイダーを作成する必要があります。以下を使用して、scrapyd にデプロイされたプロジェクトで1 つのスパイダーをスケジュールできます。

しかし、プロジェクト内のすべてのスパイダーを一度にスケジュールするにはどうすればよいでしょうか?

すべての助けに感謝します！

python screen-scraping scrapy scrapyd

2012-05-29T14:23:15.063

0 投票する

4 に答える

8387 参照

python - sparkydを使用してプロジェクトをデプロイする際のエラー

プロジェクトフォルダに複数のスパイダーがあり、すべてのスパイダーを一度に実行したいので、scrapydサービスを使用して実行することにしました。私はここを見てこれを始めました

まず第一に、私は現在のプロジェクトフォルダにいます

ファイルを開いて、scrapy.cfg後にURL行のコメントを外しました

[配備]
私はscrapy serverコマンドを実行しました、それはうまく動作し、scrapydサーバーは実行されます
このコマンドを試しましたscrapy deploy -l

結果： default http://localhost:6800/
このコマンドを試したscrapy deploy -L scrapydところ、次の出力が得られました

結果：

このコマンドでプロジェクトをデプロイしようとすると、scrapy deploy scrapyd -p default次のエラーが発生しました

私は本当にscrapydが上記のエラーを示していることを特定できません。プロジェクトをscrapydにデプロイする正しい方法に私を導くことができます

前もって感謝します..........

編集されたコード：

Peter Kirbyの答えを見た後、scrapy.cfgでtargetという名前を付け、プロジェクトフォルダーで次のコマンドを試しました。

コマンド：

次に、以下のエラーが発生しました

これを解決する方法.....

python scrapy scrapyd

2012-07-06T12:48:04.683

0 投票する

1 に答える

3995 参照

python - sparkydを使用して複数のスパイダーを実行する

プロジェクトに複数のスパイダーがあったので、scrapydサーバーにアップロードして実行することにしました。プロジェクトを正常にアップロードしました。コマンドを実行すると、すべてのスパイダーが表示されます。

次のコマンドを実行すると

与えられたスパイダーが1つしかないため、1つのスパイダーしか実行されませんが、ここで複数のスパイダーを実行したいので、次のコマンドは、scrapydで複数のスパイダーを実行するのに適していますか？

そして後で、cronジョブを使用してこのコマンドを実行します。つまり、これを頻繁に実行するようにスケジュールします。

python scrapy web-crawler scrapyd

2012-07-09T07:45:55.983

0 投票する

2 に答える

763 参照

python - コマンド「scrapycrawltest」を実行しようとすると、libxml2またはlxmlエラーが発生します

私はソースコードを次のようにフォローしています：

シェルコマンド（scrapy shell http://test.com/test）で実行すると、正常に動作します。エラーは発生しません。ただし、コマンド「scrapy cool test」を実行すると、以下のエラーが発生します。

私はすでにlibxml2とlxmlの両方をインストールしているので、それは真実ではありません。http://www.lfd.uci.edu/~gohlke/pythonlibs/からバイナリパッケージ（64ビット）をダウンロードしてインストールします。さらに、cmdからlxmlとlibxml2を正常にインポートできます。

この問題を解決するのを手伝ってください。

どうもありがとう。

python lxml scrapy libxml2 scrapyd

2012-08-15T19:25:33.707

0 投票する

3 に答える

3309 参照

python - スクレイピーログの問題

私は1つのプロジェクトに複数のスパイダーを持っています、問題は今私がSETTINGSのようにLOG_FILEを定義していることです

私が欲しいのはscrapy_SPIDERNAME_DATETIME

しかし、私は log_file name に Spidername を提供することができません..

私が見つけた

各スパイダーinitメソッドでそれを呼び出しましたが、機能していません..

任意の助けをいただければ幸いです

python python-2.7 scrapy scrapyd

2012-08-21T06:57:31.923

問題タブ [scrapyd]

Reference