問題タブ [scraperwiki]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
463 参照

python - ScraperWiki データストアはどのエンコーディングを期待していますか?

ScraperWikiでスクレイパーを作成しているときに、UTF8 でエンコードされた文字列を保存しようとすると、次のメッセージが繰り返し表示されました。

最終的に、試行錯誤と UnicodeDecodeError によって、ScraperWiki データストアが Unicode を想定しているように見えることがわかりました。

そのため、データストアに保存する直前に UTF-8 からデコードし、すべてを Unicode に変換しています。

これはエラーを回避しますが、賢明ですか? ScraperWiki データストアがサポートしているエンコーディングを確認できる人はいますか?

ありがとう!

0 投票する
3 に答える
7761 参照

python - RSS を lxml で解析中にエンコード エラーが発生しました

ダウンロードしたRSSをlxmlでパースしたいのですが、UnicodeDecodeErrorの扱いがわからないのですが?

しかし、私はエラーが発生します:

0 投票する
1 に答える
369 参照

screen-scraping - ScraperWikiは、スクレイピングしているサイトをレート制限しますか?

ScraperWikiはどういうわけか自動的にスクレイピングをレート制限しますか、それともsleep(1 * random.random())のようなものをループに追加する必要がありますか?

0 投票する
1 に答える
1669 参照

screen-scraping - ScraperWikiで「終了ステータス1」とはどういう意味ですか、それは失敗ですか?

ユーザーは、スクレーパーの実行からこのメッセージを受け取っていました。

「終了ステータス1」とは何ですか?それは成功ですか、それとも失敗ですか?失敗した場合
、ログファイルはありますか?

0 投票する
1 に答える
333 参照

scraperwiki - スクレイパーウィキは実行時間をどのように制限していますか?

スクレイパーウィキはスケジュールされた実行を停止することをどのように決定しますか? 実際の実行時間またはCPU時間に基づいていますか? または多分何か他のもの。

Mechanize がすべてのページをロードするのに 30 秒を必要とするサイトをスクレイピングしますが、ページを処理するために使用する CPU はほとんどないため、サーバーの遅さが大きな問題ではないかと思います。

0 投票する
2 に答える
5926 参照

asp.net - PythonMechanizeを使用したaspxのスクリーンスケープ-Javascriptフォームの送信

私は、scraperwikihttp :/ /scraperwiki.com/scrapers/food_standards_agency/)が、次の形式の「次の」ページのリンクをたどろうとすると問題が発生します。

フォームハンドラは次のようになります。

[次のリンク]を手動でクリックしたときのHTTPトレースでは、__ EVENTTARGETが空であると表示されますか?他のスクレーパーで見つけることができるすべてのベビーベッドは、次のページを処理する方法として__EVENTTARGETの操作を示しています。

確かに、スクレイプしたいページが次のページをどのようにロードするのかわかりませんか?スクレーパーに何を投げても、最初の結果ページをロードすることしかできません。(1ページあたりの結果数を変更できることも便利ですが、その方法もわかりません!)

それで、N>0の1+ N番目の結果ページをスクレイプする方法についてのアイデアはありますか?

0 投票する
1 に答える
53 参照

scraperwiki - スクレイパーウィキのビューを削除する方法はありますか?

スクレイパーウィキのビューを削除する方法はありますか? サイトのどこにもそれを行う方法が見つかりません。

0 投票する
2 に答える
203 参照

php - 番号付きトランスクリプトを XML に解析する

Leveson Inquiryからのトランスクリプトを解析するスクレーパーを構築したいと考えています。これは、プレーンテキストとして次の形式になっています。

(完全な例)

最終的には、次のような構造の XML ファイルを作成したいと考えています。

…助けて?

(また、"MR BARR:" はある時点で単に "Q." に変わることにも注意してください。)

どうもありがとう!

0 投票する
1 に答える
528 参照

sql - ScraperWiki: 自動インクリメント キーを使用してレコードを作成および追加する方法

代理キーを使用してテーブルを作成する方法を知っている人はいますか? 自動インクリメントのようなものを探します。これは、次に大きい一意の番号を主キーとして自動的に追加する大きな整数です。

テーブルの作成方法とレコードの追加方法を知る必要があります (できれば、scraperwiki.sqlite.save を使用)

ありがとう!

0 投票する
2 に答える
191 参照

php - Foreachループは1回の反復後に終了します

私はScraperWikiを試していましたが、昨日、liDOM内のすべてのリストを取得できました。ただし、現在は1回の反復しか実行していません。

これは私のコードです

私は実際にはPHPの人ではないので、明らかな何かが欠けている可能性があります。完全なソースはhttps://scraperwiki.com/scrapers/days_of_the_year/にあります