問題タブ [cheerio]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
4 に答える
12789 参照

javascript - .each とコールバック

request および Cheerio ノード モジュールを使用して、Web サイトからデータを取得しています。アイテムのリストを取得したいのですが、このリストが完成したら、非同期関数を呼び出します。

私の質問は、リストが完了するのをどのように待つか、つまり、.each 関数がすべてのアイテムをループしたことをどのように知ることができるかということです。

非同期でこれを行うことはできますか?

ありがとう

0 投票する
1 に答える
46 参照

javascript - これの何が問題なのですか?プロトタイプでリクエストコールバックを使用しようとしています...ほとんど成功していません

この Gistは、Node.js と Request および Cheerio を使用して、一連の Web ページからいくつかの要素を抽出するために、コールバックを含むリクエストを含めようとしている方法です。もともと、私は基本的なロジックを関数以上のものを使用して動作させていました。ただし、これをもう少しオブジェクト指向にしようとしていますが、明らかに惨めに失敗しています。ロジックは以前は機能していたので、なぜ今機能しないのか完全に困惑しています。

よろしくお願いいたします。

要点: https://gist.github.com/knu2xs/5acc6f24c5df1c881cf7

0 投票する
1 に答える
3186 参照

node.js - console.print Cheerio + nodejs 使用時の奇妙な文字

私は node.js が初めてで、データをスクレイピングする最初のスクリプトを作成しています。

このコードを使用しているときに疑問符の付いた奇妙な文字が表示される理由を知っている人はいますか?

これが私が見る出力です:

http://snag.gy/eQF1Y.jpg

ありがとうございました!

アンソニー

0 投票する
8 に答える
4426 参照

javascript - すべてのコールバックが JavaScript でいつ行われたかを知る方法

サービスのすべてのコールバックが返されたときに、最終的なコレクションをファイルに書き込みたいサービスへの呼び出しが多数あります。すべてのコールバックが完了したことを確認する方法はありますか?

編集:記録のために、私はnodeJSでcheerioを使用しています。

0 投票する
1 に答える
1954 参照

node.js - ノードが遅く、大きなデータファイルで応答しない

企業の ERP から返された Excel 形式の HTML テーブルを解析し、データを取り出して JSON として保存する単純なノード プログラムを作成しました。

これは、FS を使用してファイルを開き、Cheerio を使用してデータを抽出します。

プログラムは小さなファイル (<10MB) の場合は正常に動作しますが、大きなファイル (>30MB) の場合は数分かかります

私が問題を抱えているデータ ファイルは 38 MB で、約 30,000 行のデータがあります。

質問 1: これは高速であるべきではありませんか? 質問 2: 出力する console.log ステートメントを 1 つしか取得できません。1 つのステートメントをどこにでも置くことができ、それが機能します。複数追加すると、最初のステートメントだけが何かを出力します。

0 投票する
2 に答える
416 参照

jquery - imgタグの絶対URLを探す

Node.jsWeb スクレイピングにandを使用していますが、現在、タグcheerioの絶対 URL を抽出できない状況にあります。img

コードは次のとおりです。

Node.js 内でそのコードを実行すると値が戻ってきますundefinedが、srcそのコードを Chrome コンソールに直接適用すると正常に動作します。srcNode.jsプロパティが実装されていないようです。次にプロパティを出力してみました$(this)[0]

本当に、それは持っていません。相対URLを返すsrcだけattrbs.srcです。何かアイデアはありますか?