問題タブ [cheerio]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - .each とコールバック
request および Cheerio ノード モジュールを使用して、Web サイトからデータを取得しています。アイテムのリストを取得したいのですが、このリストが完成したら、非同期関数を呼び出します。
私の質問は、リストが完了するのをどのように待つか、つまり、.each 関数がすべてのアイテムをループしたことをどのように知ることができるかということです。
非同期でこれを行うことはできますか?
ありがとう
javascript - これの何が問題なのですか?プロトタイプでリクエストコールバックを使用しようとしています...ほとんど成功していません
この Gistは、Node.js と Request および Cheerio を使用して、一連の Web ページからいくつかの要素を抽出するために、コールバックを含むリクエストを含めようとしている方法です。もともと、私は基本的なロジックを関数以上のものを使用して動作させていました。ただし、これをもう少しオブジェクト指向にしようとしていますが、明らかに惨めに失敗しています。ロジックは以前は機能していたので、なぜ今機能しないのか完全に困惑しています。
よろしくお願いいたします。
node.js - console.print Cheerio + nodejs 使用時の奇妙な文字
私は node.js が初めてで、データをスクレイピングする最初のスクリプトを作成しています。
このコードを使用しているときに疑問符の付いた奇妙な文字が表示される理由を知っている人はいますか?
これが私が見る出力です:
ありがとうございました!
アンソニー
javascript - すべてのコールバックが JavaScript でいつ行われたかを知る方法
サービスのすべてのコールバックが返されたときに、最終的なコレクションをファイルに書き込みたいサービスへの呼び出しが多数あります。すべてのコールバックが完了したことを確認する方法はありますか?
編集:記録のために、私はnodeJSでcheerioを使用しています。
node.js - ノードが遅く、大きなデータファイルで応答しない
企業の ERP から返された Excel 形式の HTML テーブルを解析し、データを取り出して JSON として保存する単純なノード プログラムを作成しました。
これは、FS を使用してファイルを開き、Cheerio を使用してデータを抽出します。
プログラムは小さなファイル (<10MB) の場合は正常に動作しますが、大きなファイル (>30MB) の場合は数分かかります
私が問題を抱えているデータ ファイルは 38 MB で、約 30,000 行のデータがあります。
質問 1: これは高速であるべきではありませんか? 質問 2: 出力する console.log ステートメントを 1 つしか取得できません。1 つのステートメントをどこにでも置くことができ、それが機能します。複数追加すると、最初のステートメントだけが何かを出力します。
jquery - imgタグの絶対URLを探す
Node.js
Web スクレイピングにandを使用していますが、現在、タグcheerio
の絶対 URL を抽出できない状況にあります。img
コードは次のとおりです。
Node.js 内でそのコードを実行すると値が戻ってきますundefined
が、src
そのコードを Chrome コンソールに直接適用すると正常に動作します。srcNode.js
プロパティが実装されていないようです。次にプロパティを出力してみました$(this)[0]
本当に、それは持っていません。相対URLを返すsrc
だけattrbs.src
です。何かアイデアはありますか?