問題タブ [pyquery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
182 参照

python - PyQuery 要素を各サブ要素に追加して名前を変更するにはどうすればよいですか

クラス属性をそのサブ要素に追加または挿入するにはどうすればよいですか。ただし、直接の子に対してのみであり、次のクラスおよびサブ要素に対してそれを繰り返すにはどうすればよいですか。

ドキュメントでは、ここで参照されています

サンプル

だからレースクラスごとに

それを nomination と呼ばれるサブ要素に raceid として追加すると、nomination は次のようになります。

<race id="211912"次に、その子である と 候補についてこれを繰り返します。

0 投票する
2 に答える
2486 参照

jquery - PDFQuery:要素が配置されているページ番号を取得

PDFQueryを使用してPDFをスクレイピングするのはこれが初めてです。

私がする必要があるのは、いくつかのページを持つ価格表から価格を取得することです。製品コードを PDFQuery に渡したいのですが、コードを見つけてその横に価格を返す必要があります。問題は、Github ページで最初の例を使用するとテキストの場所が取得されることですが、「名前がページのどこにあるのか、またはどのページにあるのかを知る必要がないことに注意してください」と明確に示されています。これは私の価格表の場合ですが、他のすべての例ではページ番号 ( LTPage[pageid=1]) が指定されていますが、ページ番号を取得する場所がわかりません。

ページ番号を指定しないと、すべてのページの同じ場所にあるすべてのテキストが返されます。

また、exactTextコードは「92005」「92005C」「92005G」など、:contains単体ではあまり役に立たないので、機能を追加しました。

要素が配置されているページを選択し、 JQuery を使用してみましたが.closest、どちらもうまくいきませんでした。

PDFMiner のドキュメントPyQuery のドキュメントを確認しましたが、役に立た ないものはありません =(

私のコードは今次のようになります:

皆さん、どんな助けも大歓迎です!!!

0 投票する
1 に答える
381 参照

phantomjs - pyspider と phantomjs で画像をスクレイピングできない

ここで、このWeb ページの項目 (iphone) のすべての画像をスクレイピングしたいと考えています。まず、画像のすべてのリンクを抽出し、リクエストを 1 つずつ src に送信して、それらをフォルダー '/phone/' にダウンロードします。これが私のコードです:

それは非常に直感的でシンプルです。しかし、コードを実行しても何も起こらず、ターミナルに次のログ メッセージが表示されました。

私はこの問題にほとんど夢中です。何が問題なのか、どうすれば修正できるのか教えてください。前もって感謝します!

0 投票する
1 に答える
474 参照

python - 適切に構造化された XML ドキュメントで pyquery (lxml) がタグを見つけられませんか?

次のような XML ファイルがあります。関連するビットは次のとおりです。

PMIDPyQuery を使用して XML を解析し、フィールドの値を見つけようとしています。

なぜこれが機能しないのですか?コンソールにはreference、最初の print ステートメントの完全な内容が表示され、その後に 2 つの空の値が続きます。

サンプルコードが示すように、ドキュメント内の他のリーフノード ( などnct_id) を を使用してうまく見つけることができます。.find()

PyQuery が大文字のタグを好まないということですか?

0 投票する
1 に答える
496 参照

python - pyquery python を使用してイベントをトリガーする方法

Python と pyquery、美しいスープ、リクエスト、機械化などのパッケージを使用して、ヘッドレス Web ブラウザーを自動化しようとしています。

しかし、これまでのところ、ボタンでクリック イベントをトリガーする正しい方法が見つかりませんでした。たとえば、オンライン フォームに入力するために、テキスト フィールドに値を挿入することはできますが、[送信/送信] ボタンをクリックすることはできません。

0 投票する
1 に答える
218 参照

python - python pyquery importがMac OS Sierraで機能しない

以前に何百回も行ったように、pyquery をインポートしようとしていますが、機能していません。Mac OS Sierra に関連しているようです。(モジュールはpipでインストールされ、最新のものです)

名前空間でエラーが発生しました

何か案が ?どうも !

0 投票する
2 に答える
1284 参照

html - PyQueryを使用してテーブルからテキストを取得するにはどうすればよいですか?

私は pyquery をあまり使用していないので、この質問はおそらく簡単ですが、たくさんのものを試してみましたが、行き詰まっています。

テーブルから情報を取得するために PyQuery を使用しています。これが私のテーブルの始まりです:

最終行以降も続きますが、内容は以上です。だから、私が実行した場合:

私は得る:

明らかに、「なし」のものは正しくないため、必要ありません。のさまざまなコンボを試しthead tr td divましたが、取得しているものを取得できません。次に、最初に div のリストを作成し、それらを数えてリストを結合しようとしましたが、非常にハッキーなようで、Wonderlic も得られません。また、ドキュメントには を使用するように書かれているようですがtext()、括弧を追加しようとするとTypeError: 'NoneType' object is not callableが発生します。どんな洞察も大歓迎です。ありがとう!

0 投票する
1 に答える
296 参照

jquery - Pythonでjqueryデータを読み取る方法は?

次の形式の大きな jQuery データがあります。

Pythonで最初の部分(場所)のコンテキストを取得する方法はありますか? PyQueryでさまざまなコマンドを試してみましたが、うまくいきませんでした。誰でも解決策を提案できますか?

ありがとう

0 投票する
1 に答える
721 参照

python - pdfquery が BBOX に値を返さない

pdfquery ライブラリを使用して、pdf の目的の bbox 内にテキストを返そうとしています。

最初に、返されたページの左上隅から bbox を定義しました

次に、ページの左下から bbox を定義し、同様の結果を返しました。次に、8.5 インチ x 11 インチのページ全体を含む bbox を定義し、すべてのテキストではなく、さらに多くの値を返しました。「クイックスタート」の下のドキュメントに従っていたので、ここで何か間違ったことをしましたか。私はpython 2.7を使用しています