問題タブ [pyquery]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
3173 参照

python - lxmlでhtmlボディフラグメントを解析する

HTMLのフラグメントを解析しようとしています:

私は使用しますlxml.html.fromstring<body>そして、フラグメントのタグを削除し続けるため、私は気が狂っています。

document_fromstringfragment_fromstringclean_htmlwithなども試しましたpage_structure=False...何も機能しません。

html フラグメントを PyQuery に渡すので、lxml を使用する必要があります。

lxml が自分の html フラグメントを台無しにしないようにしたいだけです。それは可能ですか?

0 投票する
1 に答える
166 参照

python - PyQueryを使用してWebページに郵便番号で結果を検索するように依頼する

私はデータをクロールするのが新しいです。

ここで、Pyquery を使用して、ウェブサイト http://www.greatschools.org/find-schoolsの郵便番号で米国の学校情報をクロールする必要があります。

郵便番号を入力するたびに、検索ページの URL が非常に複雑になります。このような URL を Pyquery でプログラムするのは難しいと思います。

たとえば、郵便番号 95113 を入力すると、結果ページの URL は http://www.greatschools.org/search/search.page?lat=37.3326639&lon=-121.89183639999999&state=CA&locationType=postal_code&sortByになります。 =DISTANCE&normalizedAddress=San+Jose%2C+CA+95113&totalResults=1&city=San+Jose&zipCode=95113&locationSearchString=95113&distance=5

私の質問: 結果ページからデータをクロールしたい場合、Pyquery を使用して結果ページを取得するにはどうすればよいですか? 検索結果のURLはプログラミングで作れるようですが、作成するには長すぎますし、検索対象の郵便番号も数千あります。

より良い解決策はありますか?

0 投票する
1 に答える
819 参照

python - ファイルを開くときにpyqueryが[なし]を返す

base_result.htmpyquery でhtml ファイルを開くと、 が返さ[None]れ、検索するとエラーがスローされます。その同じファイルを文字列として使用すると、すべてがうまく機能します。

0 投票する
1 に答える
903 参照

python - PyQueryを使用してメタタグからコンテンツ値を取得するにはどうすればよいですか?

contentPyQueryを使用してこのメ​​タタグから値を取得するにはどうすればよいですか?

0 投票する
2 に答える
2133 参照

python - pyqueryを使用してHTMLテーブルを解析するには?

pyqueryを使用してHTMLテーブルを解析するには? [ http://pastie.org/pastes/8556919のソース コードの html テーブルを参照してください。

結果: {

"category_1":{ "cat1_el1_label":"cat1_el1_value",},

"category_2":{"cat2_el1_label":"cat2_el1_value",},

"category_3":{"cat3_el1_label":"cat3_el1_value",}

}

どうもありがとうございました。