ストレート lxml と PyQuery を使用したスクレイピングの経験がある人はいますか? 私は最近後者に出くわし、興味をそそられました。ライブラリについてのコメントはまだあまり見つけられていないので、どの程度堅牢なのか興味があります。
私はlxmlに精通しており、一般的に楽しんでいます。ただし、jQuery セレクター構文を使用すると便利です。
スイッチに価値はありますか?
ありがとう!
ストレート lxml と PyQuery を使用したスクレイピングの経験がある人はいますか? 私は最近後者に出くわし、興味をそそられました。ライブラリについてのコメントはまだあまり見つけられていないので、どの程度堅牢なのか興味があります。
私はlxmlに精通しており、一般的に楽しんでいます。ただし、jQuery セレクター構文を使用すると便利です。
スイッチに価値はありますか?
ありがとう!
lxml は、CSS セレクターに似た XPath をサポートします。それはあなたのニーズを満たすでしょうか?
あなただけがそれが価値があるかどうかの質問に答えることができます。
jQueryのカスタムCSSセレクターを取得するために追加の依存関係を使用するかどうかによって異なります。
jQueryが標準のCSSセレクターに追加するものは次のとおりです。http://api.jquery.com/category/selectors/jquery-selector-extensions/
そして、これらのセレクターをPyQueryの通常のCSSセレクターに変換します:https ://bitbucket.org/olauzanne/pyquery/src/c2bf08a8f4e7/pyquery/cssselectpatch.py
lxmlでプレーンCSSセレクターを使用するよりも堅牢性が低い理由がわかりません。特別なjQueryセレクターをCSSセレクターに変換するだけです。