3

現在、urllib2 と BeautifulSoup を使用して、html データを開いて解析しています。ただし、ページがレンダリングされた後に JavaScript を使用して画像をロードするサイトで問題が発生しました (ページ上の特定の画像の画像ソースを見つけようとしています)。

Twill が解決策になる可能性があると考えており、ページを開いて「find」で正規表現を使用して、探している html 文字列を返そうとしています。ただし、これを機能させるのに問題があり、Twillで正規表現を使用する方法に関するドキュメントや例が見つからないようです。

これを行う方法、またはこの問題を一般的に解決する方法についてのヘルプやアドバイスは大歓迎です。

4

2 に答える 2

0

ページソースでCSSセレクターまたは「実際の」正規表現を使用したいと思います。ツイルは私の知る限り、作業されていません。CSS セレクターを使用して BS または PyQuery を試しましたか?

于 2012-07-29T20:50:13.703 に答える