0

Beautifulsoup を使用して Web サイトから JavaScript の「.js」ファイルを取得しようとしています。これは私が現在使用しているコードですが、一部のファイルでは機能しません

jss = soup.findAll(name = 'script', attrs = { 'src': re.compile('\.js') })

たとえば、js ファイル:

src=http://krebsonsecurity.com/wp-content/plugins/comment-rating-pro/ck-karma.js?ver=3.3.2

それからそれは逃します。

js ファイルを抽出できる最適な実装を誰もが知っています。

乾杯

4

1 に答える 1

0

の値の制限を削除しますsrc(「srcを持つ」を超えて)。

re.compile('\.+')
于 2012-05-09T05:54:45.503 に答える