0

現在、特定の URL から CSS/JSS を抽出できる Python スクリプトを作成しようとしています。PoolManager() ユーティリティの助けを借りて、特定の URL の HTML を収集するのに役立つ urllib3 に出くわしました。以下の短いコードを使用して、指定された URL の HTML を抽出し、後でそれをファイルに保存することができました。

import urllib3
http = urllib3.PoolManager()
x = http.request('GET','www.something.com')
x.data

公式ページでurllib3のドキュメントを調べました。しかし、私が探しているものに近づいているさまざまな機能についてはあまりありませんでした。今、どうにかして特定の URL の外部リソースを取得する必要があり、urllib3 を使用してそれが可能かどうか、または同じことを行うのに役立つ何か他のものを検索する必要があるかどうかを知りたいです (提案も歓迎されます)。 .

よろしくお願いします!

4

1 に答える 1

0

これは、urllib3 で行うことではありません。HTML を取得したら、それを解析して、CS および JS ファイルにリンクする要素を抽出する必要があります。そのためにBeautifulSoupを使用できます。

于 2015-06-18T15:39:36.610 に答える