2

Python(3.3)でページを開く勉強中です。

 url=('http://www.google.com')
 page = urllib.request.urlopen(url)

上記のコードは、それを Google への 1 回のヒットとしてカウントしますか、それともそうしますか?

os.system('start chrome.exe google.com')

1 つ目はページをスクレイピングし、2 つ目は実際にブラウザーでページを開きます。それがページのヒットに違いを生んだかどうか疑問に思っていましたか?

4

1 に答える 1

2

どちらも非常に異なることをします。

usingurllib.request.urlopenは単一の http リクエストを作成します。

2 番目の例でも同じことが行われ、受信したドキュメントが解析され、後続のリソース (images/javascript/css/whatever) が要求されますそのため、ブラウザに google.com を読み込んだ結果、多くのヒットが発生します。

ページを読み込んでいる間、ブラウザの開発ツール (通常はネットワーク セクション) を見て、自分で試してみてください。

于 2013-09-04T01:34:57.093 に答える