python - Python リクエストで HEAD コンテンツを取得する

Question

Pythonリクエストライブラリを使用して行われた HEAD リクエストの結果を解析しようとしていますが、レスポンスコンテンツにアクセスできないようです。

docsによると、requests.Response.text からコンテンツにアクセスできるはずです。これは GET リクエストでは問題なく動作しますが、HEAD リクエストでは None を返します。

GET リクエスト (動作)

import requests
response = requests.get(url)
content = response.text

コンテンツ =<html>...</html>

HEAD リクエスト (コンテンツなし)

import requests
response = requests.head(url)
content = response.text

コンテンツ =None

編集

OK 回答から、HEAD リクエストがコンテンツのみのヘッダーを返すことになっていないことがすぐにわかりました。<head>しかし、それはページのタグ内にあるものにアクセスするには、<link>や<meta>タグなど、ドキュメント全体を取得する必要があるということでしょうか?

score 32 · Accepted Answer

定義により、HEAD リクエストへの応答にはメッセージ本文が含まれません。

応答本文を取得したい場合は、GET 要求を送信します。レスポンスのステータスコードとヘッダーのみが必要な場合は、 HEAD リクエストを送信してください。

HTTP は任意のコンテンツを転送します。HTTP タームヘッダーは HTML とはまったく関係ありません<head>。ただし、HTTP はドキュメントの一部のみをダウンロードすることをお勧めします。HTML コードの長さ<head>(またはその上限)がわかっている場合は、特定のバイト数のみを返すようにリモートサーバーに通知するHTTP Rangeヘッダーをリクエストに含めることができます。リモートサーバーが HTTP 範囲をサポートしている場合は、短縮された回答が提供されます。

score 8 · Accepted Answer

HEAD にはコンテンツがありません! 試してみてくださいresponse.headers- それがおそらくアクションの場所です。HTTP HEAD リクエストは<head>、GET リクエストから取得する HTML レスポンスの要素を取得しません。それはあなたの間違いだと思います。

score 2 · Accepted Answer

HEAD 応答には本文がありません。GET リクエストを使用して取得する場合と同じように、HTTP ヘッダーのみを返します。

python - Python リクエストで HEAD コンテンツを取得する

3 に答える 3

Related

Reference