HTTP トラフィックをリッスンし、人間によって開始された要求を認識しようとするアプリケーションを作成しています。
例: ユーザーがアドレス バーにcnn.comと入力すると、要求が開始されます。次に、他の要求 (XHR など) を破棄しながら、CNN のサーバー応答を見つけたいと考えています 。
ヘッダー情報から、何が何を意味するかをどのように判断できますか?
いくつかの調査を行った後、関連する応答には次のものが含まれていることがわかりました。
- コンテンツタイプ: text/html
- HTMLには意味のあるタイトルが付いています
- ステータス 200 OK