任意のブラウザでhttp://en.wikipedia.org/wiki/Category:Births_by_yearを開くと、多くのサブカテゴリと1つのサブページがあるカテゴリページが表示されます。これはhttp://en.wikipedia.org/wiki/Park_Sung-Baekです。
しかし、Javaで同じページを読むと、コンテンツが異なるカテゴリページが表示されます。上記のサブページの代わりに、http://en.wikipedia.org/wiki/User: Mijotoba/Ruth_Stella_Correa_Palacioが含まれています
どうすればいいですか?ウィキペディアが別のページを表示するのはなぜですか?
設定User-Agent
は役に立ちません。
「通常の」コンテンツを要求するヘッダー
GET http://en.wikipedia.org/wiki/Category:Births_by_year HTTP/1.1
Accept: text/html, application/xhtml+xml, */*
Accept-Language: ru-RU,zh-CN;q=0.5
User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)
Accept-Encoding: gzip, deflate
Connection: Keep-Alive
Host: en.wikipedia.org
「変更された」コンテンツを要求するヘッダー
GET http://en.wikipedia.org/wiki/Category:Births_by_year HTTP/1.1
User-Agent: Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; WOW64; Trident/5.0)
Host: en.wikipedia.org
Accept: text/html, image/gif, image/jpeg, *; q=.2, */*; q=.2
Connection: keep-alive