0

Yahoo からこのページを解析して、すべての質問の URL を取得しようとしています。

jsoup を使用していますが、これらのセレクターは何も選択しません。なぜですか?

doc.select("#yan-questions h3 a")
doc.select(".question-title a")
4

1 に答える 1

1

その理由が今わかりました。これは、そのサイトがさまざまなユーザー エージェントに応じてさまざまな Web ページを送信する可能性があり、User-AgentHTTP ヘッダーを含めなかった場合、応答にids が含まれないためです。

この問題は、次の行を HTTP 要求に追加すると解決されます。

User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.101
于 2013-10-31T05:40:23.053 に答える