Google App Engine を使用して、次のようなリクエストを作成しています。
URLFetchService service = URLFetchServiceFactory.getURLFetchService();
HTTPResponse response = service.fetch(request);
HTML を返すかどうかを検出するために、応答を文字列化し、HTML タグの存在を探しています。
String responseAsString = new String(response.getContent());
if (responseAsString.contains("<html>")){
// is html
}
HTML かどうかを検出するより良い方法は何でしょうか?
また、入力 URL は必ずしも example.com/page.html のようにわかりやすいとは限りません。問題は、example.com/mystery のようになる可能性があることです。