URIからソースを取得しようとしています。UTF-8として報告されています。ISO-8859-1、ISO-8859-1 Windows-1250、ISO-8859-2も試しました。
これが最新の試みの私のコードです(ISO-8859-2を試してみてください):
public static String getPage(String page,String charset) throws IOException{
URL url=new URL(page);
return org.apache.commons.io.IOUtils.toString(url.openConnection().getInputStream(),charset);
}
public static void main(String args[])throws Exception{
String page=getPage("http://buscon.rae.es/drae/srv/search?val=aba","ISO-8859-2");
System.out.println(page);
}
しかし、結果は次のとおりです。
apÄ? ge'quita、aparta'、y estedelgr。á¼?Ï?αγε)
それ以外の:
(Dellat.apăge'quita、aparta'、y este delgr.ἄπαγε)。
同様に、UTF-8(他のコードやブラウザーで動作します)や他のエンコード名も同様に失敗します。