ライブラリを使用してJavaプロジェクトを作成しHTMLCleaner
、出力をXMLファイルとして保存しています。これは私が書いたコードです:
URL urlSB = new URL("http://www.groupon.com/browse/chicago?z=skip");
URLConnection urlConnection = urlSB.openConnection();
urlConnection.addRequestProperty("User-Agent", "google.com");
urlConnection.connect();
HtmlCleaner cleaner = new HtmlCleaner();
CleanerProperties props = cleaner.getProperties();
props.setNamespacesAware(false);
TagNode tagNodeRoot = cleaner.clean(urlConnection.getInputStream());
// serialize to xml file
new PrettyXmlSerializer(props).writeToFile(
tagNodeRoot , "cleaned.xml", "utf-8"
);
問題は、プロジェクトを実行した後、cleaned.xml
ファイルが空であることです。