JavaでHTMLファイルを解析/変換するために、HtmlCleanerライブラリを使用しています。
「ÁáÉéÍíÍíÑñÓóÚúÜü」などのスペイン語の文字を処理できないようです
これまたは他のソリューションを処理するために HtmlCleaner に設定できるプロパティはありますか? これを呼び出すために使用しているコードは次のとおりです。
CleanerProperties props = new CleanerProperties();
props.setRecognizeUnicodeChars(true);
java.io.File file = new java.io.File("C:\\example.html");
TagNode tagNode = new HtmlCleaner(props).clean(file);