質問はかなり自明です。
私が直面している問題は、以下に示すように、オンラインで見つけた Tika サンプル コードがすべて StringWriter を使用していることです。どういうわけかこれを OutputStreamWriter を使用することができれば、エンコーディングを問題なく指定できます...どんな助けもいただければ幸いです。
InputStream inStream = new FileInputStream(pathname);
StringWriter sw = new StringWriter();
SAXTransformerFactory factory = (SAXTransformerFactory)SAXTransformerFactory.newInstance();
TransformerHandler handler = factory.newTransformerHandler();
handler.getTransformer().setOutputProperty(OutputKeys.METHOD,"html");
handler.getTransformer().setOutputProperty(OutputKeys.INDENT,"no");
handler.setResult(new StreamResult(sw));
parser.parse(inStream, handler, metadata, context);