PDFファイルを開いてコンテンツをテキストファイルに書き込むと、テキストファイルのコンテンツが台無しになります。エンコーディングのせいだと思います。私が理解していることから、JVMはデフォルトの文字セットをに設定しますCp1252
(Windows XPで実行しているため)。デフォルトの文字セットを変更しましたが、結果がありません(System.setProperty("file.encoding", "ISO-8859-1");
)
- ITextを使用しようとしましたが、結果のコンテンツに発音区別符号が含まれる文字がいくつか欠落しています。
何か案は?