JpedalでPDFを解析中に問題が発生しました。
wordlist
Jpedal からを読んでいると、 に文字化けが発生しwordslist
ます。これは、OCRを使用している場合や、PDF からテキストをコピーして Word または単純なテキスト エディターに貼り付けた場合にも発生します。私が理解しているのは、この PDF は MAC OS X 10.6.4 の Quartz PDF コンテキストによって生成されたもので、ファイル サイズを圧縮するために使用されますが、PDF ビューアで簡単に表示できるということです。この種の PDF のデコードをサポートする Java API を探しましたが、うまくいきませんでした。デコードに使用できるアプリケーションまたは Java API を探しています。Linux マシンで使用できる必要があります。