2

Apache PDFBox を使用して、複数の PDF ファイルからテキストを抽出しています。ファイルはポーランド語で書かれており、ポーランド語の文字が含まれています。残念ながら、抽出したテキストを印刷すると、? (疑問符) それらの文字の代わりに。

4

1 に答える 1

1

抽出されたテキストが String に格納されていると仮定すると、現在これを使用して印刷していると仮定しています-

System.out.println(s);

このスニペットを使用して、ポーランド語の文字を適切に印刷することをお勧めします-

java.io.PrintStream p = new java.io.PrintStream(System.out,false,"UTF-8");
p.println(s);

これはうまくいくはずです。印刷されたテキストには表示されません。

于 2012-07-15T23:20:37.940 に答える