私はiText 5.3.3を使用しています
PDFファイルからテキストを抽出しようとしています。
私はそのようなものを使用します:
File f (....)
FileInputStream fis = new FileInputStream(f);
r = new PdfReader(fis);
String s=PdfTextExtractor.getTextFromPage(r, 1);
System.out.print(s);
私はこれを得る:
「(...)史上初の死亡事故による危機にシンガポール航空(...)」
テキストの場合:
「(...)史上初の死亡事故による危機にシンガポール航空(...)」
または:「(...)国内のキャリアと最終的な結論は(...)の必要性を示唆している」
テキストの場合:「(...)国内のキャリアと最終的な結論は(...)の必要性を示唆している」
ご覧のとおり、「?」が表示されます。「fi」の代わりに。