PDFBox を使用して PDF 内の単語を検索するプログラムを作成したいと思います。
ここに私の小さなプログラムがあります:
List<String> words ;// List of words
PDDocument document = PDDocument.load("D:\\INIT.pdf");
PDFTextStripper s = new PDFTextStripper();
String content = s.getText(document);
Comparing(content,words);//methode for searching those words on my text
System.out.println(content);
しかし、テキストなしでPDFを直接見ることは可能getText
ですか?
getText
文字列を返します.pdfファイルに大きなテキストがある場合、この文字列は同じテキストを保持できますか?テキストが大きく、文字列でサポートされていない場合に使用する別のタイプはありますか????