3

文字が表示されますが、アラビア語の逆順で次のコードを使用します

  PDDocument pddDocument = PDDocument.load(new File("test1.pdf"));
        PDFTextStripper textStripper = new PDFTextStripper();

        TextNormalize normalize = new TextNormalize("UTF-8");
        String Text = textStripper.getText(pddDocument);

      Text=normalize.makeLineLogicalOrder(Text, true);
      Text = normalize.normalizePres(Text);
      Text = normalize.normalizeDiac(Text);
        System.out.println(Text);
4

1 に答える 1

5

http://site.icu-project.org/download/49#TOC-ICU4J-Downloadから icu4j-49_1.jar をダウンロードしてクラスパスに入れることで問題は解決しました

次に、次のようにコードを書き直します

PDDocument pddDocument = PDDocument.load(new File("test1.pdf"));
            PDFTextStripper textStripper = new PDFTextStripper();
            String Text = textStripper.getText(pddDocument);
            System.out.println(Text);
于 2012-05-28T02:44:54.137 に答える