2

MuPDF を使用して、pdf ファイルからテキストを抽出しています。ほとんどの場合は問題なく動作しますが、最後の行が抽出されないか、印刷されないことがあります。

fz_text_sheet *sheet = fz_new_text_sheet(self.ctx);
fz_text_page *text = fz_new_text_page(self.ctx, &fz_empty_rect);
fz_device *dev = fz_new_text_device(self.ctx, sheet, text);

fz_page *page = fz_load_page(self.doc, pageNumber);
fz_run_page(self.doc, page, dev, &fz_identity, NULL);

fz_output *out = fz_new_output_file(ctx, stdout);
fz_print_text_page_html(ctx, out, text);

このPDFの最初のページは、そのページのテキストの最後の行を印刷できません。

私は何か間違ったことをしていますか、それともこれはバグですか?

ありがとう!

4

1 に答える 1

0

fz_text_page を安全に使用する前に、テキスト デバイスを解放する必要があります。デバイスには、解放されるまでフラッシュされないバッファリングされたものがある場合があります。

于 2013-06-03T13:20:03.013 に答える