0

PDF の OCR 処理を行っていますが、PDF が Word (または Google Docs) からエクスポートされたかどうかを確認する方法があるかどうか知りたいです。PDFがXpdfのpdffontsでOCRされているかどうかを確認できます。Word と Google Docs は、エクスポートされた PDF を自動的に OCR することを知っているので、PDF が OCR されていないことがわかった場合。私はそれが輸出されていないことを知っています。しかし、OCR されている場合、PDF が Word/Google Docs VS からエクスポートされたかどうかを確認する方法はありますか? 具体的には、私は JavaScript で作業していますが、どんな情報でも役に立ちます。

4

1 に答える 1

0

これを調べている人のために、私が今行っているのは、-meta フラグを指定して pdfinfo (Xpdf から) を使用して、PDF に XMP メタデータがあるかどうかを確認することです。Word および Google ドキュメントからエクスポートされた PDF にはこのメタデータがありませんが、他の PDF にはあります。

于 2013-06-19T20:04:02.223 に答える