PDFファイルから、PDFの各ページに対して1つのpng画像を正常に生成しています。
問題は、使用する設定に関係なく、一部のページで GhostScript がフォントの間隔を台無しにして、一部の png で 1 つの単語が 2 つまたは 3 つの単語のように見えることです。
これらのファイルを evernote で使用しているため、予想される検索結果が台無しになるため、これは問題です。そのため、「プロバイダー」を検索しても何も返されません。これは、png ファイルでは「プロバイダー」として表示されるためです (または「ユーザー」は「使用 rs」として表示されます)。
左側にソース pdf の元のテキスト、右側に生成された png を示すスクリーンショットへの Dropbox リンク --> http://dl.dropbox.com/u/13267240/ScreenClip.png
私は Ghostscript を初めて使用し、なぜこれが起こっているのか途方に暮れています。
これが私が使用しているコマンドラインです(Pythonで):
cmd = "gswin%sc" % (SYS_PROCESSOR_ARCH) + "-q -dNOPAUSE -dBATCH -dPDFFitPage=true -sDEVICE=png16m -r%s " % (PNG_RES) + "-sOutputFile=" + '"%s\%s -pg-%%d.%s" "%s"' % (outputdir、outputFileNamePrefix、suffix、pdfSourceFile)
OR 実行時に評価:
gswin64c -q -dNOPAUSE -dBATCH -dPDFFitPage=true -sDEVICE=png16m -r300X300 -sOutputFile="C:\EPTK-TMP\02-01-はじめに-pg-%d.png" "C:\EPTK-TMP\02 -01-はじめに.pdf」