PDFをテキストファイルに変換するこのコードがあります:
gswin32c -dBATCH -dNOPAUSE -dSAFER -dDELAYBIND -dWRITESYSTEMDICT
-dSIMPLE -sDEVICE=txtwrite -dTextFormat=2 -dFirstPage=1 -dLastPage=1
-sOutputFile=C:\out.txt C:\in.pdf
PDFテーブルのフォーマットを保持しない唯一のことは、ほとんど問題なく動作します。
例:
PDF ファイルの内容:
Type From Name Name2 Code Week
Regular 30/03/15 KNOWLES, BEN HOOT KNOWLES, ANGELA 367-739-746 80.00
Regular 30/03/15 RICHARDS, COLE ROBERT HARRIS, BRADIE 401-844-307 108.00
Regular 30/03/15 SKEELS, MATT BISHOP, JASON GREGSON 413-980-291 112.00
テキストファイルに変換した後、テキストは次のように折り返されます。
Type From Name Name2 Code Week
Regular30/03/15KNOWLES, BENHOOT KNOWLES, ANGELA367-739-74680.00
Regular30/03/15RICHARDS, COLEROBERT HARRIS, BRADIE401-844-307108.00
Regular30/03/15SKEELS, MATTBISHOP, JASON GREGSON413-980-291112.00
フォーマットを維持するために必要です。フォーマットを維持する方法はありますか?
Ghostscript gswin32c
Windows 7 マシンで使用しています。バージョンは 9.16 です。
また、他の方法でアーカイブするための提案も受け付けています。
乾杯