1

私の Windows 7 PC では、コマンド ラインに「pdftotext myfile.pdf」と入力すると、myfile.pdf と同じディレクトリに .txt ファイルが作成されます。ただし、ubuntu-12.04 サーバーで同じ myfile.pdf を使用して同じコマンド ライン入力を試みると、次のようなエラー出力が表示されます。

Error: May not be a PDF file (continuing anyway)
Error (2): Illegal character <21> in hex string
Error (4): Illegal character <4f> in hex string
Error (6): Illegal character <54> in hex string
Error (7): Illegal character <59> in hex string
Error (8): Illegal character <50> in hex string
Error (11): Illegal character <48> in hex string
Error (12): Illegal character <54> in hex string
Error (13): Illegal character <4d> in hex string
Error (14): Illegal character <4c> in hex string
Error (16): Illegal character <50> in hex string
Error (17): Illegal character <55> in hex string
Error (19): Illegal character <4c> in hex string
Error (20): Illegal character <49> in hex string
Error (23): Illegal character <22> in hex string
Error (24): Illegal character <2d> in hex string
Error (25): Illegal character <2f> in hex string
Error (26): Illegal character <2f> in hex string
Error (27): Illegal character <57> in hex string
Error (30): Illegal character <2f> in hex string
Error (31): Illegal character <2f> in hex string
Error (33): Illegal character <54> in hex string
Error (36): Illegal character <48> in hex string
Error (37): Illegal character <54> in hex string
Error (38): Illegal character <4d> in hex string

等々...

Error (122): Illegal character <6c> in hex string
Error: PDF file is damaged - attempting to reconstruct xref table...
Error: Couldn't find trailer dictionary
Error: Couldn't read xref table

Windows 7 の pdf ユーティリティ パッケージは、Linux で利用できるもの (Poppler のもの) とは異なりますか? そうでなければ、同じ呼び出しで同じ結果が得られるはずですよね?

4

1 に答える 1

2

入力しようとしているファイルが PDF ファイルではないためです。

で始まります(スペースは不明な文字です)

 ! O TYP  HTML PU LI  "-//W  // T  HTM

...これはすぐに(?)次のように解釈できます...

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML

そのため、PDF のダウンロードによるエラー ページである可能性が高いです。どちらの場合も、PDF ではなく HTML ファイルです。

于 2013-01-27T00:07:31.993 に答える