2

Ghostscript を使用して、コマンド ラインで PDF を PDF/A に変換しています。

gs -dPDFA -dBATCH -dNOPAUSE -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile="output.pdf" input.pdf

しかし、出力ファイルは検索可能なテキスト プロパティを失いました。

検索可能な PDF/A ファイルを出力として取得するにはどうすればよいですか?

ありがとう。

4

1 に答える 1

0

参照する入力ファイルが提供されておらず、使用している Ghostscript のバージョンについても言及されていません。

この主題に関する私の標準的な講義から始めましょう。PDF ファイルを入力として受け取り、Ghostscript の pdfwrite デバイスを使用して新しい PDF ファイルを生成する場合、入力ファイルを「変換」、「編集」、または「変更」していません。

何が起こるかというと、PDF インタープリターが PDF ファイルを解釈し、一連のグラフィックス プリミティブを生成し、それをグラフィックス ライブラリに供給します。次に、これらのプリミティブを処理し、デバイスに渡します。次に、デバイスはそれらを出力ファイルに出力します。レンダリング デバイス (TIFF など) の場合、操作をビットマップにレンダリングし、ファイルの最後に到達すると、ビットマップをファイルとして書き込みます。pdfwrite の場合、これらのプリミティブを新しい PDF ファイルに再アセンブルします。

したがって、出力 PDF ファイルは、その外観を除いて、入力 PDF ファイルと共通点はありません。

このアプローチには欠点があります (入力ファイルの印刷以外の側面を保持する際に制限があります) が、利点もあります。たとえば、色空間の変更、透明度の平坦化、フォント エンコーディングの変更などを行うことができます。

これに加えて、PDF/A ファイルを作成することを選択しました。PDF/A は、PDF 仕様の利用可能な機能を制限しており、(元のファイルを見ずして判断することは不可能です) いくつかの側面を変更せずに元の PDF ファイルを PDF/A ファイルとして表現することは単に不可能である可能性があります。それの。

繰り返しますが、元のファイルを見なくてもわかりますが、単に目的を達成できないか、少なくとも Ghostscript を使用していない可能性があります。

于 2015-08-05T07:32:16.727 に答える