pdf - PDF からページを抽出中に Ghostscript がフォントを失う

Question

使用可能なコマンドラインを使用して、PDF をページに分割します。

for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do 
   gs \
    -dSAFER \
    -sDEVICE=pdfwrite \
    -dBATCH \
    -dNOPAUSE \
    -dFirstPage=$G \
    -dLastPage=$G \
    -o $G.pdf \
     47.pdf ;
done

ただし、一部のページはテキストなしで表示されます (グラフィックはまだ存在します)

だから、私はPDFから埋め込みフォントを抽出しようとしました:

gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"

これらのフォントは、システムの Fonts フォルダーにインストールしました。

その後、分割を繰り返しましたが、変化はありませんでした。

ページが正しく抽出されることを確認する方法は、今のところわかりません。

score 2 · Accepted Answer

Ghostscript と pdfwrite は、実際には PDF ファイルを分割することを目的としたものではありません。おそらくもっとうまく機能する他のツールがあります。pdftk を試してみませんか?

本当に Ghostscript を使用したい場合は、Git リポジトリから最先端の最新コードを取得することをお勧めします。そのコードでは、pdfwrite デバイスは「%d」を含む出力ファイル名を受け入れ、1 つのファイルを書き込みます。 1ページあたり。

それを超えて、「フォントが失われる」のではなく、単にバグが発生している可能性が最も高いと思われます。フォントが見つからない場合、テキストはまだ存在しますが、別のフォントになります。どのバージョンの GS を使用していますか?

pdf - PDF からページを抽出中に Ghostscript がフォントを失う

1 に答える 1

Related

Reference