使用可能なコマンドラインを使用して、PDF をページに分割します。
for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do
gs \
-dSAFER \
-sDEVICE=pdfwrite \
-dBATCH \
-dNOPAUSE \
-dFirstPage=$G \
-dLastPage=$G \
-o $G.pdf \
47.pdf ;
done
ただし、一部のページはテキストなしで表示されます (グラフィックはまだ存在します)
だから、私はPDFから埋め込みフォントを抽出しようとしました:
gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"
これらのフォントは、システムの Fonts フォルダーにインストールしました。
その後、分割を繰り返しましたが、変化はありませんでした。
ページが正しく抽出されることを確認する方法は、今のところわかりません。