pdf - フォントとそれに対応する cmap を PDF に抽出する

Question

PDF Vizからフォントを抽出する方法をいくつか試しました。fontforge、mupdf、C# の pdfparser、およびいくつかの pythone スクリプト。しかし、pdfに埋め込まれたフォントとそのcmapの正確なペアを取得することについて混乱しています。フォントとその cmap の正確なペアを取得するための正しいアプローチを教えてください。

score 1 · Accepted Answer

最初のコメントで述べたように、iText や iTextSharpなど、低レベルの PDF オブジェクトにアクセスできるライブラリを使用すると、簡単に実行できるはずです。

iText(Sharp) の場合、ListUsedFonts.javaとListUsedFonts.csが出発点となります。少なくとも 1 ページからアクセスできる PDF ファイル内のすべてのフォント辞書を検査します。これらの例の単純な出力の代わりに、必要なすべての情報をエクスポートするだけです。これについては、ISO 32000-1:2008を参照ガイドにする必要があります。

pdf - フォントとそれに対応する cmap を PDF に抽出する

1 に答える 1

Related

Reference