PDF Vizからフォントを抽出する方法をいくつか試しました。fontforge、mupdf、C# の pdfparser、およびいくつかの pythone スクリプト。しかし、pdfに埋め込まれたフォントとそのcmapの正確なペアを取得することについて混乱しています。フォントとその cmap の正確なペアを取得するための正しいアプローチを教えてください。
1648 次
1 に答える
1
最初のコメントで述べたように、iText や iTextSharpなど、低レベルの PDF オブジェクトにアクセスできるライブラリを使用すると、簡単に実行できるはずです。
iText(Sharp) の場合、ListUsedFonts.javaとListUsedFonts.csが出発点となります。少なくとも 1 ページからアクセスできる PDF ファイル内のすべてのフォント辞書を検査します。これらの例の単純な出力の代わりに、必要なすべての情報をエクスポートするだけです。これについては、ISO 32000-1:2008を参照ガイドにする必要があります。
于 2012-11-26T13:59:06.963 に答える