問題タブ [pdfa]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pdf - PDFA-2 または PDF/A-3 準拠レベルの PdfCopy/PdfStamper で PDF/A-1 ドキュメントを開く方法
PDF から PDF/A、PDF/A-1 から PDF/A-2、PDF/A-2 から PDF/A-3 に変換しようとしています。ご覧のとおり、私の目的は、既存の PDF ファイルから PDF/A-3 準拠ファイルを作成することです。
PDF/A-1 を PDF/A-2b に変換する際の問題は、それが機能しないことです。PDF/A-2 準拠ファイルを作成する PdfACopy で PDF/A-1 準拠 pdf ファイルを開こうとしていますが、このエラーが発生します。
異なる PDF/A バージョン。
ここに私のコードからの抜粋があります:
これらの PDF を作成または変換するにはどうすればよいですか? 元のファイルからメタデータを読み取り、PDF またはバージョンを変更し、もう一度読み取ってから変更する必要がありますか?
これらのファイルを変換する方法を教えてください。PDF-A3準拠ファイルが欲しいだけです。
pdf - Ghostscript - PDF を PDF/A に変換
Linux サーバーでこのコマンドを使用して PDF ファイルを PDF/A に変換していますが、正しく動作します。
私が持っている唯一の懸念は、グラフィックの品質です。私の最初の PDF は 1.5MB で、変換後の PDF はわずか 500kb です。グラフィックの品質が低下します。
最初のpdfの品質を維持する方法について何か考えはありますか?
pdf - iText ライブラリを使用して pdf を pdf/a に変換する
ドキュメントを PdfAConformanceLevel.PDF_A_1B 準拠にエクスポートしたいのですが、document.close を実行すると、以下のエラーが発生し、結果の pdf が使用できません。
私は次のitextバージョンを使用しています:
スタックトレース:
次のコードでPDFを作成しています:
他のファイルではエラーが発生しないため、これは入力ファイル固有のようです-ここにエラーを再現する1つのファイルがあります:私はこの入力pdfファイルを変換しようとしています: http://filebin.ca/2hR2xO1SNlzh/09062009073008005.pdf
pdf - Adobe Normalizer (つまり、Times New Roman) の TTF フォント名を見つける方法
Adobe Normalizer を使用して PostScript ファイルを PDF/A に変換しようとしています。
私が抱えている問題は、フォントが見つからない場合、ハードストップになることです。「--ignorestdttfonts=off」を追加したところ、少しは役に立ちました。コマンド文字列に使用しているものは次のとおりです。
PostScript ファイルで /Times-Roman を使用しており、インストールされているフォントとして times.ttf がありますが、次のエラーが発生します。
だから私は2つの質問があります:
- TTF ファイルが与えられた場合、Adobe Normalizer に使用するフォント名を正確に知るにはどうすればよいですか?
- フォントが見つからない場合にフォントを代用するにはどうすればよいですか? デフォルトでは Courier が使用されますが、それは行われていないようです。「--allowdefaultfont=on --defaultfont=Courier」を明示的に追加しましたが、効果はありませんでした。
xml - pdf/a 検証: pdfaExtension:schemas/*[1] :: 値の型 'Schema' に必須フィールド 'valueType' がありません
tcpdf ライブラリを使用して php で pdf/a-1b を作成しましたが、これらのエラーの検証 ( http://www.pdf-tools.com/pdf/validate-pdfa-online.aspx ) に合格しません。
pdfaExtension:schemas/ [0] :: 値タイプ「スキーマ」に必須フィールド「valueType」がありません。pdfaExtension:schemas/ [1] :: 値タイプ「スキーマ」に必須フィールド「valueType」がありません。pdfaExtension:schemas/*[2] :: 値の型 'スキーマ' に必須フィールド 'valueType' がありません。
このエラーを修正するにはどうすればよいですか? どの値が欠落していますか? どこ?
ありがとうございました
pdf - pdfbox を使用して PDF/A-1a のタグ付きコンテンツを検索
Apache fop によって生成され、pdfbox の OverlayPDF を使用してオーバーレイ レターヘッドが配置された PDF/A-1a ファイルであると思われるものがあります。preflight はファイルを OK として認識し (ただし、明らかに PDF/A-1b のみ)、Acroreader はドキュメントのプロパティで「PDF/A」モードで「タグ付き: はい」と表示します。それがどのように見えるかを見てみたいので、fopを微調整していくつかの小さな改善を加えることができます.
私の質問は、タグ付けされたコンテンツ (つまり、PDF のテキスト表現は char 出力のカーニングされたシーケンス) をどこで見ることができますか? 私はそこで少し迷っています - エディターを使用して検索するために、たとえばxmlファイルにドキュメント構造のテキスト出力を取得する別の方法はありますか? -ティア!
編集
レターヘッド自体はもともと Postscript であり、ghostscript を使用して PDF/A-1b に変換され、次に
letter_plain.pdf は fop を使用して生成されます
使用されているバージョンは pdfbox 2.0 と fop 1.1 です。
letter_with_head.pdf が PDF/A-1a ではなくなった場合、質問は、fop 呼び出しに従って 1a である letter_plain.pdf に適用され、レターヘッドを取得するために別のソリューション (svg など) を選択する必要があります。その時。
編集 2
PDF の例はこちらにあります: https://www.magentacloud.de/share/j9qk7jfzyv - サンプルは 1 ページのみであるため、個別の followingpages_letterhead.pdf は必要ありません。
編集 3
私は、テキストが下のどこかに埋もれているのではないかと疑っていますがRoot/StructTreeRoot/ParentTree/Nums/[1]/[3]/P/P/P/P/P/P
(P が何らかの形で をマップしていると仮定しfo:block
ます)、pdf からテキストを表示する場所がどこにもありません。