私は現在、プリンターの適合性について PDF をテストするための小さなツール (Python + pyPdf) を作成しています。
悲しいかな、私は最初のタスクですでに混乱しています: PDF に少なくとも 3mm の「裁ち落とし」(何も印刷されていないページの境界線) があるかどうかを検出することです。グローバルなものがないように見えるため、完全なドキュメントの裁ち落としを検出できないことは既にわかっています。ただし、ページでは、合計 5 つの異なるボックスを検出できます。
mediaBox
bleedBox
trimBox
cropBox
artBox
これらのボックスに関するpyPdf のドキュメントを読みましたがmediaBox
、全体のページ サイズ (つまり、紙) を表していると思われるのみを理解しました。
ブリードを定義する必要があることはbleedBox
明らかですが、常にそうであるとは限りません。
私が指摘したもう 1 つのことは、たとえばPDFの場合、これらのボックスはすべて各ページでまったく同じサイズ (まったく裁ち落としがないことを意味します) ですが、開くと大量の裁ち落としがあることです。これにより、個々のテキスト要素には独自のオフセットがあると思います。
したがって、明らかに、 と からブリードを計算するだけでmediaBox
はbleedBox
実行可能なオプションではありません。
誰かがそれらのボックスが実際に何であるか、そしてそこから私が結論できること (たとえば、あるボックスは常に別のボックスよりも小さい) に光を当てることができれば、私は非常に嬉しく思います。
おまけの質問:ドキュメントに記載されている「デフォルトのユーザー空間ユニット」が正確に何であるかを誰か教えてもらえますか? これは私のマシンで言及していると確信していますが、どこにでも適用したいと思います。mm
mm