0

元のPDFファイルをPAGEWISEに分割することで、大きなPDFファイルを小さなファイルに分割するために利用できるツールがたくさんあることがわかりました。たとえば、10ページのPDFドキュメントがある場合、元のPDFファイルをに分割できます。ページごとの分割で10個。

しかし、私はPDFファイルをページごとの分割よりも小さく分割する同様の種類のツールが必要です。つまり、段落、セクション、要素などのパラメーターに基づいて、PDFページを異なるドキュメントに分割する必要があります。

たとえば、
PDFファイルが2ページで10段落の場合、段落パラメータに基づいてPDFファイルを10個の個別のPdfファイルに分割したいと思います...

また、pdfにはOpen XMLのような構造は含まれていないと強く信じていますが、私も疑っています


ツールは、ページを賢く分割することによって、どのようにしてpdfファイルを小さなpdfファイルに分割できますか?
PDFファイルをページごとに分割するためにどのようなメカニズムを使用していますか?

それで、私の仕事をする方法はありますか?これについての貴重な提案をお願いします。

4

1 に答える 1

2

PDFは、ベクターベースのドキュメント記述言語です。これはページベースなので、ある意味ですべてのページが次のページから独立しています。したがって、ページを賢く分割するのは非常に簡単です。小さなサブセットをPDFで個別に抽出できるラスター画像とは異なり、小さなサブセットがどのように見えるかを知るには、ページ全体をレンダリングする必要があります。

複雑な形状のオブジェクト(ここでは線ですが、テキスト、形状、画像など)を含むページ(黒)があり、サブセット(赤)を抽出するとします。最初に、関心領域で目に見える出力を生成するすべてのオブジェクトを見つける必要があります。次に、正しくレンダリングされるように変更する必要があります(この場合、オブジェクトの形状を維持しながら、青い点から緑の点を計算します)。

ページ上の複雑な形状

より簡単なアプローチは、ページ全体を含め、表示領域を領域の寸法にクリップすることです。

でこれを行うことができますpdfjam--trim//コマンドをカスタム用紙サイズと組み合わせて確認し--offsetます--delta (pdfjam Webサイトの例6,7)。ただし、関心領域の座標を何らかの方法で計算する必要があります。

于 2012-02-27T08:13:51.387 に答える