4

Mac のプレビュー アプリケーションでは、複数の PDF ファイルを結合できますが、その機能はわかりにくいものです。同様のタスクを実行する必要があるユーティリティを Haskell で作成しています。つまり、任意の数の PDF ファイルを 1 つの新しいファイルにマージします。

これをどこから始めるべきかについて誰か提案がありますか? 明らかに、Hackage にほとんどの作業をすぐに実行できる理想的なライブラリがある場合は理想的ですが、そうでない場合は、どこから始めればよいかについてのいくつかの指針が非常に高く評価されます。

4

2 に答える 2

4

私は、解析と生成をサポートするpdfライブラリに取り組んでいます。これは低レベルであり、高レベルのツールはまだToDoリストに含まれています(優れた高レベルAPIを設計するのは難しいため)。

これは、PDFファイルの解凍と復号化の例ですPDFのマージを実装するのは簡単ですが、PDFの内部に精通している必要があります。

追加:HaskellでPDFファイルをマージする基本的な例を作成します。合計150行のコードですが、機能がほとんどありません(ファイルの上部にあるコメントを参照してください)。追加は簡単ですので、興味のある方はお知らせください。

于 2013-03-17T22:42:51.057 に答える
2

PDF ファイル形式はそれほど複雑ではありません。Adobe の公式仕様書がどこかにあります。基本的に、PDF ファイルには一連の番号付きの「オブジェクト」が含まれています。各 PDF ファイルからすべてのオブジェクトを取得し、番号を付け直して一意になるようにし、すべてのページが実際に表示されるようにページ インデックスをいじる必要があります。

Hackage にはPDF ファイルを書き込むためのパッケージがいくつかあるようですが、それらを読み取るためのパッケージはあまり見当たりません。pdfsplitアイデアについては、ソース コードを参照してください。またHPDF

于 2013-03-17T19:12:40.460 に答える