1

ドキュメントファイルの操作を含む、商用利用のためのツールを開発することを考えています(私はそれを販売するつもりです)。

操作には次のものが含まれます。1。複数のPDFファイルを1つに連結します。2. doc/docxファイルをPDFファイルに変換します。3.1つのPDFファイルを2つの別々のPDFファイルに分割します。4. PDFファイルのページに番号を付けます(順番に実行される番号を使用)。

さらに言えば、PDFの操作に役立つ無料のライブラリまたはコードを探しています。私のソフトウェアはGUIを備えているのでC#であるため、ライブラリはC#である方が好きですが、JAVAライブラリでも管理します...

私は大いに役立つ「pdftk」ライブラリを見つけましたが、残念ながらそのライセンスでは商用利用が許可されていません。

誰かが私を助けることができる無料のライブラリまたはコードのアイデアを持っていますか?

どうもありがとう!!

4

2 に答える 2

1

JavaでPDFを操作したい場合は、PDFBoxが適しています。

また、JavaとC#をサポートしているitexpdfを見ることができます。ライブラリにはコミュニティバージョンがあります。

于 2012-10-13T11:59:49.137 に答える
1

http://www.foolabs.com/xpdf/download.htmlでpdftotextを見てください。

PDFファイルの内容をテキストファイルに抽出するためのオプションを提供します。他のライブラリと比較して際立っているのは、抽出されたテキストファイルのPDFファイルからのフォーマットを維持していることです。これは、PDFにテーブルなどの構造データが含まれていて、PDFファイルにタグが付いていない場合に非常に役立ちます。PDFBoxおよびその他のライブラリは、PDFの解析中にPDFのコンテンツの構造を維持できません。

PDFからテキストファイルを抽出したら、お気に入りのプログラミング言語を使用してテキストファイルを解析できます。

ここでライセンスポリシーを見てください:http ://www.glyphandcog.com/Xpdf.html 。ソースコードを変更せずに実行可能ファイルを直接使用する場合は、実行可能ファイルを使用するアプリケーションを自由に再配布できることを明確に示しています。パフォーマンスが問題にならない場合は、ソースコードに触れる必要はありません。

パフォーマンスが懸念される場合は、機能を強調するアプリケーションの試用版を作成できますが、PDFを処理するたびに実行可能ファイルが実行されるため、当然低速です。有料版はpdftotextapiを直接呼び出すことができ、より高速になります。あなたは非常に簡単にライセンスに費やされたお金を補うことができます。もし私があなただったらこれをやったでしょうが、私は現在すでにいくつかの大きなプロジェクトを持っています:)

自分で使ったのでpdftotextを保証できます。他のすべてのライブラリは、ユーザーがPDFファイルの形式をそのまま維持することに関心があるかもしれないことを忘れているようです。

于 2012-10-13T13:19:02.490 に答える