問題タブ [pdfbox]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
7 に答える
149968 参照

java - Javaで2つのPDFファイルを1つにマージする方法は?

PDFBoxを使用して多くのPDFファイルを1つにマージしたいのですが、これが私がやったことです:

pdfFilesは、すべてのPDFArrayList<String>ファイルを含む です。

上記を実行していると、常に次のようになります。

私は何か間違ったことをしていますか?それを行う他の方法はありますか?

0 投票する
4 に答える
32084 参照

java - Apache PDFBox Javaライブラリ-テーブルを作成するためのAPIはありますか?

私はApachePDFBoxJavaライブラリを使用してPDFを作成しています。pdfboxを使用してデータテーブルを作成する方法はありますか?そのようなAPIがない場合は、drawLineなどを使用して手動でテーブルを描画する必要があります。これを実行する方法についての提案はありますか?

0 投票する
7 に答える
57036 参照

pdf - PDFをSVGに変換する

PDFをSVGに変換したいのですが、これを効率的に実行できるライブラリ/実行可能ファイルを提案してください。私はapachePDFBoxとBatikライブラリを使用して独自のJavaプログラムを作成しました-

このソリューションはうまく機能しますが、結果のsvgファイルのサイズは巨大です(pdfの何倍も大きい)。テキストエディタでsvgを見ると、問題がどこにあるのかがわかりました。文字のフォントプロパティが同じであっても、元のドキュメント内のすべての文字を独自のブロックで囲みます。たとえば、helloという単語は6つの異なるテキストブロックとして表示されます。上記のコードを修正する方法はありますか?または、より効率的に機能する別のソリューションを提案してください。

0 投票する
1 に答える
759 参照

.net - PDFBOX.netデータベースへのPDDocumentオブジェクト/シリアル化

これに光を当てることができる人がいることを願っています。[SERIALIZE]オプションを指定してPDFBOXを再コンパイルする必要があるようです。しかし、私にはその方法がわかりません。

私がやろうとしているのは、PDDocumentdocオブジェクトをデータベース内に保存することです。

エラー:アセンブリ'PDFBox、Version = 0.0.0.0、Culture = neutral、PublicKeyToken =null'に'org.apache.pdfbox.pdmodel.PDDocument'と入力すると、シリアル化可能としてマークされません。

ありがとう、ギャビン

0 投票する
1 に答える
587 参照

c# - ASP.net で PDF ファイルの空のセルを読み取る方法

ASP.netアプリケーションでPDFBOXを使用してPDFファイルを読み取ることができますが、テーブルの空のセルにスペースを追加していません.C#でPDFBOXを使用してPDFファイルから空のフィールドを読み取る方法. PDFファイルを読む他の方法はありますか?

ありがとう 。

0 投票する
1 に答える
2286 参照

java - PDPageContentStream.drawLine を使用した場合の pdfbox エラー

ユーザーが入力したフォームの 1 つから PDF を生成するために PDFBox を使用しています。線の描画には PDPageContentStream.drawLine を使用し、テキストには PDPageContentStream.drawString を使用しています。テキストは完璧に機能しますが、drawLine の使用中に PDF を印刷しようとすると、添付の画像に示すようなエラーが発生します。私のコードは次のようになります

どんな助けでも大歓迎代替テキスト

0 投票する
3 に答える
38034 参照

java - PDFBox:PDFページを画像に変換する際の問題

私の使命は非常に単純です: PDF ファイルのすべてのページを画像に変換することです。icepdf オープン ソース バージョンを使用して画像を生成しようとしましたが、正しいフォントで画像が生成されません。そこで、代わりに PDFBox を使い始めました。コードは次のとおりです。

フォントはきれいに見えますが、pdf ファイル内の画像はかすれて見えます (添付ファイルを参照)。ソースコードを調べましたが、まだ修正方法がわかりません。何が起こっているのか分かりますか?助けてください。ありがとう!!

0 投票する
3 に答える
7762 参照

java - PDFBoxで透明な線を描く

PDFBoxに透明な線で線や多角形を描きたいのですが。これは、青い線を描画する方法のサンプルコードですが、色のアルファ値を変更する方法がわかりません。

0 投票する
2 に答える
3413 参照

pdf - PDFBox テキスト抽出で「長い」スペースを保持する

PDFBoxを使用してPDFからテキストを抽出しています。PDFには表形式の構造があり、これは非常に単純で、列も互いに非常に広い間隔で配置されています

これは非常にうまく機能しますが、すべての種類の水平スペースが単一のスペース文字に変換されるため、列を区別できなくなります (列内の単語内のスペースは、列間のスペースのように見えます)。

一般的な解決策は非常に難しいことを理解していますが、この場合、列が非常に離れているため、「長いスペース」と「単語間のスペース」を簡単に区別するだけで十分です。

PDFBox に、x インチを超える水平方向の空白を単一のスペース以外のものに変えるように指示する方法はありますか? 比例アプローチ (x インチが y スペースになる) も機能します。

pdftotext C ライブラリ/ツールには、レイアウトを保持しようとする「-layout」スイッチがあります。基本的に、PDFBoxでそれをエミュレートできれば完璧です。

0 投票する
1 に答える
171 参照

java - PDF を HTMLConversion に変換する方法

最も効率的な方法で PDF を HTML に変換したかったのです。

入力は base 64 形式の pdf で、出力は html である必要があります。優れたオープンソースもOK

誰でも私を助けることができますか?