問題タブ [pdfbox]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
18365 参照

java - BufferedImage を PDFBox ドキュメントに追加する

BufferedImage現在のプロジェクトでは、PDFBox ドキュメントにを追加しようとしています。より具体的には、JFreeChart. 私のコードは次のようになります。

ドキュメントが作成されます。テキストを追加できますが、表示するのに十分な情報が画像にないというエラーが表示されます。

私が間違っていることの手がかりはありますか?

0 投票する
5 に答える
27862 参照

java - Javaを使用してPDFから画像を抽出

PDF全体を画像に変換するのではなく、PDFからのみ(長方形を使用して)バーコードを抽出する必要があります。

画像形式はjpg/pngです。

0 投票する
1 に答える
2565 参照

java - PDFBox のマージされたドキュメントには、空白ページがないか、ページが多すぎます...ただし、印刷時のみ

私が現在取り組んでいるプロジェクトでは、大量のドキュメントを印刷する必要があり、クライアントに郵送されます。たとえば、1 回の印刷に 1000 通を超える文字が含まれる場合があり、それぞれが異なるクライアントに送られます。

この印刷物を生成するために、外部サービス (つまり、PDFBox を使用しないサービス) は、最初にこれらの各レターを個別の PDF ファイルとして生成します。次に、私のコードはこれらの PDF ファイルをすべて読み込み、それらをすべて PDFBox とマージして (印刷室で 1 つのジョブとして印刷できるように)、前面に「バナー ページ」を追加します (これも PDFBox を使用)。文字をどうするかを印刷室に指示します。

すべて両面印刷です。しかし、手紙はそれぞれ別のクライアントに送られるため、1 枚の紙に 2 通の手紙を連続して印刷することはできません。つまり、ページ数が奇数のレターには空白ページを追加する必要があります。印刷の直前に、2 文字のみを含む非常に小さな印刷部数のマージされた PDF ドキュメントは、次のようになります。

しかし、これが私の問題の出番です。次のコードで空白のページを追加しました。

これは、バナー ページでは一貫して機能しているように見えますが、一部の種類の文字では失敗します。結果の PDF を開くと問題ないように見えますが、印刷すると、各文字の間に余分な白紙が入ります。

したがって、これを Acrobat Reader (または PDFBox のビューアー) で見ると、次のようになります。

印刷出力は次のようになります。

一方、そのnew PDPage()コードを取り出すと、Acrobat と印刷出力の両方で次の結果が得られます。

を介してデバッグを試みましPDDocument.silentPrint(PrinterJob)たが、PDF の構造に深く入り込むと、事態は非常に危険になり始め、場違いなものとして何も飛び出しません。何が起こっているのでしょうか?

0 投票する
1 に答える
265 参照

build - jempboxでPDFBoxの失敗をビルドする

pdfbox-1.6.0.jarがシステムで機能しないことがわかったので、SourceからビルドしてMavenをインストールしようとしました。

WindowsXPまたはFedora15でビルドしているときに、このエラーが発生しました。

解決策は何ですか?

0 投票する
1 に答える
3723 参照

android - PDFBox を使用して Android で PDF ファイルのコンテンツを表示する

アンドロイドでトム・ラッシュのApache pdfboxポートを使用して、PDFファイルの内容をそのまま表示する方法は?

0 投票する
1 に答える
1301 参照

java - PDFBoxがリンクを認識しない

特定のファイルへのリンクを検索するために、Apache PDFBox を使用して PDF をスキャンしています。

スキャンする PDF が約 1,000 ありますが、ほとんどのリンク (実際、現在確認できる限り 1 つを除くすべて) が見つかりました。

ただし、PDFBox が無視する特定のリンクが PDF 内に 1 つあります。Foxit で PDF を開いてリンクのプロパティを確認すると、他のすべてのリンクとまったく同じように見えます (実際に検出されます)。

リンクを反復処理するために使用するコードは次のとおりです。

影響を受ける PDF ではpage.getAnnotations()、空のリストが返されます。

注釈以外に知っておくべきリンクの種類はありますか?

0 投票する
1 に答える
7268 参照

java - Java を使用して PDF ドキュメントに行を追加したい

私は現在PDFBoxを使用しており、フォルダー1にあるa.pdf内から読んでいます

最初に、フォルダー内で見つかったすべての Pdf ファイルを一覧表示します。次に、各ファイルのページ数を確認します。ここで、フッターの下のファイルの最後に移動して、プリンターが認識できる画像を追加して、ファイルの終わりに達したことを認識するため、ページをステープルします。

ファイルのリストとページ数を取得するまでにたどり着きました。

最後のページの最後に移動してそこに書き込むには、どのコマンドを使用すればよいですか?

.pdf ファイルをテキストに変換する必要がありますか、それとも PDPageContentStream を使用できるようにする必要がありますか

これは私が現在使用しているコードで、AAA 文字列が pdf ファイルの最後のページに挿入されるかどうかをテストして確認しようとしています。プロジェクトはエラーなしで実行されていますが、何らかの理由で pdf に挿入されていません。

ご清聴ありがとうございました


上記で使用していたコードは正しいです。問題は、生成される PDF ファイルがバージョン 1.2 であることです。これが、pdf ドキュメントの編集を許可されていない理由です。

バージョン1.2を使用している場合、実際にアップグレードできないため、どうすればよいか誰か知っていますか.

0 投票する
2 に答える
5614 参照

java - PDFBox を使用して Java から PDF を編集する

現在、PDF からページを取得し、その特定のページを編集しようとしています。編集を行うと、PDF自体に保存されません。

これは私のコードで、誰かが助けてくれます。

0 投票する
3 に答える
8763 参照

java - Java-pdfboxはjarをインポートできませんか?

こんにちは。誰かが私が信じるこの単純な問題について私を助けてくれませんか...私はすでにJavaチャットWebサイトで8人以上の専門家に質問しましたが、誰も私を助けてくれないようです:(。私は httpからjarファイルをダウンロードしました: //pdfbox.apache.org/download.html。blueJIDEを開いて、jarをロードしました。入力すると

エラーメッセージが表示されます:

NetBeansも試し、プロジェクトプロパティに移動して、jarを追加しました。また、NetBeansのサイドメニューに移動して、その方法を試しました。それでも同じエラーが発生します。誰か助けてもらえますか?私はこれを3つの異なるPCで試しました。

大丈夫、私にもっと情報を教えてください。私はjarファイルをダウンロードしてblueJのフォルダーに入れました。オプションに移動し、「ロードされた」と表示されているjarファイルを選択しました。Netbeansでも同じことを行いました。ここでは、Jarsがまだ機能しないIDEを示しました。これは完全なコードであり、私が試しているPDFBOXWebサイトから取得したサンプルコードです。

}

0 投票する
1 に答える
3820 参照

java - PDFBox、FontBoxなどを使用してPDFをテキストに解析する際のフォントの問題

pdfbox apiを使用して、 pdfからテキストを抽出しています。
私のプログラムは正常に動作しています実際にはpdfからテキストを抽出していますが、pdfのテキストの問題フォントはCDAC-GISTSurekh(ヒンディー語フォント)であり、プログラムの出力はManglaと同じフォントではありません。
PDFのテキストとさえ一致しません。
同じフォント、つまり CDAC-GISTSurekh (ヒンディー語フォント) をダウンロードして、コンピューターのフォントに追加しましたが、それでも出力は Mangla でフォーマットされています。
解析中に出力のフォントを変更する方法はありますか?

どんな助けにも感謝..

私が書いたコード: