“xpdf”の関連問題_Stack Overflow日本語サイト

0 投票する

1 に答える

1558 参照

image - pdfbox はベクター画像を抽出できますか?

私の理解によると、

私は最初のものについてはほぼ確信していますが、2番目については確信が持てません。間違っている場合は修正してください。

この 2 つのことを前提として、latex ファイル (.eps 画像が挿入されている場所) または word ファイル (ベクター画像を含む) を pdf に変換すると、画像はラスター画像に変換されますか?

また、ベクトル画像ではなく、pdfからラスター画像のみを抽出できると思いますPDFBox（xpdfとして埋め込まれているため）。XObjectsその理解は正しいですか？stackoverflow のこの質問は関連していますが、まだ回答がありません。

2013-02-13T04:47:52.260

0 投票する

0 に答える

451 参照

pdf - 段落境界を理解するためのPDFコンテンツストリームの解析

PDFコンテンツストリームを解析して段落境界を識別する方法はありますか? ISO 32000-1:2008 を読みましたが、pdf コンテンツストリームに、表示ソフトウェアに段落の開始または終了を指示する演算子が含まれているかどうかを理解できませんでした。テキスト抽出ソフトウェアは、その情報を気に入っpdfboxたりxpdf提供したりできますか?

pdf pdfbox xpdf

2013-02-15T20:59:21.130

0 投票する

1 に答える

2317 参照

pdf - どのクリップパスがパスに適用されるか、または PDF ベクターグラフィックスを塗りつぶすかを特定する方法を教えてください。

PDF ファイルからベクターグラフィックスを抽出し、対応する SVG ファイルを作成しようとしています。この目的のために、xpdf ライブラリでSVGOutputDev ( https://github.com/immateriel/pdf2svg/blob/master/SVGOutputDev.cc ) を使用しています。現在、SVGOutputDev はクリップパス抽出を実装していません。同じ実装を試みています。クリップパス定義自体を抽出することはできますが、これらの定義のどれが通常のストロークまたは塗りつぶし領域に適用されるかを判断できません。たとえば、http://pastebin.com/jTdzv3YZを参照してください。PDFのページから抽出したSVGと、抽出中に見られる一連のPDFグラフィックコマンドの対応するダンプ。その SVG からわかるように、複数のクリップパスと 1 つの四角形の塗りつぶし領域があります。塗りつぶされた四角形が定義される前に複数のクリップパスが定義されていても、直前に定義された円形のクリップパスのみ四角形の定義は、四角形に関連付けられていることが期待されます (さまざまな PDF リーダーで PDF ページがどのようにレンダリングされたかによって、白の背景に黒く塗りつぶされた円が 2 つだけ表示されます)。問題は、どのクリップパスが PDF で定義された通常の塗りつぶし/ストローク領域に関連付けられているかをどのように知るかということです。参考までに、PDF 仕様書の関連セクションを調べましたが、あまり明確ではありませんでした (「クリッピングパス操作は、最後のパス構築演算子の後、パスオブジェクトを終了するパス描画演算子の前に表示される場合があります。ただし、クリッピングパスオペレータはペイントオペレータの前に表示されますが、表示された時点でクリッピングパスを変更するのではなく、後続のペイントオペレータの効果を変更します。

pdf svg clipping xpdf

2013-06-08T19:42:47.973

0 投票する

1 に答える

127 参照

pdf - PDF クロップボックスと PDF ページから作成された SVG の不一致

PDFページの背景画像をSVGに抽出しようとしています(xpdfライブラリを使用)。私が直面している問題は、PDF リーダーによってレンダリングされない追加の画像/グラフィック (おそらくcropboxの外側) が PDF に含まれているが、対応する SVG にこれらの画像/グラフィックが含まれていることです。SVGのviewBox属性をcropBoxに対応するように設定してみましたその PDF ページの境界はありませんが、結果の SVG には、PDF によってレンダリングされないグラフィックオブジェクトがいくつか表示されます。また、SVG にクリップパスを追加しようとしました - 長方形のクリッピング領域 (PDF のクロップボックスに対応する境界を持つ) ですが、これも PDF に見られない追加のグラフィック要素の一部を排除しませんでした。何が問題になる可能性がありますか？PDFクロップボックスをSVGに引き継ぐ正しい方法は何ですか? ところで、上記の両方のケース (viewbox とクリッピング領域のアプローチ) で生成された SVG は、PDF ページの表示可能領域の寸法にかなり近く、追加の要素は端の近くにしか見えませんでした。PDF から取得したクロップボックスの寸法を SVG で直接使用してはならないということですか?

pdf svg xpdf

2013-08-26T18:28:06.620

0 投票する

1 に答える

11845 参照

pdf - すべてのpdfをテキストに変換するバッチファイル（xpdf付き）

PDFファイルがいっぱいのフォルダでバッチ変換を実行したいと思います。xPDF を使用していますが、これは単一ファイルのコマンドプロンプトです。

c:\Test\pdftotext -レイアウト firstpdftoconvert.pdf firstpdfconverted.txt

誰かがバッチファイルを使用して一度に（すべてのpdfファイルのみを変換して）それを行うのを手伝ってくれませんか？前もって感謝します！

pdf batch-file xpdf

2014-01-23T12:06:56.930

0 投票する

0 に答える

177 参照

php - コピーまたはxpdfでpdfの奇妙な文字

Linuxサーバーでxpdf（phpを使用）を使用してpdfファイルから情報を抽出しています

一部のファイルではすべて問題ありません

しかし、他のいくつかでは、抽出されたテキストは非常に奇妙です!

Acrobat Reader で PDF を見ると、通常のテキストが表示されます

しかし、抽出すると、たとえば次のようになります。

また、コンピューターの Windows 8.1 で PDF からメモ帳またはメモ帳 ++ にコピーアンドペーストすると、これらの奇妙な文字が表示されます。

何か助けてください。よろしく

php linux pdf xpdf

2014-04-09T09:48:40.370

問題タブ [xpdf]

image - pdfbox はベクター画像を抽出できますか?

pdf - 段落境界を理解するためのPDFコンテンツストリームの解析

pdf - どのクリップ パスがパスに適用されるか、または PDF ベクター グラフィックスを塗りつぶすかを特定する方法を教えてください。

pdf - PDF クロップボックスと PDF ページから作成された SVG の不一致

pdf - すべてのpdfをテキストに変換するバッチファイル（xpdf付き）

php - コピーまたはxpdfでpdfの奇妙な文字

Reference

pdf - どのクリップパスがパスに適用されるか、または PDF ベクターグラフィックスを塗りつぶすかを特定する方法を教えてください。