問題タブ [ghostscript]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
8 に答える
310296 参照

pdf - PDFから埋め込みフォントを有効なフォントファイルとして抽出するにはどうすればよいですか?

pdftk.exePDFで使用されているフォントと、それらが埋め込まれているかどうかを示すことができるユーティリティを知っています。

問題:フォントが埋め込まれたPDFファイルがある場合、通常のフォントファイルとして再利用できるようにそれらのフォントを抽出するにはどうすればよいですか?それを行うことができる(できれば無料の)ツールはありますか?また、これは、たとえばiTextを使用してプログラムで実行できますか?

0 投票する
2 に答える
2432 参照

pdf - GhostscriptはPDFに埋め込まれたフォントをうまくレンダリングしません(すべてジャギー)

Ghostscriptは、PDFに埋め込まれたフォントを適切にレンダリングしません。例:http : //vegro.nl/cmsfiles/ConsumentenAssortiment/Brochure/10.axd右上のロゴ(「Thermrad」)の文字はすべてギザギザになっています。Adobe Readerでファイルを開いても、まったく問題ありません。

あなたもこの問題を抱えていますか?解決策はありますか?何日も探していましたが、何も見つかりません。

WindowsVistaとCentOSの両方でGhostscript8.64と8.71を試しました。

0 投票する
2 に答える
2107 参照

pdf - RMagickはpsをpdfに変換します

PS ファイルを PDF に変換すると、ローカル マシンでは問題なく動作しますが、実稼働サーバーでは、Mac OSX プレビューの印刷設定から 100% の代わりに [拡大縮小] を選択したかのように、ページに余白が追加されます。 . どうすればこれを防ぐことができますか? 現在、私はやっています:

更新:私はこれを解決しました!以下の私の答えを見てください。

0 投票する
1 に答える
306 参照

pdf - PDF フォントが正しく表示されない

Ghostscript 8.63 を使用して、pdf ドキュメントを個別のページとして分割しています。問題は、分割された PDF ドキュメント内の一部の PDF のフォントが重なっている (黒いパッチ) ことです。verdana-bold フォントのテキストで観察されます。

gostscript に必要なすべてのフォントを -sFontPath ディレクトリにコピーし、ghostscript も verdana、verdana-bold フォント ファイルを開きますが、分割されたファイルのフォントは適切ではありません。

0 投票する
3 に答える
6640 参照

linux - 低品質のPDFを画像に変換するためにImageMagickを実行するための最良のパラメーターは何ですか(OCR用)

私はいくつかの低品質のPDFを持っています。OCRを使用したいと思います。より正確には、 Ocropus からテキストを取得します。使用するには、最初にImageMagick (pdfを画像に変換するコマンドラインツール)を使用して、これらのpdfをjpgまたはpngに変換します。

ただし、ImageMagickは非常に低品質の画像を生成し、Ocropusはほとんど何も認識しません。可能な限り高品質の画像をOCRに提供するために、低品質のpdfを処理するための最良のパラメーターは何かを知りたいと思います。

このページを見つけましたが、どこから始めればよいのかわかりません。

0 投票する
1 に答える
2951 参照

pdf - GhostscriptがPDFファイルからすべてのテキストを抽出しない

PDFページからテキストを抽出するためにghostscript8.71を使用しています。

私が使用しているコマンドは次のとおりです。

そして、私は<stdout>テキストを別のファイルに送るために使用しています。

しかし、問題は、検索可能なテキストアイテムの一部がGhostscriptによって抽出されないことです。

一部のフォントテキストは抽出されません。例:太字のVerdana。しかし、Ghostscriptはフォントファイルを開いています。

PDFファイルをアップロードできますが、ここではアップロードオプションが見つかりませんでした。利用可能なオプションがあれば、私に知らせてください。

0 投票する
4 に答える
5551 参照

postscript - PostScriptで文字列の高さを決定する方法は?

ポストスクリプトで文字列の高さ(指定されたスケールとフォント)を決定する必要があります。

テストを水平方向(まだ垂直方向ではない)の(10,10)の中央に印刷します。(これを確認するために、10,10に小さな円も表示します)。また、テキストを垂直方向に中央揃えにするために文字列の高さを決定する必要がありますが、そのための関数が見つかりません。

0 投票する
2 に答える
8138 参照

pdf - プログラムで生成されたPDFの問題をどのように見つけることができますか?

私のグループは、itext-sharpライブラリとC#/。NETを使用して、カスタムの動的PDFを生成しています。ほとんどの場合、このプロセスは私たちのニーズにうまく機能しています。開発/テスト中に発生する可能性のある問題の1つは、レイアウトの問題であり、AdobeReaderなどでPDFが正しく開かない/レンダリングされない可能性があります。新しいバージョンのAcrobat/Reader。

ドキュメントは、最初のXページの表示を正しく開きます。ただし、エラーが発生した場合、ドキュメントの残りのページは表示されません。

前述のように、通常、この問題をC#/iTextコードのレイアウトタイプの問題まで追跡できます。最終的には、推測とチェックの方法を使用するか、分割統治法を使用してエラーを見つけます。それは機能しますが、これらの問題を解決するための最良の方法とは思えません。

PDFドキュメントの検証プロセスをスピードアップし、ドキュメントのエラーを指摘するのに役立つツールが利用できるかどうか疑問に思いました。

0 投票する
1 に答える
4597 参照

linux - Linux上のPDF:フォントサブセットを組み合わせて、タイプ3をタイプ1に置き換えます

Linuxで後処理したいPDFファイルがあります。特に私はしたい:

  • タイプ3フォントをタイプ1フォントに置き換えます
  • 同じフォントの複数のサブセットを単一のサブセットに置き換えます(サブセットは、LaTeXに図を含めた結果であり、各図にはサブセット化されたフォントが含まれています)

Windowsでは、Adobe Distillerを使用してこれらの2つの手順を実行できます(ドキュメントファイルを開き、それぞれの設定で新しいPDFドキュメントに印刷します)。

Linuxでは、Ghostscript [1]を使用してフォントをサブセット化できますが、(すべて?)タイプ3フォントをタイプ1フォントに置き換えたり、同じフォントの複数のサブセットを組み合わせたりすることはできないようです。

無料のツールを使用してこれら2つのタスクを実行する方法についてのヒントはありますか?

( PDFでタイプ3フォントをタイプ1フォントに変換する方法への返信を知っています。ただし、この会話はDistillerで正常に機能するように見えるため、理論的にフォントに関する情報を失ってもかまいません)。


[1]引数付き:

0 投票する
15 に答える
283008 参照

pdf - PDFからテキストを抽出する方法は?

PDFからテキストと画像を抽出するためのライブラリ/APIを推奨できる人はいますか?ドキュメントの既知の領域に含まれているテキストを取得できる必要があるため、APIはページ上の各要素の位置情報を提供する必要があります。

xmlそのデータをまたはjsonフォーマットで出力したいと思います。現在、かなり良いように見えるPdfTextStreamを調べていますが、他の人々の経験や提案を聞きたいと思います。

プログラムでPDFからテキストを抽出するための代替手段(商用または無料)はありますか?