問題タブ [pdf-manipulation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
pdf - ラスタライズを回避してコマンドラインから PDF をグレースケールに変換する方法は?
この PDF をグレースケールに変換しようとしています: https://dl.dropboxusercontent.com/u/10351891/page-27.pdf
Ghostscript (v 9.10) で pdfwrite デバイスを使用すると、「カラー スペースをグレーに変換できません。ストラテジーを LeaveColorUnchanged に戻しています。」というメッセージが表示されて失敗します。メッセージ。
中間の ps ファイル (gs、pdftops (v 0.24.3) または pdf2ps を使用) を介して変換できますが、この変換では PDF 全体がラスタライズされます。私は他にもたくさんのことを試しました:qpdf(v 5.0.1)またはpdftk(v 1.44)を使用してPDFを正規化し、それをsvgファイルに変換し、Inkscape(v 0.48.4)を介してPDFに戻します...何もないようです仕事に。
私が見つけた唯一の解決策 (実稼働環境では適していません) は、Mac で Preview を使用し、Quartz Gray Tone フィルターを手動または Automator スクリプトで適用することです。
誰かがそれを行う別の有効な方法を見つけましたか? または、PDF を正規化するか、Ghostscript メッセージ「色空間を変換できません...」を防ぐために問題を修正するか、別の方法で色空間を強制することは可能ですか?
ありがとう!
c# - 「Producer」というメタデータにテキストの代わりに漢字を
iTextSharp を使用して PDF のメタデータを編集すると問題が発生します。Word で Word 文書を PDF に保存します。「Producer」というフィールドには、「Microsoft Word 210」というテキストを含む単語が入力されています。その後、ITextSharp でメタデータを編集すると、iTextSharp は、「iTextSharp 4.1.6 を使用して変更されました」というテキストを追加するために、このフィールドを編集しようとします。
結果はProducer(þÿMicrosoft® Word 2010; modified using iTextSharp 4.1.6 by 1T3XT)
です。Adobe Reader で、ドキュメント プロパティのフィールド PDF Producer に漢字が表示されます。
文字を手動で削除すると、アドビはフィールドを読み取ることができますþÿ
。
なぜ私がこの問題を抱えているのか知っていますか? この問題を解決するにはどうすればよいですか?
c# - Visual Studio を使用せずに .net スクリプトで DLL を参照する方法
C# スクリプトで DLL を参照するにはどうすればよいですか? 私は Visual Studio を使用していません。NPP と C# プラグインを使用して、簡単な 1 ファイル スクリプトを作成しているだけです。そのスクリプトは、サード パーティの DLL を参照する必要があります。これを実現するために含めることができるコード スニペットはありますか?
参照したいDLLはiTextSharp用です
c# - C# プログラムからゴーストスクリプトを実行する方法
C# プログラムからゴースト スクリプトを呼び出して、いくつかの引数を渡して PDF ファイルのフッターをトリミングし、一時ファイルを新しい修正バージョンで上書きしようとしています。
gs.exe を間違って呼び出していると思います。start(gs) に渡した文字列が機能しない理由がわかる人はいますか?
スクリプトをトレースすると、到達したときにキャッチがトリガーされますSystem.Diagnostics.Process.Start(gs);
これは、process.start(gs) 関数で呼び出されている文字列です。
これは、コンソールに表示されるメッセージです。
次に、これが私のメソッドのコードです。
python - Python PyPDF2 結合ページ
ページに分割された大きなテーブルを含む PDF があるため、ページごとのテーブルを大きなページの大きなテーブルに結合する必要があります。
これは PyPDF2 または別のライブラリで可能ですか?
乾杯
linux - 効率的な方法で n ページごとに PDF を別の PDF にマージする方法
次のことを行うための最良の(最も効率的で信頼性の高い)ソリューションを見つけたいと思います。
- 私は1つの大きなPDFページAを持っています(1000ページとしましょう)
- 別のPDFページBがあります(小さい、2ページとしましょう)
- Aのnページごと(毎秒としましょう)の後にPDF BをPDF Aにマージしたい
使いやすいパラメータ構文でこれをサポートする Linux ツールはありますか (パラメータ「-merge-after-every 2」を指定するなど)。
おそらく他の代替ソリューション/アプローチですか?
私はpdfsamを試しましたが、明示的なページシーケンスで非常に長いパラメータリストを渡す必要があるようです. また、1000ページのPDFの各ページの後にPDFページをマージする場合、pdfsamは私のマシンでstackoverflow例外で停止します(ファイルAのページサイズが小さい場合に機能します)。
python - PythonでpdfMinerを使用して値を予測的に読み取る方法
私はpdfMinerを使用してグラフから値を読み取っていますが、これまでのところうまく機能しています!
ただし、正しいデータが正しく読み取られても、予測できない方法で読み取られる領域が 1 つあります。つまり、すべてのグラフの値が、表示される順序とはまったく異なる順序で正しく読み取られます。
私が知っている限り、最後のグラフが常に最初に読み込まれると言って、それを中心にプログラムを構築できるので、これは完全に問題ではありません。pdfMiner がこのデータを読み取る方法がほぼ完全に予測不可能であるように思われることを除けば、識別可能なパターンは見つかりません。
これはおそらく、私が pdfMiner に慣れていないため、どのように機能するのか完全にはわかりません。そうです、もし誰かが私を正しい方向に向けることができれば、それは本当に役に立ちます.
ここに私のデータがあります
そして、ここに私が使用している変換コードがあります:
java - iText : ページから /Resources を取得できません
iText 5.0.1 を使用して既存の PDF を操作しています。RUPSを使用して既存の PDF を分析すると、最初のページに /Resources が含まれていることがわかります。
ただし、次の例を使用して PDF を操作すると、 pageDictionary.get(PdfName.RESOURCES)が null を返すため、NPE が発生します。
デバッグ時にpageDictionnaryオブジェクトに含まれるものは次のとおりです。
残念ながら、機密保持のため、現在 PDF を投稿することはできませんが、なぜこの NPE を取得しているのかわかる人はいますか? または、さらに調査する方法を知っている人はいますか? (私は iText と PDF 構造の専門家にはほど遠いです...そしてゆっくりと考えを失いつつあります)
どうもありがとうございました !