問題タブ [xpdf]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
vim - viキーバインディングのためにxdviでfind-previousまたはxpdfでfindPreviousを追加するにはどうすればよいですか?
xdvi に find-previous 関数、または xpdf に findPrevious 関数を追加する方法はありますか? これらは、「後方検索」オプションがすでにチェックされている検索ダイアログを表示する機能と同等です。
キーバインドを定義するためにそのような関数が必要です
私の .xpdfrc と
私の.Xdefaultsで。次に、両方のプログラムに vi のようなキーバインドの完全なセットを用意します。
c++ - XPDF(または他のもの)でPDFを編集する
xpdfライブラリを使用して PDF ファイルを編集できるかどうか、また可能であればその方法を教えてください。これは可能だと思いますが、xpdfのチュートリアルやドキュメントが見つからなかったので、本当にわかりません:( .他のライブラリがpdf編集をサポートしている場合、別のライブラリを使用することもできます。そのようなライブラリの私の唯一の要件はC++ライブラリまたは少なくともCライブラリである必要があり、クロスプラットフォーム (Windows および Linux) である必要があること
たとえば、pdfファイルの基本的な編集のみが必要です。
「これは PDF ドキュメントのテキストです」は、「これは PDF のテキストです」に変更され、テキストの色も異なります。
返信ありがとうございます。
php - PDFの目次を抽出しますか?
私はSWFToolsとXPDFの助けを借りてpdfを画像/swfとテキストに抽出しています。私はこれらをPDFスクリプトで実行しています。
しかし今、私はさらに一歩進んで、PDFから目次を取得しようとしています。この情報を抽出することは可能ですか?
php - Godaddy Linux 共有ホスティング サーバーに xpdf をインストールするにはどうすればよいですか?
Godaddy サーバーへのアクセス量に基づいて、XPDF をインストールすることが可能かどうかを判断するのに苦労しています。誰かがこれに光を当てることができますか?ここにXPDFへのリンクがあります。GoDaddy サーバー
に関する情報は次のとおりです。
私の目標は、サーバー上の PHP スクリプトを使用して、PDF をプレーン テキストに自動的に変換することです。これまでのところ、PHP Web サイトのコメントに投稿されたコードのような他のソリューションでは不十分でした。すべての調査は XPDF を指しているようです。
c# - 最速の PDF->.NET プロジェクト用テキスト ライブラリ
基本的に私の PDF コレクションのカタログとなるアプリケーションを作成しようとしています。数万の PDF を含む 15 ~ 20 GB について話しています。また、全文検索メカニズムを組み込む予定です。検索には Lucene.NET (実際には NHibernate.Search) を使用し、PDF からテキストへの変換にはライブラリを使用します。どれが最良の選択でしょうか? 私はこれらを検討していました:
- PDFボックス
- c# ラッパー経由の pdftotext (xpdf から)
- iTextSharp
編集:他の良いオプションは、iFilters を使用しているようです。これらのライブラリと比較して、それら (Foxit/Adobe) のパフォーマンス (速度/品質) はどれくらいですか?
商用ライブラリはおそらく問題外です。これは私の個人的なプロジェクトであり、商用ソリューションの予算は実際にはありませんが、PDFTextStream は非常に見栄えがします。
私が読んだことから、 pdftotextはPDFBoxよりもはるかに高速です。pdftotext と比較して、iTextSharp はどれくらいうまく機能しますか? または、誰かが他の優れたソリューションを推奨できますか?
c# - pdfcreator を使用して、pdf などの画像のデータを処理する
ヘイ、みんな。多分あなたたちは私のプロジェクトで私を助けることができます. 仮想プリンターとしてpdfcreatorを使用して、いくつかの画像をファイルに印刷しています。任意のタイプの画像にすることができます。しかし、そこからデータを抽出する必要があります。それはできますか?私はC#を使用しています。
python - 保護された PDF ドキュメントをスキャンする
現在、ディレクトリ内のどのPDFが「保護されたドキュメント」であるかを見つける必要があります。すべての pdfは保護されておらず、xpdf 経由で変換できる必要がありますが、そうではありません。ディレクトリ内のすべての PDF をスキャンして、保護されているかどうかを確認するにはどうすればよいですか?
performance - MuPdf ライブラリは、pdf ページから画像をレンダリングする際に xpdf/poppler よりも高速ですか?
MuPdf ライブラリは、xpdf/poppler よりも PDF ページからの画像のレンダリングが高速ですか? 高性能だと言われています。
c# - PDFをテキストに変換する
PDF ファイルを txt に変換する C# または C++ (MFC) アプリケーションを作成する必要があります。変換するだけでなく、ヘッダー、フッター、左余白のゴミ文字などを削除する必要があります。したがって、アプリケーションでは、ユーザーがページ余白を設定して不要なものを切り取ることができます。実際に xpdf を使用してそのようなアプリケーションを作成しましたが、抽出したテキストにカスタム タグを挿入して斜体と太字を維持しようとすると、いくつかの問題が発生します。多分誰かが何か役に立つことを提案できますか?
ありがとう。
pdf - xpdfまたはmupdfを介して指定されたテキスト位置を取得する方法は?
PDFファイル内の指定されたテキストとテキスト位置を抽出したい。
xpdf と mupdf は pdf ファイルを解析できることを知っているので、このタスクを実行するのに役立つと思います。
しかし、これら 2 つのライブラリを使用してテキストの位置を取得する方法は?