問題タブ [pdfclown]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2921 参照

pdf - .netを使用してpdfから座標で単語を抽出するにはどうすればよいですか?

私は分音記号付きのヘブライ語でpdfを扱っています。すべての単語をその座標で抽出したい。ITextSharp と pdfClown を使用しようとしましたが、どちらも私が望むものを与えてくれませんでした。

pdfClown では、ITextSharp に文字\文字がありません。単語の座標を取得できません。

それを行う方法はありますか?(無料のフレームワーク\コードを探しています)

編集:

PDFClown コード:

0 投票する
1 に答える
548 参照

java - PDF Clown を使用して PDF ファイルに書き込むときに行をスキップするにはどうすればよいですか?

PDF Clown を使用して PDF ファイルに書き込むときに行をスキップするにはどうすればよいですか? IntelliJで使用しています。

私はそれをpdfファイルへの非常に基本的なテキストの書き込みに使用しています.行をスキップする方法についての指示がないことは想像しがたいです.

どんな助けでも大歓迎です。

0 投票する
1 に答える
1064 参照

java - PDFClownを使用してPDFファイルに画像を追加する方法

jpeg 画像を pdf ファイルに変換するために、PDFClown .jar ライブラリを使用します。ただし、次のエラーが表示されます。

java.lang.RuntimeException: java.io.EOFException

ここでコードを見つけることができます:

何が悪いのか教えてください。

0 投票する
1 に答える
435 参照

java - PDFClown 編集可能な長方形

与えられた例に従うpdfClownと、特定のテキストを強調表示し、それぞれの単語の周りに長方形を描くことができます。

このリアクタブルを後で編集可能にする可能性はありAdobe Acrobatますか?

私の現在のワークフロー (予定):

  1. ドキュメントをインポートする
  2. ハイライトのドキュメントを検索
  3. ハイライトの色を決定する
  4. 長方形の外側の境界の周りに長方形を描画します
  5. 決定された色に応じて、文字を含む別の長方形にコールアウトを追加します

Acrobat Reader私が見る限り、以前に強調表示された単語の周りに四角形をドラッグすることはできません。pdfClown の Web ページから提供された例を使用して、すべての文字の周りに反応角を描画しました。

考慮し忘れたことはありますか?

0 投票する
1 に答える
829 参照

java - PdfClown で PDF を印刷すると、PdfClown が新しいページを作成せずに印刷がページからはみ出します。修正方法は?

PdfClown を使用して PDF を印刷すると、PdfClown が新しいページを作成せずに印刷がページからはみ出します。これを修正するにはどうすればよいですか?

コードは以下のとおりです。テキストをPDFページに印刷します。印刷がページの下部からはみ出し始めると、別のPDFページが自動的に追加されます。これを解決するPdfClown設定はありますか?

どんな助けでも大歓迎です。

0 投票する
1 に答える
291 参照

pdf - PDFClown での空の空白の変換

PDFClown でクラスを使用するTextExtractorと、「任意の改行」とも呼ばれる空の空白が発生するという問題が発生します。これらの文字はランダムに埋め込まれますが、Acrobat Reader では無視されます。'\n'したがって、これらの文字が存在する行は、Acrobat では 1 行として表示されますが、 で改行文字として指定すると、テキストが抽出されると複数の行に分割されますTextExtractor.ToString(...)

PDF clown は、単純に空白文字を取り、それを単一のスペースまたは' '. 代わりに元の文字が抽出されるように、この変換をバイパスする方法はありますか?