問題タブ [pdf-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1933 参照

php - 「Smalot PDF パーサー」の結果: テキストが同じ行にない

そこで、PDF パーサー ( http://www.pdfparser.org/ ) をインストールしました。私は彼らのウェブサイトをチェックし、デモを使用しました。これにより、私が望んでいた結果が得られました。コンポーザーの使用方法を何時間も検索した後、ようやく機能するようになりました。今、私はデモから結果を得る方法の次の問題に行き詰まっています。

ドキュメントページにあるサンプルコードを使用しました。テキストを抽出しましたが、すべてのテキストが同じ行にあります。デモを使用すると、すべての新しいページが新しい段落で始まり、すべてのテキストが別の行に配置されました。コード:

上記のコードを使用したときに述べたように、すべてのテキストを 1 行にまとめました。私の質問は、デモ ページのスクリプトと同じ結果を得るにはどうすればよいですか??

0 投票する
1 に答える
789 参照

java - PDFTextStripper.writeString(String text, List をオーバーライドできませんtextPositions) メソッドを使用して c#?

私は PdfBox の .net を使用して解析し、テキストの場所とともに PDF からテキストを抽出しています。そのために、検索中に次の Java コードを見つけました。

次の方法で.netに変換しました。

しかし、上記のコードで次のようなコンパイル エラーが発生します。

エラー 1 メソッド 'writeString' のオーバーロードはありません 2 つの引数を取ります

エラー 2 'PDFTextLocationStripper.writeString(java.lang.String, java.util.List)': オーバーライドする適切なメソッドが見つかりません

では、場所とともにテキストを抽出できるように、writeString メソッドをオーバーライドするにはどうすればよいでしょうか。

0 投票する
0 に答える
388 参照

ios - PDF テキスト パーサーを迅速にコーディングする

私は現在、PDFテキストパーサーを完全に迅速に開発しています。私はPDFKittensコードを調べていて、CGPDFStringRefをパラメーターとして取っているstringwithpdfstringメソッド(SimpleFont.m内)でこれを見つけました。

私の理解から *bytes は CChar です。このメソッドは正確に何を繰り返していますか? このコードを迅速に変換すると、 Type UnsafePointer?というエラーが表示されます。添字メンバーはありません。 Swift の目的の C コードに相当するものは何ですか?

0 投票する
0 に答える
136 参照

php - PHPを使用してPDFを解析および再生成する方法

PDF の一部を編集し、編集後に同じ形式で再生成したい。私は試しpdftkましたが、読み取り専用ラベルを編集することはできSmalot pdf parserません。

よろしくお願いします!!!1