問題タブ [pdf-parsing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - 「Smalot PDF パーサー」の結果: テキストが同じ行にない
そこで、PDF パーサー ( http://www.pdfparser.org/ ) をインストールしました。私は彼らのウェブサイトをチェックし、デモを使用しました。これにより、私が望んでいた結果が得られました。コンポーザーの使用方法を何時間も検索した後、ようやく機能するようになりました。今、私はデモから結果を得る方法の次の問題に行き詰まっています。
ドキュメントページにあるサンプルコードを使用しました。テキストを抽出しましたが、すべてのテキストが同じ行にあります。デモを使用すると、すべての新しいページが新しい段落で始まり、すべてのテキストが別の行に配置されました。コード:
上記のコードを使用したときに述べたように、すべてのテキストを 1 行にまとめました。私の質問は、デモ ページのスクリプトと同じ結果を得るにはどうすればよいですか??
java - PDFTextStripper.writeString(String text, List をオーバーライドできませんtextPositions) メソッドを使用して c#?
私は PdfBox の .net を使用して解析し、テキストの場所とともに PDF からテキストを抽出しています。そのために、検索中に次の Java コードを見つけました。
次の方法で.netに変換しました。
しかし、上記のコードで次のようなコンパイル エラーが発生します。
エラー 1 メソッド 'writeString' のオーバーロードはありません 2 つの引数を取ります
エラー 2 'PDFTextLocationStripper.writeString(java.lang.String, java.util.List)': オーバーライドする適切なメソッドが見つかりません
では、場所とともにテキストを抽出できるように、writeString メソッドをオーバーライドするにはどうすればよいでしょうか。
ios - PDF テキスト パーサーを迅速にコーディングする
私は現在、PDFテキストパーサーを完全に迅速に開発しています。私はPDFKittensコードを調べていて、CGPDFStringRefをパラメーターとして取っているstringwithpdfstringメソッド(SimpleFont.m内)でこれを見つけました。
私の理解から *bytes は CChar です。このメソッドは正確に何を繰り返していますか? このコードを迅速に変換すると、 Type UnsafePointer?というエラーが表示されます。添字メンバーはありません。 Swift の目的の C コードに相当するものは何ですか?
php - PHPを使用してPDFを解析および再生成する方法
PDF の一部を編集し、編集後に同じ形式で再生成したい。私は試しpdftk
ましたが、読み取り専用ラベルを編集することはできSmalot pdf parser
ません。
よろしくお願いします!!!1