問題タブ [pdf-parsing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
445 参照

php - PDF パーサー ライブラリを使用してテキスト入力から複数の PDF を解析する

PDF Parser PHP ライブラリを使用して、フォーム テキストエリア (1 行に 1 つの PDF URL) を介して送信された複数の PDF からテキストを解析しようとしています。

私が使用しているコードは次のとおりです。

注: 「vendor/autoload.php」はComposerファイルです。

これは、テキストエリアに 1 つの URL のみを配置した場合は期待どおりに機能しますが、複数の URL を配置した場合は何も返されません。foreach ループに何か問題があるのか​​ 、それともこのライブラリがループ内の複数の PDF の解析をサポートしていないのかはわかりません...アドバイスをいただければ幸いです。

0 投票する
3 に答える
3003 参照

pdf - Python3.4 による PDF テキスト抽出

PDF ファイル内のテキストはテキスト形式であり、スキャンされていません。PDFMiner は python3 をサポートしていません。他の解決策はありますか?

0 投票する
2 に答える
875 参照

python - Python3 を使用して pdf (元は .html) ファイルを開いて読み取る方法

このファイルを python3 で開く必要があります。

http://www.arch.gob.ec/index.php/descargas/doc_download/478-historial-de-produccion-nacional-de-crudo-2011.html

ここで、それを読み取って、データ テーブルを抽出する必要があります。数時間検索しましたが、何も機能していないようです。私はスクレイピング/解析が初めてで、PDFのファイル処理を調べたのは初めてです。

いろいろ助けてくれてありがとう!

0 投票する
1 に答える
268 参照

objective-c - バッファストリームにゼロを含むバイトバッファ ( NSData / const char* ) を NSLog する方法は?

ストリームの途中にゼロ (' 0 ')を含む圧縮されたストリーム オブジェクトを含むPDFのコンテンツをNSLogしたいと考えています。

残念ながら、最初のストリーム オブジェクトで ' 0 ' が最初に出現すると、コンソールの出力が終了します...

SOまたはクラウドで何も見つかりませんでした。
4つの異なる方法で試してみました...

それらの 4 つすべてのコンソールでの出力: (もちろん、バッキング ストアでは常に null で終了する文字列です)

ここでは、「x + TT」の後の「0」(ストリームオブジェクトの始まり)のためにストリームが終了します...

誰?