問題タブ [pdftools]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
333 参照

image-processing - Tesseractを使用してpngからテキストが認識されない

URL にアップロードされた pdf からデータを取得する必要があります。pdf は image/.png 形式であるため、tesseract パッケージを使用している間、いくつかの行が認識されませんでした。

コード:

実際の出力では、製品のリストとその価格が次のように読み取られます。

予想される出力は次のようになります。

dpi 引数の値を何度か変更しようとしましたが、あまり役に立ちませんでした。前もって感謝します!

0 投票する
0 に答える
99 参照

r - 複数のページから PDF から DataFrame へ R

50 ページを含む pdf で完全なデータフレームを作成したいと考えています。タイトルを削除することで、1 ページのみから 1 つのデータ フレームを生成できましたが、タイトルを無視して 50 ページ全体に対して 1 つのデータ フレームを生成する必要があります。これは私が持っているもので、ファイルは次のようになります。これを達成する方法について何か助けやアドバイスはありますか?