問題タブ [pdftools]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image-processing - Tesseractを使用してpngからテキストが認識されない
URL にアップロードされた pdf からデータを取得する必要があります。pdf は image/.png 形式であるため、tesseract パッケージを使用している間、いくつかの行が認識されませんでした。
コード:
実際の出力では、製品のリストとその価格が次のように読み取られます。
予想される出力は次のようになります。
dpi 引数の値を何度か変更しようとしましたが、あまり役に立ちませんでした。前もって感謝します!
r - 複数のページから PDF から DataFrame へ R
50 ページを含む pdf で完全なデータフレームを作成したいと考えています。タイトルを削除することで、1 ページのみから 1 つのデータ フレームを生成できましたが、タイトルを無視して 50 ページ全体に対して 1 つのデータ フレームを生成する必要があります。これは私が持っているもので、ファイルは次のようになります。これを達成する方法について何か助けやアドバイスはありますか?