問題タブ [pdftools]

質問する

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

79 問題

0 投票する

1 に答える

333 参照

image-processing - Tesseractを使用してpngからテキストが認識されない

URL にアップロードされた pdf からデータを取得する必要があります。pdf は image/.png 形式であるため、tesseract パッケージを使用している間、いくつかの行が認識されませんでした。

コード：

実際の出力では、製品のリストとその価格が次のように読み取られます。

予想される出力は次のようになります。

dpi 引数の値を何度か変更しようとしましたが、あまり役に立ちませんでした。前もって感謝します！

2020-04-06T07:13:46.523

0 投票する

0 に答える

99 参照

r - 複数のページから PDF から DataFrame へ R

50 ページを含む pdf で完全なデータフレームを作成したいと考えています。タイトルを削除することで、1 ページのみから 1 つのデータフレームを生成できましたが、タイトルを無視して 50 ページ全体に対して 1 つのデータフレームを生成する必要があります。これは私が持っているもので、ファイルは次のようになります。これを達成する方法について何か助けやアドバイスはありますか？

r merge pdftools

2020-08-06T05:07:44.120

1 2 3 4 5 6 7 8 9 10

問題タブ [pdftools]

image-processing - Tesseractを使用してpngからテキストが認識されない

r - 複数のページから PDF から DataFrame へ R

Reference