スキャンした方眼紙ノート(手書き)のPDFを取り、テキストファイルに変換したいと思います。
これどうやってするの?
ありがとう
OCRopusなどのOCRライブラリを確認してください。PDFは必要ないと思いますので、最初にTIFFまたはJPEGに変換する必要があるかもしれません。
タイピングを変換するOCRライブラリがあります(OCRopus、tesseractなど)。
Javaベースの手書きライブラリもあります。OCRopusにその機能があるかどうかはわかりませんが、手書き認識を行うために調べていたライブラリの1つは次のとおりです。
おそらくあなたはpdfを取り、必要に応じてそれをtiffに変換することができます(ソフトウェアによると)、そしてそれはあなたに何かを与えるでしょう..
幸運を!
それが PDF ファイルとしてのノートブックである場合は、gmail アカウントに電子メールで送信できます。gmail を使用すると、ブラウザ内から PDF を HTML ファイルとして「表示」できます。それでもページは画像のままです。
テキストを取り出したい場合、OCR は機能するかもしれませんが、テキストを取り出すことができない場合もあります。