改行で区切られたテキスト ファイルに単語の辞書があります。そして、Tesseract を使って筆跡を認識し、最も近い一致する行をテキスト ファイルに出力したいと考えています。
Tesseract を使用するのはこれが初めてで、すでにプロジェクト ワークスペースにあり、トレーニング データが必要なだけです。
これを行うためにTesseractをトレーニングすることは可能ですか?
改行で区切られたテキスト ファイルに単語の辞書があります。そして、Tesseract を使って筆跡を認識し、最も近い一致する行をテキスト ファイルに出力したいと考えています。
Tesseract を使用するのはこれが初めてで、すでにプロジェクト ワークスペースにあり、トレーニング データが必要なだけです。
これを行うためにTesseractをトレーニングすることは可能ですか?
手書きを認識するように tesseract をトレーニングすることは可能です。手順は次のとおりです: https://tesseract-ocr.github.io/tessdoc/Training-Tesseract
しかし、あまり良い結果を期待しないでください。学者は通常、約 90% を超える精度の結果を得ています。単語と数字の参考文献をいくつか示します。したがって、ユース ケースで少なくとも 1/10 のエラーを処理できる場合は、これでうまくいく可能性があります。