android - 辞書トレーニングによる Tesseract 手書き

Question

改行で区切られたテキストファイルに単語の辞書があります。そして、Tesseract を使って筆跡を認識し、最も近い一致する行をテキストファイルに出力したいと考えています。

Tesseract を使用するのはこれが初めてで、すでにプロジェクトワークスペースにあり、トレーニングデータが必要なだけです。

これを行うためにTesseractをトレーニングすることは可能ですか?

score 15 · Accepted Answer

手書きを認識するように tesseract をトレーニングすることは可能です。手順は次のとおりです: https://tesseract-ocr.github.io/tessdoc/Training-Tesseract

しかし、あまり良い結果を期待しないでください。学者は通常、約 90% を超える精度の結果を得ています。単語と数字の参考文献をいくつか示します。したがって、ユースケースで少なくとも 1/10 のエラーを処理できる場合は、これでうまくいく可能性があります。

1 に答える 1