19

改行で区切られたテキスト ファイルに単語の辞書があります。そして、Tesseract を使って筆跡を認識し、最も近い一致する行をテキスト ファイルに出力したいと考えています。

Tesseract を使用するのはこれが初めてで、すでにプロジェクト ワークスペースにあり、トレーニング データが必要なだけです。

これを行うためにTesseractをトレーニングすることは可能ですか?

4

1 に答える 1

15

手書きを認識するように tesseract をトレーニングすることは可能です。手順は次のとおりです: https://tesseract-ocr.github.io/tessdoc/Training-Tesseract

しかし、あまり良い結果を期待しないでください。学者は通常、約 90% を超える精度の結果を得ています。単語数字の参考文献をいくつか示します。したがって、ユース ケースで少なくとも 1/10 のエラーを処理できる場合は、これでうまくいく可能性があります。

于 2012-11-04T18:03:56.083 に答える