OCR を実行する特定の 10 枚の画像セットがあります。それらはすべて数字です。やや短く、各画像で約 20 桁です。特定のイメージが 1 つあります。最初に実行すると、いくつかの不一致が生じます。ただし、最初に他のテストを実行してからそのテストに戻ると、すべての文字が一致します。
より多くの OCR 操作が実行されるにつれて、Tesseract が文字を学習していると結論付けたいと思います。これは非常に喜ばしいことです。問題は、可能であれば、学習データを保存することです.Tesseractは、次に使用するときにそれを取得することを知っていますか?