ocr - Tesseract OCR の新しい言語のトレーニングに使用するデータの種類

Question

Tesseract OCR の新しい言語をトレーニングするために使用するデータの種類を知りたいですか?

各キャラですか？それとも、特定の文を作成する必要がありますか?

この情報のソースを提供するのを手伝ってください.wikiページでは明確にわかりません.

score 1 · Accepted Answer

このページを試してみてください。古代ギリシャ語を認識させるために彼らが取った手順を示しています http://www.eutypon.gr/eutypon/pdf/e2012-29/e29-a01.pdf

これは、tesseract のトレーニングに関する tesseract チームからの一般的な情報ですhttps://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3

1 に答える 1