Tesseract OCR の新しい言語をトレーニングするために使用するデータの種類を知りたいですか?
各キャラですか?それとも、特定の文を作成する必要がありますか?
この情報のソースを提供するのを手伝ってください.wikiページでは明確にわかりません.
Tesseract OCR の新しい言語をトレーニングするために使用するデータの種類を知りたいですか?
各キャラですか?それとも、特定の文を作成する必要がありますか?
この情報のソースを提供するのを手伝ってください.wikiページでは明確にわかりません.
このページを試してみてください。古代ギリシャ語を認識させるために彼らが取った手順を示しています http://www.eutypon.gr/eutypon/pdf/e2012-29/e29-a01.pdf
これは、tesseract のトレーニングに関する tesseract チームからの一般的な情報ですhttps://code.google.com/p/tesseract-ocr/wiki/TrainingTesseract3