私の知る限り、Tesseract 3.x には 6 つの英語 (間違っていたら訂正してください) フォントが付属しています。5 種類以上のフォントについて Tesseract をトレーニングする必要があります。必要なのは大文字と数字だけです (特殊文字や記号は必要ありません)。
たとえば、次のようなさまざまなプロセスに従い ました。 Tesseract 3 OCRエンジンに新しいフォントを追加する
また、 Serak Tesseract Trainer for Tesseract 3.02などのプロセスを自動化するツールも使用しました。
ボックス ファイルの生成にはQT Box Editorを使用しました
上記のツールを使用した後、eng.traineddata
ファイルを取得します。eng.traineddata
すべてのチュートリアルで、このファイルをフォルダーに追加するように指示されていTesseract-OCR\tessdata
ますが、そうすると、元のeng.traineddata
ファイルが置き換えられます。これを行った後、Tesseract 3.x に付属するデフォルトのフォントは失われますか?
新しいフォントを追加するにはどうすればよいですか? それはまだ私には明らかではありません。ここで誰かが私を助けてくれることを願っています。ありがとう。