Windows 7 64ビットでtesseract 3.0.1を使用しています。私は新しい言語で図書館を訓練します。
私のサンプルデータは非常に適切に配置されています。各キャラクターのボックスの座標を定義するとき、ボックスがキャラクターにしっかりと閉じていることはどのくらい重要ですか? 私はアドインの 1 つを使用していますが、一部の (または多くの) 空白を含む各文字に対して粗粒度のボックスを定義する方がはるかに高速です。もちろんボックスが他のキャラクターと重なることはありません。
実際には、実際のケース (テスト) と同じようにスペースを配置することをお勧めします。次に、tesseract-box-editorまたはjTessBoxEditorを使用して、文字ボックスの境界を修正できます。