私は現在、アルファベットのすべての文字、大文字のリストを持っています。フォントは一定です。つまり、入力は常に同じフォントになります。
フォントが一定であることを考えると、本当に複数の文字が必要なのか、それとも 1 文字ずつを使用してプログラムをトレーニングできるのか? 文字ごとに複数の画像が必要な場合、同じ画像を機械学習アルゴリズムで実行して、2 番目の画像として使用できますか? (フォントが同じなので、2 番目のイメージはまったく同じであることに注意してください)。
「画面を印刷」して特定の文字を 1 つずつキャプチャするのは大変な作業なので、基本的には、すべての画像を 50 回コピーして貼り付けて、52 サンプル サイズを 2600 サンプル サイズにすることができるかどうか疑問に思っています。
私はpythonでscikit-learnを使用しており、文字を認識するためにさまざまな教師あり学習アルゴリズムをテストします。