おやすみ :)
現在、画像を読み込んでピクセルごとの RGB 値を確認できる DevIL ライブラリを使用しています。個人的な学習プロジェクトとして、Photoshop で自分で作成したいくつかの画像用の非常に基本的な OCR システムを作成しようとしています。
画像のすべての歪みをうまく取り除くことができ、テキストと数字が残りました。私は現在、入力から学習する高度なニューラル ネットワークを探していません。比較的簡単に始めたいので、個々の文字を識別し、それらの文字のピクセルを数えることに着手しました。
2 つの問題があります。
- 個々のキャラクターの識別。
- 最も重要なのは、以前にカウントしたピクセルをカウントせずに、接続されたピクセル (同じ色) をカウントするアルゴリズムが必要であることです。私には数学のバックグラウンドがないので、これが私にとって最大の問題です。
この問題について何か助けていただければ幸いです。
編集:
現在使用しているのは C++ であるため、この質問に C++ のタグを付けました。ただし、疑似コードまたは別の言語からの簡単に読み取れるコードも問題ありません。