私はこの画像を持っています
それをOCRする方法は?これは非常に難しいことですが、助けていただければ幸いです。
私はこの画像を持っています
それをOCRする方法は?これは非常に難しいことですが、助けていただければ幸いです。
私はあなたを動かすために2つのライブラリを提案します:
自分で検出を開発する時間があれば、大まかに次のようにします。
画像間でかなり一貫している10桁しかないので、これは機能するはずです。
画像のコントラストとガンマで遊んでみてください。必要なのは、ほとんどのライブラリの文字のしっかりしたアウトラインです。パフォーマンスSLAに応じて、さまざまなコントラスト/ガンマシナリオを実行し、OCRソフトウェアに2、3のショットを撮らせることができます。結果の集計を取り、一貫性があるかどうかを確認します。これにより、長期的にはかなり正確な結果が得られる可能性があります。
数字の機械学習(ここでは、中立的なネットワークを使用)は通常、最小限のトレーニングですでに正確であり、使いやすいです。
1つのDIYアプローチ:
いくつかのニューラルネットからの出力は???1160060060??1???である可能性があります 最初の文字。これから、最も一般的に表示される(0)を選択する必要があります。
認識された数字の順序を正しくするには、画像の幅のごく一部を切り取るように、「移動ウィンドウ」を使用します。
画像の幅全体にわたってこれを繰り返します。
最もトリッキーなビットは、1桁と次の桁の間のスペースを把握することについてである可能性が非常に高いです。
運が良ければ、数字は常に同じサイズ(モニスペース)であり、必要なピクセル数を事前に決定できます。それ以外の場合、これは通常、ピクセルをニューラルネットワークにフィードする前のキャリブレーションステップで実行できます。
画像を回転させることができる場合は、回転を理解するのに役立つ別のニューラルネットワークを用意することが実際には理にかなっているかもしれません。
プログラマー(そして私)は、1980年代にコモドールコンピューターですでに数字認識を試しました!最近では、これと同様のタスクを持つ大学のAIコースがいくつか見つかるかもしれません。