iPhoneのカメラ画像からリアルタイムで数字を認識する必要があります。画像に5桁以下しかないことはわかっています。
iPhone の計算仕様を考えると、この問題を解決するのは現実的ですか? Tesseract OCR ライブラリを使用した経験のある人はいますか?それを使用することで解決できると思いますか?
「リアルタイム」の定義によって異なりますが、はい、特にフォント、照明条件などが可能な場合は、iPhone 4 で 0 ~ 9 の数字だけを比較的高速に認識できるはずです。に登場。
Sudoku Grab がiPhone カメラを使用してパズルを認識する方法に関する記事を読むことを強くお勧めします。彼らの場合、訓練されたニューラル ネットワークを使用して数字を識別しました。これは、最新の iOS ハードウェアでは合理的に単純で高速であるはずです。
OpenCV などの現在の認識ライブラリは、iPhone の CPU を使用して処理を行います。顔認識などのさらに複雑なタスクをビデオ ソースで使用するのに十分な速さで実行でき、スタッターを最小限に抑えることができると聞いています。
パフォーマンスをさらに向上させるために、新しい iOS デバイスのプログラマブル GPU には多くの可能性があると私は信じています。私のベンチマークでは、単純な画像処理に iPhone 4 の GPU を使用すると、14 倍から28倍のスピードアップが見られました。現在これに目を向けている人はほとんどいませんが、数独グラブのニューラル ネットワークのようなものは、GPU で実行するメリットを得るのに十分な並列プロセスである必要があります。
はい、tesseract エンジンを使用して可能です
確認したい場合のサンプルコードは次のとおりです...
計算上可能なはずです。バーコードをリアルタイムで取得できるアプリや、リアルタイム翻訳を行うアプリもあります。(ワードレンズ)。ただし、彼らがどのライブラリを使用しているかはわかりません。