問題タブ [number-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 画像内の数字を認識する
私はウェブ上の画像で数字を認識するためのリソースを探していました。そのトピックに関する多くのリソースを提供する多くのリンクを見つけました。しかし、残念ながら、それは助けるよりも混乱を招きます。どこから始めればよいのかわかりません。
邪魔されていない(キャプチャなどがない)5つの数字が含まれている画像があります。数字は白地に黒で、標準フォントで書かれています。
私の最初のステップは、数字を分けることでした。私が現在使用しているアルゴリズムは非常に単純で、列が完全に白であり、したがってスペースであるかどうかをチェックするだけです。次に、各文字をトリミングして、周囲に白い境界線がないようにします。これは非常にうまく機能します。
しかし今、私は実際の数の認識に固執しています。正しいものを推測する最良の方法がわかりません。フォントと直接比較するのは良い考えではないと思います。数字が少しだけ異なると、それ以上機能しなくなるからです。
誰かがこれがどのように行われるかについてのヒントを教えてもらえますか?
質問は関係ありませんが、これをC#またはJavaで実装します。その仕事をするライブラリをいくつか見つけましたが、何かを学ぶために自分で実装したいと思います。
iphone - 数字を検出して処理しますか?
グリッドに書かれた数字を検出し、iPhone カメラを使用して処理しようとしています。私がまだ見つけたのは、次のような良い例です。
http://cmgresearch.blogspot.com/2010/01/augmented-reality-on-iphone-how-to_01.html
オーバーレイ ビューに数字をある程度描画することはできますが、これらの数字が何であるかを検出することはできません。
編集
こんにちは皆さん、 http: //github.com/nolanbrown/Tesseract-iPhone-Demoでコードをダウンロードしてテストを開始したリンクを見つけましたが、一度しか実行されず、出力が得られず、それ以来、クラッシュが発生しました次のエラー ログが表示されます。
今、私が見つけた131行目に行きます
しかし、私は介入することも、問題を解決する方法を見つけることもできません。これを知っている人は助けてください。私は過去4日間これに夢中で、一歩も前進していません。
ありがとう、マドゥップ
neural-network - Yan Cheng, Cheok による手書き数字認識の使用?
私が取り組んでいるプロジェクトに (Yan Cheng、Cheok による手書きの番号認識) を使用する予定です。番号認識にはデータベースを使用する必要がありますが、ファイルは Web サイトにありません。「」というファイルを使用する必要があります。 LRTBHVtrainingdata.txtI=96H=200LR=0.9M=0.1C=2000.snet" 彼らのチュートリアルで言うように、しかし、私が彼らのウェブサイト (http://yann.lecun.com/exdb/mnist/) で見つけたのは 4 つです。ファイルと私はそれらを使用する方法がわからない? データベースをどこで入手するか、どこで使用するか、またはファイルを使用する方法について何か助けはありますか?
python - Python と tensorflow を使用した画像からの数値認識
詳細: Ubuntu 14.04(LTS)、OpenCV 2.4.13、Spyder 2.3.9(Python 2.7)、Tensorflow r0.10
PythonとTensorflow (オプションのOpenCV )で画像から Number を認識したい 。
さらに、テンソルフローでMNISTデータトレーニングを使用したい
このように(コードはこのページの動画を参考に)、
コード:
しかし、問題は、どうすればnumpy配列を次のように作成できるかです
コードの追加:
[[ 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.50196081 1.1.1.1.1.1.0.50196081 0.25098041 0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0 . 0.50196081 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 0.25098041 0. 0. 0. 0. 0. 0. 0. 0.0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.50196081 1. 1. 1. 0.74901962 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 1. 0.74901962 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 1. 1. 1. 0.50196081 0. 0. 0. 0. 0. 0. 0. 0.0.25098041 1. 1. 0.74901962 0.25098041 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.74901962 1. 1. 0.74901962 0. 0. 0. 0. 0. 0. 0. 0. 0 . 0. 0.25098041 1. 1. 0.74901962 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 50196081 1. 1. 0.74901962 0. 0. 0. 0. 0. 0. 0. 0. 0 . 0. 0. 0. 0.25098041 1. 1. 0.50196081 0. 0. 0. 0. 0. 0. 0. 0. 0.50196081 1. 1. 0.25098041 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 1. 1. 0.50196081 0. 0. 0. 0. 0. 0. 0. 1. 1. 1. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.25098041 1. 1. 1. 0. 0. 0. 0. 0. 0. 0 . 0. 1. 1. 0.50196081 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.25098041 1. 1. 1. 1. 0. 0. 0.0. 0. 0. 0. 0. 0.74901962 1. 0.50196081 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.74901962 1. 1. 1. 0.25098041 0. 0. 0. 0. 0. 0. 0. 0. 0.50196081 1. 1. 0. 0. 0. 0. 0. 0. 0. 0. 0.25098041 0.74901962 1. 1. 1. 1. 0.74901962 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.50196081 1. 1. 0.74901962 0. 0. 0. 0. 0. 0.25098041 0.50196081 1. 1.1. 1. 1. 1. 0.50196081 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 74901962 1. 1. 1. 1. 0.50196081 0.50196081 0.74901962 1. 1. 1. 1 . 1. 1. 1. 0.50196081 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.74901962 1. 1. 1. 1. 1. 1. 1. 1 . 1. 1. 1. 0.50196081 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.0.25098041 1.1.1.1.1.1.1.0.50196081 0.25098041 0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0.0 . 0. 0. 0. 0.50196081 0.50196081 0.50196081 0.50196081 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0 . 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.0.0.0.0.0.0.0.0.0.0.0.0.0.]]0.0.0.0.]]0.0.0.0.]]
問題を解決するために OpenCV を使用すると、画像に関する numpy 配列を作成できますが、少し奇妙です。(配列を28x28のベクトルにしたい)
コードの追加:
[[[255 255 255] [255 255 255] [255 255 255] ..., [255 255 255] [255 255 255] [255 255 255]]
[[255 255 255] [255 255 255] [255 255 255] ..., [255 255 255] [255 255 255] [255 255 255]]
[[255 255 255] [255 255 255] [255 255 255] ..., [255 255 255] [255 255 255] [255 255 255]]
...、
[[255 255 255] [255 255 255] [255 255 255] ..., [255 255 255] [255 255 255] [255 255 255]]
[[255 255 255] [255 255 255] [255 255 255] ..., [255 255 255] [255 255 255] [255 255 255]]
[[255 255 255] [255 255 255] [255 255 255] ..., [255 255 255] [255 255 255] [255 255 255]]]
そして、値('resized_image') を Tensorflow コードに入れます。このような、
コードの変更:
その結果、この行でエラーが発生します。
ValueError: 形状 '(?, 784)' を持つ Tensor u'Placeholder_2:0' の形状 (28, 28, 3) の値をフィードできません
ついに、
1)テンソルフローコード(おそらくnumpy配列[784])に入力できるデータを作成する方法を知りたい
2) テンソルフローを使った数字認識の例を知っていますか?
私は機械学習の初心者です。
どうすればいいのか詳しく教えてください。