問題タブ [image-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1828 参照

image-processing - 画像/テキスト認識

この会社 Mitek が、iPhone のカメラを通して領収書を読み取り、そこからの情報を記録できるアプリを作っているのを見ました。( http://www.miteksystems.com/OOMPH_MobileReceipt.asp )。私の推測では、ある種の画像/テキスト認識ソフトウェアを介して画像を実行していると思います。彼らが何を使用している可能性があるかについてのアイデアはありますか?写真からテキストを解釈できる API があれば、それは素晴らしいことです。

乾杯、
マイク

0 投票する
2 に答える
722 参照

c# - 画像が移動したピクセルの量を見つける方法は?

固定カメラからキャプチャされた連続した各画像でオブジェクトがどれだけ移動したかを計算しようとしています。ここでテストしているのは、オブジェクトを毎回同じ場所に配置するセットアップの再現性です。

問題のオブジェクトの中央には、単純な形状のスタンプが配置されています (以下を参照)。カメラには、数平方ミリメートル (~25) のビューしかありません。画像には、クリアする必要のある他のアーティファクトがあるかもしれませんが、現在表示できるのは単純な図だけです。

テンプレート

私が計算しようとしているのは、前の画像と比較して、各画像で線が交差する場所のオフセットです。下の図では、赤い線は 2 番目の画像で線が交差する場所を表しています。彼らがどれだけ移動したか。

問題

私の質問は、画像認識 C# ライブラリ、できれば EmguCV を使用して、緑色の四角形 (オフセット) の寸法を計算するにはどうすればよいですか? 私はいくつかの Emgu のチュートリアルに従いましたが、巧妙な変換により、ソフトウェアは 2 本の線だけを検出できますが、ライブラリが 2 本の長い線ではなく 500 本を超えるミニ線を作成するため、それらが交差する場所を取得する方法についてはわかりません。

ヘルプ、アイデア、提案を歓迎します。ありがとう!

0 投票する
1 に答える
1641 参照

iphone - Objective C を使用した画像比較

錠剤の画像が同じかどうかを比較するアプリケーションを作成する予定です。写真の錠剤の色、形、サイズを検出し、その写真が同じ錠剤の他の写真と同じかどうかを比較するために使用できるソースはありますか?

よろしく、 ZaldzBgz

0 投票する
3 に答える
230 参照

image-processing - スキャンや写真から単純な子供のような絵の主題を認識することは可能ですか?

私は子供の心理学の研究を進めており、何千もの子供の絵を分析する必要があります.オブジェクトのライブラリと比較して写真の内容を推測するために、エッジトレースなどを使用して可能な限り自動化したいと考えています.太陽、家、木、犬などは可能ですか?

0 投票する
3 に答える
807 参照

c# - mat lab を使用した顔認識 Web サービスの開発は簡単ですか?

matlab の機能で動作する Web サービスを開発するのはどれくらい複雑ですか? 私のプロジェクトには期間が限られているため、ブロックの問題があるかどうかを知る必要があります。

それともopenCVで作業する方が良いですか?

0 投票する
2 に答える
597 参照

java - ニューラル ネットワークのトレーニング

すべての数字の写真を認識しようとしています。写真上で数字の位置が違うこと以外はほとんどノイズがないように、数字以外はすべて取り除いています。Neuroph の画像認識 GUI を使用していますが、トレーニングについていくつか質問があります。

写真に使用する解像度が高いほど、トレーニングが悪化するようです。どうしてこれなの?トレーニング セットには 100 枚の写真があります。各桁の 10。それは少なすぎるのではないでしょうか?私が何をしても、すべてのトレーニングがネットワークエラーの合計で通常2〜3の数値に収束するのはなぜですか。

お役に立てれば幸いです。

編集:

これはトレーニングの1つの写真です 代替テキスト

それはあまり学ばない

0 投票する
2 に答える
3459 参照

opencv - 固有顔アルゴリズムの正解率を向上させる方法

C#でEmguCVライブラリ(openCVラッパー)を使用して、固有顔アルゴリズムを使用して顔検出と顔認識を実装します

最小距離がトレーニングセット内の同じ人物ではない、トレーニングセット内に存在しないが、トレーニングセット内の適切な距離の人物と一致するなど、正解率の間違いが多く見つかりました。

私を助けてください。

ありがとうございました。

追加情報:-トレーニングセットで1人あたり1つの顔画像を使用します(まっすぐな顔画像、向きなし)-現在、トレーニングセットで約10〜20人でテストしています

0 投票する
1 に答える
151 参照

image-recognition - 大きな画像/写真でマーカーを特定する

私の全体的な目標は、制御された美術館のような環境で、類似した反射性の低テクスチャのモノクロオブジェクトを認識することです。これらのオブジェクトはうまく設計されており、視覚的に魅力的です。

私の理解では、ゴーグル、kooaba、tineyeなどの現代的なオブジェクトおよび画像認識ソフトウェアを見ると、この目標は高すぎます。

だから私はオブジェクトに小さなマーカーを置いてマーカーを識別することを考えていました。AR追跡ソフトウェアを使用するには、マーカーが黒/白で醜いものである必要があります。それは私が識別したいオブジェクトの視覚的な外観を台無しにするでしょう。

写真の(任意にデザインされた/視覚的に魅力的な)マーカーを認識するソフトウェアを知っていますか?

または; これはiOS/androidデバイス用のopenCVで達成できると思いますか?

0 投票する
3 に答える
3570 参照

algorithm - Google Shopper での画像認識はどのように機能しますか?

このソフトウェアの動作の良さ (そして速さ) には驚かされます。薄明かりの中、本の表紙の小さな領域に携帯電話のカメラをかざしたところ、Google Shopper がそれを識別するのに数秒しかかかりませんでした。それはほとんど魔法です。誰もがそれがどのように機能するか知っていますか?

0 投票する
1 に答える
91 参照

image-processing - 画像しかない場合、面グラフデータを見つけるにはどうすればよいですか?

面グラフ(画像)には、さまざまな色でグラフ化されたいくつかのデータ系列があります。x軸上の各ラベルの画像サイズと座標がわかっていますが、画像の認識によって一連のy軸を見つけることは可能ですか?誰かが光を当てることができますか?