問題タブ [computer-vision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - セマンティック画像認識の開始
適切な画像を(不適切に)認識する方法は?
写真と画像のモデレートと管理を対象としたgaeを容易にし、有効にし、容易にするために、基本的なPython画像認識、つまり、人間が判断できるまで疑わしい素材を抑制し、そのほとんどを承認するために画像がどのように見えるかという基本的なセマンティック情報を開始します。良いです。10,000を超える画像のテストバッチには1つまたはごくわずかしか含まれていなかったため、誤検知を自然に回避することは適切です。私は以下のリンクをたどることを見つけました、そしてすべてのアドバイス、提案と推薦のために前もってすべてに感謝します。非常に基本的に、モデレートは、デフォルトの決定に応じて、多数の画像と、デフォルトの「ok」またはその逆のボタン「ok」と「Disapprove」ボタンを表示します(デフォルトでは、おそらくすべてを公開し、絶対的なものから不適切な場合はアドホック(人間)の不承認主要部分> リンクテキスト
computer-vision - ダウンヒル シンプレックス法
テンプレート マッチングにダウンヒル シンプレックス法を使用することは可能ですか?オブジェクトのエッジに 40 個のランドマークがあり、これらのランドマークに法線ベクトルのピクセル強度があり、ダウンヒル シンプレックス法を使用してテンプレートをストレッチするとします。各反復の後の反復は、私が取り組んでいるテンプレートオブジェクトと画像にあるピクセルの誤差の平均二乗をチェックしますか?誰もがアイデアを得ましたか?ありがとう
python - OCRトランプ
トランプの画像を入力してランクとスーツを返したいという楽しみのプロジェクトをやろうと思いました。左上隅にすべての情報があるので、左上隅を見るだけでよいと思います。堅牢である必要があります。AceofDiamondsの大きな画像がある場合は、20〜200%の範囲で拡大縮小でき、それでも正しい答えが得られるはずです。
最初の質問-これを行うためにすでに書かれたものはありますか?もしそうなら、私はOCRに何か他のものを見つけるので、私は努力を複製しません。
第二に-これを行うための最良の方法は何ですか?神経網?何か手作業でコーディングしましたか?誰かがポインタを与えることができますか?(0xCAAF9452は受け入れ可能な答えではありません)。
c++ - イメージ シフトの検索
プログラミング言語vb.net、C++、またはC#を使用して、同じ2つの画像間のシフトと回転を見つける方法は?
opencv - OpenCV:ビデオフィードで点滅するライトを検出する
ビデオフィードがあります。このビデオフィードには、さまざまな速度で点滅するいくつかのライトが含まれています。すべてのライトは同じ色です(すべて赤外線LEDです)。これらの点滅するライトの位置と頻度をどのように検出できますか?
免責事項:私はOpenCVに非常に慣れていません。私はLearningOpenCVのコピーを持っていますが、それは少し圧倒されます。誰かがOpenCVの用語で解決策を説明できれば、それは大いにありがたいです。私は私のためにコードが書かれることを期待していません。
algorithm - エッジ検出/画像認識について学び始めるのに最適な記事
私は、エッジ検出と画像セグメンテーション/オブジェクト認識に関するかなり広範な知識を必要とする個人的なプロジェクトに携わっています。
コードを書く前に計画/理解することの重要性を知っています。これを念頭に置いて、コンピューティングのこれらの領域について学ぶために、どこから始めるのが最適ですか? 理想的には、オンラインの記事/論文を探しています。
ありがとう
c# - ハフ変換の質問
C# でハフ変換を次のように実装しました。
したがって、私の理解では、すべての曲線の交点のシータと半径を見つけました。では、どうすれば実際の行を見つけることができますか?
勾配と点を見つける必要があると主張する人もいますが、今何をすべきかははっきりしていません。
助けてくれてありがとう、ジョナサン
image-processing - OCR-最も「異なる」または「認識可能な」ASCII文字?
最も「異なる」または「認識可能な」NASCII文字を判別する方法を探しています...たとえば、N = 10の場合、0x21から0x7EまでのASCIIセットで最も異なるN文字は何でしょうか。明らかに、文字「X」は「O」(文字)とは非常に異なりますが、「O」(文字)は「0」(ゼロ)に非常に似ています。ゼロと文字Oがどちらか一方としてのみ検出され、それがゼロか文字Oかを心配する必要がないなど、制限されたOCR文字サブセットを想定すると、最も異なるNは何になりますか一般的なOCRエンジン(Tesseractなど)が低品質の入力画像から簡単に認識できる文字はありますか?仮定。「+」や「t」などは、大きく誤解される可能性があります。作ることができます、
ありがとう、ベン