問題タブ [vision]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
3290 参照

image-processing - 画像内の文字を識別するにはどうすればよいですか? (OCR前)

Web で見つけられるのは OCR に関するものだけですが、まだそこにはありません。文字が画像のどこにあるかを認識しなければなりません。

どんな助けでも大歓迎です

0 投票する
1 に答える
269 参照

webcam - 一連の監視カメラ画像から重要な画像を見つける

私は家の外で盗難に遭ったことがあるので、Dorgem (http://dorgem.sf.net) で毎秒キャプチャする簡単な Web カメラをセットアップしました。

Dorgem は、モーション検出を使用して、画面上で何かが動いているフレームのみをキャプチャする機能を提供します。問題は、使用するモーション検出アルゴリズムが非常に敏感であることです。安価な Web カメラで撮影した連続ショット間の色の変化が原因でオフになり、家の前の木々が風に吹かれているためにオフになります。また、私の家の前は交通量の多いエリアなので、合法的にキャプチャされたフレームも多数あります。

私は、Dorgem のモーション検出を使用して、毎秒平均 2800/3600 フレームをキャプチャしています。これは、興味深いアクティビティがどこにあるかを見つけるために検索するには多すぎます。

モーション検出がより簡単になるように、カメラをより最適な位置に再配置して、関心のある領域のみをキャプチャできるようにしたいのですが、これはオプションではありません。

私のカメラの位置は固定されており、各写真は私の家の前の同じ領域をフレームに収めているため、画像をスキャンして、その画像の興味深い領域でどの画像が動いているかを突き止め、すべてを捨てることができるはずです。他のフレーム。

例: ピクセル 320,240 に変化がある場合、誰かが私の家の前に足を踏み入れたので、そのフレームを見たいと思いますが、ピクセル 1,1 に変化がある場合は、風に吹かれる木だけでフレームが表示されます。破棄されます。

写真のセットで差分を見つけるためのツールである pdiff を見てきましたが、特定の領域ではなく、画像全体の差分にも焦点を当てているようです: http://pdiff.sourceforge.net/

また、人間の画像認識に基づいてハッシュを計算するツールである phash も調べましたが、複雑すぎるようです: http://www.phash.org/

imagemagick の mogrify -crop を使用してシェル スクリプトに実装して、関心のある画像の領域を選択し、pdiff を実行して興味深いものを見つけ、それを使用して興味深いフレームを選択できると思います。

何かご意見は?アイデア?既存のツール?

0 投票する
3 に答える
401 参照

networking - クラウド上のコンピューター ビジョン

クラウド上でコンピューター ビジョンを実行する方法はありますか? アイデアは、人々がウェブサイトにログインすると、ウェブカメラがアクティブになり、ビデオ データがインターネット経由でサーバーに送信されるようなものです。サーバーはこれらのデータを処理し、処理されたデータをリアルタイムまたは少なくとも 1 秒あたり 10 フレームでユーザーに送り返します。

これは実行可能ですか?ネットワーク側に必要なスキルとは?ビデオ ストリーミングが 1 つのコンポーネントであることは知っています。また、どのようにサーバーをセットアップできますか? 分散システムは、限られた時間内に非常に大規模な計算を行うことを考慮していますか?

0 投票する
3 に答える
2080 参照

ocr - 光学式文字認識

みなさん、画面の数字を読み取ったり、画面上の画像を認識したりできるプログラムを Java で作成しようとしています。どうすればこれを達成できるのだろうと思っていましたか?数字のフォントは常に同じです。私はこれまでこのようなことをプログラムしたことはありませんが、どのように機能するかについての私の考えは、プログラムにスクリーンショットを撮らせてから、数字の画像をスクリーンショット画像のセクションに重ねて、それらが一致するかどうかを確認し、これを各数字に対して繰り返すことです. これがこれを行う正しい方法である場合、どのようにコードに入れますか。

助けてくれてありがとう。

0 投票する
1 に答える
915 参照

android - アンドロイド顔認識

変更された Crystax NDK を使用して OpenCV をセットアップしようとしましたが、成功しませんでした (CygWin を使用してコンパイルすることはできましたが、そこからどこへ行くべきかわかりません)。単純な顔認識ルーチンを実行する、使用できるより単純なクラス ライブラリはありますか? 私がする必要があるのは、顔を見つけて、おそらくそれらを比較することだけです. 前もって感謝します

0 投票する
7 に答える
2499 参照

computer-vision - コンピューター ビジョン データセット

画像分類用のコンピューター ビジョン アルゴリズムをテストしています。猫や犬など、オブジェクトのいくつかのカテゴリを含むデータセットを見つけたいと思います。このデータセットには、クラスの固有の変動性による各クラス内のすべての変動性が含まれている必要があります。つまり、さまざまな視点やさまざまな照明条件で撮影された写真について心配する必要はありません。カテゴリ内のほとんどすべての変動性は、そのカテゴリの固有の変動性によるものでなければなりません。たとえば、猫のカテゴリには多くのものが含まれます。画像が異なるのは、画像が異なる条件で作成されたからではなく、実際に猫の見た目が異なるからです。

できれば、オブジェクトは「切り取る」(均一な背景で)ことになります。データセットのサイズは重要ではありません。合成画像 (おそらく 3D グラフィック ソフトウェアで作成されたもの) も問題ありません。画像にはカテゴリのラベルを付ける必要があります。

このようなデータセットを知っている人はいますか?

0 投票する
1 に答える
11408 参照

algorithm - バイラテラル フィルター

ガウス フィルターを指定して、バイラテラル フィルターを実装するにはどうすればよいですか?

0 投票する
1 に答える
311 参照

wpf - VC++およびopenCVコードに最適なインターフェイス

私はwin32C++コードとopenCVを持っており、そのコードへのインターフェイスを設計したいと思います。

そのための最良の実装は何ですか?

WPFを使用したいのですが、VC++とopenCVではサポートされていないと言うWebサイトが増えています

クラウドあなたは私を助けますか?

前もって感謝します。

0 投票する
2 に答える
1958 参照

android - Android のオプティカル フロー

OpenCV を Android で動作させるために 2 週間取り組んできました。オプティカル フローの Android 実装がどこにあるか知っていますか? OpenCVで実装できたらいいのに。

0 投票する
1 に答える
178 参照

vision - レイヤ ビジョンを有効にするにはどうすればよいですか?

私はLayar開発に不慣れです。Layar Vision チャレンジにサインアップしたいのですが、自分のレイヤーで Layar Vision を有効にできませんでした。このヘルプ ページでは、レイヤー ビジョンを有効にするプロセスが次のように定義されています。

しかし、私はこれを行う方法を理解できませんでした。誰か助けてください。