問題タブ [object-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
image-processing - 画像処理と物体認識についてどこから学び始めますか?
私はいくつかの基本的なコンピューター化されたオブジェクト認識アプリケーションを書くことに興味があるので、意思決定機能のためのいくつかのAIとともに、画像処理アルゴリズムの理論的背景が必要だと思います。
私はコンピュータサイエンスの卒業生です。いつの日か、これらの分野の1つで修士号を取得する予定です。それまでの間、私は有利なスタートを切り、いくつかの自己学習をしたいと思います。
だから私の質問は、どこから始めればいいのかということです。正しい方向への矢印、可能であればいくつかのリンクをいただければ幸いです。
object-recognition - 物体認識に最適なツール
オブジェクト認識に関する小さなプロジェクトを行いたいのですが、このトピックに関するツールや文献の提案はありますか?
image-processing - 画像分類:画像から多くの建物のさまざまな特徴を認識する
それで、私は多くの建物の経度/緯度または住所を持っているとしましょう
衛星画像、「ストリート ビュー」、そしておそらく建物の 3D/透視図を取得できます。
私は見つけたい:
高さ、階数、床面積(建物の最大面積)
建物の。約20万棟。
衛星写真や写真から建物を認識するためのライブラリはありますか? 顔検出のようなものだと思います。
他の提案はありますか?
ありがとう!
php - 画像JPGまたはPNGのパターンを認識
こんにちは、私はオブジェクトのタイプを認識し、PHP を使用して写真 jpg または png に変換したいと考えています。まさにそれを作りたいので、誰かそれについて知っているならお願いします。
よろしくギルダス
android - Android 拡張現実のヘルプ
マーカーを検出して出力テキストを作成する方法についてのガイドが必要です..例:犬の画像を含むマーカー、検出されると、テキストフィールドに「DOG」という出力テキストがあります..誰かが私を助けてくれますか私の考えで?ああ、ところで、私のアイデアにnyartoolkitまたはandarを使用するのにどちらがより効果的ですか?ありがとう:)助けが必要..!
opencv - 実際のプロジェクト開発前の機能検出(SIFTなど)プロトタイピング用のOpenCVのGUIバージョン?
レンダリングされた3次元デジタルムービーから特定のオブジェクトまたはモデルを認識できるようにする必要があるという考えがありました。
限られた調査の結果、私が必要としているのは、コンピュータビジョンの分野での特徴検出と呼ばれるものであることがわかりました。
だから、私がしたいのは:
- 映画の特定のキャラクターのスクリーンショットをいくつか作成します(例:front / back / leftSide / rightSide)
- 映画を再生する
- 映画の再生中に、映画の新しいスクリーンショットを継続的に作成します
- スクリーンショットごとに、機能検出(SIFT?、openCV?を使用)を実行して、キャラクターの外観が存在するかどうかを確認します(キャラクターが遠くにあるために小さく見える場合、またはキャラクターが嘘をついている場合は、それらを認識しなければなりません。下)。
- キャラクターが見つかったら通知します
これはOpenCVで可能ですよね?
「問題」は、このアプリケーションを開発するためにc++またはpythonを学ぶ必要があるということです。私の映画とスクリーンショットが私がやりたいことに適用できるのであれば、これは問題ではありません。
そこで、最初に映画のスクリーンショットをテストしたいと思います。テストデータを入力し、プロトタイピングの手段としてその機能検出アルゴリズムを手動で実行できるOpenCVのGUIバージョンはありますか?
フィードバックをいただければ幸いです。ありがとう。
algorithm - コンピュータビジョン:色を考慮したSURF(高速化された堅牢な機能)
Speeded Up Robust Features(SURF)Computer Visionアルゴリズムを拡張して、異なる色の均等に分散された形状のオブジェクトを区別できるようにすることは可能ですか?
同じオブジェクトを異なる色で区別できるようにSURFを強化しようとする研究論文やその他の情報源を探しています。
opencv - 特定の平らな物体の物体検出
私はコンピューター ビジョンに不慣れで、画像 (またはビデオ フレーム) 内の特定の平らなオブジェクトを検出したいと考えています。
具体的でフラットとはどういう意味ですか?
平らな
平らな物体は物体のようなものですが、ご存知のとおり、平らです... 私にとっての意味:
- オブジェクトは常にほぼ同じ「正面」角度から表示されます。つまり、カメラの軸は (多かれ少なかれ) オブジェクトの表面法線に対応します。(ただし、それらはその軸を中心に回転する場合があります)。
- 照明の角度が変化しないオブジェクト (つまり、影を落とす隆起や折り目がない)。
明確な
- 正確な外観と形状を知っているオブジェクト。それらはすべてまったく同じで、バリエーションはありません。
- 私はそれらの (正確な) 写真 (または表現) を持っています。
そのようなオブジェクトの例
- 1ドル紙幣の表面
- モナ・リザ
- (お気に入りの雑誌はこちら)の最終号の表紙
- ...
問題は簡単なので、基本的にそのように機能するコンピューター ビジョン ライブラリの関数を見つけることができるはずです。
実際、私はオブジェクトのサイズや位置をあまり気にしません。数が必要なだけです。
しかし、私はこのようなものを見つけることができません。私が見つけることができるのは、ハール分類器と呼ばれるものを使用した無数の顔認識の例だけです。これは、私の問題にはまったく適していないようです。
- 面は平らではないため、分類器はさまざまな照明や影などの問題に対処する必要があります...
- 顔、つまり、似ているが完全に同一ではないオブジェクトを認識しなければなりません。
- 顔が「似ている」という理由だけで、トレーニングされていない顔を認識しなければなりません。
- これが適していないことの証明: 数百または数千の正と負のサンプルでトレーニングする必要があります。私の問題では、必要なすべての情報が 1 つのサンプルに含まれています。だから、それは正しくありません。
それで、このようなものは存在しますか?
これは標準のコンピューター ビジョン ライブラリのように思われるため、OpenCV を使用したいと思いますが、どのようなソリューションにも対応しています。
computer-vision - オブジェクトの表現と認識を難しくするものは何ですか?
直感的には、ほとんどすべてのオブジェクトのさまざまな角度からの1ダースほどの2D画像が与えられれば、そのオブジェクトの3D表現を簡単に構築できるはずです。その後、この方法で得られた3D表現のライブラリを使用して、新しい2D画像を識別することができます。
これらの線に沿ってどのような文献がありますか、そしてなぜそれはまだ強力な物体認識を生み出していないのですか?
probability - 画像認識を使用したオブジェクトのアイデンティティの決定
画像内で最も支配的なオブジェクトと見なされるものの基本的な形状、色、および寸法を決定できる画像分析ソフトウェアを作成しました。
また、アルゴリズムが選択するオブジェクトのデータベースも作成しました。
たとえば、システムが幅 42cm、高さ 26cm の黒い長方形を検出した場合です。この場合、「箱」と「バックパック」の両方が正解となります。75% の確率でバックパック、25% の確率で箱 (おそらく、箱が 3黒しかなかったバックパックとは対照的に、さまざまな色と幅広いサイズのバリエーションがあります)?
その他アドバイスも大歓迎です。私は画像認識について独学しなければならないので、画像から引き出そうとする必要がある他のこと、またはデータベースについて別の方法で行う必要がある場合は、それらのコメントも大歓迎です!