問題タブ [cbir]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1322 参照

python - Pythonによる画像からのオブジェクト抽出

画像からオブジェクトを抽出したい。たとえば、写真に写っている人間の数を数えたり、優れたデータベース (Google の例など) で同様の写真を見つけたり、写真のフィールド (オフィスや家の性質) を見つけたりしたいなどです。

この作業を行うためのPythonライブラリまたはモジュールを知っていましたか。リンクしていただけるなら

  • この作業のチュートリアルまたは指示
  • 類似のサンプル プロジェクト
0 投票する
1 に答える
1449 参照

image - bag of words による画像検索 (CBIR)

コンテンツ ベースの画像検索に bag of words を使用したい。bag-of-words をコンテンツ ベースの画像検索に適用する方法について混乱しています。明確にするために:

SURF 機能を使用してプログラムをトレーニングし、BoW 記述子を抽出しました。これをサポート ベクター マシンにトレーニング データとしてフィードします。次に、クエリ画像が与えられると、サポートベクターマシンは、特定の画像がどのクラスに属するかを予測できます。

言い換えれば、クエリ画像が与えられると、クラスを見つけることができます。たとえば、車の画像をクエリすると、プログラムは「車」を返します。似たような画像を見つけるにはどうすればよいでしょうか。

クラスが与えられた場合、トレーニングセットから画像を返すでしょうか? それとも、クエリ画像を指定すると、プログラムは、SVM が同じクラスを予測するテストセットのサブセットも返すでしょうか?

0 投票する
1 に答える
417 参照

algorithm - コンテンツベースの画像検索リソース

私は CBIR (Content Based Image Retrival) の多くの論文を見てきました。この分野で最も重要または有名なアルゴリズムのすべての理論と説明が記載された電子ブックまたはその他のリソースを見つけたいと思います。

どんな提案でも大歓迎です。

ありがとうございました!

0 投票する
1 に答える
927 参照

linux - コンテンツベースの画像検索 Linux

Ubuntu 12.04 を実行しているマシンで特定のテキストを含む画像を探しています

たとえば、次の画像のように、「Some text here」を探しているとします。 いくつかのテキスト

ハードドライブでそのテキストを含む大きな画像を見つけられるようにしたい: 拡大画像

私のマシンを検索する方法はありますか?

ヒントをありがとう!

0 投票する
0 に答える
201 参照

image-processing - 画像属性の抽出

私はコンピュータービジョンのプロジェクトを行っていますが、助けが必要です。私のプロジェクトの目的は、あらゆるオブジェクトの属性を抽出することです。たとえば、Nike のランニング シューズを持っている場合、まずそれが靴であることを認識し、次にそれが Nike の靴であることを認識できる必要があります。 Adidas の靴ではなく (おそらく Nike のダニのため)、それがランニング シューズであり、フットボールのスタッドではないことがわかります。

これを画像分類の問題として扱うことから始めました。次の手順を使用しています。

  1. 靴、かかと、時計などのトレーニング サンプル (それぞれ約 60 個) を取得し、Dense SIFT を使用してそれらの特徴を抽出しました。
  2. k-means クラスタリングを使用してボキャブラリを作成します (ボキャブラリ サイズを 600 に任意に選択)。
  3. 画像の Bag-Of-Words 表現を作成します。
  4. SVM 分類器をトレーニングして、すべてのクラス (靴、かかと、時計) のバッグ オブ ワード (特徴ベクトル) を取得します。
  5. テストのために、テスト画像の特徴ベクトルを抽出し、既に作成されたボキャブラリからそのバッグオブワード表現を見つけました。
  6. テスト画像のbag-of-wordsと各クラスのbag-of-wordsを比較し、最も一致したクラスを返しました。

ここからどのように進めばよいか知りたいですか?D-SIFT を使用した特徴抽出は、特定の点の周囲の勾配のみを表すため、属性の識別に役立ちますか?

また、分類が間違っている場合もあります。たとえば、左の靴と時計の画像を使用して分類器をトレーニングした場合、右の靴が時計として分類されます。この問題を解決するには、トレーニング セットに適切な靴を含める必要があることは理解していますが、従うべき他のアプローチはありますか?

また、形状を理解する方法はありますか?たとえば、時計の分類子をトレーニングした場合、トレーニング セットに円形と長方形の両方の文字盤を持つ時計がある場合、新しいテスト画像の形状を識別できますか? それとも、円形と長方形の文字盤を備えた時計用に個別にトレーニングするだけですか? ありがとう

0 投票する
1 に答える
663 参照

opencv - 類似画像検出の固定数のキーポイント

1000枚を超える画像の一連の画像があります。すべての画像について、SURF 記述子を抽出します。ここで、クエリ Image を追加し、画像セット内で最も類似した画像を見つけようとします。パフォーマンスとメモリの理由から、記述子を使用して各画像 200 キーポイントを抽出するだけです。そして、これは多かれ少なかれ私の問題です。現時点では、次のようにして一致をフィルタリングします。

Symmetrie Matching: 両方向の単純な BruteForce マッチング。したがって、Image1 から Image2 へ、Image2 から Image1 へ。両方向に存在する一致を保持するだけです。

より多くのフィルター方法があることを知っています。ご覧のとおり、最終試合の数で距離を重み付けしようとしています。しかし、私はこれを正しくやっているという感覚はありません。他のアプローチを見ると、それらはすべて、画像に存在するすべての抽出対象ポイントで計算されているように見えます。誰かがこれに対する良いアプローチを持っていますか? または、距離に重み付けすることをお勧めしますか?

絶対的な解決策がないことはわかっていますが、いくつかの経験、アイデア、およびその他のアプローチが非常に役立ちます。