問題タブ [image-recognition]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
8 に答える
33733 参照

iphone - iPhoneコード用の画像認識ライブラリ/API

これらの機能を備えたiOSアプリを作成する必要があります。

  • カメラを使用して画像をキャプチャします。
  • その画像を認識します:サンプル画像と一致しますか?

それを行うためのオンラインAPIはありますか(Google、Yahooなどから)?たとえば、画像をアップロードして画像のURLを取得し、その後、新しい画像と既存の画像を比較するためのURLをリクエストできますか?

0 投票する
1 に答える
1874 参照

image-processing - OpenCV - 角度の異なる長いオブジェクトの Haar 分類器

以前、OpenCV で Haar 分類器を使用したことがあります。残念ながら、正方形のオブジェクトと固定角度 (つまり面) でのみ機能するようです。ただし、角度の異なる「長い」(長方形の) オブジェクトを見つける必要があります (サンプル入力画像を参照)。

そのようなオブジェクトを見つけるために Haar 分類子をトレーニングする方法はありますか? 私が見つけることができるのは、顔認識のチュートリアルだけです。他の代替アプローチはありますか?

サンプル入力画像

0 投票する
3 に答える
1616 参照

c++ - 簡単な手書きの形を認識する方法は?

単純な形状のセット (次の図を参照) があり、手書きの形状を認識して、おそらくセット内にある形状を把握したいと考えています。

それを行う簡単なアルゴリズムはありますか?またはオープンソースのライブラリですか?

ところで、私のタスクは単純なので、OpenCV のような複雑すぎるライブラリは使用しません。

前もって感謝します!!

形状

0 投票する
1 に答える
348 参照

actionscript-3 - JBoss:画像をスキャンして他の画像を探す

これには簡単な答えがないことはわかっていますが、画像、つまりビデオを(フレームごとに)スキャンして、特定のエラーでその初期画像内の他の画像を識別する方法を学びたいと思います。

このためのライブラリはありますか?ヒントはありますか?

ありがとうございました。

0 投票する
1 に答える
5540 参照

c# - 画像OCRで文字を認識する

結果なしで検索しました。他のトピックをコピーする場合は、混乱しないように削除してください。C#を使った画像認識OCRについて質問です

スクラブルを示す画像に取り組んでいます。最初に画像をグレースケールに変換し、黒い文字だけを見つけるためにしきい値を設定してから、中央値を使用して文字の周りの壁を避けました。

では、文字を認識する end 関数を取得するにはどうすればよいでしょうか。どういうわけか「foreach」文字を分離する必要があります:-)または認識を開始するだけですか? 認識を開始する前に、どの問題に注意する必要がありますか? どんな情報源でも構いません。:-)

どんなアイデアも非常に役立ちます。

0 投票する
3 に答える
322 参照

algorithm - 一連の点から線を計算するにはどうすればよいですか?

おそらく簡単な質問ですが、今のところ簡単な解決策を見つけることができませんでした。私は非常に特殊なユースケースのための単純な画像認識ソフトウェアに取り組んでいます。

与えられているのは、おそらく直線上にある点の束です。ただし、一部のポイントが誤って配置され、線から離れています。特に線の端の近くでは、ポイントが多かれ少なかれ不正確になる可能性があります。

例:

線の一般的な方向は既知であり、この場合は垂直です。この例の実際の線は、実際には垂直で、わずかに斜めに傾斜しています。

無限の線(つまり、勾配とオフセット)にのみ関心があり、端点の位置は重要ではありません。

追加情報(重要かどうかはわかりません)として、2つのポイントを水平に並べることはできません。例:

パフォーマンスは重要ではありません。私はC#で作業していますが、どの言語でも、一般的なアイデアでも問題ありません。

0 投票する
3 に答える
1697 参照

java - Webページの色/パターンの認識

学校のプロジェクトとして、学習チェスのアプリケーションを作成してみたいと思います。私の最初の計画は、このAIをそれ自体と単純に対比させることでしたが、それが成功したかどうかを実際に示すには、それがどれだけうまく進んでいるかを示すことができる必要があります。これを行うために、私はそれがchess.comなどのサイトで評価されたゲームをプレイすることを望みます。ただし、(まだ)パブリックAPIはありません。

そのため、色や画像を認識するJavaのプログラムを作りたかったのです。すべての位置の内部2次元配列を保持し、ボード上のピースを認識します。JavaRobotClassのようなものを使用してウィンドウでこれを行う方法を見つけたと思います。

しかし、私がやりたいのは、このWebページを内部ウィンドウで開き、バックグラウンドでこれを継続することです。フォアグラウンドにいる必要なしに、自分のウィンドウ内の色を認識する方法はありますか?

編集:私はちょうど見つけたこのブラウザコンポーネントを使用することを計画しています。ページのフルページスナップショットを作成して、BufferedImage(?)として保存できることに気づきました。これにより、これを簡単に行うことができますか?

編集2:「他の人、コンピューター/チェスエンジン、または終盤テーブルベースからの外部支援は完全に禁止されています」と読みました。私は、コンピューターにすべての演奏をさせることは確かにそれに含まれていると思います。だから私は別のサイトを使ってみるかもしれないので、chess.comに固有の答えはそれをカットしません!

0 投票する
7 に答える
68356 参照

algorithm - 画像の類似性の比較

私はもともとcstheory.stackexchange.comでこの質問をしましたが、 stats.stackexchange.comに移動するように提案されました。

2つのビットマップ画像間の類似度メトリックを返す既存のアルゴリズムはありますか?「似ている」とは、人間がこれら2つの画像を同じ写真から変更したと言うことを意味します。たとえば、アルゴリズムは、次の3つの画像が同じであると言う必要があります(元の画像、位置がずれている画像、縮小されている画像)。

同じ

ここに画像の説明を入力してください ここに画像の説明を入力してください ここに画像の説明を入力してください

ゆがんだ画像や反転した画像を検出する必要はありません。また、同じオブジェクトが異なる方向にあるかどうかを検出する必要もありません。

違う

ここに画像の説明を入力してください ここに画像の説明を入力してください

このアルゴリズムを使用して、自分のWebサイトでのスパムを防止したいと思います。スパマーが怠惰すぎてスパム画像を変更できないことに気づきました。顔だけではありません。私はすでにそこに多くの素晴らしい顔認識アルゴリズムがあることを知っています。スパム画像は、URLからサッカー場、裸の体まで、何でもかまいません。

0 投票する
3 に答える
2714 参照

image-recognition - 簡単な画像認識: グリッド上の黒と白の石

私は現在、簡単なはずの画像認識の問題について疑問に思っていますが、これまで簡単な解決策を見つけることができませんでした。

入力は、明るい木の表面を示す約 1 メガピクセルの長方形の画像です。薄いが目に見えるグリッドがあります。グリッドは黒色で、規則的でほぼ正方形です (幅より約 8% 長い)。グリッド サイズは正確に 19x19 です。一般的なボードの色は「木」で、さまざまですが、明るい茶色がかった色になる傾向があります。(詳細)

表面には小さな丸い黒と白の石がたくさん置かれています。それらは常に交差点に配置されていますが、人的エラーにより、わずかにずれている可能性があります。彼らの色は純粋な黒と白です。

ボードは、0 から約 300 の石で覆われています (361 の交差点の 80%)。黒と白の石の数はほぼ同じです。

ボーダー (石が配置されていないボードの端) のサイズはさまざまですが、「小さい」ことが知られています。

光の加減で盤面に石の影が出る場合がございます。また、石の上に(光の方向に)単一の白い点が現れます。

ごばん

グリッド上の石の位置を検出したいと思います。

私の考えは、各ピクセルの明るさを見て、それらを 3 つのクラスに分類することです: 明るい (白い石)、中間 (ボード)、暗い (黒い石)。黒いピクセルが多い領域は、黒い石などと見なされます。

その後、黒と白の領域のサイズを使用して、実際のグリッド サイズを計算できます。

もう 1 つのアイデアは、グリッド ラインを認識し、それを使用してグリッドのサイズと位置を計算することです。線が非常に細い (石で覆われていることが多い) ため、どうすればよいかわかりません。

この問題に関するアイデアをぜひお聞かせください。適切と思われるアルゴリズムはありますか? 非常に役立つクールなトリックを思いつくことができますか? 私は気が狂っていて、この問題は解決できませんか? 私はC#で作業していますが、どの言語でも大歓迎です。