問題タブ [image-recognition]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 2 つの画像を比較するアルゴリズム
2 つの異なる画像ファイル (どの形式を選択しても) が与えられた場合、一方が他方の違法なコピーであるかどうかを予測するプログラムを作成する必要があります。コピーの作成者は、回転、ネガの作成、些細な詳細の追加 (および画像の寸法の変更) などを行う場合があります。
この種の仕事をするためのアルゴリズムを知っていますか?
c# - .NET 用の適切な画像認識ライブラリはありますか?
Web カメラで撮影した画像と、コンピューターに保存されている画像を比較できるようにしたいと考えています。
ライブラリはミッション クリティカルなもの (警察の捜査など) には使用されないため、100% 正確である必要はありません。
CodeProject の Image Recognitionのデモンストレーション プロジェクトを試してみましたが、小さな画像でのみ機能し、120x90 ピクセルのまったく同じ画像を比較してもまったく機能しません (これは OK :P に分類されません)。
以前に画像認識で成功したことはありますか?
もしそうなら、C# または VB.NET で使用できるライブラリへのリンクを提供できますか?
algorithm - 画像認識と 3D レンダリング
オブジェクト (この場合は定義済みのオブジェクト) の画像を撮影し、さまざまな複雑さの背景を持つ写真からそのオブジェクトだけを切り取るアルゴリズムを開発するのは、どれほど難しいことでしょう。
さらに、写真のオブジェクト (家、車、犬など - ただし、常に 1 つのタイプ) を 3D レンダリングに変換する必要があります。利用可能な 3D レンダリング エンジンがあることは知っていますが (有料、無料、または何らかの条件付きで)、これが機能するには、オブジェクト (対象) をあらゆる方法で測定する必要があります。たとえば、これが人である場合、身長、肩の曲率、顔の半径、各指の長さなどを測定する必要があります。
この問題を解決する実現可能性はどのようなものでしょうか? この研究分野に特化した良いリンクを知っている人はいますか? この問題に対するオープンソースの解決策を見たことがありますが、オブジェクトの周りをトレースしてトリミングする際のオブジェクトの測定の容易さについて疑問が残ります。
ありがとう
基本的には 2D 画像を撮りたい (典型的な画像: 複数のオブジェクトを含む複雑な写真などよりも簡単です)。
、
しかし、それを 3D 画像に変換したいのであれば、3D レンダリング/モデリング エンジンを構築する必要があるのではないでしょうか。
さらに、私が提供したそのリンクは 3ds max に入り、いくつかのプロパティが設定され、レンダリングが行われます。
c++ - 画像認識用の C++ ライブラリ: 文字列への単語を含む画像
特定のフォントやフォントの高さに基づいて文字を見つけることができるように、画像を取得して画像認識を実行するための c++ ライブラリを知っている人はいますか? フォントを選択できないものでもいいでしょう (例: readLetters(Image image))。
forms - スキャンした文書画像の空白フィールドを見つける方法
アプリケーションで、モノクロ イメージ ファイルとして存在するフォームの 1 つのフィールドに入力する必要があります。フォームは常に同じ紙のバージョンとして開始されますが、アプリケーションがユーザーからフォームを取得するまでに、複数回スキャンまたはファックス送信されている可能性があります。そのため、必要なフィールドがすべてのファイルで同じ場所にあるわけではありません。
ユーザーが常に空白のフォームを受け取るとは限らないため、後で認識できるマークやプレースホルダーを印刷する機能がありません。
元の空白のフォームにテキストがありますが、FAX 送信された可能性があるため、解像度は 200 dpi しかありません。テキストは常に人間が読むのに十分な大きさですが、OCR については懐疑的です。
予算はいくらかあるので、無料のソリューションは必要ありません... $2000 としましょう。
とは言え、検討中です
必要なフィールドのテキスト ラベルを見つけるための OCR ソリューションを入手してください。私は自分自身をロールバックするためのリソースや専門知識を持っているとは思いません. テキストの内容はすでに知っているので、完全な認識は必要ありません。ただし、X 座標と Y 座標を知る必要があります。これを行うソフトウェアはありますか?それとも、プログラミングは思ったより簡単ですか?
フォームのエッジを認識するソフトウェアを作成または購入します。そこから、必要なフィールドの相対位置を取得できました。スキャナー ソフトウェアが小さな文書の画像の周りに配置する破線について考えています。それは既知のアルゴリズムですか、それとも利用可能な解決策はありますか?
必要なフィールドを認識する他の方法。フォーム入力ソフトウェアをグーグルで検索しようとすると、何百もの Web フォーム、PDF フォームなどの一致が得られます。
私は言葉にうるさいわけではありません。私のアプリケーションは Linux で実行されますが、最適なソリューションが Microsoft である場合、おそらくそれを機能させることができます。
よろしくお願いします。
java - 円認識用の高速 Java ライブラリ
提供されたビットマップで円認識用の Java ライブラリを探しています。私の Java の知識は基本的すぎて実装できません。ハフは効率的に変換します (Java 初心者)。
ありがとう!
.net - 画像認識ライブラリ
有能な画像認識ライブラリ (できればオープン ソース) が .Net にあるかどうか疑問に思いますか? ページとドキュメントをバッチでスキャンするアプリケーションがあります。あるドキュメントを別のドキュメントから分離するために (これらのドキュメントは複数のページを持つ可能性があるため)、ユーザーにページを配置してもらい、たとえばホッキョクグマの画像をドキュメント間で区切るように依頼する予定です。したがって、私のアプリケーションはすべてのスキャンを行い、ページにホッキョクグマが含まれているかどうかを確認し、含まれている場合は最初のドキュメントの最後と呼びます。
アプリケーションがテキストを認識する OCR については知っていますが、同等の画像についてはどうでしょうか。
artificial-intelligence - ストリートビュー画像から監視カメラの位置を抽出
以前の質問に関連して、コンピュータ ビジョン アルゴリズムを使用して、Google ストリートビューの写真から監視カメラの位置を抽出する現実的な可能性はありますか? 私はその分野の専門家ではありません。しかし、顔検出などよりは簡単なはずです。
c - Obj-C の画像認識用ライブラリ?
白い背景に黒い点を識別できるライブラリを探しています。できればCまたはobjective-cで。
また、そのようなアルゴリズムを検索する際に使用できるキーワードは何ですか? 画像認識に関する多くの情報を見つけましたが、探しているものに似たものはありません。
ありがとう!