問題タブ [image-processing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - 画像内のテキストの検索
私は現在プロジェクトに取り組んでおり、私の目標は画像内のテキストを見つけることです。テキストをOCRすることは、まだ私の意図ではありません。基本的に、画像内のテキストの境界を取得したい。操作に AForge.Net イメージング コンポーネントを使用しています。何らかの形で支援はありますか?
2009 年 2 月 5 日更新: それ以来、私は自分のプロジェクトで別のルートをたどってきました。ただし、MODI (Microsoft Office Document Imaging) を使用してテキストを取得しようとしました。画像をOCRし、そこからテキストを簡単に引き出すことができます。
algorithm - 2 つの画像を比較するアルゴリズム
2 つの異なる画像ファイル (どの形式を選択しても) が与えられた場合、一方が他方の違法なコピーであるかどうかを予測するプログラムを作成する必要があります。コピーの作成者は、回転、ネガの作成、些細な詳細の追加 (および画像の寸法の変更) などを行う場合があります。
この種の仕事をするためのアルゴリズムを知っていますか?
algorithm - 2 つの画像の類似性を測定するにはどうすればよいですか?
1 つのアプリケーション (Web ページの可能性があります) のスクリーンショットと以前に撮影したスクリーンショットを比較して、アプリケーションが正しく表示されているかどうかを判断したいと考えています。アスペクトが少し異なる可能性があるため (Web アプリの場合、ブラウザーによっては、一部の要素がわずかに異なる場所にある可能性があります)、完全一致の比較はしたくありません。スクリーンショットがどの程度似ているかを測定する必要があります。
すでにそれを行うライブラリ/ツールはありますか? どのように実装しますか?
python - 画像処理、Python で?
最近、少なくとも基本的な画像処理が必要な問題に遭遇しました。Python でこれを行うことはできますか。
java - 最速のガウスぼかしの実装
可能な限り最速のガウスぼかしアルゴリズムをどのように実装しますか?
Javaで実装するので、GPUソリューションは除外されます。私のアプリケーションplanetGenesisはクロスプラットフォームなので、 JNIは必要ありません。
image-processing - SOでユーザーIDイメージはどのように生成されますか?
このサイトの各ユーザーに関連付けられているかわいい万華鏡のような画像に少し興味があります。それらはどのように生成されますか?可能性は次のとおりです。
- 画像のリストはすでにいくつかのフォルダーにあり、ランダムに選択されます。
- ユーザーが登録するたびに画像が生成されます。
いずれにせよ、そのような画像を生成するためにどのようなアルゴリズムが使用されているかに興味があります。
algorithm - 画像のグラデーションで塗りつぶされたコーナーをブレンドするアルゴリズム
画像の周りにアルファ ブレンドされたグラデーションの境界線を配置する必要があります。私の問題は、コーナーをブレンドして、水平方向と垂直方向のグラデーションが交わる場所を滑らかにすることです。この問題を解決する標準アルゴリズムがあると思います。何年も前に学校で遭遇したと思います。しかし、いくつかの Web 検索で 1 つの参照を見つけることができませんでした。
(隅に放射状の塗りつぶしパターンを実装しましたが、遷移はまだ十分にスムーズではありません。)
私の質問:
この問題の標準アルゴリズムがある場合、その名前は何ですか? さらに良いことに、どのように実装されていますか?
標準的なアルゴリズムを使用せずに、角に滑らかなグラデーションを生成するために必要なピクセル値を決定する最良の方法は何ですか? (縦のグラデーションから横のグラデーションにスムーズに移行します。)
編集:大きな画像の上に挿入する画像があると想像してください。大きい画像は黒一色で、小さい画像は白一色です。挿入する前に、小さな画像にアルファ値を設定してその周りに透明な「境界線」を作成し、大きな画像に「フェード」することで、小さな画像を大きな画像にブレンドしたいと考えています。正しく行うと、黒から白への滑らかなグラデーションが得られます。コーナーと内側のエッジを除くすべての場所で行います。
画像の中央近くのグラデーション境界の端では、値は 255 になります (透明ではありません)。境界が外側の端に近づくにつれて、アルファ値は 0 に近づきます。頂点と水平の境界が交わる画像のコーナーでは、対角線に相当するものになります。その線引きをなくしてスムーズに移行したい。
私が必要としているのは、水平エッジと垂直エッジが交差するときに画像の隅で重なる各ピクセルのアルファ値 (0 ~ 255) を決定するアルゴリズムです。
ruby-on-rails - 画像からバーコードを読み取る方法
java - Javaベースのアプリケーションで使用するためにライブビデオデバイスから画像をキャプチャするための最良の方法は何ですか?
特定のシナリオを半リアルタイムで検出するための画像処理の問題を調査しています。私の目標は、ライブビデオをJavaコードのMotionJPEGフレームとして何らかの形で到着させることです。
私はJavaMediaFrameworkに精通していますが、残念ながら、事実上死んでいるAPIと見なすことができると思います。私はAxisボックスにも精通しており、それらのソリューションは本当に気に入っていますが、特定の関心のあるポイントに関する重要なフィードバックをいただければ幸いです。
これが、この議論の目的のために私が「最良」を定義する方法です。
- レイテンシー-このビデオストリームを使用してカメラを制御している場合、可能であれば、ラウンドトリップレイテンシーを100ミリ秒未満に保ちたいと思います。これは、コントロール入力から目に見える変化が見られるまでの時間として測定されます。しばらくしてから編集してください。もう1つ覚えておくべきことは、カメラ制御は手動と自動(イベントトリガー)の組み合わせである可能性が高いということです。高品質のフィードが個別にアーカイブされている場合でも、これらの写真をすぐに確認する必要があります。
- コスト-無料/オープンソースは無料でないよりはましです。
- 調整可能なコーデックパラメータ-特定の状況に合わせてコーデックを調整できる必要があります。高速で低解像度のストリームの方が実際に処理しやすい場合があります。
- Javaとの「統合」-このソリューションを私のコードにフックするのはどれくらいの問題ですか?ソケットを介してパケットを送信していますか?URLを打つ?Direct3D / JNIの組み合わせをインストールしますか?
- Windows / Linux /両方?-オペレーティングシステムにとらわれないソリューションを好むのは、OSのいくつかのフレーバーに提供する必要があるためですが、一方に最適で他方には最適でないソリューションがあるかもしれません。
注:私は他の画像/ビデオキャプチャコーデックを知っていますが、それはこの質問の焦点ではありません。フレームの精度が低下するため、ストリーミングAPI(MPEG4など)には特に関心がありません。ただし、別のフレーム精度のデータストリームを配信する私の質問に対する解決策がある場合は、チャイムを鳴らしてください。
この質問のフォローアップ:現時点では、ソフトウェアやPCで直接ビデオをキャプチャするのではなく、 Axisビデオエンコーダーなどのアプライアンスを購入する傾向があります。しかし、誰かが代替案を持っているなら、私はそれらを聞いてみたいです。
c# - 画像内の固有の色の数をカウントするためのアルゴリズム
十分に高速でありながら、メモリを備えた優雅なものを探しています。画像は24bppSystem.Drawing.Bitmapです。