問題タブ [binary-image]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - matlabでOCRのバイナリイメージで非常に近い文字を分離する方法は?
相関を使用して、Matlab で基本的な OCR システムを作成しました。(これはプロのプロジェクトではなく、演習としてのみ使用されており、Matlab の ocr() 関数は使用していません)。私のコードは、きれいなテキスト画像に対してほぼ正しく機能しています。しかし、仕事を少し難しくすると (テキスト写真を角度付きで横向きに撮る)、私のコードは良い結果をもたらしません。テキストを正しく配置するために主成分分析を使用していますが、これを行うと (角度を付けて写真を撮る)、文字が非常に接近していて、認識プロセスのためにそれらを分離することができません。
元の画像と前処理 (適応しきい値処理、調整、PCA) 後
文字を正しく区切るにはどうすればよいですか?
computer-vision - 光速ラベリング等価構築におけるテーブルの初期化
光速ラベリング (Matlab) を実装しようとしています。この記事のアルゴリズム 14 では、相対ラベルと絶対ラベルの間の等価性を保持するテーブル ERA と、等価クラスを保持するテーブル EQ を使用します。 https://pdfs.semanticscholar.org/ef31/7c257603004d818ca1e2a2aa67d36d40147e.pdf
これらの行列は、いくつかのデータで初期化する必要がありますか? EQ がゼロの行列として始まる場合、祖先 a (14 行目と 17 行目) は常に 0 になるため、セグメンテーションの最後で EQ は空の行列になるようです。
お早めにどうぞ!
opencv - 可読性を維持しながらグレー スケールの QR コード イメージを 2 値化する
コンピューターで生成されたグレー スケール形式の QR コードを取得します。これらの QR コードは読み取り可能です。ただし、これらのグレースケール QR コードを特定のエンド アプリケーション用のバイナリ形式に変換する必要があります。ここで問題が発生します。QR コードを 2 値化すると、その可読性が失われます (主に CamScanner アプリによる読み取り)。固定グローバルしきい値 (60、80、127、150、190 などの複数のしきい値を試した) での単純な二値化や加重平均による適応しきい値など、OpenCV で利用可能ないくつかの基本的な二値化手法を試しました。それらのどれも、望ましい読みやすさの結果をもたらしていません。