0

同様に、スケールに関係なく、.png 内のすべての A の位置を見つけますが、すべて適切に回転しますか?

編集:これは私が考えているよりも難しい問題だと言った人は正しいです。詳細を追加したかったのです。(白地に黒のスキャンされた手書きの画像) から文字の位置を見つける方法を探しています。 .

これは大規模なプロジェクトであることを認識しているので、このようなことを行うオープンソース ライブラリや単純なアルゴリズムがあるかどうか疑問に思っていました。いくつかのコーナー マッチング スキームを試しましたが、うまくいきませんでした。

4

2 に答える 2

0

まず、あなたの質問はコンピュータビジョンの領域にあります(初心者にはそう見えるかもしれませんが、画像処理ではありません)。次に、png画像が自然のシーンの写真であるかスキャンされたドキュメントであるかによって大きな違いが生じます。自然画像の場合、一般的なオブジェクト検出、特にテキスト検出の文献を確認する必要があります。スキャンされたドキュメントの場合、フィールドはドキュメント分析(またはドキュメント処理)です。

いずれにせよ、あなたの問題はおそらく解決可能だと思いますが、解決策はあなたが持続したいと思うよりも(努力と時間の面で)遠いかもしれません。

于 2010-12-08T11:58:45.230 に答える
0

これを行うための非常に良い方法の 1 つは、「A」をモデルとして NGC (非グレースケール相関) を使用することです。問題は、これがスケール不変法ではないことです。実際、この質問は非常に複雑になる可能性があります。複数のスケールを解決するには、各スケールとループ (低速) のモデルを生成できます。

于 2010-12-09T20:48:41.113 に答える