私は画像のエッジ検出に取り組んでおり、アルゴリズムのパフォーマンスを評価したいと思います。誰かが私にそれを進める方法についての参照または方法を教えてくれるなら、それは本当に役に立ちます。:)
私はグラウンドトゥルースを持っておらず、データセットにはカラーとグレーの画像が含まれています。
ありがとうございました。
私は画像のエッジ検出に取り組んでおり、アルゴリズムのパフォーマンスを評価したいと思います。誰かが私にそれを進める方法についての参照または方法を教えてくれるなら、それは本当に役に立ちます。:)
私はグラウンドトゥルースを持っておらず、データセットにはカラーとグレーの画像が含まれています。
ありがとうございました。
たとえば、3Dレンダリング、正確なマスクを使用した2D画像の合成(ロイヤリティフリーのフォトセットで取得可能)、またはエッジを直接導入する(細い/細い線)など、既知のエッジを持つ合成データセットを作成します。調整対象に適したタイプの、エッジのように見える交絡する非エッジを追加することを忘れないでください。
(非合成)データセットを使用します。比較する参照アルゴリズムを実行します。また、たとえば投票によって、参照アルゴリズムの組み合わせを生成します(過半数、Nのうち少なくともKなど)。(a)各参照アルゴまたはその組み合わせがエッジ(誤検知)として分類しないエッジとしてアルゴが分類するポイントの数、または(b)ポイントの数に関して、アルゴと参照アルゴのパフォーマンスの統計を計算しますこれは、参照アルゴがあなたのアルゴが分類しないエッジとして分類します(偽陰性)。また、各ポイントを調べ、どのアルゴがそれをエッジとして分類するか(または分類しないか)を調べることにより、アルゴの順位相関タイプの数を計算することもできます。
グラウンドトゥルースを手動で作成します。開始点として参照エッジ検出アルゴを使用してから、手作業で修正します。いずれにせよ、少数の画像に対して行うことはおそらく価値があります。
幸運を!
比較のために、私が説明した @Alex のような定量的尺度が最適です。そのためには、グラウンド トゥルース セットを使用して何が「正しい」かを定義し、特定の画像が正しいか、より詳細なレベルで、どの程度正しいか (パーセンテージなどの数値) を一貫して判断する方法を定義する必要があります。@アレックス私はそれを行う方法を与えました。
グラウンド トゥルースがないグラフィックス リサーチでよく使用されるもう 1 つのオプションは、ユーザー調査です。時間がかかり、多くの場合、コストがかかるため、通常はあまり望ましくありません。ただし、求めるのが定性的な改善である場合、または定量的な測定が難しすぎる場合は、ユーザー調査が適切な解決策です。
ユーザー調査とは、入力画像が与えられた結果がどの程度優れているかについて人々を調査することを意味します。物事を評価する尺度を与え、自分の結果と別のアルゴリズムの結果の両方からランダムにサンプルを与えることができます
もちろん、さらに多くのアイデアが必要な場合は、エッジ検出の論文をチェックして、結果をどのように測定したかを確認してください (彼らはすでに同じプロセスを経て、何が最適かを判断しているため、実際には最初にここを参照します)。それら:グーグル学者)。