2

オブジェクトの向きを検出するコンピューター ビジョン スクリプトを作成しようとしています。ほとんどの場合は機能しますが、特定の画像では同じように機能しないようです。

このスクリプトは、輪郭を見つけるためにぼかしとキャニー エッジ検出に依存しています。

作業例:

ここに画像の説明を入力

失敗する部分: ここに画像の説明を入力

ここに画像の説明を入力

失敗した部分については、同じ形状の 1 つに対して 2 行で、他の形状の 1 つを完全に無視します。

メインコード:

import cv2
from imgops import imutils
import CVAlgo

z = 'am'

path = 'images/pca.jpg'
#path = 'images/pca2.jpg'

img = cv2.imread(path)
imgray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

img = imutils.resize(img, height = 600)
imgray = imutils.resize(img, height = 600)

final = img.copy()

thresh, imgray = CVAlgo.filtering(img, imgray, z)


__ , contours, hierarchy = cv2.findContours(thresh.copy(),cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

# Iterate through all contours
test = CVAlgo.cnt_gui(final, contours)

#cv2.imwrite('1.jpg', final)

cv2.imshow('thresh', thresh)
cv2.imshow('contours', final)
cv2.waitKey(0)

CVAlgo.py

import cv2
from numpy import *
from pylab import *
from imgops import imutils
import math

def invert_img(img):
    img = (255-img)
    return img


def canny(imgray):
    imgray = cv2.GaussianBlur(imgray, (11,11), 200)
    canny_low = 0
    canny_high = 100

    thresh = cv2.Canny(imgray,canny_low,canny_high)
    return thresh

def cnt_gui(img, contours):
    cnts = sorted(contours, key = cv2.contourArea, reverse = True)

    for i in range(0,len(cnts)):
        sel_cnts = sorted(contours, key = cv2.contourArea, reverse = True)[i]

        area = cv2.contourArea(sel_cnts)

        if area < 1000:
            continue

        # get orientation angle and center coord
        center, axis,angle = cv2.fitEllipse(sel_cnts)

        hyp = 100  # length of the orientation line

        # Find out coordinates of 2nd point if given length of line and center coord 
        linex = int(center[0]) + int(math.sin(math.radians(angle))*hyp)
        liney = int(center[1]) - int(math.cos(math.radians(angle))*hyp)

        # Draw orienation
        cv2.line(img, (int(center[0]),int(center[1])), (linex, liney), (0,0,255),5)             
        cv2.circle(img, (int(center[0]), int(center[1])), 10, (255,0,0), -1)

    return img

def filtering(img, imgray, mode):
    imgray = cv2.medianBlur(imgray, 11)
    thresh = cv2.Canny(imgray,75,200)

    return thresh, imgray

誰が問題が何であるか知っていますか?このスクリプトを改善する方法を知っている人はいますか?

4

2 に答える 2

2

検出されなかった形状は黒の背景に近すぎるため、その輪郭は白い物体領域の輪郭と結合されています。オブジェクトの 1 つで見つかった 2 番目の方向は、実際には外側の輪郭の方向です。これの一部を回避するには、 cv2.dilate の cv2.dilate 関数を使用して、しきい値処理後にバイナリ イメージを拡張または閉じることができます

于 2015-12-26T17:57:35.823 に答える