ガウスエッジ検出のラプラシアンの同等の実装を探しています。
matlab では、次の関数を使用します
[BW,threshold] = edge(I,'log',...)
Python には、ガウスのラプラシアンを計算する関数が存在します。エッジを確実に戻すわけではありません。
scipy.ndimage.filters.gaussian_laplace
オンライン実装またはコードへのポインタ
ありがとう
ガウスエッジ検出のラプラシアンの同等の実装を探しています。
matlab では、次の関数を使用します
[BW,threshold] = edge(I,'log',...)
Python には、ガウスのラプラシアンを計算する関数が存在します。エッジを確実に戻すわけではありません。
scipy.ndimage.filters.gaussian_laplace
オンライン実装またはコードへのポインタ
ありがとう
matlab edge() がすべきこと
scipy の Log フィルターは、上記のステップ 1 のみを実行します。上記の手順 2 ~ 4 を模倣するために、次のスニペットを実装しました。
import scipy as sp
import numpy as np
import scipy.ndimage as nd
import matplotlib.pyplot as plt
from skimage import data
# lena = sp.misc.lena() this function was deprecated in version 0.17
img = data.camera() # use a standard image from skimage instead
LoG = nd.gaussian_laplace(img , 2)
thres = np.absolute(LoG).mean() * 0.75
output = sp.zeros(LoG.shape)
w = output.shape[1]
h = output.shape[0]
for y in range(1, h - 1):
for x in range(1, w - 1):
patch = LoG[y-1:y+2, x-1:x+2]
p = LoG[y, x]
maxP = patch.max()
minP = patch.min()
if (p > 0):
zeroCross = True if minP < 0 else False
else:
zeroCross = True if maxP > 0 else False
if ((maxP - minP) > thres) and zeroCross:
output[y, x] = 1
plt.imshow(output)
plt.show()
もちろん、これは遅く、おそらく慣用的ではありません。私もPythonを初めて使用するためですが、アイデアを示す必要があります。それを改善する方法についての提案も大歓迎です。
ycyeh のコードで少し遊んでみました (提供してくれてありがとう)。私のアプリケーションでは、バイナリの 0 と 1 だけでなく、min-max-range に比例する出力値を使用することで、より良い結果が得られました。(その後、スレッシュはもう必要ありませんでしたが、結果にしきい値を簡単に適用できます。)また、ループをnumpy配列操作に変更して、実行を高速化しました。
import numpy as np
import scipy.misc
import cv2 # using opencv as I am not too familiar w/ scipy yet, sorry
def laplace_of_gaussian(gray_img, sigma=1., kappa=0.75, pad=False):
"""
Applies Laplacian of Gaussians to grayscale image.
:param gray_img: image to apply LoG to
:param sigma: Gauss sigma of Gaussian applied to image, <= 0. for none
:param kappa: difference threshold as factor to mean of image values, <= 0 for none
:param pad: flag to pad output w/ zero border, keeping input image size
"""
assert len(gray_img.shape) == 2
img = cv2.GaussianBlur(gray_img, (0, 0), sigma) if 0. < sigma else gray_img
img = cv2.Laplacian(img, cv2.CV_64F)
rows, cols = img.shape[:2]
# min/max of 3x3-neighbourhoods
min_map = np.minimum.reduce(list(img[r:rows-2+r, c:cols-2+c]
for r in range(3) for c in range(3)))
max_map = np.maximum.reduce(list(img[r:rows-2+r, c:cols-2+c]
for r in range(3) for c in range(3)))
# bool matrix for image value positiv (w/out border pixels)
pos_img = 0 < img[1:rows-1, 1:cols-1]
# bool matrix for min < 0 and 0 < image pixel
neg_min = min_map < 0
neg_min[1 - pos_img] = 0
# bool matrix for 0 < max and image pixel < 0
pos_max = 0 < max_map
pos_max[pos_img] = 0
# sign change at pixel?
zero_cross = neg_min + pos_max
# values: max - min, scaled to 0--255; set to 0 for no sign change
value_scale = 255. / max(1., img.max() - img.min())
values = value_scale * (max_map - min_map)
values[1 - zero_cross] = 0.
# optional thresholding
if 0. <= kappa:
thresh = float(np.absolute(img).mean()) * kappa
values[values < thresh] = 0.
log_img = values.astype(np.uint8)
if pad:
log_img = np.pad(log_img, pad_width=1, mode='constant', constant_values=0)
return log_img
def _main():
"""Test routine"""
# load grayscale image
img = scipy.misc.face() # lena removed from newer scipy versions
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# apply LoG
log = laplace_of_gaussian(img)
# display
cv2.imshow('LoG', log)
cv2.waitKey(0)
if __name__ == '__main__':
_main()