非常に単純な問題だと思いますが、解決策や効果的な検索キーワードが見つかりません。
私はこの画像を持っています。
黒いエッジは役に立たないので、Windowsアイコン(および青い背景)だけを残して、それらをカットしたいと思います。
Windowsアイコンの座標とサイズを計算したくありません。GIMPとPhotoshopには一種のオートクロップ機能があります。OpenCVにはありませんか?
非常に単純な問題だと思いますが、解決策や効果的な検索キーワードが見つかりません。
私はこの画像を持っています。
黒いエッジは役に立たないので、Windowsアイコン(および青い背景)だけを残して、それらをカットしたいと思います。
Windowsアイコンの座標とサイズを計算したくありません。GIMPとPhotoshopには一種のオートクロップ機能があります。OpenCVにはありませんか?
すべての画像がこのようになっているかどうかはわかりません。しかし、この画像の場合、以下はそれをトリミングするための単純なpython-opencvコードです。
最初のインポートライブラリ:
import cv2
import numpy as np
画像を読み取り、グレースケールに変換し、しきい値1のバイナリ画像を作成します。
img = cv2.imread('sofwin.png')
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray,1,255,cv2.THRESH_BINARY)
次に、その中の輪郭を見つけます。オブジェクトは1つしかないので、その境界の長方形を見つけます。
contours,hierarchy = cv2.findContours(thresh,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
cnt = contours[0]
x,y,w,h = cv2.boundingRect(cnt)
次に、画像を切り抜いて、別のファイルに保存します。
crop = img[y:y+h,x:x+w]
cv2.imwrite('sofwinres.png',crop)
結果は次のとおりです。
import numpy as np
def autocrop(image, threshold=0):
"""Crops any edges below or equal to threshold
Crops blank image to 1x1.
Returns cropped image.
"""
if len(image.shape) == 3:
flatImage = np.max(image, 2)
else:
flatImage = image
assert len(flatImage.shape) == 2
rows = np.where(np.max(flatImage, 0) > threshold)[0]
if rows.size:
cols = np.where(np.max(flatImage, 1) > threshold)[0]
image = image[cols[0]: cols[-1] + 1, rows[0]: rows[-1] + 1]
else:
image = image[:1, :1]
return image
私はこの答えがはるかに簡潔だと思いました:
def crop(image):
y_nonzero, x_nonzero, _ = np.nonzero(image)
return image[np.min(y_nonzero):np.max(y_nonzero), np.min(x_nonzero):np.max(x_nonzero)]
わかりました。完全を期すために、上記の各推奨事項を実装し、再帰アルゴリズムの反復バージョンを追加し(修正後)、一連のパフォーマンステストを実行しました。
TLDR:再帰はおそらく平均的なケースに最適です(ただし、以下の1つを使用してください。OPにはいくつかのバグがあります)。オートクロップは、ほとんど空になると予想される画像に最適です。
一般的な調査結果:1。上記の再帰的アルゴリズムには、1つずつずれたバグがいくつかあります。修正されたバージョンは以下のとおりです。2. cv2.findContours関数には、長方形以外の画像に問題があり、実際には、さまざまなシナリオで画像の一部がトリミングされます。cv2.CHAIN_APPROX_NONEを使用して、役立つかどうかを確認するバージョンを追加しました(役に立たない)。3. autocropの実装は、まばらな画像には最適ですが、再帰的/反復アルゴリズムの逆である密な画像には適していません。
import numpy as np
import cv2
def trim_recursive(frame):
if frame.shape[0] == 0:
return np.zeros((0,0,3))
# crop top
if not np.sum(frame[0]):
return trim_recursive(frame[1:])
# crop bottom
elif not np.sum(frame[-1]):
return trim_recursive(frame[:-1])
# crop left
elif not np.sum(frame[:, 0]):
return trim_recursive(frame[:, 1:])
# crop right
elif not np.sum(frame[:, -1]):
return trim_recursive(frame[:, :-1])
return frame
def trim_contours(frame):
gray = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray,1,255,cv2.THRESH_BINARY)
_, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
if len(contours) == 0:
return np.zeros((0,0,3))
cnt = contours[0]
x, y, w, h = cv2.boundingRect(cnt)
crop = frame[y:y + h, x:x + w]
return crop
def trim_contours_exact(frame):
gray = cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray,1,255,cv2.THRESH_BINARY)
_, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_NONE)
if len(contours) == 0:
return np.zeros((0,0,3))
cnt = contours[0]
x, y, w, h = cv2.boundingRect(cnt)
crop = frame[y:y + h, x:x + w]
return crop
def trim_iterative(frame):
for start_y in range(1, frame.shape[0]):
if np.sum(frame[:start_y]) > 0:
start_y -= 1
break
if start_y == frame.shape[0]:
if len(frame.shape) == 2:
return np.zeros((0,0))
else:
return np.zeros((0,0,0))
for trim_bottom in range(1, frame.shape[0]):
if np.sum(frame[-trim_bottom:]) > 0:
break
for start_x in range(1, frame.shape[1]):
if np.sum(frame[:, :start_x]) > 0:
start_x -= 1
break
for trim_right in range(1, frame.shape[1]):
if np.sum(frame[:, -trim_right:]) > 0:
break
end_y = frame.shape[0] - trim_bottom + 1
end_x = frame.shape[1] - trim_right + 1
# print('iterative cropping x:{}, w:{}, y:{}, h:{}'.format(start_x, end_x - start_x, start_y, end_y - start_y))
return frame[start_y:end_y, start_x:end_x]
def autocrop(image, threshold=0):
"""Crops any edges below or equal to threshold
Crops blank image to 1x1.
Returns cropped image.
"""
if len(image.shape) == 3:
flatImage = np.max(image, 2)
else:
flatImage = image
assert len(flatImage.shape) == 2
rows = np.where(np.max(flatImage, 0) > threshold)[0]
if rows.size:
cols = np.where(np.max(flatImage, 1) > threshold)[0]
image = image[cols[0]: cols[-1] + 1, rows[0]: rows[-1] + 1]
else:
image = image[:1, :1]
return image
次に、それをテストするために、次の単純な関数を作成しました。
import datetime
import numpy as np
import random
ITERATIONS = 10000
def test_image(img):
orig_shape = img.shape
print ('original shape: {}'.format(orig_shape))
start_time = datetime.datetime.now()
for i in range(ITERATIONS):
recursive_img = trim_recursive(img)
print ('recursive shape: {}, took {} seconds'.format(recursive_img.shape, (datetime.datetime.now()-start_time).total_seconds()))
start_time = datetime.datetime.now()
for i in range(ITERATIONS):
contour_img = trim_contours(img)
print ('contour shape: {}, took {} seconds'.format(contour_img.shape, (datetime.datetime.now()-start_time).total_seconds()))
start_time = datetime.datetime.now()
for i in range(ITERATIONS):
exact_contour_img = trim_contours(img)
print ('exact contour shape: {}, took {} seconds'.format(exact_contour_img.shape, (datetime.datetime.now()-start_time).total_seconds()))
start_time = datetime.datetime.now()
for i in range(ITERATIONS):
iterative_img = trim_iterative(img)
print ('iterative shape: {}, took {} seconds'.format(iterative_img.shape, (datetime.datetime.now()-start_time).total_seconds()))
start_time = datetime.datetime.now()
for i in range(ITERATIONS):
auto_img = autocrop(img)
print ('autocrop shape: {}, took {} seconds'.format(auto_img.shape, (datetime.datetime.now()-start_time).total_seconds()))
def main():
orig_shape = (10,10,3)
print('Empty image--should be 0x0x3')
zero_img = np.zeros(orig_shape, dtype='uint8')
test_image(zero_img)
print('Small image--should be 1x1x3')
small_img = np.zeros(orig_shape, dtype='uint8')
small_img[3,3] = 1
test_image(small_img)
print('Medium image--should be 3x7x3')
med_img = np.zeros(orig_shape, dtype='uint8')
med_img[5:8, 2:9] = 1
test_image(med_img)
print('Random image--should be full image: 100x100')
lg_img = np.zeros((100,100,3), dtype='uint8')
for y in range (100):
for x in range(100):
lg_img[y,x, 0] = random.randint(0,255)
lg_img[y, x, 1] = random.randint(0, 255)
lg_img[y, x, 2] = random.randint(0, 255)
test_image(lg_img)
main()
...そして結果...
Empty image--should be 0x0x3
original shape: (10, 10, 3)
recursive shape: (0, 0, 3), took 0.295851 seconds
contour shape: (0, 0, 3), took 0.048656 seconds
exact contour shape: (0, 0, 3), took 0.046273 seconds
iterative shape: (0, 0, 3), took 1.742498 seconds
autocrop shape: (1, 1, 3), took 0.093347 seconds
Small image--should be 1x1x3
original shape: (10, 10, 3)
recursive shape: (1, 1, 3), took 1.342977 seconds
contour shape: (0, 0, 3), took 0.048919 seconds
exact contour shape: (0, 0, 3), took 0.04683 seconds
iterative shape: (1, 1, 3), took 1.084258 seconds
autocrop shape: (1, 1, 3), took 0.140886 seconds
Medium image--should be 3x7x3
original shape: (10, 10, 3)
recursive shape: (3, 7, 3), took 0.610821 seconds
contour shape: (0, 0, 3), took 0.047263 seconds
exact contour shape: (0, 0, 3), took 0.046342 seconds
iterative shape: (3, 7, 3), took 0.696778 seconds
autocrop shape: (3, 7, 3), took 0.14493 seconds
Random image--should be full image: 100x100
original shape: (100, 100, 3)
recursive shape: (100, 100, 3), took 0.131619 seconds
contour shape: (98, 98, 3), took 0.285515 seconds
exact contour shape: (98, 98, 3), took 0.288365 seconds
iterative shape: (100, 100, 3), took 0.251708 seconds
autocrop shape: (100, 100, 3), took 1.280476 seconds
滑らかで小さな再帰関数はどうですか?
import cv2
import numpy as np
def trim(frame):
#crop top
if not np.sum(frame[0]):
return trim(frame[1:])
#crop bottom
elif not np.sum(frame[-1]):
return trim(frame[:-2])
#crop left
elif not np.sum(frame[:,0]):
return trim(frame[:,1:])
#crop right
elif not np.sum(frame[:,-1]):
return trim(frame[:,:-2])
return frame
画像を読み込んでしきい値を設定し、暗い領域が黒くなるようにします。
img = cv2.imread("path_to_image.png")
thold = (img>120)*img
次に、再帰関数を呼び出します
trimmedImage = trim(thold)
それが誰かを助ける場合に備えて、私は@wordsforthewiseのPILベースのソリューションの代わりにこの微調整を行いました:
bw = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
rows, cols = bw.shape
non_empty_columns = np.where(bw.max(axis=0) > 0)[0]
non_empty_rows = np.where(bw.max(axis=1) > 0)[0]
cropBox = (min(non_empty_rows) * (1 - padding),
min(max(non_empty_rows) * (1 + padding), rows),
min(non_empty_columns) * (1 - padding),
min(max(non_empty_columns) * (1 + padding), cols))
return img[cropBox[0]:cropBox[1]+1, cropBox[2]:cropBox[3]+1 , :]
(これは、元のコードが黒い背景ではなく白い背景を切り取ると想定しているという点で微調整です。)
Pythonバージョン3.6
画像を切り抜いて、「CropedImages」フォルダに挿入します
import cv2
import os
arr = os.listdir('./OriginalImages')
for itr in arr:
img = cv2.imread(itr)
gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
_,thresh = cv2.threshold(gray, 120, 255, cv2.THRESH_BINARY)
_, contours, _ = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)
cnt = contours[0]
x,y,w,h = cv2.boundingRect(cnt)
crop = img[y:y+h,x:x+w]
cv2.imwrite('CropedImages/'+itr,crop)
9行目で120という数字を他の数字に変えて、あなたの画像を試してみてください、それはうまくいくでしょう