OpenCVCAPIを多用するC/C++で記述されたアプリケーション用のPythonラッパーを作成しようとしています。以前のプログラムで正常に使用したことがあるので、これにはctypesを使用したいと思います。しかし、PythonからCライブラリの関数にパラメータとしてIplImageを渡そうとすると、問題が発生します。
問題を実証するためにサンプルテストライブラリを作成しました。これが私が使いたいライブラリの関数です:
// ImageDll.h
#include "opencv2/opencv.hpp"
extern "C" //Tells the compile to use C-linkage for the next scope.
{
// Returns image loaded from location
__declspec(dllexport) IplImage* Load(char* dir);
// Show image
__declspec(dllexport) void Show(IplImage* img);
}
そしてcppファイル:
// ImageDll.cpp
// compile with: /EHsc /LD
#include "ImageDll.h"
using namespace std;
extern "C" //Tells the compile to use C-linkage for the next scope.
{
IplImage* Load(char* dir)
{
return cvLoadImage(dir, CV_LOAD_IMAGE_COLOR);
}
void Show(IplImage* img)
{
cvShowImage("image", img);
cvWaitKey(0);
}
}
そして、これがPythonでの最初の試みです。
from time import sleep
from ctypes import *
from modules.acquisition import InitCamera, GetImage
from modules.utils import struct
import cv2.cv as cv
# load DLL containing image functions
print "Loading shared library with genetic algorithm...",
image_lib = cdll.LoadLibrary("OpenCV_test_DLL.dll")
print "Done."
# get function handles
print "Loading functions of library...",
image_load = image_lib.Load
image_show = image_lib.Show
# set return type for functions (because ctypes default is int)
image_load.restype = c_void_p
image_show.restype = None
print "Done."
# initialize source
print "Initializing camera",
source = struct()
InitCamera(source)
print "Done."
# show video
while (1):
# get image as PIL image
img = GetImage(source)
# transform image to OpenCV IplImage
cv_img = cv.CreateImageHeader(img.size, cv.IPL_DEPTH_8U, 3)
cv.SetData(cv_img, img.tostring())
# show image using OpenCV highgui lib
image_show(pointer(cv_img))
ご覧のとおり、カメラからPIL画像として画像を取得し、それをpythonIplImageに変換します。最後の行のimage_show(pointer(cv_img))をcv2.cvモジュールのPythonバインディングに置き換えると、これは100%機能します。
cv.ShowImage("image", cv_img)
cv.WaitKey(20)
その後、正しい出力が得られます。
したがって、問題は、TypeErrorで失敗するimage_show(pointer(cv_img))にあります。typeにはストレージ情報が必要です。これは、cv_imgが有効なctypesIplImage構造である必要があるためです。私はそれをctypesで模倣しようとしましたが、ほとんど成功していません。
from ctypes import *
from cv2 import cv
# ctypes IplImage
class cIplImage(Structure):
_fields_ = [("nSize", c_int),
("ID", c_int),
("nChannels", c_int),
("alphaChannel", c_int),
("depth", c_int),
("colorModel", c_char * 4),
("channelSeq", c_char * 4),
("dataOrder", c_int),
("origin", c_int),
("align", c_int),
("width", c_int),
("height", c_int),
("roi", c_void_p),
("maskROI", c_void_p),
("imageID", c_void_p),
("tileInfo", c_void_p),
("imageSize", c_int),
("imageData", c_char_p),
("widthStep", c_int),
("BorderMode", c_int * 4),
("BorderConst", c_int * 4),
("imageDataOrigin", c_char_p)]
変換を行う関数は次のとおりです。
# convert Python PIL to ctypes Ipl
def PIL2Ipl(input_img):
# mode dictionary:
# (pil_mode : (ipl_depth, ipl_channels)
mode_list = {
"RGB" : (cv.IPL_DEPTH_8U, 3),
"L" : (cv.IPL_DEPTH_8U, 1),
"F" : (cv.IPL_DEPTH_32F, 1)
}
if not mode_list.has_key(input_img.mode):
raise ValueError, 'unknown or unsupported input mode'
result = cIplImage()
result.imageData = c_char_p(input_img.tostring())
result.depth = c_int(mode_list[input_img.mode][0])
result.channels = c_int(mode_list[input_img.mode][1])
result.height = c_int(input_img.size[0])
result.width = c_int(input_img.size[1])
return result
("imageData", c_char_p),
("widthStep", c_int),
("BorderMode", c_int * 4),
("BorderConst", c_int * 4),
("imageDataOrigin", c_char_p)]
その後、ビデオループはに変わります
# show video
while (1):
# get image as PIL image
img = GetImage(source)
# transform image to OpenCV IplImage
cv_img = cIplImage()
cv_img = PIL2Ipl(img)
# show image using OpenCV highgui lib
image_show(pointer(cv_img))
このようにして、データはライブラリに渡されますが、OpenCVエラー:不明な関数の不正なフラグ(パラメーターまたは構造体フィールド)(認識されない、またはサポートされていない配列型)を求めて叫びます。したがって、作成されたctypes構造は無効です。誰かがそれを正しく実装する方法を知っていますか?python IplImageをcライブラリに渡すことができる場合は、ctypesを使用しない他のソリューションも受け入れます。ありがとう。
注:この2日間、この質問に対する回答を見つけようとしましたが、成功しませんでした。OpenCV 1.0には解決策がありますが、最近のPython用のOpenCVバインディングでは、numpy配列を使用しており、PythonとCアプリケーション間のインターフェイスを機能させることはほとんど不可能です。:(