使用OpenCV和SVM与图像
我在阅读图像,提取训练功能以及使用SVM在OpenCV中测试新图像方面遇到困难。 有人能指点我一个很好的链接吗? 我已经看过支持向量机的OpenCV简介。 但它不能帮助阅读图像,我不知道如何将其纳入。
我的目标是分类图像中的像素。 这些像素将属于曲线。 我理解形成训练矩阵(例如,图像A 1,1 1,2 1,3 1,4 1,5 2,1 2,2 2,3 2,4 2,5 3,1 3,2 3, 3 3,4 3,5
我将把训练矩阵形成为[3] [2] = {{1,1} {1,2} {1,3} {1,4} {1,5} {2,1} .. {} }
但是,我对标签有点混淆。 根据我的理解,我必须指定训练矩阵中的哪一行(图像)对应,它对应于曲线还是非曲线。 但是,如果有一些像素属于曲线而有些像素不属于曲线,那么如何标记训练矩阵行(图像)。 例如,我的训练矩阵是[3] [2] = {{1,1} {1,2} {1,3} {1,4} {1,5} {2,1} .. {}}像素{1,1}和{1,4}属于曲线,但其余部分不属于曲线。
最近我不得不处理这个问题,这就是我最终做了什么来让SVM为图像工作。
要在一组图像上训练SVM,首先必须构建SVM的训练矩阵。 该矩阵如下指定:矩阵的每一行对应于一个图像,并且该行中的每个元素对应于该类的一个特征 - 在这种情况下,该特征点处的像素的颜色。 由于您的图像是二维的,您需要将它们转换为一维矩阵。 每行的长度将是图像的面积(请注意图像的大小必须相同)。
假设您想要在5个不同的图像上训练SVM,并且每个图像都是4x3像素。 首先你必须初始化训练矩阵。 矩阵中的行数为5,列数将为图像的面积,4 * 3 = 12。
int num_files = 5;
int img_area = 4*3;
Mat training_mat(num_files,img_area,CV_32FC1);
理想情况下, num_files
和img_area
不会被硬编码,而是通过循环目录并计算图像数量并获取图像的实际区域而获得。
下一步是用每个图像的数据“填充” training_mat
的行。 下面是这个映射如何为一行工作的例子。
我已经将图像矩阵的每个元素都编号为它应该在训练矩阵的相应行中的位置。 例如,如果这是第三张图像,这将是训练矩阵中的第三行。
您必须遍历每个图像并相应地设置输出矩阵中的值。 以下是多个图像的示例:
至于你如何在代码中做到这一点,你可以使用reshape()
,但由于矩阵不连续,我遇到了问题。 根据我的经验,我做了这样的事情:
Mat img_mat = imread(imgname,0); // I used 0 for greyscale
int ii = 0; // Current column in training_mat
for (int i = 0; i<img_mat.rows; i++) {
for (int j = 0; j < img_mat.cols; j++) {
training_mat.at<float>(file_num,ii++) = img_mat.at<uchar>(i,j);
}
}
对每个训练图像执行此操作(记住要递增file_num
)。 在此之后,您应该正确设置您的训练矩阵以传入SVM函数。 其余步骤应与在线示例非常相似。
请注意,在执行此操作时,您还必须为每个训练图像设置标签。 例如,如果您基于图像对眼睛和非眼睛进行分类,则需要指定训练矩阵中的哪一行对应于眼睛和非眼睛。 这被指定为1D矩阵,其中1D矩阵中的每个元素对应于2D矩阵中的每一行。 选择每个类别的值(例如,-1表示非眼睛,1表示眼睛)并将其设置在标签矩阵中。
Mat labels(num_files,1,CV_32FC1);
所以如果这个labels
矩阵中的第3个元素是-1,就意味着训练矩阵中的第3行是在“非眼睛”类中。 您可以在评估每幅图像的循环中设置这些值。 你可以做的一件事是将训练数据分类到每个类的单独目录中,并循环遍历每个目录中的图像,并根据目录设置标签。
接下来要做的是设置您的SVM参数。 这些值将根据您的项目而有所不同,但基本上您会声明一个CvSVMParams
对象并设置值:
CvSVMParams params;
params.svm_type = CvSVM::C_SVC;
params.kernel_type = CvSVM::POLY;
params.gamma = 3;
// ...etc
在线提供了几个关于如何设置这些参数的示例,如您在问题中发布的链接。
接下来,您将创建一个CvSVM
对象并根据您的数据进行训练!
CvSVM svm;
svm.train(training_mat, labels, Mat(), Mat(), params);
根据您拥有的数据量,这可能需要很长时间。 但是,在完成训练之后,您可以保存训练有素的SVM,这样您就不必每次都重新训练。
svm.save("svm_filename"); // saving
svm.load("svm_filename"); // loading
要使用训练svm.predict()
SVM测试图像,只需读取图像,将其转换为1D矩阵,然后将其传递给svm.predict()
:
svm.predict(img_mat_1d);
它会根据您设置的标签返回一个值(例如,基于我上面的眼睛/非眼睛示例,-1或1)。 或者,如果您想一次测试多个图像,则可以创建一个与之前定义的训练矩阵具有相同格式的矩阵,并将其作为参数传入。 不过,返回值会有所不同。
祝你好运!
链接地址: http://www.djcxy.com/p/67007.html