OpenCV:旋转/平移向量到OpenGL模型视图矩阵

我试图用OpenCV来做一些基本的增强现实。 我正在使用findChessboardCorners从相机图像获取一组点。 然后,我沿着z = 0平面创建一个3D四边形,并使用solvePnP获得成像点与平面点之间的单应性。 从那里,我想我应该能够建立一个模型视图矩阵,这将允许我在图像顶部渲染一个具有正确姿势的立方体。

solvePnP的文档说,它输出一个旋转向量“(与[平移向量]一起)将模型坐标系中的点带到相机坐标系统中。” 我认为这与我想要的是相反的; 因为我的四边形是在z = 0的平面上的,所以我想要一个模型视图矩阵,它将把这个四边形转换为合适的3D平面。

我认为通过以相反的顺序执行相反的旋转和平移,我可以计算出正确的模型视图矩阵,但这似乎不起作用。 虽然渲染对象(立方体)确实随着相机图像移动,并且似乎大致正确地平移,但旋转根本不起作用; 它在多个轴上,只能在一个轴上旋转,有时在错误的方向旋转。 以下是我到目前为止所做的:

std::vector<Point2f> corners;
bool found = findChessboardCorners(*_imageBuffer, cv::Size(5,4), corners,
                                      CV_CALIB_CB_FILTER_QUADS |
                                      CV_CALIB_CB_FAST_CHECK);
if(found)
{
  drawChessboardCorners(*_imageBuffer, cv::Size(6, 5), corners, found);

  std::vector<double> distortionCoefficients(5);  // camera distortion
  distortionCoefficients[0] = 0.070969;
  distortionCoefficients[1] = 0.777647;
  distortionCoefficients[2] = -0.009131;
  distortionCoefficients[3] = -0.013867;
  distortionCoefficients[4] = -5.141519;

  // Since the image was resized, we need to scale the found corner points
  float sw = _width / SMALL_WIDTH;
  float sh = _height / SMALL_HEIGHT;
  std::vector<Point2f> board_verts;
  board_verts.push_back(Point2f(corners[0].x * sw, corners[0].y * sh));
  board_verts.push_back(Point2f(corners[15].x * sw, corners[15].y * sh));
  board_verts.push_back(Point2f(corners[19].x * sw, corners[19].y * sh));
  board_verts.push_back(Point2f(corners[4].x * sw, corners[4].y * sh));
  Mat boardMat(board_verts);

  std::vector<Point3f> square_verts;
  square_verts.push_back(Point3f(-1, 1, 0));                              
  square_verts.push_back(Point3f(-1, -1, 0));
  square_verts.push_back(Point3f(1, -1, 0));
  square_verts.push_back(Point3f(1, 1, 0));
  Mat squareMat(square_verts);

  // Transform the camera's intrinsic parameters into an OpenGL camera matrix
  glMatrixMode(GL_PROJECTION);
  glLoadIdentity();

  // Camera parameters
  double f_x = 786.42938232; // Focal length in x axis
  double f_y = 786.42938232; // Focal length in y axis (usually the same?)
  double c_x = 217.01358032; // Camera primary point x
  double c_y = 311.25384521; // Camera primary point y


  cv::Mat cameraMatrix(3,3,CV_32FC1);
  cameraMatrix.at<float>(0,0) = f_x;
  cameraMatrix.at<float>(0,1) = 0.0;
  cameraMatrix.at<float>(0,2) = c_x;
  cameraMatrix.at<float>(1,0) = 0.0;
  cameraMatrix.at<float>(1,1) = f_y;
  cameraMatrix.at<float>(1,2) = c_y;
  cameraMatrix.at<float>(2,0) = 0.0;
  cameraMatrix.at<float>(2,1) = 0.0;
  cameraMatrix.at<float>(2,2) = 1.0;

  Mat rvec(3, 1, CV_32F), tvec(3, 1, CV_32F);
  solvePnP(squareMat, boardMat, cameraMatrix, distortionCoefficients, 
               rvec, tvec);

  _rv[0] = rvec.at<double>(0, 0);
  _rv[1] = rvec.at<double>(1, 0);
  _rv[2] = rvec.at<double>(2, 0);
  _tv[0] = tvec.at<double>(0, 0);
  _tv[1] = tvec.at<double>(1, 0);
  _tv[2] = tvec.at<double>(2, 0);
}

然后在绘图代码中...

GLKMatrix4 modelViewMatrix = GLKMatrix4MakeTranslation(0.0f, 0.0f, 0.0f);
modelViewMatrix = GLKMatrix4Translate(modelViewMatrix, -tv[1], -tv[0], -tv[2]);
modelViewMatrix = GLKMatrix4Rotate(modelViewMatrix, -rv[0], 1.0f, 0.0f, 0.0f);
modelViewMatrix = GLKMatrix4Rotate(modelViewMatrix, -rv[1], 0.0f, 1.0f, 0.0f);
modelViewMatrix = GLKMatrix4Rotate(modelViewMatrix, -rv[2], 0.0f, 0.0f, 1.0f);

我渲染的顶点在原点周围创建了一个单位长度的立方体(即沿每条边从-0.5到0.5)。我知道OpenGL翻译函数以“逆序”执行变换,所以上面应该沿着z,y,然后x轴,然后翻译它。 不过,它似乎是先翻译后旋转的,所以苹果的GLKMatrix4工作方式可能不同吗?

这个问题看起来与我的非常相似,特别是coder9的答案似乎可能或多或少是我正在寻找的。 然而,我尝试了它并将结果与​​我的方法进行了比较,并且我在两种情况下得到的矩阵都是相同的。 我觉得答案是对的,但我错过了一些关键的细节。


您必须确保轴正对着正确的方向。 尤其是,在OpenGL和OpenCV中,y轴和z轴面向不同的方向,以确保xyz基础是直接的。 您可以在此博客文章中找到一些信息和代码(使用iPad相机)。

- 编辑 -阿好。 不幸的是,我使用这些资源来反过来(opengl ---> opencv)来测试一些算法。 我的主要问题是图像的行顺序在OpenGL和OpenCV之间反转(这可能有帮助)。

模拟摄像机时,我遇到了相同的投影矩阵,这些矩阵可以在这里和广义投影矩阵纸中找到。 这篇博文的评论中引用的这篇论文也展示了计算机视觉与OpenGL预测之间的某种联系。


我不是IOS程序员,所以这个答案可能会误导人! 如果问题不是按照应用旋转和平移的顺序,那么建议使用更简单和更常用的坐标系。

角向量中的点在图像的左上角具有原点(0,0),而y轴朝向图像的底部。 通常从数学中我们习惯于考虑坐标系,原点在中心,y轴朝向图像顶部。 根据你推入board_verts的坐标,我猜你正在犯同样的错误。 如果是这样的话,很容易通过这样的东西来改变角落的位置:

for (i=0;i<corners.size();i++) {
  corners[i].x -= width/2;
  corners[i].y = -corners[i].y + height/2;
}

那么你可以调用solvePnP()。 调试这并不困难,只需打印四个角的位置和估计的R和T,并查看它们是否有意义。 然后,您可以继续进行OpenGL步骤。 请让我知道它是怎么回事。

链接地址: http://www.djcxy.com/p/37167.html

上一篇: OpenCV: rotation/translation vector to OpenGL modelview matrix

下一篇: How does cube shadowmapping algorithm work?