相机内外参矩阵:从3D世界坐标到2D像素坐标变换

发布于:2025-07-27 ⋅ 阅读:(16) ⋅ 点赞:(0)

介绍

相机参数矩阵描述了三维世界到二维图像的投影关系,分为内参矩阵(Intrinsic Matrix)和外参矩阵(Extrinsic Matrix)。以下是详细解释和坐标变换公式:


1. 内参矩阵(Intrinsic Matrix, K)

作用:将相机坐标系下的3D点投影到图像像素坐标系(2D),描述相机自身的几何和光学特性。
公式
K = [ f x s u 0 0 f y v 0 0 0 1 ] K = \begin{bmatrix} f_x & s & u_0 \\ 0 & f_y & v_0 \\ 0 & 0 & 1 \end{bmatrix} K= fx00sfy0u0v01
参数含义

  • (f_x, f_y):焦距(单位为像素),分别表示x和y方向的缩放因子(受传感器尺寸和镜头焦距影响)。
  • (u_0, v_0):主点坐标(Principal Point),即光轴与图像平面的交点(通常接近图像中心)。
  • (s):轴倾斜参数(Skew),描述图像坐标轴的倾斜程度(现代相机通常为0)。

2. 外参矩阵(Extrinsic Matrix, [R|t])

作用:将世界坐标系下的3D点变换到相机坐标系,描述相机在空间中的位置和姿态(旋转+平移)。
公式
外参 = [ R ∣ t ] = [ r 11 r 12 r 13 t x r 21 r 22 r 23 t y r 31 r 32 r 33 t z ] \text{外参} = [R \mid t] = \begin{bmatrix} r_{11} & r_{12} & r_{13} & t_x \\ r_{21} & r_{22} & r_{23} & t_y \\ r_{31} & r_{32} & r_{33} & t_z \end{bmatrix} 外参=[Rt]= r11r21r31r12r22r32r13r23r33txtytz
参数含义

  • (R):3×3旋转矩阵(正交矩阵),表示相机相对于世界坐标系的朝向。
  • (t):3×1平移向量,表示相机光心在世界坐标系中的位置。

3. 完整投影过程(世界坐标 → 像素坐标)

设一个3D点在世界坐标系中的齐次坐标为 P w = [ X w , Y w , Z w , 1 ] T P_w = [X_w, Y_w, Z_w, 1]^T Pw=[Xw,Yw,Zw,1]T,其投影到像素坐标 p = [ u , v , 1 ] T p = [u, v, 1]^T p=[u,v,1]T 的流程如下:

步骤1:世界坐标 → 相机坐标(外参变换)

[ X c Y c Z c 1 ] = [ R t 0 1 ] [ X w Y w Z w 1 ] 或 P c = R ⋅ P w + t \begin{bmatrix} X_c \\ Y_c \\ Z_c \\ 1 \end{bmatrix} = \begin{bmatrix} R & t \\ 0 & 1 \end{bmatrix} \begin{bmatrix} X_w \\ Y_w \\ Z_w \\ 1 \end{bmatrix} \quad \text{或} \quad P_c = R \cdot P_w + t XcYcZc1 =[R0t1] XwYwZw1 Pc=RPw+t

步骤2:相机坐标 → 归一化图像坐标(透视投影)

[ x y 1 ] = 1 Z c [ X c Y c Z c ] ⇒ { x = X c / Z c y = Y c / Z c \begin{bmatrix} x \\ y \\ 1 \end{bmatrix} = \frac{1}{Z_c} \begin{bmatrix} X_c \\ Y_c \\ Z_c \end{bmatrix} \quad \Rightarrow \quad \begin{cases} x = X_c / Z_c \\ y = Y_c / Z_c \end{cases} xy1 =Zc1 XcYcZc {x=Xc/Zcy=Yc/Zc

步骤3:归一化坐标 → 像素坐标(内参变换)

[ u v 1 ] = K [ x y 1 ] = [ f x x + s y + u 0 f y y + v 0 1 ] \begin{bmatrix} u \\ v \\ 1 \end{bmatrix} = K \begin{bmatrix} x \\ y \\ 1 \end{bmatrix} = \begin{bmatrix} f_x x + s y + u_0 \\ f_y y + v_0 \\ 1 \end{bmatrix} uv1 =K xy1 = fxx+sy+u0fyy+v01

整合公式(直接投影)

Z c [ u v 1 ] = K ⋅ [ R ∣ t ] [ X w Y w Z w 1 ] Z_c \begin{bmatrix} u \\ v \\ 1 \end{bmatrix} = K \cdot [R \mid t] \begin{bmatrix} X_w \\ Y_w \\ Z_w \\ 1 \end{bmatrix} Zc uv1 =K[Rt] XwYwZw1


4. 关键坐标变换总结

坐标系 符号 转换关系
世界坐标系 (World) P w P_w Pw 参考全局坐标
相机坐标系 (Camera) P c P_c Pc P c = R P w + t P_c = R P_w + t Pc=RPw+t
归一化坐标系 (Normalized) ( x , y ) (x,y) (x,y) x = X c / Z c , y = Y c / Z c x = X_c/Z_c, y = Y_c/Z_c x=Xc/Zc,y=Yc/Zc
像素坐标系 (Pixel) ( u , v ) (u,v) (u,v) u = f x x + u 0 , v = f y y + v 0 u = f_x x + u_0, v = f_y y + v_0 u=fxx+u0,v=fyy+v0

5. 畸变参数(补充)

实际相机还需考虑镜头畸变(径向畸变、切向畸变),使用以下模型修正归一化坐标 ( x , y ) (x, y) (x,y)
{ x corrected = x ( 1 + k 1 r 2 + k 2 r 4 ) + 2 p 1 x y + p 2 ( r 2 + 2 x 2 ) y corrected = y ( 1 + k 1 r 2 + k 2 r 4 ) + p 1 ( r 2 + 2 y 2 ) + 2 p 2 x y \begin{cases} x_{\text{corrected}} = x (1 + k_1 r^2 + k_2 r^4) + 2 p_1 x y + p_2 (r^2 + 2x^2) \\ y_{\text{corrected}} = y (1 + k_1 r^2 + k_2 r^4) + p_1 (r^2 + 2y^2) + 2 p_2 x y \end{cases} {xcorrected=x(1+k1r2+k2r4)+2p1xy+p2(r2+2x2)ycorrected=y(1+k1r2+k2r4)+p1(r2+2y2)+2p2xy
其中 r 2 = x 2 + y 2 r^2 = x^2 + y^2 r2=x2+y2,参数 k 1 , k 2 k_1, k_2 k1,k2 为径向畸变系数, p 1 , p 2 p_1, p_2 p1,p2 为切向畸变系数。


6. 示例(OpenCV 模型)

在OpenCV中,投影过程定义为:

u = f_x * (X_c / Z_c) + u_0
v = f_y * (Y_c / Z_c) + v_0

外参通过 solvePnP 求解,内参和畸变参数通过 calibrateCamera 标定。


总结

  • 内参矩阵 K K K:相机自身属性(焦距、主点、倾斜)。
  • 外参 [ R ∣ t ] [R \mid t] [Rt]:相机在世界中的位置和姿态。
  • 投影公式 Z c p = K [ R ∣ t ] P w Z_c p = K [R \mid t] P_w Zcp=K[Rt]Pw
  • 畸变模型:修正非线性误差,提升精度。

网站公告

今日签到

点亮在社区的每一天
去签到