矩阵的范数和逆矩阵的范数的关系

发布于:2025-07-01 ⋅ 阅读:(22) ⋅ 点赞:(0)

矩阵的范数和逆矩阵的范数之间的关系是线性代数中的一个重要主题,尤其是在数值分析和矩阵理论中。

前提条件

  • 我们讨论的是方阵 A A A 的情况,因为只有方阵才可能存在逆矩阵。
  • 矩阵 A A A可逆的(即 det ⁡ ( A ) ≠ 0 \det(A) \neq 0 det(A)=0),这意味着 A − 1 A^{-1} A1 存在。

关键结论

对于一个给定的矩阵范数 ∥ ⋅ ∥ \|\cdot\| ,如果 A A A 是可逆的,则有以下不等式成立:

∥ A − 1 ∥ ≥ 1 ∥ A ∥ \|A^{-1}\| \geq \frac{1}{\|A\|} A1A1

其中, ∥ A ∥ \|A\| A 表示矩阵 A A A 的范数,而 ∥ A − 1 ∥ \|A^{-1}\| A1 则表示其逆矩阵的范数。注意这里的范数可以是任何相容的矩阵范数,如诱导范数(induced norm)、Frobenius范数等。

推导过程简述

考虑向量 x x x 和单位向量 y = A x / ∥ A x ∥ y = Ax/\|Ax\| y=Ax/∥Ax,我们有:

1 = ∥ y ∥ = ∥ A x ∥ A x ∥ ∥ ≤ ∥ A ∥ ⋅ ∥ x ∥ A x ∥ ∥ 1 = \|y\| = \left\|\frac{Ax}{\|Ax\|}\right\| \leq \|A\| \cdot \left\|\frac{x}{\|Ax\|}\right\| 1=y= AxAx A Axx

由此可以得出:

1 ∥ A ∥ ≤ ∥ x ∥ ∥ A x ∥ \frac{1}{\|A\|} \leq \frac{\|x\|}{\|Ax\|} A1Axx

对所有非零向量 x x x 成立。特别地,取 x = A − 1 z x = A^{-1}z x=A1z 对于任意非零向量 z z z,我们得到:

1 ∥ A ∥ ≤ ∥ A − 1 z ∥ ∥ z ∥ \frac{1}{\|A\|} \leq \frac{\|A^{-1}z\|}{\|z\|} A1zA1z

从而得出:

∥ A − 1 ∥ ≥ 1 ∥ A ∥ \|A^{-1}\| \geq \frac{1}{\|A\|} A1A1

注意事项

  • 这个关系表明了逆矩阵的范数至少为原矩阵范数的倒数。然而,在实际应用中, ∥ A − 1 ∥ \|A^{-1}\| A1 可能远大于 1 / ∥ A ∥ 1/\|A\| 1/∥A,特别是在矩阵接近奇异的情况下(即当 det ⁡ ( A ) \det(A) det(A) 非常接近于0时)。
  • 矩阵条件数(condition number)定义为 κ ( A ) = ∥ A ∥ ⋅ ∥ A − 1 ∥ \kappa(A) = \|A\| \cdot \|A^{-1}\| κ(A)=AA1,它衡量了矩阵求解线性系统时的敏感度。条件数越大,意味着矩阵越“病态”,数值计算的结果可能越不稳定。

示例说明

假设有一个 2 × 2 2 \times 2 2×2 矩阵 A A A

A = [ 4 7 2 5 ] A = \begin{bmatrix} 4 & 7 \\ 2 & 5 \end{bmatrix} A=[4275]

其逆矩阵为:

A − 1 = [ 5 / 6 − 7 / 6 − 1 / 3 2 / 3 ] A^{-1} = \begin{bmatrix} 5/6 & -7/6 \\ -1/3 & 2/3 \end{bmatrix} A1=[5/61/37/62/3]

如果我们使用谱范数(spectral norm),即最大奇异值作为范数,则可以通过计算各自的奇异值来估计范数,并验证上述不等式是否成立。

📘 谱范数定义

矩阵 A A A谱范数定义为它的最大奇异值:

∥ A ∥ 2 = σ max ⁡ ( A ) \|A\|_2 = \sigma_{\max}(A) A2=σmax(A)

而奇异值是矩阵 A T A A^T A ATA 的特征值的平方根。因此,我们可以按以下步骤计算:

  1. 计算 A T A A^T A ATA
  2. 求其特征值
  3. 取最大特征值的平方根即为谱范数

✅ 步骤一:计算 A T A A^T A ATA

A T = [ 4 2 7 5 ] , A T A = [ 4 2 7 5 ] [ 4 7 2 5 ] = [ 4 2 + 2 2 4 ⋅ 7 + 2 ⋅ 5 7 ⋅ 4 + 5 ⋅ 2 7 2 + 5 2 ] = [ 20 38 38 74 ] A^T = \begin{bmatrix} 4 & 2 \\ 7 & 5 \end{bmatrix}, \quad A^T A = \begin{bmatrix} 4 & 2 \\ 7 & 5 \end{bmatrix} \begin{bmatrix} 4 & 7 \\ 2 & 5 \end{bmatrix} = \begin{bmatrix} 4^2 + 2^2 & 4\cdot7 + 2\cdot5 \\ 7\cdot4 + 5\cdot2 & 7^2 + 5^2 \end{bmatrix} = \begin{bmatrix} 20 & 38 \\ 38 & 74 \end{bmatrix} AT=[4725],ATA=[4725][4275]=[42+2274+5247+2572+52]=[20383874]


✅ 步骤二:求 A T A A^T A ATA 的特征值

M = A T A = [ 20 38 38 74 ] M = A^T A = \begin{bmatrix} 20 & 38 \\ 38 & 74 \end{bmatrix} M=ATA=[20383874]

特征方程为:

det ⁡ ( M − λ I ) = ∣ 20 − λ 38 38 74 − λ ∣ = ( 20 − λ ) ( 74 − λ ) − 3 8 2 \det(M - \lambda I) = \begin{vmatrix} 20 - \lambda & 38 \\ 38 & 74 - \lambda \end{vmatrix} = (20 - \lambda)(74 - \lambda) - 38^2 det(MλI)= 20λ383874λ =(20λ)(74λ)382

展开:

( 20 − λ ) ( 74 − λ ) = 1480 − 94 λ + λ 2 3 8 2 = 1444 (20 - \lambda)(74 - \lambda) = 1480 - 94\lambda + \lambda^2 \\ 38^2 = 1444 (20λ)(74λ)=148094λ+λ2382=1444

所以特征方程为:

λ 2 − 94 λ + 36 = 0 \lambda^2 - 94\lambda + 36 = 0 λ294λ+36=0

使用求根公式:

λ = 94 ± 9 4 2 − 4 ⋅ 1 ⋅ 36 2 = 94 ± 8836 − 144 2 = 94 ± 8692 2 \lambda = \frac{94 \pm \sqrt{94^2 - 4 \cdot 1 \cdot 36}}{2} = \frac{94 \pm \sqrt{8836 - 144}}{2} = \frac{94 \pm \sqrt{8692}}{2} λ=294±9424136 =294±8836144 =294±8692

8692 ≈ 93.23 ⇒ λ 1 ≈ 94 + 93.23 2 = 93.615 , λ 2 ≈ 94 − 93.23 2 = 0.385 \sqrt{8692} \approx 93.23 \Rightarrow \lambda_1 \approx \frac{94 + 93.23}{2} = 93.615, \quad \lambda_2 \approx \frac{94 - 93.23}{2} = 0.385 8692 93.23λ1294+93.23=93.615,λ229493.23=0.385


✅ 步骤三:取最大特征值的平方根

∥ A ∥ 2 = λ max ⁡ = 93.615 ≈ 9.68 \|A\|_2 = \sqrt{\lambda_{\max}} = \sqrt{93.615} \approx 9.68 A2=λmax =93.615 9.68


✅ 对 A − 1 A^{-1} A1 做同样的操作

先写出:
A − 1 = [ 5 6 − 7 6 − 1 3 2 3 ] ⇒ ( A − 1 ) T = [ 5 6 − 1 3 − 7 6 2 3 ] A^{-1} = \begin{bmatrix} \frac{5}{6} & -\frac{7}{6} \\ -\frac{1}{3} & \frac{2}{3} \end{bmatrix} \Rightarrow (A^{-1})^T = \begin{bmatrix} \frac{5}{6} & -\frac{1}{3} \\ -\frac{7}{6} & \frac{2}{3} \end{bmatrix} A1=[65316732](A1)T=[65673132]

计算 ( A − 1 ) T A − 1 (A^{-1})^T A^{-1} (A1)TA1

( A − 1 ) T A − 1 = [ 5 6 − 1 3 − 7 6 2 3 ] [ 5 6 − 7 6 − 1 3 2 3 ] = [ ( 5 6 ) 2 + ( − 1 3 ) 2 5 6 ⋅ ( − 7 6 ) + ( − 1 3 ) ⋅ 2 3 ( − 7 6 ) ⋅ 5 6 + 2 3 ⋅ ( − 1 3 ) ( − 7 6 ) 2 + ( 2 3 ) 2 ] (A^{-1})^T A^{-1} = \begin{bmatrix} \frac{5}{6} & -\frac{1}{3} \\ -\frac{7}{6} & \frac{2}{3} \end{bmatrix} \begin{bmatrix} \frac{5}{6} & -\frac{7}{6} \\ -\frac{1}{3} & \frac{2}{3} \end{bmatrix} = \begin{bmatrix} \left(\frac{5}{6}\right)^2 + \left(-\frac{1}{3}\right)^2 & \frac{5}{6} \cdot \left(-\frac{7}{6}\right) + \left(-\frac{1}{3}\right)\cdot\frac{2}{3} \\ \left(-\frac{7}{6}\right)\cdot\frac{5}{6} + \frac{2}{3}\cdot\left(-\frac{1}{3}\right) & \left(-\frac{7}{6}\right)^2 + \left(\frac{2}{3}\right)^2 \end{bmatrix} (A1)TA1=[65673132][65316732]=[(65)2+(31)2(67)65+32(31)65(67)+(31)32(67)2+(32)2]

逐项计算:

  • 第 (1,1) 项: 25 36 + 1 9 = 25 36 + 4 36 = 29 36 \frac{25}{36} + \frac{1}{9} = \frac{25}{36} + \frac{4}{36} = \frac{29}{36} 3625+91=3625+364=3629
  • 第 (1,2) 项: − 35 36 − 2 9 = − 35 36 − 8 36 = − 43 36 -\frac{35}{36} - \frac{2}{9} = -\frac{35}{36} - \frac{8}{36} = -\frac{43}{36} 363592=3635368=3643
  • 第 (2,2) 项: 49 36 + 4 9 = 49 36 + 16 36 = 65 36 \frac{49}{36} + \frac{4}{9} = \frac{49}{36} + \frac{16}{36} = \frac{65}{36} 3649+94=3649+3616=3665

所以:
( A − 1 ) T A − 1 = [ 29 36 − 43 36 − 43 36 65 36 ] (A^{-1})^T A^{-1} = \begin{bmatrix} \frac{29}{36} & -\frac{43}{36} \\ -\frac{43}{36} & \frac{65}{36} \end{bmatrix} (A1)TA1=[3629364336433665]

接下来求这个矩阵的最大特征值:

特征方程:
det ⁡ ( [ 29 36 − λ − 43 36 − 43 36 65 36 − λ ] ) = 0 \det\left( \begin{bmatrix} \frac{29}{36} - \lambda & -\frac{43}{36} \\ -\frac{43}{36} & \frac{65}{36} - \lambda \end{bmatrix} \right) = 0 det([3629λ364336433665λ])=0

( 29 36 − λ ) ( 65 36 − λ ) − ( 43 36 ) 2 = 0 \left(\frac{29}{36} - \lambda\right)\left(\frac{65}{36} - \lambda\right) - \left(\frac{43}{36}\right)^2 = 0 (3629λ)(3665λ)(3643)2=0

展开得:
λ 2 − ( 94 36 ) λ + ( 29 ⋅ 65 − 4 3 2 3 6 2 ) = 0 \lambda^2 - \left(\frac{94}{36}\right)\lambda + \left(\frac{29\cdot65 - 43^2}{36^2}\right) = 0 λ2(3694)λ+(3622965432)=0

计算常数项:

  • 29 ⋅ 65 = 1885 29 \cdot 65 = 1885 2965=1885
  • 4 3 2 = 1849 43^2 = 1849 432=1849
  • 所以分子为 1885 − 1849 = 36 1885 - 1849 = 36 18851849=36

代入后:
λ 2 − 94 36 λ + 36 1296 = λ 2 − 94 36 λ + 1 36 = 0 \lambda^2 - \frac{94}{36}\lambda + \frac{36}{1296} = \lambda^2 - \frac{94}{36}\lambda + \frac{1}{36} = 0 λ23694λ+129636=λ23694λ+361=0

用求根公式解:
λ = 94 36 ± ( 94 36 ) 2 − 4 36 2 ≈ 2.611 ± 6.817 − 0.111 2 = 2.611 ± 6.706 2 ≈ 2.611 ± 2.590 2 \lambda = \frac{\frac{94}{36} \pm \sqrt{\left(\frac{94}{36}\right)^2 - \frac{4}{36}}}{2} \approx \frac{2.611 \pm \sqrt{6.817 - 0.111}}{2} = \frac{2.611 \pm \sqrt{6.706}}{2} \approx \frac{2.611 \pm 2.590}{2} λ=23694±(3694)2364 22.611±6.8170.111 =22.611±6.706 22.611±2.590

得到两个特征值:

  • λ 1 ≈ 5.201 2 = 2.6005 \lambda_1 \approx \frac{5.201}{2} = 2.6005 λ125.201=2.6005
  • λ 2 ≈ 0.021 2 = 0.0105 \lambda_2 \approx \frac{0.021}{2} = 0.0105 λ220.021=0.0105

所以:

∥ A − 1 ∥ 2 = λ max ⁡ = 2.6005 ≈ 1.613 \|A^{-1}\|_2 = \sqrt{\lambda_{\max}} = \sqrt{2.6005} \approx 1.613 A12=λmax =2.6005 1.613


✅ 最终结果总结
矩阵 谱范数
A A A ∣ A ∣ 2 ≈ 9.68 |A|_2 \approx 9.68 A29.68
A − 1 A^{-1} A1 ∣ A − 1 ∣ 2 ≈ 1.613 |A^{-1}|_2 \approx 1.613 A121.613

📌 验证关系: ∥ A − 1 ∥ ≥ 1 ∥ A ∥ \|A^{-1}\| \geq \frac{1}{\|A\|} A1A1

1 ∥ A ∥ ≈ 1 9.68 ≈ 0.1033 < 1.613 = ∥ A − 1 ∥ \frac{1}{\|A\|} \approx \frac{1}{9.68} \approx 0.1033 < 1.613 = \|A^{-1}\| A19.6810.1033<1.613=A1

✅ 成立!


网站公告

今日签到

点亮在社区的每一天
去签到