8.2 线性变换的矩阵-EW帮帮网

一、线性变换的矩阵

本节将对每个线性变换 $T$ 都指定一个矩阵 $A$ . 对于一般的列向量，输入 $\boldsymbol v$ 在空间 $\pmb{\textrm V}=\pmb{\textrm R}^n$ 中，输出 $T(\boldsymbol v)$ 在空间 $\textrm{\pmb W}=\pmb{\textrm R}^m$ 中，则这个变换的矩阵 $A$ 即是 $m\times n$ 的，我们在 $\textrm{\pmb V}$ 和 $\textrm{\pmb W}$ 中基向量的选取将决定 $A$ .
$\textrm{\pmb R}^n$ 和 $\textrm{\pmb R}^m$ 中的标准基向量是 $I$ 的列向量，这种选择可以得到一个标准矩阵，就是通常情况下的 $T(\boldsymbol v)=A\boldsymbol v$ . 但是这些空间也有其它的基，所以同样的变换 $T$ 还可以用其它的矩阵表示。线性代数的主要研究目的之一就是选择出线性变换 $T$ 的最佳矩阵（对角矩阵）。
所有的向量空间 $\textrm{\pmb V}$ 和 $\pmb{\textrm W}$ 都有基，选择每一种基都会得到 $T$ 的一个矩阵，当输入基和输出基不相等时， $T(\boldsymbol v)=\boldsymbol v$ 的矩阵就不再是单位矩阵 $I$ ，而是 “基变换矩阵（change of basis matrix）”. 以下是核心思想：

假设我们已知输入基向量 $\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_n$ 的变换 $T(\boldsymbol v_1),T(\boldsymbol v_2),\cdots,T(\boldsymbol v_n)$ .
则这个矩阵 $A$ 的第 $1$ 列到第 $n$ 列是这些输出 $T(\boldsymbol v_1),T(\boldsymbol v_2),\cdots,T(\boldsymbol v_n)$ . 此处输出基向量是标准正交基向量。
$\pmb{A\,左乘\,\boldsymbol c=矩阵左乘向量=A\,的\,n\,个列向量的线性组合}$ .
$A\boldsymbol c$ 就是线性组合 $c_1T(\boldsymbol v_1)+c_2T(\boldsymbol v_2)+\cdots+c_nT(\boldsymbol v_n)=T(\boldsymbol v)$ .

原因： 每个 $\boldsymbol v$ 都是基向量 $\boldsymbol v_j$ 唯一的线性组合 $c_1\boldsymbol v_1+c_2\boldsymbol v_2+\cdots+c_n\boldsymbol v_n$ ，由于 $T$ 是线性变换， $T(\boldsymbol v)$ 一定是输出向量 $T(\boldsymbol v_j)$ 相同的线性组合 $c_1T(\boldsymbol v_1)+c_2T(\boldsymbol v_2)+\cdots+c_nT(\boldsymbol v_n)$ .
例1 中给出的矩阵 $A$ 选择的是 $\textrm {\pmb R}^2$ 和 $\textrm{\pmb R}^3$ 空间中的标准基向量。

【例1】假设变换 $T$ 将基向量 $\boldsymbol v_1=(1,0)$ 变换为 $T(\boldsymbol v_1)=(2,3,4)$ ，将第二个基向量 $\boldsymbol v_2=(0,1)$ 变换为 $T(\boldsymbol v_2)=(5,5,5)$ . 如果 $T$ 是 $\textrm{\pmb R}^2$ 到 $R3 \pmb{\textrm R}^3$ 的线性变换，则这个 “标准矩阵” 是 $3\times2$ 的。输出向量 $T(\boldsymbol v_1)$ 和 $T(\boldsymbol v_2)$ 是 $A$ 的列向量： $A=\begin{bmatrix}2&5\\3&5\\4&5\end{bmatrix}\kern 20ptc_1=1\,且\,c_2=1\,得到\,T(\boldsymbol v_1+\boldsymbol v_2)=\begin{bmatrix}2&5\\3&5\\4&5\end{bmatrix}\begin{bmatrix}1\\1\end{bmatrix}=\begin{bmatrix}7\\8\\9\end{bmatrix}$

二、基的变换

【例2】假设输入空间 $\textrm{\pmb V}=\textrm{\pmb R}^2$ 也是输出空间 $\textrm{\pmb W}=\textrm{\pmb R}^2$ ， $T(\boldsymbol v)=\boldsymbol v$ 是恒等变换（identity transformation），此时我们可能会认为变换矩阵就是单位矩阵 $I$ ，但是这只有在输入基和输出基相同的情况下才会出现。下面会选择不同的基以演示矩阵是如何构造的。
对于这种特殊情况 $T(\boldsymbol v)=\boldsymbol v$ ，这里用矩阵 $B$ 来替代 $A$ ，我们要将基 $\boldsymbol v_i$ 变换为基 $\boldsymbol w_i$ ，每个 $\boldsymbol v_i$ 均为 $\boldsymbol w_1$ 和 $\boldsymbol w_2$ 的线性组合。 $\begin{array}{l}\pmb{输入基}\kern 5pt\begin{bmatrix}\boldsymbol v_1&\boldsymbol v_2\end{bmatrix}=\begin{bmatrix}3&6\\3&8\end{bmatrix}&\pmb{输出基}\kern 5pt\begin{bmatrix}\boldsymbol w_1&\boldsymbol w_2\end{bmatrix}=\begin{bmatrix}3&0\\1&2\end{bmatrix}&{\color{blue}基的变换}&\begin{matrix}\color{blue}\boldsymbol v_1=\pmb1\boldsymbol w_1+\pmb1\boldsymbol w_2\\\color{blue}\boldsymbol v_2=\pmb2\boldsymbol w_1+\pmb3\boldsymbol w_2\end{matrix}\end{array}$ 请注意！这里将输入基 $\boldsymbol v_1,\boldsymbol v_2$ 用输出基 $\boldsymbol w_1,\boldsymbol w_2$ 来表示，这是因为按照定义，恒等变换 $T$ 作用于每个输出基向量： $T(\boldsymbol v_1)=\boldsymbol v_1,\,T(\boldsymbol v_2)=\boldsymbol v_2$ ，则这里我们将输出向量 $\boldsymbol v_1$ 和 $\boldsymbol v_2$ 用输出基 $\boldsymbol w_1$ 和 $\boldsymbol w_2$ 来表示。这些加粗的数字 $\pmb1,\pmb1$ 和 $\pmb2,\pmb3$ 给出了矩阵 $B$ （基的变换矩阵 the change of basis matrix）的第一列和第二列： $W B = V$ ，所以 $B=W−1V \pmb{B=W^{-1}V}$ . $\begin{array}{l}\pmb{基变换矩阵\,B}&\begin{bmatrix}\boldsymbol w_1&\boldsymbol w_2\end{bmatrix}{\color{blue}\begin{bmatrix}B\end{bmatrix}}=\begin{bmatrix}\boldsymbol v_1&\boldsymbol v_2\end{bmatrix}&就是&\begin{bmatrix}3&0\\1&2\end{bmatrix}\begin{bmatrix}\color{blue}1&\color{blue}2\\\color{blue}1&\color{blue}3\end{bmatrix}=\begin{bmatrix}3&6\\3&8\end{bmatrix}\end{array}\kern 10pt(8.2.1)$

$\begin{array}{l}当输入基是矩阵\,\textrm{\pmb V}\,的列向量，输出基是矩阵\,\textrm{\pmb W}\,的列向量时，T(\boldsymbol v)=\boldsymbol v\,的基变换矩阵是\,\pmb{B=W^{-1}V}\end{array}$

关键点： 理解 $B=W^{-1}V$ 的简单方法：假设同一个向量 $\boldsymbol u$ 分别由输入基 $\boldsymbol v_i$ 和输出基 $\boldsymbol w_j$ 来表示，有下面三种方法： $\begin{array}{l}\boldsymbol u=c_1\boldsymbol v_1+c_2\boldsymbol v_2+\cdots+c_n\boldsymbol v_n\\\boldsymbol u=d_1\boldsymbol w_1+d_2\boldsymbol w_2+\cdots+d_n\boldsymbol w_n&\end{array}即\begin{bmatrix}\boldsymbol v_1&\boldsymbol v_2&\cdots&\boldsymbol v_n\end{bmatrix}\begin{bmatrix}c_1\\c_2\\\vdots\\c_n\end{bmatrix}=\begin{bmatrix}\boldsymbol w_1&\boldsymbol w_2&\cdots&\boldsymbol w_n\end{bmatrix}\begin{bmatrix}d_1\\d_2\\\vdots\\d_n\end{bmatrix}和\kern 5pt\pmb{Vc=Wd}$ 新基 $\boldsymbol w_j$ 的系数 $\pmb d$ 是 $d=W−1Vc \pmb {d= W^{-1}Vc}$ ，则 $\pmb{B=W^{-1}V}.\kern 15pt(8.2.2)$
公式 $B=W−1V \pmb{B=W^{-1}V}$ 给出一个有趣的现象：当标准基 $V=I \pmb{V=I}$ 变成一个不同的基 $\pmb W$ 时，基变换矩阵是不是 $\pmb W$ 而是 $B=W−1V \pmb{B=W^{-1}V}$ . 大的基向量有小的系数！标准基向量 $\begin{bmatrix}x\\y\end{bmatrix}$ 在 $\boldsymbol w_1,\boldsymbol w_2$ 的这组基向量情况下的系数是 $\begin{bmatrix}\boldsymbol w_1&\boldsymbol w_2\end{bmatrix}^{-1}\begin{bmatrix}x\\y\end{bmatrix}$ .

三、变换矩阵的构造

下面我们构造任意一个线性变换的矩阵。假设 $T$ 将 $n$ 维的空间 $\pmb{\textrm V}$ 变换成 $m$ 维的空间 $\pmb{\textrm W}$ ，我们在空间 $\pmb{\textrm V}$ 中选择一组基 $\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_n$ ，在空间 $\pmb{\textrm W}$ 中选择一组基 $\boldsymbol w_1,\boldsymbol w_2,\cdots,\boldsymbol w_n$ ，则变换矩阵 $A$ 是 $m\times n$ 的。为了求得 $A$ 的第一列，将 $T$ 作用于第一个基向量 $\boldsymbol v_1$ ，则输出 $T(\boldsymbol v_1)$ 在空间 $\pmb{\textrm W}$ 中。

${\color{blue}T(\boldsymbol v_1)}\,是空间\,\pmb{\textrm W}\,输出基的一种线性组合\,\color{blue}a_{11}\boldsymbol w_1+a_{21}\boldsymbol w_2+\cdots+a_{m1}\boldsymbol w_m$

$a_{11},a_{21},\cdots,a_{m1}$ 这些数是 $A$ 的第一列，将 $\boldsymbol v_1$ 变换为 $T(\boldsymbol v_1)$ 对应 $A$ 左乘 $(1,0,\cdots,0)$ ，这给出了变换矩阵 $A$ 的第一列。当 $T$ 是求导且第一个基向量是 $1$ 时，它的导数是 $T(\boldsymbol v_1)=\boldsymbol 0$ ，所以下面的导数矩阵中，第一列全为零。

【例3】 $\pmb T$ 是求导运算： $\pmb{T(\boldsymbol v)=\displaystyle\frac{\textrm dv}{\textrm dx}}$ ，此时矩阵 $A$ 是 “求导矩阵（derivate matrix）”，输入基 $\boldsymbol v_i$ 是 $1,x,x^2,x^3$ ，输出基 $\boldsymbol w_j$ 是 $1,x,x^2$ ： $\begin{array}{l}如果\,\boldsymbol v=c_1+c_2x+c_3x^2+c_4x^3\\则\,\displaystyle\frac{d\boldsymbol v}{\textrm dx}=\pmb1c_2+\pmb2c_3x+\pmb3c_4x^2\end{array}\kern 10ptA\boldsymbol c=\begin{bmatrix}0&\pmb1&0&0\\0&0&\pmb2&0\\0&0&0&\pmb3\end{bmatrix}\begin{bmatrix}c_1\\c_2\\c_3\\c_4\end{bmatrix}=\begin{bmatrix}c_2\\2c_3\\3c_4\end{bmatrix}$

$\pmb{关键准则:}\,A\,的第\,j\,列是变换\,T\,作用在第\,j\,个基向量\,\boldsymbol v_j\,所得$
${\color{blue}T(\boldsymbol v_j)=a_{1j}\boldsymbol w_1+a_{2j}\boldsymbol w_2+\cdots+a_{mj}\boldsymbol w_m\,是输出基向量的线性组合}\kern 15pt(8.2.3)$

这些数字 $a_{ij}$ 构成了变换矩阵 $A$ . 变换矩阵可以直接得到基向量的像（basis vectors right），然后线性性质得到所有向量的像。任意向量 $\boldsymbol v$ 都可以写成线性组合 $c_1\boldsymbol v_1+c_2\boldsymbol v_2+\cdots+c_n\boldsymbol v_n$ ， $T(\boldsymbol v)$ 是基向量 $\boldsymbol w_j$ 的一种线性组合。当 $A$ 左乘 $\boldsymbol v$ 的组合系数向量 $\boldsymbol c=(c_1,c_2,\cdots,c_n)$ ， $A\boldsymbol c$ 得到 $T(\boldsymbol v)$ 关于输出基向量的组合系数。这是因为矩阵乘法（列向量的线性组合）和 $T$ 一样是线性的。
矩阵 $A$ 告诉了我们线性变换 $T$ 做了什么，每一个从 $\pmb{\textrm V}$ 到 $\textrm{\pmb W}$ 的线性变换都可以用一个矩阵来表示，这个矩阵取决于基的选择。

【例4】对于积分 $T^+(\boldsymbol v)$ ，第一个基函数也是 $1$ ，它的积分是第二个基函数 $x$ ，所以 “积分矩阵（integral matrix）” $A^+$ 的第一列是 $(0, 1, 0, 0)$ $\begin{array}{l}\pmb{d_1+d_2x+d_3x^2\,的积分是}\\\pmb{d_1x+\displaystyle\frac{1}{2}d_2x^2+\frac{1}{3}d_3x^3}\end{array}\kern 15ptA^+\boldsymbol d=\begin{bmatrix}0&0&0\\\pmb1&0&0\\0&\pmb{\dfrac{1}{2}}&0\\0&0&\pmb{\dfrac{1}{3}}\end{bmatrix}\begin{bmatrix}d_1\\d_2\\d_3\end{bmatrix}=\begin{bmatrix}0\\d_1\\\dfrac{1}{2}d_2\\[1.5ex]\dfrac{1}{3}d_3\end{bmatrix}$ 如果对一个函数先积分再求导，将得到原函数，因此， $AA^+=I$ . 但是如果是先求导再积分，则常数项会消失，因此 $A^+A$ 不是 $I$ . 对 $\pmb 1$ 先求导再积分的结果是零： $T^+T(1)=零函数的积分=0$ 这和 $A^+A$ 是相符的，其第一列都是零。求导变换 $T$ 有一个核（常数函数），它的矩阵 $A$ 有一个零空间。再次出现的主要思想： $A\boldsymbol v$ 表示 $T(\boldsymbol v)$ 的结果。
求导和积分的例子有三个重要的点：第一，线性变换 $T$ 无处不在，例如在微积分、微分方程和线性代数中；第二，与 $Rn \pmb {\textrm R}^n$ 不同的空间很重要，输入空间 $\pmb {\textrm V}$ 和输出空间 $\pmb{\textrm W}$ 都可以是函数空间；第三，如果我们先求导再积分，我们可以将它们的矩阵乘起来 $A+A \pmb{A^+A}$ 后计算。

四、矩阵乘积 AB 对应于变换 TS

下面是一些重要内容 —— 矩阵乘法规则的真正原因。两个线性变换 $T$ 和 $S$ 的矩阵分别是 $A$ 和 $B$ ，现在比较 $TS$ 和乘积 $A B$ ：
当将变换 $T$ 作用于 $S$ 的输出时，由以下规则得到 $TS$ ： $(TS)(\boldsymbol u)\,定义为\,\pmb{T(S(\boldsymbol u))},\,输出\,S(\boldsymbol u)\,成了\,T\,的输入.$ 将矩阵 $A$ 作用于 $B$ 的输出时，由以下规则得到乘积 $A B$ ： $(AB)(\boldsymbol x)\,定义为\,\pmb{A(B(\boldsymbol x))},\,输出\,B\boldsymbol x\,成了\,A\,的输入.$ $\pmb{矩阵乘法规则得到的矩阵\,AB\,是变换\,TS\,的矩阵.}$ 变换 $S$ 是从空间 $\pmb{\textrm U}$ 到空间 $\pmb{\textrm V}$ ，它的矩阵使用了空间 $\pmb{\textrm U}$ 的基 $\boldsymbol u_1,\boldsymbol u_2,\cdots,\boldsymbol u_p$ 和空间 $\pmb{\textrm V}$ 的基 $\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_n$ ，这个矩阵是 $n\times p$ 的。变换 $T$ 是从空间 $\pmb{\textrm V}$ 到空间 $\pmb{\textrm W}$ ，它的变换矩阵一定要使用空间 $\pmb{\textrm V}$ 的同一组基 $\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_n$ ， $\textrm{\pmb V}$ 是 $S$ 的输出空间也是 $T$ 的输入空间。此时矩阵 $AB \pmb{AB}$ 对应于变换 $TS \pmb{TS}$ .

乘法： 线性变换 $TS$ 将 $\textrm {\pmb U}$ 中的任一向量变换到 $\textrm{\pmb V}$ 中的 $S(\boldsymbol u)$ ，再变换到 $\textrm{\pmb W}$ 中的 $T(S(\boldsymbol u))$ . 矩阵 $A B$ 作用于 $\textrm{\pmb R}^p$ 空间中的任一向量 $\boldsymbol x$ ，先得到 $\textrm{\pmb R}^n$ 中的 $B\boldsymbol x$ ，然后得到 $\textrm{\pmb R}^m$ 中的 $AB\boldsymbol x$ . 矩阵 $A B$ 就是变换 $TS$ 的矩阵： $\color{blue}TS：\pmb{\textrm U}\rightarrow\pmb{\textrm V}\rightarrow\pmb{\textrm W}\kern 18ptAB：(m\times n)(n\times p)=(m\times p)$

输入是 $\boldsymbol u=x_1\boldsymbol u_1+x_2\boldsymbol u_2+\cdots+x_p\boldsymbol u_p$ ，输出 $T(S(\boldsymbol u))$ 对应于输出 $AB\boldsymbol x$ . 变换 $TS$ 的复合对应于矩阵的乘积 $A B$ .
最重要的情况是空间 $U,V,W \pmb{\textrm {U,\,V,\,W}}$ 均相同且均选择相同的基，当 $m = n = p$ 时，则变换矩阵均为方阵，所以可以相乘。

【例5】 $S$ 将平面逆时针旋转 $\theta$ ， $T$ 也是逆时针旋转 $\theta$ ，则 $TS$ 逆时针旋转 $2\theta$ ，变换 $T^2$ 的对应旋转矩阵 $A^2$ 也是逆时针旋转 $2\theta$ ： $T=S\kern 15ptA=B\kern 15ptT^2\,是逆时针旋转2\,\theta\kern 15ptA^2=\begin{bmatrix}\cos2\theta&-\sin2\theta\\\sin2\theta&\kern 7pt\cos2\theta\end{bmatrix}\kern 15pt(8.2.4)$ 通过对比变换的平方 $T^2$ 和它们矩阵的平方 $A^2$ ，我们可以得到 $\cos2\theta$ 和 $\sin2\theta$ 的公式。 $A$ 乘 $A$ ： $\begin{bmatrix}\cos\theta&-\sin\theta\\\sin\theta&\kern 7pt\cos\theta\end{bmatrix}\begin{bmatrix}\cos\theta&-\sin\theta\\\sin\theta&\kern 7pt\cos\theta\end{bmatrix}=\begin{bmatrix}\cos^2\theta-\sin^2\theta&-2\sin\theta\cos\theta\\2\sin\theta\cos\theta&\cos^2\theta-\sin^2\theta\end{bmatrix}\kern 15pt(8.4.5)$ 比较（8.2.4）和（8.2.5）可以得到 $\cos2\theta=\cos^2\theta-\sin^2\theta$ 和 $\sin2\theta=2\sin\theta\cos\theta$ . 三角公式（至少是倍角公式）可由线性代数得到。

【例6】 $S$ 逆时针选择角度 $\theta$ ， $T$ 逆时针选择角度 $-\theta$ ，则由 $TS = I$ 可以得到 $A B = I$ . 该情形下 $T(S(\boldsymbol u))$ 就是 $\boldsymbol u$ ，旋转后又旋转回来了。相应的矩阵表示， $AB\boldsymbol x$ 一定就是 $\boldsymbol x$ ，这两个矩阵互为逆矩阵。将 $\cos(-\theta)=\cos\theta$ 和 $\sin(-\theta)=-\sin\theta$ 代入旋转矩阵 $A$ 中即可验证： $AB=\begin{bmatrix}\kern 7pt\cos\theta&\sin\theta\\-\sin\theta&\cos\theta\end{bmatrix}\begin{bmatrix}\cos\theta&-\sin\theta\\\sin\theta&\kern 7pt\cos\theta\end{bmatrix}=\begin{bmatrix}\cos^2\theta+\sin^2\theta&0\\0&\cos^\theta+\sin^2\theta\end{bmatrix}=I$

五、选择最佳基

下面是本节的最后一部分：选择最佳基使得变换矩阵为对角矩阵。使用标准基（ $I$ 的列向量）时，变换 $T$ 的矩阵 $A$ 可能不是对角矩阵；当使用不同的基时，同样的变换 $T$ 会由不同的矩阵表示。选择基向量时，两个很好的选择是特征向量和奇异向量： $\begin{array}{l}\pmb{特征向量}\kern 15pt如果变换 \,T\,将\,\pmb{\textrm R}^n\,映射到\,\textrm{\pmb R}^n，则它的矩阵\,A\,是个方阵。但是使用标准基时，矩阵\,A\,可能不是对角的。\\如果\,A\,有\,n\,个线性无关的特征向量，选择它们作为输入和输出基，使用这组\,“好基”\,时，\pmb{T\,的变换矩阵为\,\Lambda，其对}\\\pmb{角元素是\,A\,的特征值}。\end{array}$ 【例7】投影矩阵 $T$ 将 $R2 \pmb{\textrm R}^2$ 中的每个向量 $\boldsymbol v=(x,y)$ 投影到直线 $y = - x$ 上。若使用标准基， $\boldsymbol v_1=(1,0)$ 的投影为 $T(\boldsymbol v_1)=(\dfrac{1}{2},-\dfrac{1}{2})$ ； $\boldsymbol v_2=(0,1)$ 的投影为 $T(\boldsymbol v_2)=(-\dfrac{1}{2},\dfrac{1}{2})$ ，这些投影构成了 $A$ 的列： $\begin{array}{l}\pmb{标准基下的}\\\pmb{投影矩阵是}\\\pmb{非对角矩阵}\end{array}\kern 15ptA=\begin{bmatrix}\kern 7pt\dfrac{1}{2}&-\dfrac{1}{2}\\[1.5ex]-\dfrac{1}{2}&\kern 7pt\dfrac{1}{2}\end{bmatrix}\,有\,A^T=A\,且\,A^2=A$ 下面是关于选取特征向量作为基向量的情况，可以对角化变换矩阵！
当基向量是原变换矩阵 $A$ 的特征向量时，变换矩阵将变为对角矩阵。 $\begin{array}{l}\boldsymbol v_1=\boldsymbol w_1=(1,-1)\,投影到自身：T(\boldsymbol v_1)=\boldsymbol v_1，对应\,\lambda_1=1\\\boldsymbol v_2=\boldsymbol w_2=(1,1)\,投影到零向量：T(\boldsymbol v_2)=\boldsymbol 0，对应\,\lambda_2=0\end{array}$ $\begin{array}{l}\pmb{特征向量基}\\\pmb{对应对角矩阵}\end{array}\kern 15pt新的变换矩阵是\,\begin{bmatrix}1&0\\0&0\end{bmatrix}=\begin{bmatrix}\lambda_1&0\\0&\lambda_2\end{bmatrix}=\Lambda\kern 20pt(8.2.6)$ 特征向量是完美的基向量，它们给出特征值矩阵 $\Lambda$ .
当输入基和输出基相同但并不一定是特征向量时会怎样的？将这些基向量 $\boldsymbol b_i$ 作为 $B$ 的列，则基变换矩阵（从标准基到新基）是 $\pmb{B_{\textrm{in}}}=\pmb B$ ， $\pmb{B_{\textrm{out}}}=\pmb{ B^{-1}}$ ， $T$ 新的变换矩阵和 $A$ 相似：

新基 $\boldsymbol b_i$ 的变换矩阵 $\pmb{A_{\textrm{new}}}=\pmb{B^{-1}AB}$ 与标准基的变换矩阵 $\pmb A$ 相似： ${\color{blue}A_{\boldsymbol b_i到\,\boldsymbol b_i}=B^{-1}_{标准基到\,\boldsymbol b_i}A_{标准基}B_{\boldsymbol b_i到标准基}}\kern 20pt(8.2.7)$

原因： 设标准基下的坐标向量为 $\boldsymbol v$ ，变换矩阵是 $A$ 。新基矩阵为 $B$ ，新的变换矩阵是 $A_{\textrm{new}}$ . $\,\boldsymbol v$ 在新基的坐标可以由 $\boldsymbol v=B\boldsymbol x$ 求得，即新基下的坐标向量 $\boldsymbol x=B^{-1}\boldsymbol v$ ，其中 $B^{-1}$ 即为基变换矩阵。经变换 $T$ 作用后的坐标为 $A_{\textrm{new}}\boldsymbol x=A_{\textrm{new}}B^{-1}\boldsymbol v$ 。而 $\boldsymbol v$ 在标准基下经过 $T$ 变换后为 $A\boldsymbol v$ ，将其转换为新基的坐标即为 $B^{-1}A\boldsymbol v$ ，这两者应相等，即 $A_{\textrm{new}}B^{-1}\boldsymbol v=B^{-1}A$ ，即可求得 $A_{\textrm{new}}=B^{-1}AB$ ！
这里也可以通过变换的乘积法则理解：对于变换 $I T I$ ， $I$ 是恒等变换，它们的矩阵分别是 $B^{-1},A,B$ . 矩阵 $B$ 是由标准基下的输入向量 $\boldsymbol b_i$ 组成。将其理解成左乘，即先是基变换矩阵由新基到标准基 $B$ ，然后在标准基下进行变换得 $A B$ ，最后再变换为新基即得到 $B^{-1}AB$ .
最后考虑 $\pmb V$ 和 $\pmb W$ 是不同的空间情形，此时有不同的基 $\boldsymbol v_i$ 和 $\boldsymbol w_j$ . 当我们选定基后且给出变换 $T$ ，我们可以得到一个矩阵 $A$ ，此时 $A$ 可能不是对称的，甚至可能不是方阵，但是我们总可以选择出基 $\boldsymbol v_i$ 和 $\boldsymbol w_j$ 使得这个矩阵是对角矩阵。这个矩阵就是奇异值分解 $A=U\Sigma V^T$ 中的奇异值矩阵 $\pmb{\Sigma=\textrm{diag}(\sigma_1,\sigma_2,\cdots,\sigma_r)}$ ，其中 $\textrm{diag}(\sigma_1,\sigma_2,\cdots,\sigma_r)$ 是 MATLAB 中的函数，表示对角元素是 $\sigma_1,\sigma_2,\cdots,\sigma_r$ 的对角矩阵。 $\begin{array}{l}\pmb{奇异向量}\kern 15pt\textrm{SVD}\,给出了\,U^{-1}AV=\Sigma，右奇异值向量\,\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_n\,是输入基，左奇异值向量\,\boldsymbol u_1,\boldsymbol u_2,\cdots,\boldsymbol u_m\\是输出基。由矩阵的乘法法则，在这些新基下的同样的变换矩阵为\,B^{-1}_{\textrm{out}}AB_{\textrm{in}}=U^{-1}AV=\Sigma.\end{array}$ 这里就不能称 $\Sigma$ 和 $A$ “相似” 了。现在是有两个基，输入基和输出基，它们都是标准正交基所以保持了向量的长度。这里我们可以称 $\Sigma$ 和 $A$ 是 “等距的（isometric）”。 $定义\kern 20pt如果\,Q_1\,和\,Q_2\,均为正交矩阵，则\,C=Q_1^{-1}AQ_2\,与\,A\,等距.$ 【例8】为了构造变换 $T=\dfrac{\textrm d}{\textrm dx}$ 的矩阵 $A$ ，我们选择了输入基 $1,x,x^2,x^3$ 和输出基 $1,x,x^2$ ，矩阵 $A$ 很简单但可惜的是它并不是对角矩阵。但是我们可以取每组基的反序。
现在输入基是 $x^3,x^2,x,1$ ，输出基是 $x^2,x,1$ ，基变换矩阵 $B_{\textrm{in}}$ 和 $B_{\textrm{out}}$ 是置换矩阵。 $T(\boldsymbol u)=\dfrac{\textrm d\boldsymbol u}{\textrm dx}$ 在新基下的变换矩阵是对角奇异值矩阵 $\pmb{B^{-1}_{\textrm{out}}AB_{\textrm{in}}=\Sigma}$ ，且奇异值 $\sigma_1,\sigma_2,\sigma_3=3,2,1$ ： $\pmb{B^{-1}_{\textrm{out}}AB_{\textrm{in}}}=\begin{bmatrix}&&1\\&1\\1\end{bmatrix}\begin{bmatrix}0&\pmb1&0&0\\0&0&\pmb2&0\\0&0&0&\pmb3\end{bmatrix}\begin{bmatrix}&&&1\\&&1\\&1\\1\end{bmatrix}=\begin{bmatrix}\pmb3&0&0&0\\0&\pmb2&0&0\\0&0&\pmb1&0\end{bmatrix}\kern 15pt(8.2.8)$ 从上式可以看到 $x^3$

六、主要内容总结

如果我们已知一组基的线性变换 $T(\boldsymbol v_1),T(\boldsymbol v_2),\cdots,T(\boldsymbol v_n)$ ，那么线性性质将会决定其它所有的变换 $T(\boldsymbol v)$ .
线性变换 $T$ 的输入基是 $\boldsymbol v_1,\boldsymbol v_2,\cdots,\boldsymbol v_n$ ，输出基是 $\boldsymbol w_1,\boldsymbol w_2,\cdots,\boldsymbol w_m$ ，则存在 $m\times n$ 的矩阵 $A$ 来表示这个线性变换。
基变换矩阵 $B=W^{-1}V=B^{-1}_{\textrm{out}}B_{\textrm{in}}$ 表示恒等变换 $T(\boldsymbol v)=\boldsymbol v$ .
如果矩阵 $A$ 和 $B$ 分别表示变换 $T$ 和 $S$ ，并且 $S$ 的输出基是 $T$ 的输入基，则矩阵 $A B$ 表示变换 $T(S(\boldsymbol u))$ .
最佳的输入-输出基是 $A$ 特征向量或奇异向量，且 $B^{-1}AB=\Lambda=特征值矩阵\kern 20ptB^{-1}_{\textrm{out}}AB_{\textrm{in}}=\Sigma=奇异值矩阵$

七、例题

【例9】 $2\times2$ 的矩阵空间有下面四个 “向量” 作为一组基： $\boldsymbol v_1=\begin{bmatrix}1&0\\0&0\end{bmatrix}\kern 15pt\boldsymbol v_2=\begin{bmatrix}0&1\\0&0\end{bmatrix}\kern 15pt\boldsymbol v_3=\begin{bmatrix}0&0\\1&0\end{bmatrix}\kern 15pt\boldsymbol v_4=\begin{bmatrix}0&0\\0&1\end{bmatrix}$ 线性变换 $T$ 是转置每个 $2\times2$ 的矩阵，那么在这组基下表示变换 $T$ 的矩阵 $A$ 是什么（输入基 = 输出基）？逆矩阵 $A^{-1}$ 是什么？转置变换的逆变换 $T^{-1}$ 是什么？
解：转置这四个 “基矩阵” 仅仅是交换 $\boldsymbol v_2$ 和 $\boldsymbol v_3$ ： $\begin{array}{l}T(\boldsymbol v_1)=\boldsymbol v_1\\T(\boldsymbol v_2)=\boldsymbol v_3\\T(\boldsymbol v_3)=\boldsymbol v_2\\T(\boldsymbol v_4)=\boldsymbol v_4\end{array}\kern 10pt给出了变换矩阵的四列\kern 10ptA=\begin{bmatrix}1&0&0&0\\0&0&1&0\\0&1&0&0\\0&0&0&1\end{bmatrix}$ 逆矩阵 $A^{-1}$ 和 $A$ 相同，逆变换 $T^{-1}$ 和 $T$ 相同。如果我们转置两次，最终得到的矩阵和原始矩阵相同。
注意 $2\times2$ 的矩阵空间是 $4$ 维的，所以矩阵 $A$ （转置变换 $T$ 的变换矩阵）是 $4\times4$ 的， $A$ 的零空间是 $\pmb Z$ ， $T$ 的核是零矩阵 —— 转置后为零矩阵的只有零矩阵。 $A$ 的特征值是 $1, 1, 1, - 1$ .
对应特征值 $\lambda=-1$ ，即满足 $T(A)=A^T=-A$ 的 “矩阵直线” 是什么？反对称矩阵！

8.2 线性变换的矩阵

一、线性变换的矩阵

二、基的变换

三、变换矩阵的构造

四、矩阵乘积 AB 对应于变换 TS

五、选择最佳基

六、主要内容总结

七、例题

网站公告

今日签到

热门文章

最新发布