第四、五章补充:线代本质合集(B站:小崔说数)

发布于:2025-02-10 ⋅ 阅读:(37) ⋅ 点赞:(0)

视频1:线性空间

原视频:【线性代数的本质】向量空间、基向量的几何解释_哔哩哔哩_bilibili

很多同学在学习线性代数的时候,会遇到一个困扰,就是不知道什么是线性空间。因为中文的教材往往对线性空间的定义是非常偏数学的(当然也可以说它非常严谨),但你想理解它是不太容易的。而实际上线性空间它完全可以通过生活来理解。所以本期视频要讲一讲什么叫线性空间。

一、什么是空间

关于什么是空间,大家翻开教材的话,教材会给你一些非常数学的、非常偏分析的定义,然后你就眼花缭乱了。但其实我们在一开始学习线性代数这门课的时候,千万不要搞得这么复杂,我们就简单地把空间理解成大家所能认知的那个空间就可以了,如下图👇

二、坐标

我们用大家最熟悉的二维平面举例子,很显然,二维平面是由一大堆的点组成的,我们在这张图上标出这个点(2,3)。在线性代数中,我们常常不把点看做点,而是把它当做从原点出发,向这个点所发射的向量,即用向量的方式来研究这个点。当然向量的坐标和点的坐标也是一样的,是\binom{2}{3},如下图👇

那么上图的\vec{i}\vec{j}向量能否通过线性组合的方式组成\vec{\alpha }向量?即:能否表示成x\vec{i}+y\vec{j}=\vec{\alpha }?

当然可以了,显然:2\vec{i}+3\vec{j}=\vec{\alpha }

那么我随便在上图的平面中取一个点,\vec{i}\vec{j}向量显然都能通过线性组合的方式去组合成这个向量。也就是这个二维空间中的所有点都能被\vec{i}\vec{j}向量表示出来,那也就可以说是\vec{i}\vec{j}表示出了这个R^{2}空间,换言之,\vec{i}\vec{j}张成了这个空间。\vec{i}\vec{j}向量被称为基向量组,或基(basis)。

接下来我们再来研究一些问题👇

请问这个平面空间只有这一组基吗?下图中画出的\vec{\alpha }\vec{\beta }向量能否起到和刚才一样的效果?稍微想想你就知道是可以的,如下图👇

也就是说,\vec{\alpha }\vec{\beta }向量也是一组基。所以显然一个空间不止一组基,它有无限多组基。而空间中有一些比较特殊的基,如刚才的\vec{i}\vec{j}向量,以及下图中的一大堆向量(它们两个向量之间都是垂直的,或者说正交的,并且它们向量的长度或者说模都等于1)👇

我们把这样的一些基称为“规范正交基”。“规范”就是长度为1,“正交”就是彼此垂直。而最最常用的一组规范正交基就是\vec{i}\vec{j}向量。

三、过渡矩阵

在之前的一期空间变换的视频里有讲过:乘上一个矩阵,相当于在做一个空间变换(或者说图形变换),而由我们刚才的讨论可知,我们的二维空间有无限多组基,不过这些组基有个共同点,就是它们都表示出了同一个空间,那么它们之间能相互转化吗?当然可以!无非就是通过旋转拉伸变换得到,而旋转拉伸这些空间变换在线性代数中就是通过乘上一个矩阵P来实现,而这个P就被称为“过渡矩阵”或“基变换的矩阵”👇

通过以上的讲解,你知道什么叫线性空间了。相信在你理解了这些直观的东西之后,你再去看课本上那些严谨复杂的定义,应该就会好很多了。所以线性代数这门课大家一定要掌握数形结合,一定要知道它的这些公式、定理的背后对应的是什么。

视频2:用向量视角看待解方程组

原视频:【线性代数的本质】用向量视角看待解方程组_哔哩哔哩_bilibili

在学习线性代数这门课的时候,很多同学没有办法把向量组之间的关系和方程组之间去建立联系,而我们考试的时候往往是向量的题目你要想到方程,而方程的题目你要往向量去想,所以这期视频就给大家讲一讲向量组之间的关系和方程组如何衔接到一起。

为了搞清楚向量与方程组之间有什么关系,我们用下图这个简单的方程组来打比方👇

在初中的时候,我们就能用加减消元(高斯消元)的方式把这个方程解出来。

接下来,我们来聊聊有没有什么几何的方法来解决这个方程。答案是有的,而且不止一种👇

一、行图像法

第一种方法是“行图像法”,也是我们高中时候常常使用的一种方法。

所谓“行图像法”,其实就是把这个方程组按照行给上下砍一下,那么它就变成两个方程了👇

毫无疑问,这两个方程表示的都是直线,我们把这两条直线画下来,其交点(1,2)就是方程的解👇

我们把这种方式称为“行图像发”,非常直观,也是高中的做题方法。

二、列图像法

大家知道,线性代数也是在解方程组,那么线性代数这门课里面是用什么样的方法去解方程组呢?或者说它的几何意义是什么呢?

它的方法叫“列图像法”,我们还是以前面的方程为例,我们这次按照列对这个方程组进行分块,并分别用不同的向量字母来表示它们👇

然后,我们再对此进行向量的乘法👇

那么我么来看一下,上图这个式子在图像上代表一个什么含义👇

由于我们前面已经算出了方程的解为:x=1y=2,所以👇

中学我们就学过了,向量的加法遵循平行四边形法则。

所以我们来思考,这个方程组它解决的是当xy分别等于多少的时候这个方程成立的问题,那么同理,就是当xy分别等于多少的时候下面这个式子成立👇

上面这个式子被称为“\alpha\beta的线性组合”。所以我们可以比较方便地说,方程组在找一个线性组合,使\alpha\beta可以组合成\gamma

线性代数这门课最重要的两章:一是怎么解方程组、二是研究向量之间的线性组合。所以它俩其实是一致的。所以同学们一定要把这一点深深地印在脑子里,那么我们在学习线代的时候才能更加综合。

关于向量与方程组之间的关系就讲到这里,听完了以上的讲解,相信你能理解为什么向量组的线性表示和方程组的有解无解是相联系的,或者说它俩是等价的,是一回事儿。所以大家要把这层联系深深地印在脑子里,我们做题和学习线性代数这门课的时候才能更加综合、更加融合。

视频3:为什么说线性代数研究的是空间变换?(矩阵乘法与空间变换)

原视频:【线性代数的本质】为什么说线性代数研究的是空间变换?_哔哩哔哩_bilibili

很多人学习线性代数的方法是有问题的,因为中国的教材往往把线性代数教成了一种纯粹的计算的学科,告诉你一大堆规则(如逆序数、行列式变换规则等),然后在这个规则上面推出别的规则,然后再一直算。所以这就造成了一个问题:学到最后不知道自己学了个什么东西,只是掌握了一些计算的法则,不知道它有什么用,不知道它能用来干嘛,然后稍微扩展一些的东西根本完全无法理解,所以会对大家的学习造成非常大的困扰。

我个人觉得,对于线性代数这门课,理解它真正是在做什么,理解它真正代表的是空间变换,是非常非常重要的。接下去,我将用一些简单的例子给大家讲明白为什么线性代数是在讲空间变换。

一、不可交换性

相信所有老师在讲线性代数的时候都有聊过“矩阵的乘法是不可交换的”,虽然在某些特殊的情况下有AB=BA,但这些特殊情况我们不讨论。

首先,我们来聊聊为什么矩阵的乘法是不具有交换性的。👇

为了聊清楚这个话题,我们就要学习一下矩阵乘法的本质了。

我们从变换的角度来思考一下上面的式子:

A\alpha =\beta可以翻译成:对\alpha进行了一个A变换,把\alpha这个向量变成了\beta向量。这个是口头上的描述,那么从几何上它是什么意思呢?

我们知道,\alpha =\binom{a}{b}A\alpha =\beta =\binom{2a}{b},对\alpha进行A变换就是\alpha纵坐标不变,横坐标扩大一倍,就变成了\beta👇

当然,我们想对空间变换建立一个直观的认识不能只靠一个向量,那我们就多找点向量,比如一个正方形👇

这个正方形显然是由一堆点组成的,但是在线性代数中,我们不把点看作点,我们常把点看作由原点出发,到这个点到向量(或者说这个点到坐标和向量的坐标没什么区别)。所以这个正方形你也可以理解成是由一大堆向量组成的图形。那么我可以对这一堆向量进行A变换。

我们前面说过,A变换时把任何一个向量的横坐标变成2倍,纵坐标不变。那么原先的正方形将变成下面这个样子⬇️

所以我们常说,\begin{bmatrix} 2 & 0\\ 0& 1 \end{bmatrix}这个矩阵对应的是拉伸变换。即一个向量乘上\begin{bmatrix} 2 & 0\\ 0& 1 \end{bmatrix},将会在x轴方向做一个拉伸。

那接下来我们再举个例子,我相信大家现在应该能够明白,矩阵的乘法就是在做一个空间上的变换了。那我这里再给大家一个比较有意思的矩阵——B矩阵👇

这个B矩阵如果乘上一个向量\alpha,产生的变化就是:向量\alpha将进行一个逆时针旋转\theta度的变换👇

也就是说,任何一个\alpha向量,在B矩阵的影响下(或者说做一个B变换),将被逆时针旋转\theta度。而顺着这个思路,我们对一个图形(比如还是刚才的正方形)进行变换的话,这个正方形也会逆时针旋转\theta度(见上图右侧)。

学完了上面的知识,我们就可以用刚才所讲的几何意义来解释为什么矩阵的乘法是不可交换的👇

这里给了你两个矩阵,分别是A矩阵(刚才的拉伸矩阵),和B矩阵(逆时针旋转45^{o}的矩阵),然后我又画了2个正方形,我想研究的是对这个正方形先做A操作再做B操作,与先做B操作再做A操作,最后会变成一样的形状吗?如果能,那就认同它有交换性,否则就没有交换性👇

显然,ABBA没有把正方形变成同一个形状。其实这个也非常好解释,你想一想,一个图形先旋转后拉伸,和先拉伸后旋转,它几乎是不太可能变成同一个图形的,所以它就不可交换呗。

所以因为矩阵乘法的本质是变换,所以它是不具有交换性的。打个简单的比方,先穿袜子后穿鞋,和先穿鞋后穿袜子,这两个都是对你的脚进行变换,但这两者不太可能变成同一个事物,除非你鞋和袜子是同一个东西,或者是有一些比较特殊的情况。

以上就是不可交换性的讲解。

二、行列式的几何意义

讲完了不可交换性,我们来聊一聊大家常常问我的问题:行列式到底在讲什么东西?我今天就告诉你它到底在讲什么东西。

我先直接说结论,行列式的几何意义就是“图形变换前后的一个放大率”。当然在二维里面,它是面积的一个放大率,那么各位也能想到,三维的矩阵对应的是一个三维空间里面的一个变换,它就是一个体积的放大率。

下图A矩阵的行列式的值是2,各位想一想,一个1\times 1的正方形被放大到一个2\times 1的长方形,显然是放大了2倍。👇

那么各位再想一想,旋转一个图形,开会改变它的面积吗?显然不会。所以旋转变换的放大率是1。👇

所以,行列式的几何意义就是这个变换的放大率。

当然,“放大率”这个概念有时候会出现一些特殊情况,比如行列式的值是负的,这表示图像在空间中发生了翻折👇

除此之外,还有第二种比较特殊的情况,就是行列式等于0。那么它随便乘上一个向量,都会导致其横纵坐标相等,而横纵坐标相等的点一定会出现在y=x上面。所以从几何上来讲,如果对下图的正方形做\begin{pmatrix} 1 & 1\\ 1 & 1 \end{pmatrix}的变换,它会把所有的点全都变到y=x上去。即这个正方形本来是二维的,现在变成一维的了,而一条线是没有面积的,所以面积由1变为0了,所以放大率为0。

所以假如一个矩阵的行列式为0,那么它就可以理解为《三体》中的“降维打击”,就是把一个二维的物体啪的一下拍成一维,或者把一个三维物体拍成二维。

既然都说到这里了,我们就再讲一个东西:

大家都知道,如果A的行列式|A|\neq 0,那么A是可逆的矩阵;如果A的行列式|A| = 0,那么A就是一个不可逆的矩阵。

大家可以这样记👇

|A|\neq 0:想象你在玩一个橡皮泥,你可以把它变成另外的形状,这个过程是可逆的,即你可以把橡皮泥恢复原状(虽然过程很难)。即:一个三维物体变成另一个三维物体这个过程是可逆的。

|A| = 0:假如你现在把一个三维物体降维打击了,这个过程是不可逆的,因为低维物体无法变成高维物体,因为它原本高维的信息已经丢失了。

听完以上的讲解,相信你已经对线性代数有了一个全新的认识。总而言之,线性代数并不是由一堆规则组成的学科,我们一定要知道这堆规则背后对应的是线性变换、空间变换。只有了解了这一层,你才能把线性代数的各个知识点给串联到一起,然后这个知识体系才能牢靠。当然对于考研的同学来讲,你做题肯定是会做得更快的。

视频4:秩的几何意义

原视频:【线性代数的本质】秩的几何意义_哔哩哔哩_bilibili

在长期的教学过程中,经常有同学问我:矩阵的“秩”是什么意思?本期视频我们就来聊一聊矩阵“秩”的几何含义。

一、秩的意义

关于秩的意义,我们大抵可以从两个方面去理解:

不过,光看这两句话是不行的,下面我们一个一个地去分析👇

首先,我们来看第一句话:矩阵列向量所张成空间的维度(基向量个数)

面👆我给了两个二维矩阵,它们都是在二维空间里的。我要做的操作是:首先对这个矩阵进行分块,之后就出现了2个列向量\alpha\beta,然后我们在二维平面上把它画出来,那么以这两个向量为基向量,所张成的空间显然是一个二维空间,那么我们就说:这个矩阵的秩等于2。

第二个图我们同样也进行列分块,形成\binom{1}{1}\binom{2}{2},由这两个向量所张成的空间并不是整个二维平面,而是下面这根蓝线,是一根直线。而在几何上面直线的维度是1,所以第二个矩阵的秩等于1。

上面都是在二维空间包括方阵里面去操作的,我们来看一下三维空间,在这个非方阵的情况下是否依然有这样的性质呢?

上图中👆,第一个矩阵是一个非方阵,我们也一样对它进行列分块,得出的两个向量\alpha\beta是三维空间的向量,从几何上来讲,\alpha\beta显然可以张成xoy这个二维平面,我们常常把这个二维空间称为三维空间的“二维子空间”,它和之前的二维空间还是不太一样的,虽然都是二维的,但这个二维空间的“爸爸”是三维空间。显然,这个矩阵的秩等于2。

第二个矩阵分块之后,形成\alpha\beta\gamma这三个向量,这里你应该能感觉到,\gamma向量似乎没什么用啊,因为\alpha\beta\gamma这三个向量张成的空间依旧是二维空间,所以\gamma这个向量对我们张成空间的帮助其实是没有的,所以它张成的依旧是二维空间。所以这个矩阵的秩等于2。

那么讲到这里,我可以再自己写个矩阵👆,它的秩显然就是三个坐标轴所张成的空间(三维空间),所以它的秩等于3。

二、矩阵变换后的空间维度

刚才我们讲了关于秩的第一种理解方式,就是列空间的维度。第二种就涉及到矩阵的变换。之前在空间变换那期视频里讲过,矩阵变换的背后对应的其实是空间变换。比如👇

上图👆是个最简单的例子,矩阵A是个三阶的单位矩阵,显然它对任何向量做变换,结果依然还是该向量本身。比如,图中我们对正方体中所有的向量进行A操作,显然正方体没有发生任何变化。所以经过A变换,这个正方体的维度依旧是3,所以矩阵A的秩r(A)=3

接下来我们来看B矩阵,显然任何一个向量\begin{pmatrix} x\\ y \\ z \end{pmatrix}乘上B矩阵,结果都会变成\begin{pmatrix} 2x\\ y \\ z \end{pmatrix}。所以,假如我对图中的正方形的所有向量进行B变换,这个正方体就会沿着x轴正方向拉伸到2倍,变成一个长方体。变换之后的空间维度是3,所以矩阵B的秩r(B)=3

如上图👆,当然,不是每个三阶矩阵的秩都等于3,比如上面的C矩阵,它把z坐标给消除掉了,所以我对这个正方体进行C变换,它会将这个正方体压到xoy平面上,变成一个二维平面,仿佛对它进行了降维打击。显然它变换后的维度是二维,所以矩阵C的秩r(C)=2

同理,上图👆的D矩阵,对正方形进行D变换,会将其做一个压缩,压缩成x轴上的一根小线段。所以正方形从3维变成了1维。所以矩阵D的秩(即变换之后的维度)r(D)=1

那么现在回来再看这两句话,你的脑海里有没有画面感呢?👇

听完以上的讲解,你现在应该知道“秩”是个什么东西,当然这是从几何上来讲的。


网站公告

今日签到

点亮在社区的每一天
去签到