如何理解线性代数?

可能与专业有关,没有工科课程的知识,总觉得线代比微积分、离散、概统都要抽象,例如矩阵为什么这样定义、为什么乘法又是这样,一直都是知其然不知其所以然。
关注者
7,785
被浏览
2,060,291

99 个回答

#入门教程贴

0, 引言

人类在探索每一个科学问题的时候,为了简化问题,都会把具体科学问题看作一个机器。给这个机器输入一个条件,机器会运转,对条件进行加工,然后输出一种现象。

通过研究输入与输出,有时候可以推测出机器内部的构造,这就是所谓的科学。比如牛顿,他发现:给物体一个力,就能使物体产生一个加速度,力越大,加速度就越大。

当然,有时候研究了输入与输出,依然没有搞清楚机器内部的原理,只是知道一个大概的规律,那么就干脆先不管内部原理,先把这个规律为自己所用。这就是所谓的工程。比如,人们通过做实验发现,给机翼一个气流,机翼就能够产生一个升力,人们并不能解释升力是怎么产生的,但是不妨碍自己使用,于是给一个驾驶舱装上两个翅膀,飞机就上天了。

人类探索自然运行的原理,归根结底是想利用这些原理,对万物进行定量控制。

定量控制的意思是说:牛顿写出《原理》这本书的时候,不能够含糊其辞的说,给物体很大的力,物体就能产生很大的加速度。而是必须告诉大众:给一个多少Kg的物体多少N的力能够产生多少 m/s^{2} 的加速度。

这时候,数学应运而生。简而言之,数学就是人类在解释这个世界是怎样运行的时候,人为发明的一种工具,有了这种工具,我们可以不用那么含糊其辞。

于是,就有了函数。

于是就有了F=Ma,于是就有了各种各样的公式、定理及定律。

1, 什么是线性代数

函数研究的是,输入一个数,经过函数运算之后,产出一个数。而有时候我们研究的问题太复杂,需要输入很多个数,经过运算之后,产出很多个数。这时候,线性代数应运而生。

很多个数,我们可以用括号括起来,形成一个数组。在几何学上,数组被称作向量,向量就是一个有大小有方向的直线段。

所以,线性代数就是:输入一段直线,经过加工之后,产出一段直线

线性的意思就是,你往机器里扔进去直线,产出的肯定也是直线。

当然,在数学上,线性有着及其严格的定义,并不是像我刚才说的那么简单。不过,正由于线性的严格定义,才能够实现:输入一段直线,产出一段直线。

与函数相类似,用图描述线性代数就是:

输入叫向量,内部原理叫矩阵,输出叫向量。

2, 矩阵是怎么对直线进行加工的?

通过函数表达式y=5x+9我们可以一目了然地知道,输入的自变量x是怎样一步步被加工,最后输出因变量y的。

同样,我们通过观察矩阵,也可以一目了然地知道,输入的直线是怎样一步步被加工的。

假如输入的直线为[1,2]。

插一句,向量[1,2]的全称其实是1i+2j,i和j叫做基向量。意思是说,我们目前所写出来的向量,是以这两个向量作为基本原料,拼凑组合出来的。

假如用于加工向量的矩阵为[0,1 -1,0],

那么这个矩阵所代表的加工过程就是,把基向量i,换成矩阵中的第一列,把基向量j换成矩阵中的第二列。然后再以新的基向量为原料,重新利用[1,2]拼凑一个新的向量。用新的基向量拼凑出来的新向量就是输出。

通过展示矩阵对向量的加工过程,我们可以“看出”上面例子的解。

下面,我们用熟悉的口诀“左行乘右列”来检验一下上面的答案是否靠谱。

其实,计算所用的口诀就来源于上述加工过程。

同理,稍微复杂一些的三维向量遇到三维矩阵后的加工过程如下图:

3, 行列式是什么?

矩阵对向量进行加工,行列式能够描述这种加工作用的强弱。

上文提到,矩阵对向量加工是通过改变基向量来实现的。以二维为例,默认的基向量张成的面积为1,经过矩阵变换之后形成的新的基向量张成的面积变为了S,那么这个矩阵的行列式就为S。

有时候,矩阵的行列式为0,说明新的基向量张成的面积为0,说明新的基向量发生了重合。

有时候,矩阵的行列式为负数,说明线性空间发生了翻转。也就是说,本来,默认的两个基向量,j在i的逆时针方向,经过矩阵加工之后,线性空间发生了翻转,导致i在j的逆时针方向。如下图:

4, 什么叫单位矩阵?

矩阵能够对向量进行加工,产生一个新的向量。但有一种矩阵比较特殊,无论给它输入什么样的向量,加工后产生的向量都与原来的相同,这种矩阵叫单位矩阵。

既然矩阵对向量的加工作用是通过改变基向量来实现的,如果想保持输入与输出相等,那么只需要保证矩阵不会改变基向量即可。

所以,二阶单位矩阵,三阶单位矩阵以及n阶单位矩阵可写为:

5, 什么叫逆矩阵?

矩阵对向量具有加工作用,两个矩阵相乘,则表示的是两种加工作用的叠加。也就是说:

如果上图中向量1等于向量3,那么就说明,向量经过矩阵1和矩阵2的加工之后,又变成了原来的自己。进一步说明,矩阵1和矩阵2对于向量的加工作用刚好相反。那么就说矩阵1和矩阵2互为逆矩阵。

明白了原理,也就知道如何求解逆矩阵了。

插个题外话:为什么行列式为0的矩阵没有逆矩阵?

因为行列式如果为0,表明矩阵在在对向量变换的过程中,将向量空间压缩到了一个更低的维度上。以二维矩阵为例:

向量降维后,将无法再还原回原来的样子。

就好比有一个三维长方体,从大部分角度观察,都是一个三维结构,但是当正视俯视侧视时,你只能观察到一个二维矩形。我们是无法通过这个二维矩形的样子,来推测出原来的长方体的。

6, 什么是秩

矩阵可以将一个向量进行加工,变成另外一个向量。

比如一个3阶矩阵,可以对很多三维向量进行加工,变成很多新的三维向量。

有时候,所有的这些新的三维向量,最终都落在一条直线上,即1维。

有时候,所有的新的三维向量最终都落在一个二维平面上,即2维。

有时候,所有的新的三维向量最终都落在三维空间上,即3维。

以上情况分别对应于秩为1,2,3。

总之,秩就是描述这个矩阵会不会将输入的向量空间降维。如果没有降维,这种情况称为满秩。

7, 什么是特征向量、特征值?

矩阵能够对向量进行加工,变成一个新的向量。

有时候会出现这种情况:

对于某一个矩阵,输入一个向量,经过矩阵的加工后,新生成的向量与原来的向量共线。也就是说这个矩阵对这个特定的向量的加工过程中没有改变其方向。

那么,这个不会被改变方向的向量叫做这个矩阵的特征向量。

虽然不会被改变方向,但是改变了大小,新的向量长度是原来的向量的长度的 \lambda 倍,这个 \lambda 叫做特征向量的特征值。

8,有所疏漏,写的不全,想听哪里在评论区留言。




另外,

我开了个公众号“陈二喜”,目前只有我一个粉丝,之后会同步知乎的回答。

引言

这篇文章始于2015年,感谢大家给了这么多赞和鼓励!最初是以几何意义去诠释线性代数,许多朋友表示从中收获颇多、兴趣大增,我猜不少人可能在克拉默法则的几何意义那里就被吸引了,这是很自然的,因为我们在学习时都想探求本质,思想通透时好奇心才得到满足,应用起来也得心应手,而直观的几何意义相比那味同嚼蜡的课本内容,通过新的视角让初学者对线代本质的理解更进一步——事实上我们无法空洞地去理解一些抽象概念的意义,总是通过一些直观的、可自明的东西,慢慢类比再辅以符号简记,才可以去运转一些抽象语言,正如维特根斯坦所说:"好的比喻让理智清新",后语言哲学也很重视"隐喻"现象,来解读我们是如何理解抽象概念之意义的。

很遗憾的是,许多数学教材都是在全盘陈述前人的结论,无论是概念定义、定理、证明和例题,都是照搬,不肯多说一点概念相关的数学史、意义与应用,我们不清楚这些作者是甘愿只做搬运工,还是实在没有深刻的见地。只有少数数学大家,才真的常把真相一语道破,如陈省身先生的部分讲义,会用生动的语言讲述缘由和见解,另外曾看到一本薄薄的离散数学,作者在代数结构与同构的部分竟然破天荒的说了句"在我看来,同构就是两个代数系统仅仅只有记号不同,而结构或本质是相同的",然后他还以中国的阴阳系统和二进制代数来举例。我还见过一个同学,他说大一时对数学充满兴趣,他和多数同学一样也想搞懂那同济教材内容背后的本质,只是他稍有强迫症,不把当前部分搞透彻就不继续(学习理科就要有这种精神),可惜书本不多写、老师不多讲,他自己也无头绪不知从何处自学,最后就放弃了,可能这样的同学还有不少。

所以多数数学教材和老师提供的知识,处于一个尴尬的境地——既不是直观生动的形式,也不是如当代哲学那般对语言概念进行反思从而获得真正通透的理解(所谓真正的哲学,就是对思想的逻辑澄清,对提问和答问语言的澄清)。他们所写的和所讲的只是字面上有点抽象,如维氏和陈嘉映都说过的"概念到概念之间的空转",只给了我们一些抽象概念和话语,并没有讲述这背后的助于我们透彻理解的"抽象思想",虽然给出了概念的定义和定理的证明,但这对整个体系思想的理解无济于事,因为我们需要知道这些概念和定理存在的意义,就像海德格尔在《存在与时间》开篇就考察了"问题"本身的一般形式,分为问之所问、问之所及和问之所以问,我们关注的正是"何以如此说、何以如此问",维特根斯坦也有过类似的表述:

世界如何,不是神秘的,神秘的是世界存在
整个现代世界观的基础是建立在一个错觉之上,即所谓的自然法则是对自然现象的解释

这一追究不仅是为了让后生仔们读到好的数学书、学到真正的数学,也是揭露了这样一个事实——当下有许多数学从业者或数学家,对诸多数学概念和工具已经"习以为常"了,觉得数学大厦根基稳定甚至独此一栋,从而不假思索地拿来继承发展、去算去用,工科理科的朋友都知道,即便对一个理论不刨根问底,的确也可以做出些成果,但革命性的创新必然要厚积薄发和重塑概念,需要敏锐的洞察和质疑的勇气,维氏说"天才即天赋勇气"实在恰当。目前有反思觉悟的大数学家,望月新一算一个。罗素曾批评古典哲学家太懒不去学点数学,今天倒要建议数学家多读读现代哲学,学会考察习以为常的概念和语言,从而疏通沟渠并迎来活水。更多同学应该在此看到,在数学和基础科学的世界里仍然大有可为,还有很多阻碍、矛盾、冗杂和难题等有待全新的数学体系去解决。

所以在2015年原文的基础上,我会陆续补充一些更抽象的内容来帮助朋友们更好地理解线性代数。例如,矩阵的标准型问题,其实与"模及主理想上的模"有关,不熟悉抽象代数的朋友,仍然会做相关计算,但理解了这层抽象思想,会看到更大的世界,融会贯通并运用自如,对此,代数学家莫宗坚曾说:

一些数学与科学上的问题,如果局限在小范围内,常常越弄越繁,不容易理出头绪来,如果能打破框框,走入更广阔、从而也更抽象的道路,则就立见真章了

这段话,在我漫游过数学的千山万水之后,是如此赞同和欣赏,同时也想把这些年获得的真知与思想,分享给大家,一同感受世界的浪漫与不平凡。许多人曾觉得数学很枯燥,其实是因为还没看到过真正的数学,这就像一个人去看海,走到中途却遇到一个脏脏的湖泊(这就像我们常用教材上的内容),误以为是大海失望而归,但如果真的坚持走到海边,一定会被那种壮美所感动~


——————————————————————

2015年原文:线性代数的几何意义

矩阵的几何意义

矩阵由若干向量组成(可以是有限个,也可以是无限可数个),其形式和数学史赋予它的最自然的几何含义和线性空间有关(向量间的加法以及另一个数集带来的乘法为这个空间赋予了基本结构),这部分内容将在后续更新里单独列出来讲。这里不妨先简单直观一些,要么把矩阵画成几个行向量或列向量,要么画成由向量终点组成的图形,这刚好和当代计算机图形学有联系,例如大家常玩的3D游戏或某些基于矢量绘图引擎的2D游戏,就都是矩阵可视化以及矩阵变换的生动实例。
如矩阵

\left( \begin{matrix} 5 & 7 & 9 \\ 6 & 3 & 5 \end{matrix} \right)

按照列向量可表示为如下图形

如下图是在matlab中将z=sin(x)*cos(y)算得的离散点组成的矩阵表示成几何图形,当你旋转这个图形观察时,每个画面都是计算机用相应的旋转和投影变换矩阵,对原始的图形数据矩阵相乘变换后得到的,在3D游戏中移动、转动、缩放和光照等也都是靠矩阵运算完成的,当然这里让我们初步感受到一种魔力——矩阵既可以用来表示纯数据(如复杂图形的顶点),也可以用来对数据做变换,在以后的学习中我们会看到,这其实是在说,不仅某阶向量和矩阵全体可以构成一个线性空间,它上面的全体线性变换也构成一个线性空间,即任何线性变换都可以在选择确定的基后,用矩阵来表示。但神奇的东西何止于此,背后还隐藏着更深刻的内容——借用语言哲学的思想,我们对数学语言本身进行反思,会有诸多更本质的东西显现,例如你开始可能会以为离散的加减乘除运算包括矩阵运算等,在工程应用时只能近似和将就,以为偏微分方程等基于连续性的微积分工具才是宝典,但最终会发现,我们所拥有的原子运算只有基础代数运算,而真正"存在"的数学对象都是离散的(连续是一种幻象,或者说只是一个语言概念,而且充当这个语言里的相对本体,可参见奎因哲学),数学世界乃至物理世界都是由离散的对象和它们之间的关系所定义的,这方面有兴趣可以去看看代数几何与前沿物理的思想。

注1:如果单独查看一个矩阵 A_{m \times n}

可以有两种解读:矩阵A由m个n维向量组成,或者由n个m维向量组成;在使用时会根据实际情或约定选择其中一种,而在参与变换或其他运算时,这两种解读一般不能混淆,一定要确定

注2:当我们把矩阵表示成图形时,其作图没有固定标准,并不一定是把所有向量终点连接起来构成一个多边形,规则是使用者制定的,可以是网格,可以是离散面片等

行列式的几何意义

方阵 A_{n\times n} 的行列式的绝对值是其行向量或列向量所张成的平行几何体的空间积,对于二阶行列式,就是向量张成的平行四边形的面积,对于三阶行列式,就是对应平行六面体的体积;如方阵

\left( \begin{matrix} 5 & 6\\ 7 & 3 \end{matrix} \right)

的行列式绝对值为27,它就是下图平行四边形的面积

注:行列式其实是带有符号的,实际上,正负号表征了这些向量作为线性空间基的手性,正号表示右手系,负号表示左手系,在二阶矩阵的向量空间里,其判别方法是,伸出右手和矩阵的第一个列向量或行向量平行,然后调整手的正反使得能从此向量转过小于180度的角到达第二个向量,这时大拇指如果朝上(从纸面指向自己)则为右手系,矩阵的行列式为正,反之则为左手系,对应行列式为负;如果是三阶矩阵,则从第一个向量转向第二个向量时,如果大拇指指向第三个向量方向(不必重合),则为右手系,其行列式为正,反之为左手系,行列式为负;其实这一点上更广义的表述应是向量空间的基相对自然坐标系的顺序性(代数上可用逆序数表达)

克拉默法则的几何意义

以二维形式为例来说明其几何意义:

现有方程:

A\vec{x}=\vec{b}

其中

A= \left( \begin{matrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{matrix} \right) ,记 \vec{a_1}=\left( \begin{matrix} a_{11}\\ a_{21} \end{matrix} \right)\vec{a_2}=\left( \begin{matrix} a_{12}\\ a_{22} \end{matrix} \right)

\vec{b}=\left( \begin{matrix} b_1\\ b_2 \end{matrix} \right)

\vec{x}=\left( \begin{matrix} x_1\\ x_2 \end{matrix} \right)

原方程也可表示为

x_1 \vec{a_1}+x_2 \vec{a_2}= \vec{b}

这样可以把 x_1x_2 看作是列向量 \vec{a_1}\vec{a_2} 的缩放因子,经过伸缩后再叠加即得到和向量 \vec{b} ,故原方程可以解读为

把A的列向量缩放并叠加后得到向量 \vec{b} ,求伸缩因子 \vec{x}

我们已经知道行列式的几何意义,显然矩阵A对应的平行四边形的面积就是|A|(这里以带符号的有方向面积表示,因为伸缩因子也是有符号的),当某一个向量被伸缩后,如图将OB边伸长至OE,形成新的平行四边形OAFE,记其面积为 S_{OAFE}

这样 \vec{a_1} 的伸缩因子 x_1 可表示为

x_1=\frac{S_{OAFE}}{\left| A \right|}

所以只要求出OAFE的面积即可解出未知量

图中OG即向量b,因为它是 x_1 \vec{a_1},x_2 \vec{a_2} 的线性叠加,所以G点必在EF的延长线上,这样OG和OE相对OA边的高就是相同的,故OA与OG组成的平行四边形面积和OAFE相同,即所求面积为 \left| ( \begin{matrix} \vec{b} & \vec{a_2} \end{matrix} ) \right| ,所以

x_1=\frac{\left| ( \begin{matrix} \vec{b} & \vec{a_2} \end{matrix} ) \right|}{\left| A \right|}

同理可得

x_2=\frac{\left| ( \begin{matrix} \vec{a_1} & \vec{b} \end{matrix} ) \right|}{\left| A \right|}

矩阵乘法的几何意义

我们知道矩阵是由若干向量组成的,因此可自然地把矩阵乘法看作是两个矩阵的同维向量之间做内积(或点乘),而内积的意义是两向量同向投影的乘积,但这只是一个表面的几何含义,比较抽象(也有应用之处,后面会提到);实际上,对于矩阵乘法C=AB,作用后得到的新矩阵C可以看作是矩阵A经过某种变换得到的,也可以看作是矩阵B经过某种变换后得到的,而这种变换显然就是乘以另一个矩阵的过程,结合前面提到的矩阵的几何意义,故可以把矩阵乘法C=AB看作是图形A(或B)经过变换B(或A)后得到新图形C,或者是向量空间A(或B)经过变换B(或A)后得到新的向量空间C,对于简单的变换矩阵这一点最容易感性体会到;例如变换矩阵


会把原3D图形向x-y面投影,变换矩阵


会把原图形对x轴镜像,变换矩阵


会把原2D图形相对原点逆时针旋转30度。

初等变换的几何意义

由前面叙述的部分几何意义,我们很快就能看出初等变换的几何含义了

交换矩阵的两行(列):改变向量在矩阵中的排列顺序,当矩阵表示图形时,此操作对图形没有影响,因而矩阵张成的空间维数(秩)不变,但是当矩阵代表向量空间时,会改变此坐标系的手性,当计算方阵的行列式时,会改变其符号;

以一个非零数k乘矩阵的某一行(列):即对矩阵中某一向量进行伸缩变换,整个矩阵代表的图形对应发生变化,由于k不能为0,所以矩阵张成空间的维数(秩)不变,方阵张成的平行几何体的空间积(行列式)变成原来的k倍

把矩阵的某一行(列)的k倍加于另一行(列)上:对矩阵中某一向量做线性叠加,且新向量终点总是在另一向量的平行线上,所以对任意矩阵,图形产生了剪切变形,由于剪切变形不会使向量重叠或缩为0,所以张成空间的维数也不变;对于方阵,由前面几何推导克拉默法则的过程知道,如果把某一向量加上矩阵内另一向量的k倍,由于新向量和原向量相对其余向量组成的平行体的高不变,所以方阵对应的平行几何体的空间积不变(行列式不变),

例如在matlab中用矩阵


作用下面左图对应的矩阵(第三行乘以0.2,即缩短z方向坐标5倍),得到的新图形如下右图所示

Matlab程序如下,可以动手试一试,还可修改其中的变换矩阵以得到不同效果

x=0:0.1:5;

y=x;

[x y]=meshgrid(x,y); %构造网格

z=sin(x).*cos(y).*x.*y;

surf(x,y,z); %绘制原图形

x=reshape(x,2601,1);

y=reshape(y,2601,1);

z=reshape(z,2601,1);

m=[x y z]; %几何图形对应的n*3矩阵

t=[1 0 0;0 1 0;0 0 0.2]; %变换矩阵

m=m*t; %进行变换

x=m(:,1);

y=m(:,2);

z=m(:,3);

x=reshape(x,51,51);

y=reshape(y,51,51);

z=reshape(z,51,51);

figure;

surf(x,y,z) %绘制变换后的图形

然后我们把变换矩阵修改为


即把第二行乘以2加到第一行,由上述分析知道这样会把原图形沿y方向剪切变形,剪切量为对应x坐标的二倍,实际效果如下图所示,这里我们取俯视角以观察x-y面的情形,从右图可以看出理论分析是正确的(注意观察变换前后的y向坐标值)


矩阵秩的几何意义

矩阵的秩即矩阵的各向量所张成空间的维数

不能说秩是矩阵对应图形的维数,因为矩阵的图形只取了各向量的终点,而不含有这些向量的之间的几何关系,故二者的维数不一定相等,而矩阵的秩按定义应取其向量空间维数。如下图中的空间向量a,b,c可以张成一个三维空间,故矩阵(a b c)的秩为3,但是其终点组成的图形是一平面,维数为2,显然和秩是不一样的

结合上面对初等变换的几何解释,正是因为三种初等变换都不改变矩阵向量空间的维数,所以对于复杂的难以观察维数的矩阵,我们可以先用初等变换作用于矩阵进行简化,然后到容易观察的形式时求出它的秩;

向量组线性相关/无关的几何意义

注:在讨论向量张成的空间相关问题时,某种程度上我们可以把向量组和矩阵等价对待,二者都是一组向量的集合,只是向量组相对矩阵明确了向量的维数与向量个数,而矩阵有行与列两种选择,所以只要确定矩阵的向量取行还是列,就可以把矩阵当作向量组讨论;

线性相关在代数上就是一组向量中至少有一个向量能用其余向量线性表示,而几何意义是它们所张成的向量空间维数少于这些向量的个数,这样就至少存在一个向量落在其余向量形成的向量空间中,而向量空间实际上是一个坐标系统,所以处于其中的点(向量)都可以由这些向量定位出来(线性表示),在向量之间表现出一种相关性;而线性无关的几何意义就是一组向量张成空间的维数等于这些向量的个数,这样没有任何一个向量落在其余向量形成的空间里,每一个向量对其余向量来说都是超越自身空间维度的(独立的),因而无法被定位(线性表示),表现成一种相互无关性

以上图棱锥为例,因为HI处于GH和GI所形成的面里,所以HI必然可以由这两个向量表示,所以三者线性相关(三者形成的空间维数为2<3);而HI在IG和IF形成的平面之外,所以H点无论如何都不能被GI和IF定位到,同时IF也不在IG和HI形成的平面里,IG不在IH和IF形成的平面里,同理可知它们之间不能线性表示,所以三者线性无关(三者形成的空间维数为3=向量个数)

方程Ax=0的几何意义

由前面叙述容易看出此方程表示向量x与A的每一个行向量都垂直,或者说向量x垂直于矩阵A的行向量空间。这样我们可以直接根据几何意义得到结论:Ax=0有非零解的充要条件是矩阵A的秩要小于x的维数n;这是因为对于确定维度的向量空间M,如果我们可以找出独立于它的一维或多维空间N,则在空间N里的向量总是垂直于空间M;例如在直角坐标系O-xyz中,设A是x-y平面上的向量空间,x是空间向量,因为z维上的向量总是垂直于A,所以x在这一方向上存在无数非零解。反之若矩阵A的秩等于n,且x非零,则由于x也在n维空间内,所以它和A中的行向量必然线性相关,无法独立于A的行向量空间,所以这时仅有零解。

当方程有非零解时,设A的向量空间维数为R(秩),由上叙述可知解向量x中存在n-R个分量取值自由,如果我们把这n-R个自由变量看作是一个n-R维空间中的向量坐标时,显然此空间中每一个向量都能确定原方程组的一个解,又因为每一个向量都可以用这个n-R维空间的一组单位正交基线性表示,所以这组单位正交向量所确定的一组解通过线性组合就可以表示出原方程的任意解,故这组解就是原方程的一个基础解系,上述叙述也正是基础解系的几何意义

方程Ax=b的几何意义

设A是m*n矩阵,x是n维向量,由前述几何意义知道,如果b处于A的向量空间中(b和A的向量线性相关),则一定可以由A的向量线性表示,也即解存在,而b落在A的向量空间等价于b的维数小于等于向量空间A的维数,也可表述为R(A)=R(A b)=R,即A的秩等于增广矩阵的秩,这种表达也是许多教科书中常用的。当R=n时,n维向量x的每个分量都是线性表示的确定系数,故只有唯一解,而R<n时,向量空间有n-R个维度不存在,故这些维度上对应的系数可任意(自由变量),这时存在无穷多解