有没有人能用人类的语言告诉我,相似矩阵有什么用?
相似矩阵的定义是:
设 A,B 都是 n 阶矩阵,若有可逆矩阵 P ,使 P^{-1}AP=B 则称 B 是 A 的相似矩阵,或说 A 和 B 相似。----《线性代数》同济版
让我们从通俗解释开始。
1 通俗解释
今天《雷神3》上映了,我坐在第一排看电影:
而你坐在最后一排看电影:
我们看的是同一部电影,但是我们各自眼中看到的电影却因为位置不同而有所不同(比如清晰度啊、角度啊),所以说,“第一排看到的电影”和“最后一排看到的电影”是“相似”的。
那么相似矩阵走进的电影院,放映的是哪部电影?也就是说,什么是不变的呢?
是线性变换。
2 线性变换
什么是线性变换?让我们从函数说起。
2.1 线性函数
函数我们很早就接触了,直观地讲,就是把 x 轴上的点映射到曲线上(下面是函数y=sin(x) ,把 x 轴上的点映射到了正弦曲线上):
还有的函数,比如 y=x ,是把 x 轴上的点映射到直线上,我们称为线性函数:
2.2 从线性函数到线性变换
线性函数其实就是线性变换,为了看起来更像是线性变换,我换一种标记法。
比如之前的 y=x ,我们可以认为是把 (a,0) 点映射到 (0,a) 点,我们称为线性变换T ,记作:
T:(a,0)\to (0,a),a\in \mathbb {R},b\in \mathbb {R}\\
不过按照这个写法,作图就有点不一样了:
矩阵的形式很显然如下:
\begin{pmatrix} 0 \\ a \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ 0 \end{pmatrix}\\
这样做最直接的好处是,我们可以轻易的摆脱 x 轴的限制。
只要替换 (a,0) 为平面内所有的点 (a,b) ,我们就可以对整个平面做变换,该线性变换记作:
T:(a,b)\to (b,a)\\
进而可以写作矩阵的形式:
\begin{pmatrix} b \\ a \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix}\\
为了示意整个平面的点都被变换了,我用下面的淡蓝色网格来表示这个线性变换(这个变换实际上镜面反转,为了方便观察增加一个参考点 \vec{x_{}} 以及虚线表示的反转对称轴):
我们记:
\vec{y_{}}=\begin{pmatrix} b \\ a \end{pmatrix}\qquad \vec{x_{}}=\begin{pmatrix} a \\ b \end{pmatrix}\qquad A=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\\
我们可以得到更简便的记法(这种形式看起来也更像线性方程 y=ax ):
\vec{y_{}}=A\vec{x_{}}\\
反正 \vec{y_{}},\vec{x_{}} 都是指代的平面上所有的点,我们干脆更简化点,认为:
而 y=x 不过是这个 A 的一种特殊情况。
2.3 矩阵 A 与基
慢着!刚才的结论其实是不完整的,我们还少了一个信息。
y=x 是基于直角坐标系的,通过这个转换:
y=x\to A=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\\
得到的 A 也是基于直角坐标系的。
只是在线性变换中,我们不称为直角坐标系,我们叫做标准正交基。
标准正交基是 \{ \vec{i_{}}=\begin{pmatrix} 1 \\ 0 \end{pmatrix},\vec{j_{}}=\begin{pmatrix} 0 \\ 1 \end{pmatrix}\} ,它们所张成的线性空间如下(关于这幅图画的解释,可以参考 如何理解矩阵乘法? ):
A 在此基下,完成了镜面反转这个线性变换:
因此,让我们补完之前的结论:
看到这个结论,可能你会想,难道还可以在别的基下?在别的基下是什么情况啊?
好,终于到了我们本文的重点了。
3 相似矩阵
知道了线性变换,让我们回到文章开头就给出的隐喻,看电影。
线性变换就是电影院中播放的电影,不同的基坐在不同的位置观看:
同一部“电影”,不同基“看到”的就是不同的矩阵:
那怎么得到不同基下的矩阵呢?让我们来看看变换的细节。
3.1 细节
先上一张图,说明不同基下的矩阵的变换思路,这个图有点复杂,请参照之后的解释一起来看:
下面是对图的解释:
- 有两个基: V_1:\{ \vec{i_{}},\vec{j_{}}\} 和 V_2:\{ \vec{i'},\vec{j'}\}
- V1\to V2 ,可以通过 P^{-1} 转换
- V2\to V1 ,可以通过 P 转换
整个转换的核心,就是上图正中的文字:
解释下:
- \vec{v'} 是 V2 下的点
- \vec{v'} 通过 P 变为 V1 下的点,即 P\vec{v'}
- 在 V1 下,通过 A 矩阵完成线性变换,即 AP\vec{v'}
- 通过 P^{-1} 从变回 V2 下的点,即 P^{-1}AP\vec{v'}
综上,我们可以有:
B\vec{v'}=P^{-1}AP\vec{v'}\\
我们可以认为:
B=P^{-1}AP\\
那么 B 和 A 互为相似矩阵。
那就还有一个细节了, V2\to V1 的转换矩阵 P ?
这个问题不复杂,只是坐标换来换去的,我尽量讲清楚。
首先我们给出空间中的一点,比如说 m 点吧:
相信大家可以理解,不论有没有基,这个点都是客观存在的。
然后,我们给出 m 点在 \vec{i'},\vec{j'} 的坐标 \vec{v'} :
为了表示 \vec{v'} 是 \vec{i'},\vec{j'} 下的坐标,我们写成这样:
\vec{v'}=\begin{pmatrix} a \\ b \end{pmatrix}=a\vec{i'}+b\vec{j'}\\
如果我们知道了 \vec{i'},\vec{j'} 在 \vec{i},\vec{j} 下的坐标:
那么有:
\begin{align*} \vec{v'} & = a\vec{i'}+b\vec{j'}\\ & = a(c\vec{i}+d\vec{j})+b(e\vec{i}+f\vec{j}) \end{align*}\\
此时,实际上 m 点的坐标,已经变到了 \vec{i},\vec{j} 下的 \vec{v} :
坐标已经转换了,继续往下推:
\begin{align*} \vec{v} & = a(c\vec{i}+d\vec{j})+b(e\vec{i}+f\vec{j})\\ & = \begin{pmatrix} c & e \\ d & f \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix}\\ & = \begin{pmatrix} \vec{i'} & \vec{j'} \end{pmatrix}\vec{v'} \\ & = P\vec{v'} \end{align*}\\
所以 P 其实就是:
P=\begin{pmatrix} \vec{i'} & \vec{j'} \end{pmatrix}\\
要记得啊,上面的 \vec{i'},\vec{j'} 是在 \vec{i},\vec{j} 下的坐标。
这里面稍微复杂点的就是,转换的时候要想清楚到底是在哪个基下!
为什么我们需要相似矩阵呢?我们来看看熟悉的极坐标。
3.2 极坐标
比如我把直角坐标系( xy 坐标系)的圆方程换元为极坐标( \rho \theta 坐标系)下:
x^2+y^2=a^2\implies \begin{cases} \rho =a\\ \theta \in \mathbb {R}\end{cases}\\
图像也从左边变为了右边:
换元之后是不是代数式和图像都变简单了。
相似矩阵的目的也是为了找到更简单的坐标系。
那么什么叫作简单的坐标系呢?
3.3 对角矩阵
比如这个 A 矩阵:
A=\begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix}\\
可以这样分解:
B=P^{-1}AP=\begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix}\\
其中 P=P^{-1}=\begin{pmatrix} -\frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \cr \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{pmatrix}
B 就是对角矩阵,看上去就很清爽,我认为这个就是简单的坐标系。
关于这方面更多的可以参看, 特征值、特征向量
更多内容推荐马同学图解数学系列