有没有人能用人类的语言告诉我,相似矩阵有什么用?

做论文需要用相似矩阵评估一个聚类模型。我不需要知道其数学原理,只要知道这东西是干什么用的。有人能告诉我么? === 补充一下,我知道什么是相似矩阵,也…
关注者
926
被浏览
494,791
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

相似矩阵的定义是:

A,B 都是 n 阶矩阵,若有可逆矩阵 P ,使 P^{-1}AP=B 则称 B A 的相似矩阵,或说 A B 相似。----《线性代数》同济版

让我们从通俗解释开始。

1 通俗解释

今天《雷神3》上映了,我坐在第一排看电影:

而你坐在最后一排看电影:

我们看的是同一部电影,但是我们各自眼中看到的电影却因为位置不同而有所不同(比如清晰度啊、角度啊),所以说,“第一排看到的电影”和“最后一排看到的电影”是“相似”的。

那么相似矩阵走进的电影院,放映的是哪部电影?也就是说,什么是不变的呢?

是线性变换。

2 线性变换

什么是线性变换?让我们从函数说起。

2.1 线性函数

函数我们很早就接触了,直观地讲,就是把 x 轴上的点映射到曲线上(下面是函数y=sin(x) ,把 x 轴上的点映射到了正弦曲线上):

还有的函数,比如 y=x ,是把 x 轴上的点映射到直线上,我们称为线性函数:

2.2 从线性函数到线性变换

线性函数其实就是线性变换,为了看起来更像是线性变换,我换一种标记法。

比如之前的 y=x ,我们可以认为是把 (a,0) 点映射到 (0,a) 点,我们称为线性变换T ,记作:

T:(a,0)\to (0,a),a\in \mathbb {R},b\in \mathbb {R}\\

不过按照这个写法,作图就有点不一样了:

矩阵的形式很显然如下:

\begin{pmatrix} 0 \\ a \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ 0 \end{pmatrix}\\

这样做最直接的好处是,我们可以轻易的摆脱 x 轴的限制。

只要替换 (a,0) 为平面内所有的点 (a,b) ,我们就可以对整个平面做变换,该线性变换记作:

T:(a,b)\to (b,a)\\

进而可以写作矩阵的形式:

\begin{pmatrix} b \\ a \end{pmatrix}=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix}\\

为了示意整个平面的点都被变换了,我用下面的淡蓝色网格来表示这个线性变换(这个变换实际上镜面反转,为了方便观察增加一个参考点 \vec{x_{}} 以及虚线表示的反转对称轴):

我们记:

\vec{y_{}}=\begin{pmatrix} b \\ a \end{pmatrix}\qquad \vec{x_{}}=\begin{pmatrix} a \\ b \end{pmatrix}\qquad A=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\\

我们可以得到更简便的记法(这种形式看起来也更像线性方程 y=ax ):

\vec{y_{}}=A\vec{x_{}}\\

反正 \vec{y_{}},\vec{x_{}} 都是指代的平面上所有的点,我们干脆更简化点,认为:

y=x 不过是这个 A 的一种特殊情况。

2.3 矩阵 A 与基

慢着!刚才的结论其实是不完整的,我们还少了一个信息。

y=x 是基于直角坐标系的,通过这个转换:

y=x\to A=\begin{pmatrix} 0 & 1 \\ 1 & 0 \end{pmatrix}\\

得到的 A 也是基于直角坐标系的。

只是在线性变换中,我们不称为直角坐标系,我们叫做标准正交基。

标准正交基是 \{ \vec{i_{}}=\begin{pmatrix} 1 \\ 0 \end{pmatrix},\vec{j_{}}=\begin{pmatrix} 0 \\ 1 \end{pmatrix}\} ,它们所张成的线性空间如下(关于这幅图画的解释,可以参考 如何理解矩阵乘法? ):

A 在此基下,完成了镜面反转这个线性变换:

因此,让我们补完之前的结论:

看到这个结论,可能你会想,难道还可以在别的基下?在别的基下是什么情况啊?

好,终于到了我们本文的重点了。

3 相似矩阵

知道了线性变换,让我们回到文章开头就给出的隐喻,看电影。

线性变换就是电影院中播放的电影,不同的基坐在不同的位置观看:

同一部“电影”,不同基“看到”的就是不同的矩阵:

那怎么得到不同基下的矩阵呢?让我们来看看变换的细节。

3.1 细节

先上一张图,说明不同基下的矩阵的变换思路,这个图有点复杂,请参照之后的解释一起来看:

下面是对图的解释:

  • 有两个基: V_1:\{ \vec{i_{}},\vec{j_{}}\} V_2:\{ \vec{i'},\vec{j'}\}
  • V1\to V2 ,可以通过 P^{-1} 转换
  • V2\to V1 ,可以通过 P 转换

整个转换的核心,就是上图正中的文字:

解释下:

  • \vec{v'}V2 下的点
  • \vec{v'} 通过 P 变为 V1 下的点,即 P\vec{v'}
  • V1 下,通过 A 矩阵完成线性变换,即 AP\vec{v'}
  • 通过 P^{-1} 从变回 V2 下的点,即 P^{-1}AP\vec{v'}

综上,我们可以有:

B\vec{v'}=P^{-1}AP\vec{v'}\\

我们可以认为:

B=P^{-1}AP\\

那么 BA 互为相似矩阵。

那就还有一个细节了, V2\to V1 的转换矩阵 P

这个问题不复杂,只是坐标换来换去的,我尽量讲清楚。

首先我们给出空间中的一点,比如说 m 点吧:

相信大家可以理解,不论有没有基,这个点都是客观存在的。

然后,我们给出 m 点在 \vec{i'},\vec{j'} 的坐标 \vec{v'}

为了表示 \vec{v'}\vec{i'},\vec{j'} 下的坐标,我们写成这样:

\vec{v'}=\begin{pmatrix} a \\ b \end{pmatrix}=a\vec{i'}+b\vec{j'}\\

如果我们知道了 \vec{i'},\vec{j'}\vec{i},\vec{j} 下的坐标:

那么有:

\begin{align*} \vec{v'} & = a\vec{i'}+b\vec{j'}\\ & = a(c\vec{i}+d\vec{j})+b(e\vec{i}+f\vec{j}) \end{align*}\\

此时,实际上 m 点的坐标,已经变到了 \vec{i},\vec{j} 下的 \vec{v}

坐标已经转换了,继续往下推:

\begin{align*} \vec{v} & = a(c\vec{i}+d\vec{j})+b(e\vec{i}+f\vec{j})\\ & = \begin{pmatrix} c & e \\ d & f \end{pmatrix}\begin{pmatrix} a \\ b \end{pmatrix}\\ & = \begin{pmatrix} \vec{i'} & \vec{j'} \end{pmatrix}\vec{v'} \\ & = P\vec{v'} \end{align*}\\

所以 P 其实就是:

P=\begin{pmatrix} \vec{i'} & \vec{j'} \end{pmatrix}\\

要记得啊,上面的 \vec{i'},\vec{j'} 是在 \vec{i},\vec{j} 下的坐标。

这里面稍微复杂点的就是,转换的时候要想清楚到底是在哪个基下!

为什么我们需要相似矩阵呢?我们来看看熟悉的极坐标。

3.2 极坐标

比如我把直角坐标系( xy 坐标系)的圆方程换元为极坐标( \rho \theta 坐标系)下:

x^2+y^2=a^2\implies \begin{cases} \rho =a\\ \theta \in \mathbb {R}\end{cases}\\

图像也从左边变为了右边:

换元之后是不是代数式和图像都变简单了。

相似矩阵的目的也是为了找到更简单的坐标系。

那么什么叫作简单的坐标系呢?

3.3 对角矩阵

比如这个 A 矩阵:

A=\begin{pmatrix} 2 & -1 \\ -1 & 2 \end{pmatrix}\\

可以这样分解:

B=P^{-1}AP=\begin{pmatrix} 3 & 0 \\ 0 & 1 \end{pmatrix}\\

其中 P=P^{-1}=\begin{pmatrix} -\frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \cr \frac{\sqrt{2}}{2} & \frac{\sqrt{2}}{2} \end{pmatrix}

B 就是对角矩阵,看上去就很清爽,我认为这个就是简单的坐标系。

关于这方面更多的可以参看, 特征值、特征向量

更多内容推荐马同学图解数学系列

编辑于 2024-01-05 11:30・IP 属地四川