如何理解矩阵特征值?

关注者
7,138
被浏览
2,832,121
登录后你可以
不限量看优质回答私信答主深度交流精彩内容一键收藏

“横看成岭侧成峰,远近高低各不同”这句古诗精准地描述了相似变换及特征值的本质。为了理解矩阵特征值,首先需要理解相似变换的意义。下面,我们将问题分解为6个部分,逐步深入理解。

(1)基底之间的过渡关系

根据线性代数知识,只要找到合适的基底(Base),即可建立坐标系,线性空间中的任意对象都可以用坐标(Coordinate)表示。设 \left[ \alpha \right]\text{=}\left\{ {{\alpha }_{1}}\cdot \cdot \cdot ,{{\alpha }_{i}}\cdot \cdot \cdot {{\alpha }_{n}} \right\}\[\left[ \beta \right]\text{=}\left\{ {{\beta }_{1}}\cdot \cdot \cdot ,{{\beta }_{i}}\cdot \cdot \cdot ,{{\beta }_{n}} \right\}\]n 维线性空间 V 中的两组基,即可建立两个坐标系, \left[ \beta \right] 基和 \left[ \alpha \right] 基之间的关系为

\left\{ \begin{align} & {{\beta }_{1}}={{p}_{11}}{{\alpha }_{1}}+{{p}_{21}}{{\alpha }_{2}}+\cdot \cdot \cdot {{p}_{n1}}{{\alpha }_{n}} \\ & {{\beta }_{2}}={{p}_{12}}{{\alpha }_{1}}+{{p}_{22}}{{\alpha }_{2}}+\cdot \cdot \cdot {{p}_{n2}}{{\alpha }_{n}} \\ & \cdot \cdot \cdot \\ & {{\beta }_{n}}={{p}_{1n}}{{\alpha }_{1}}+{{p}_{2n}}{{\alpha }_{2}}+\cdot \cdot \cdot {{p}_{nn}}{{\alpha }_{n}} \\ \end{align} \right.

式中, p_{ij} 为过渡系数。

将上式改写成矩阵的形式为

\left[ \beta \right]=\left[ \alpha \right]P

式中, P 为过渡矩阵。

(2)坐标之间的过渡关系

在线性空间 V 中,可以用基和坐标来描述这个空间中的对象,通常表示为向量的形式。同一个对象在不同基下的坐标是不同的,因此描述对象的向量(坐标)也不同。例如, \left[ \alpha \right] 基下的向量 a\left[ \beta \right] 基下表示为向量 c\left[ \alpha \right] 基下的向量 b\left[ \beta \right] 基下表示为向量 d ,坐标之间的过渡关系为

\left\{ \begin{align} & c={{P}^{-1}}a \\ & d={{P}^{-1}}b \\ \end{align} \right.

(3)矩阵乘法描述运动

矩阵乘法描述了线性空间 V 中的运动,即线性变换,其将一个向量变成另一个方向或长度不同的新向量。如下图所示,在 \left[ \alpha \right] 基下描述一个线性变换 \[a\to b\] ,用矩阵乘法表示为 \[b=Aa\] 。在 \left[ \beta \right] 基下描述该线性变换为 \[c\to d\] ,用矩阵乘法表示为 \[d=Bc\]

(4)理解矩阵相似

为了揭示矩阵 AB 之间的关系,将 \left[ \alpha \right] 基下的向量 a 变到 \left[ \beta \right] 基下的向量 c ,即 \[c={{P}^{-1}}a\] 。对向量 c 左乘矩阵 B ,得到向量 d 。然后,进行一次逆变换 \[b=Pd\] ,将 \left[ \beta \right] 基下的向量 d 变成 \left[ \alpha \right] 基下的向量 b 。比较 b=Aa\[b=PB{{P}^{-1}}a\] ,可以发现 \[B={{P}^{-1}}AP\] 。表明矩阵相似建立了同一个线性变换在不同基下的关系

(5)矩阵对角化与特征值

在线性变换的过程中,向量发生伸缩、旋转或剪切。不同的坐标系(基)下,矩阵的复杂程度不一样,正如从不同角度看问题,其难易程度是不一样的!那么是否存在一个“完美的”坐标系,能够将线性变换(矩阵)以最简单的形式表述出来呢?矩阵相似变换可以为我们找到这样的坐标系,简单回顾矩阵相似变换的过程。若存在 n 个线性无关的向量 p_i ,满足

Ap_i=\lambda p_i

则有可逆矩阵

\[P=\left[ {{p}_{1}},\cdots {{p}_{i}},\cdots {{p}_{n}} \right]\]

使得

\[\Lambda ={{P}^{-1}}AP\]

式中, \[\Lambda \] 为对角矩阵, \[{{\lambda }_{i}}\] 为矩阵 A特征值,向量 p_i 为矩阵 A特征向量

矩阵的相似变换可以通过选取特殊的坐标轴,将一个比较复杂的矩阵变成一个比较简单的矩阵,而保证这两个矩阵都是描述了同一个线性变换。因此,矩阵对角化为我们提供了一个很好的看问题的角度。利用相似对角化,可将矩阵 A 用最简洁的对角阵 \[\Lambda \] 表示,即实现矩阵解耦。只要我们以特征向量为基底(坐标轴),矩阵 A 的全部信息都可以用特征值表示,其中实数特征值对应向量伸缩、纯虚数特征值对应向量旋转,重特征值还可能导致向量剪切!对一个线性变换而言,特征向量指明变换的方向,而特征值反映的是变换的剧烈程度。可以说,特征值揭示了运动的本质!

为什么矩阵的特征值有时会被称为谱呢?其实这和特征值的物理意义有关。在《线性系统理论》、《控制理论》、《信号与系统》、《机械振动》、《数值分析》这类课程中会介绍,线性微分/差分方程组系数矩阵的特征值对应系统振动的固有频率,特征向量就是结构振动的位移比

一个动力系统的动态特征决定于矩阵的特征值。特征值实数部分的正负决定系统是趋于稳定的定点还是发散,特征值虚数部分意味着系统围绕平衡点振动。可以说,特征值是动力系统最本质的特征,决定系统运动的演化和归宿。动力系统的矩阵特征值相同,则系统有相同的动态特征。动力系统的动态特征可通过选取特征向量作为坐标轴来揭示和探寻。因此,相似变换和特征值的地位才如此重要!

(6)理解矩阵合同

理解了以上内容,我们采用同样的思路理解矩阵合同,定义双线性运算为

\[E\left( a,b \right)={{a}^{\text{T}}} U b\text{=}\left( {{a}_{1}},{{a}_{2}},\cdots ,{{a}_{n}} \right)\left( \begin{matrix} {{u}_{11}} & {{u}_{12}} & \cdots & {{u}_{1n}} \\ {{u}_{21}} & {{u}_{22}} & \cdots & {{u}_{2n}} \\ \vdots & \vdots & {} & \vdots \\ {{u}_{n1}} & {{u}_{n2}} & \cdots & {{u}_{nn}} \\ \end{matrix} \right)\left( \begin{matrix} {{b}_{1}} \\ {{b}_{2}} \\ \vdots \\ {{b}_{n}} \\ \end{matrix} \right)\]

如图所示,在 \left[ \alpha \right] 基下,有一个双线性运算 E ,可以表示为 \[{{a}^{\text{T}}}\cdot U\cdot b\] 。当选择另一组基 \left[ \beta \right] 描述该双线性运算 E ,可以表示为 \[{{c}^{\text{T}}}\cdot V\cdot d\]

为了揭示矩阵 UV 之间的关系,将 \left[ \alpha\right] 基下的向量 a 变到 \left[ \beta\right] 基下的向量 c ,即 \[c={{P}^{-1}}a\] 。将\left[ \alpha\right] 基下的向量 b 变到 \left[ \beta\right] 基下的向量 d ,即 \[b={{P}^{-1}}d\] 。比较 \[{{c}^{\text{T}}}\cdot V\cdot d\]\[{{c}^{\text{T}}}\cdot {{P}^{\text{T}}}UP\cdot d\] ,可以发现 \[V={{P}^{\text{T}}}UP\]表明矩阵合同描述了同一个双线性型运算在不同坐标系下的关系。

通常,机械系统中的动能、势能、做功等都可归为双线性运算的形式,因此矩阵合同保证了坐标系变化前后系统中“做功/能量”一样,即保证了不同坐标系下的“做功/能量”不变。

编辑于 2023-06-13 10:20・IP 属地黑龙江