22对角化、A的幂

2023-10-19 00:42:27

一、矩阵对角化及其条件

1.2 矩阵对角化

对角化是对方阵的一种运算，使得其运算结果为一个对角方阵。下面会讲具体的例子：

什么是对角矩阵：从左上角到右下角的直线（叫做对角线）以外的元素都是零。这种方阵称为对角矩阵，简称对角阵，记作： $\Lambda=diag(\lambda_1,\lambda_2,\cdots,\lambda_n)$

将方阵 $A$ 的特征向量放入一个新的矩阵 $S$ ，那么有：
$\begin{aligned} AS&=A\begin{bmatrix}c_1&c_2&\cdots&c_n\end{bmatrix}\\&=\begin{bmatrix}\lambda_1c_1&\cdots&\lambda_nc_n\end{bmatrix}\\ &=\begin{bmatrix}c_1&c_2&\cdots& c_n\end{bmatrix}\begin{bmatrix}\lambda_1&0&\cdots&0\\0&\lambda_2&\cdots&0\\ \cdots&\cdots&\cdots&\cdots\\ \cdots&\cdots&\cdots&\lambda_n\end{bmatrix}=S\Lambda \end{aligned}\tag{1}$
也就是有：
$AS=S\Lambda\tag{2}$
假设特征向量是线性无关的有：
$S^{-1}AS=\Lambda\tag{3}$
下面是等价表达，也就是我们这节课矩阵对角化的重要公式：
$A=S\Lambda S^{-1}\tag{4}$
这样的对角化为什么是重要的？答：可以化简矩阵的幕，减少运算量。考虑两个相同矩阵 $A$ 相乘的结果：
由（4）可得：
$A^2=S\Lambda S^{-1}S\Lambda S^{-1}=S\Lambda(SS^{-1})\Lambda S^{-1}=S\Lambda^2S^{-1}\tag{5}$
上面的式子告诉我们我们可以将矩阵的幂转化到特征矩阵与特征向量构成的矩阵。更一般的，
$A^k=S\Lambda^kS^{-1}\tag{6}$
请不要忘记方阵进行对角化的条件，存在矩阵维度大小的独立的特征向量。如果你不想判断特征向量是否独立，可以考虑直接利用特征值是否相同进行判断，有以下结论：所有特征值都不同。

OK，在最后对比一下中学时期学的指数函数与本节学的矩阵作为幂的指数函数：

对比项	指数无穷大时归零条件
$A^k$	$\forall \quad \vert\lambda_i\vert<1$
$a^k$	$\vert a\vert<1$

特征值如果相同是不是一定无法进行对角化？答：不是。 $A$ 矩阵的特征值不同，是其可对角化的充分不必要条件。为什么是不必要的条件？下面是几个例子：特征值相同但是存在可以被对角化。

例子1：单位矩阵 $I=\begin{bmatrix}1&0&0\\0&1&0\\0&0&1\end{bmatrix}$ ，其特征值有三个，都是1，但是所有的向量都是其特征向量，任取3个即可。

例子2：对于一个三角矩阵 $A=\begin{bmatrix}2&1\\0&2\end{bmatrix}$ 的特征值为2和2，再求其特征向量 $A-2I=\begin{bmatrix}0&1\\0&0\end{bmatrix}$ ，这个矩阵的零空间是零向量，特征向量为 $x_1=\begin{bmatrix}1\\0\end{bmatrix}$ ，因为不能找到2个线性无关的向量，不可以进行对角化。

二、应用：差分方程（Difference equation） $u_k=A^ku_0$

如果 $x_i$ 是 $A$ 的一个特征向量，那么 $kx_i$ ( $k\neq 0$ )也是其特征向量。

这里讨论一个较为简单的一阶差分方程，其一般形式是：
$u_{k+1}=Au_k\tag{7}$
如果你感到抽象，你可以将一个物体的状态在某个时刻的整体状态为一个列向量 $u_k=\begin{bmatrix}1\\2\\3\end{bmatrix}$ ，每一个元素都代表具体的状态，下一刻的状态 $u_{k+1}$ 由一个矩阵 $A$ 更新。

下面来写一下（7）的通项公式：
$u_1=Au_0\\ u_2=A^2u_0\\ \cdots\\ u_k=A^ku_0\tag{10}$

虽然知道了通项公式，但是计算多次 $A$ 并不是一个聪明之举，利用这节课前面提到对角化方法进行计算上的简化。下面是进行简化的过程：

在进行简化之前首先要确保矩阵 $A$ 是可对角化的。设向量 $u_0$ 是矩阵 $A$ 特征向量 $x_i$ 的线性组合：
$u_0=c_1x_1+c_2x_2+\dots+c_nx_n\tag{11}$

为什么我们以可以使用 $A$ 的特征向量的线性组合来表示 $u_0$ ？这是因为特征向量是线性无关的，它可以表示特征向量个数的任何向量，当然就包括 $u_0$ 。

接着我们将式子左右两边同时乘以矩阵 $A$ ，有：
$\begin{aligned} Au_0&=A(c_1x_1+c_2x_2+\dots+c_nx_n)\\ &=c_1x_1+Ac_2x_2+\cdots+Ac_nx_n\\ &=c_1\lambda_1x_1+c_2\lambda_2x_2+\cdots+c_n\lambda_nx_n\\ \end{aligned}\tag{12}$
容易推出：
$A^ku_0=c_1\lambda_1^kx_1+c_2\lambda_2^kx_2+\cdots+c_n\lambda_n^kx_n\tag{13}$
以上的公式告诉我们 $A$ 的 $k$ 次幂乘以初值 $u_0$ 等于一个数 $c_i$ 乘以其特征值 $\lambda_i$ 的 $k$ 次方。我们再使用矩阵与语言描述一下上面的推导过程：
$u_0=\begin{bmatrix} &&\\ x_1&\cdots&x_n\\ && \end{bmatrix}\begin{bmatrix}c_1\\\vdots\\c_n\end{bmatrix}\tag{14}$
也就是
$u_0=Sc\tag{15}$
其中矩阵 $S$ 是特征向量矩阵，因为它是可逆的，所以：
$c=S^{-1}u_0\tag{16}$
下面考虑通项 $A^{k}u_0$ ：
$\begin{aligned} u_k=A^ku_0&=S\Lambda^kS^{-1}u_0=S\Lambda^k(S^{-1}c)=S\Lambda^kc\\ &=\begin{bmatrix} &&\\ x_1&\cdots&x_n\\ && \end{bmatrix}\begin{bmatrix}(\lambda_1)^k&&\\&\ddots\\&&(\lambda_n)^k\end{bmatrix}\begin{bmatrix}c_1\\\vdots\\c_n\end{bmatrix} \end{aligned}\tag{17}$

斐波那契数列（Fibonacci）例子：
$0,1,1,2,3,5,8,13\cdots F_{100}$
如何将第100个斐波那契数求出以及其增长速度如何？

答：增长速度、收敛性、稳定性是由特征值决定的，下面给出其递推公式：
$F_{k+2}=F_{k+1}+F_k$
这个方程不仅和上一个值 $F_k$ 有关，而且还与上上个的值 $F_k$ 有关，是一个二阶差分方程。还能添加一个条件：
$F_{k+2}=F_{k+1}+F_k\\ F_{k+1}=F_{k+1}$
写成矩阵形式：
$\begin{bmatrix}F_{k+2}\\F_{k+1}\end{bmatrix}=\begin{bmatrix}1&1\\1&0\end{bmatrix}\begin{bmatrix}F_{k+1}\\F_k\end{bmatrix}$
这里利用一个小技巧将二阶方程“降”为一阶方程：
$u_k=\begin{bmatrix}F_{k+1}\\F_k\end{bmatrix}\\ u_{k+1}=\begin{bmatrix}u_{k+2}\\u_{k+1}\end{bmatrix}$
代入（14）有：
$u_{k+1}=\begin{bmatrix}1&1\\1&0\end{bmatrix}u_k$
由： $\vert A-\lambda I\vert=-\lambda^2-\lambda+1=0$ 可以求得特征值分别是：
$\lambda_1=\frac{1+\sqrt{5}}{2}\approx1.618\\ \lambda_2=\frac{1-\sqrt{5}}{2}\approx0.618$
对应的特征向量为：
$\begin{bmatrix}1-\lambda&1\\1&-\lambda\end{bmatrix}x=0$
$x=\begin{bmatrix}\lambda\\1\end{bmatrix}$ 是矩阵的特征向量，这是因为：
$Ax=\begin{bmatrix}-\lambda^2-\lambda+1\\0\end{bmatrix}=\begin{bmatrix}0\\0\end{bmatrix}$
这是因为 $-\lambda^2-\lambda+1=0$ 恰好等于特征根方程。

$x_1=\begin{bmatrix}1.618\\1\end{bmatrix}\quad x_2=\begin{bmatrix}0.618\\1\end{bmatrix}$

为了利用之前的结论，我们需要将初值 $u_0$ 用 $A$ 矩阵的特征向量的线性组合表示，假设这个线性组合是 $c_0$ 和 $c_1$
$u_0=c_1x_1+c_0x_2$
结果是什么并不重要。让我们回顾整个解题逻辑：

将二阶差分方程转换成一阶差分方程，目的是应用一阶差分方程幂特点
确定求得的特征值和特征向量可以用来表示 $u_0$
若第二步存在，那么有 $u_k=A^{100}u_0=c_1\lambda_1^{100}x_1+c_2\lambda_2^{100}x_2+\cdots+c_n\lambda_n^{100}x_n$

因为这里只是二阶矩阵，所以：
$u_k=c_1\lambda_1^{100}x_1+c_2\lambda_2^{100}x_2$

对于这个例子：
$u_{100}=c_1(0.618)^{100}x_1+c_2(1.618)^{100}x_2$
简单分析，随着阶数的增大，特征值小于1的（0.618）影响将会越来越小，所以取决定性因素的特征值是比较大的那个（1.618）。

【1】20220930 重新整理了课堂上不明白的地方。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

22对角化、A的幂

一、矩阵对角化及其条件

1.2 矩阵对角化

二、应用：差分方程（Difference equation） u k = A k u 0 u_k=A^ku_0 uk​=Aku0​

相关文章

二、应用：差分方程（Difference equation） $u_k=A^ku_0$