机器学习——矩阵和线性代数相关知识总结
方阵行列式
计算: n n n阶方阵的行列式等于它的任一行(或列)的各元素与其对应的代数余子式乘积之和。
代数余子式
余子式:在一个 n n n阶行列式 A A A中,把 ( i , j ) (\mathrm{i}, \mathrm{j}) (i,j)元素 a i j a_{ij} aij所在的第 i i i行和第 j j j列划去后,留下的 n − 1 n-1 n−1阶方阵的行列式叫做元素 a i j a_{ij} aij的余子式,记做 M i j M_{ij} Mij。
代数余子式: A i j = ( − 1 ) i + j M i j A_{i j}=(-1)^{i+j} M_{i j} Aij=(−1)i+jMij
行列式的计算:
A = ( a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ) ∀ 1 ≤ i ≤ n , ∣ A ∣ = ∑ j = 1 n a i j ⋅ ( − 1 ) i + j M i j A=\left(\begin{array}{lll}{a_{11}} & {a_{12}} & {a_{13}} \\ {a_{21}} & {a_{22}} & {a_{23}} \\ {a_{31}} & {a_{32}} & {a_{33}}\end{array}\right) \quad \forall 1 \leq i \leq n,|A|=\sum_{j=1}^{n} a_{i j} \cdot(-1)^{i+j} M_{i j} A=⎝⎛a11a21a31a12a22a32a13a23a33⎠⎞∀1≤i≤n,∣A∣=∑j=1naij⋅(−1)i+jMij
伴随矩阵:对于 n × n n×n n×n方阵的任意元素 a i j a_{ij} aij的代数余子式 A i j A_{ij} Aij构成的方阵 A ∗ A^* A∗。
A ∗ = ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ) A^{*}=\left(\begin{array}{cccc}{A_{11}} & {A_{21}} & {\cdots} & {A_{n 1}} \\ {A_{12}} & {A_{22}} & {\cdots} & {A_{n 2}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {A_{1 n}} & {A_{2 n}} & {\cdots} & {A_{n n}}\end{array}\right) A∗=⎝⎜⎜⎜⎛A11A12⋮A1nA21A22⋮A2n⋯⋯⋱⋯An1An2⋮Ann⎠⎟⎟⎟⎞( A i j A_{ij} Aij为矩阵 A ∗ A^* A∗的第 j j j行第 i i i列)
可以得到:
A ⋅ A ∗ = ( ∣ A ∣ 0 ⋯ 0 0 ∣ A ∣ ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ ∣ A ∣ ) = ∣ A ∣ ⋅ I ⇒ A − 1 = 1 ∣ A ∣ A ∗ A \cdot A^{*}=\left(\begin{array}{cccc}{|A|} & {0} & {\cdots} & {0} \\ {0} & {|A|} & {\cdots} & {0} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {0} & {0} & {\cdots} & {|A|}\end{array}\right)=|A| \cdot I \Rightarrow A^{-1}=\frac{1}{|A|} A^{*} A⋅A∗=⎝⎜⎜⎜⎛∣A∣0⋮00∣A∣⋮0⋯⋯⋱⋯00⋮∣A∣⎠⎟⎟⎟⎞=∣A∣⋅I⇒A−1=∣A∣1A∗
矩阵乘法
矩阵与矩阵相乘: A A A为 m × s m×s m×s的矩阵, B B B为 s × n s×n s×n的矩阵,那么, C = A × B C=A×B C=A×B是 m × n m×n m×n阶的矩阵,其中, c i j = ∑ k = 1 s a i k b k j c_{i j}=\sum_{k=1}^{s} a_{i k} b_{k j} cij=∑k=1saikbkj。
矩阵与向量相乘: A A A为 m × n m×n m×n的矩阵, x \bold{x} x为 n × 1 n×1 n×1的向量,则 A x A\bold{x} Ax是 m × 1 m×1 m×1阶的向量,记 y ⃗ = A ⋅ x ⃗ \vec{y}=A \cdot \vec{x} y=A⋅x。(从 n n n维到 m m m维空间点的线性变换)
矩阵的秩
在 m × n m×n m×n的矩阵 A A A中任取 k k k行 k k k列,不改变每个元素在 A A A中的相对位置,得到的 k k k阶方阵称为矩阵 A A A的 k k k阶子式。
如果矩阵 A A A有一个行列式不为 0 0 0的 r r r阶子式 D D D,并且其所有的 r + 1 r+1 r+1阶子式(如果存在的话)的行列式都等于 0 0 0,那么, D D D称为矩阵 A A A的最高阶非零子式, r r r称为矩阵 A A A的秩,记做 R ( A ) = r R(A) =r R(A)=r。
- n × n n×n n×n的可逆矩阵,秩为 n n n,称为满秩矩阵。
- 矩阵的秩等于它行(列)向量组的秩。
向量组
定义:对于由向量 ( a 1 , a 2 , … , a m ) \left(a_{1}, a_{2}, \dots, a_{m}\right) (a1,a2,…,am) 组成的向量组 A A A和由向量 ( b 1 , b 2 , … , b n ) \left(b_{1}, b_{2}, \dots, b_{n}\right) (b1,b2,…,bn)组成的向量组 B B B, B B B组能由 A A A组线性表示,则称两个向量组等价,得到系数矩阵 K K K:
( b 1 b 2 ⋯ b n ) = ( a 1 a 2 ⋯ a m ) ( k 11 k 12 ⋯ k 1 n k 21 k 22 ⋯ k 2 n ⋮ ⋮ ⋱ ⋮ k m 1 k m 2 ⋯ k m n ) \left.\begin{array}{lllll}{\left(b_{1} \quad b_{2}\right.} & {\cdots} & {\left.b_{n}\right)=\left(a_{1}\right.} & {a_{2}} & {\cdots} & {a_{m}}\end{array}\right)\left(\begin{array}{cccc}{k_{11}} & {k_{12}} & {\cdots} & {k_{1 n}} \\ {k_{21}} & {k_{22}} & {\cdots} &{k_{2 n}}\\ {\vdots} & {\vdots} & {\ddots} & {\vdots}\\ {k_{m 1}} & {k_{m 2}} & {\cdots} & {k_{m n}}\end{array}\right) (b1b2⋯bn)=(a1a2⋯am)⎝⎜⎜⎜⎛k11k21⋮km1k12k22⋮km2⋯⋯⋱⋯k1nk2n⋮kmn⎠⎟⎟⎟⎞
正交阵
定义:若 n n n阶矩阵 A A A满足 A T A = I A^TA=I ATA=I,则称矩阵 A A A为正交矩阵,简称正交阵。
充要条件: A A A的列(行)向量都是单位向量,且两两相交。
正交变换: A A A为正交阵, x \bold{x} x为向量,则 A x A\bold{x} Ax称为正交变换。(不改变向量长度)
特征值和特征向量
对于 n n n阶矩阵 A A A,若数 λ \lambda λ和 n n n维非0列向量 x \bold{x} x满足 A x = λ x \mathrm{A\bold{x}}=\lambda \mathrm{\bold{x}} Ax=λx,则称 λ \lambda λ为 A A A的特征值, x \bold{x} x为 A A A的对应特征值 λ \lambda λ的特征向量。
( A − λ I ) x = 0 \quad\quad\quad\quad(A-\lambda I) x=0 (A−λI)x=0 ∣ A − λ I ∣ = 0 \quad\quad\quad\quad\quad |A-\lambda I|=0 ∣A−λI∣=0
性质:
- λ 1 + λ 2 + … + λ n = a 11 + a 22 + … + a n n \lambda_{1}+\lambda_{2}+\ldots+\lambda_{n}=a_{11}+a_{22}+\ldots+a_{n n} λ1+λ2+…+λn=a11+a22+…+ann(对角线元素和等于特征值之和,称为矩阵的迹)
- λ 1 λ 2 … λ n = ∣ A ∣ \lambda_{1} \lambda_{2} \ldots \lambda_{n}=|\mathbf{A}| λ1λ2…λn=∣A∣
- λ 2 \lambda^2 λ2是 A 2 A^2 A2的平均值(根据定义可证)
- A A A可逆时, λ − 1 \lambda^{-1} λ−1是 A − 1 A^{-1} A−1的特征值(根据定义可证)
- 若特征值 λ 1 , λ 2 , … , λ m \lambda_{1}, \lambda_{2}, \ldots,\lambda_{m} λ1,λ2,…,λm各不相等,则对应的特征向量线性 u 1 , u 2 , … , u m u_{1}, u_{2}, \ldots,u_{m} u1,u2,…,um线性无关。
- 实对称阵的特征值是实数,特征向量是实向量,并且正交。
- 矩阵形式: A ⋅ ( u v ) = ( λ 1 0 0 λ 2 ) ( u v ) A \cdot(u \quad v)=\left(\begin{array}{ll}{\lambda_{1}} & {0} \\ {0} & {\lambda_{2}}\end{array}\right)(u \quad v) A⋅(uv)=(λ100λ2)(uv)(u,v是两个特征向量)
- 合同变换: P − 1 A P = P T A P = Λ P^{-1} A P=P^{T} A P=\Lambda P−1AP=PTAP=Λ( A A A为对称阵, P P P为特征向量组成的正交矩阵, Λ \Lambda Λ为特征值组成对角阵,可以由上式证明)
矩阵和向量求导
-
向量对向量求导:
∂ A x ⃗ ∂ x ⃗ = A T \frac{\partial A \vec{x}}{\partial \vec{x}}=A^{T} ∂x∂Ax=AT ∂ A x ⃗ ∂ x ⃗ T = A \quad\frac{\partial A \vec{x}}{\partial \vec{x}^{T}}=A ∂xT∂Ax=A ∂ ( x ⃗ T A ) ∂ x ⃗ = A \quad\frac{\partial\left(\vec{x}^{T} A\right)}{\partial \vec{x}}=A ∂x∂(xTA)=A -
向量对标量求导:
∂ y ∂ x ⃗ = ∂ ( x ⃗ T ⋅ A ⋅ x ⃗ ) ∂ x ⃗ = ( A T + A ) ⋅ x ⃗ \frac{\partial y}{\partial \vec{x}}=\frac{\partial\left(\vec{x}^{T} \cdot A \cdot \vec{x}\right)}{\partial \vec{x}}=\left(A^{T}+A\right) \cdot \vec{x} ∂x∂y=∂x∂(xT⋅A⋅x)=(AT+A)⋅x -
标量对方阵的求导:
∂ ∣ A ∣ ∂ A = ( A ∗ ) T = ∣ A ∣ ⋅ ( A − 1 ) T \frac{\partial|A|}{\partial A}=\left(A^{*}\right)^{T}=|A| \cdot\left(A^{-1}\right)^{T} ∂A∂∣A∣=(A∗)T=∣A∣⋅(A−1)T
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
