机器学习——矩阵和线性代数相关知识总结

方阵行列式

计算: n n n阶方阵的行列式等于它的任一行(或列)的各元素与其对应的代数余子式乘积之和。

代数余子式

余子式:在一个 n n n阶行列式 A A A中,把 ( i , j ) (\mathrm{i}, \mathrm{j}) (i,j)元素 a i j a_{ij} aij所在的第 i i i行和第 j j j列划去后,留下的 n − 1 n-1 n1阶方阵的行列式叫做元素 a i j a_{ij} aij的余子式,记做 M i j M_{ij} Mij

代数余子式: A i j = ( − 1 ) i + j M i j A_{i j}=(-1)^{i+j} M_{i j} Aij=(1)i+jMij

行列式的计算:
A = ( a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 ) ∀ 1 ≤ i ≤ n , ∣ A ∣ = ∑ j = 1 n a i j ⋅ ( − 1 ) i + j M i j A=\left(\begin{array}{lll}{a_{11}} & {a_{12}} & {a_{13}} \\ {a_{21}} & {a_{22}} & {a_{23}} \\ {a_{31}} & {a_{32}} & {a_{33}}\end{array}\right) \quad \forall 1 \leq i \leq n,|A|=\sum_{j=1}^{n} a_{i j} \cdot(-1)^{i+j} M_{i j} A=a11a21a31a12a22a32a13a23a331in,A=j=1naij(1)i+jMij

伴随矩阵:对于 n × n n×n n×n方阵的任意元素 a i j a_{ij} aij的代数余子式 A i j A_{ij} Aij构成的方阵 A ∗ A^* A
A ∗ = ( A 11 A 21 ⋯ A n 1 A 12 A 22 ⋯ A n 2 ⋮ ⋮ ⋱ ⋮ A 1 n A 2 n ⋯ A n n ) A^{*}=\left(\begin{array}{cccc}{A_{11}} & {A_{21}} & {\cdots} & {A_{n 1}} \\ {A_{12}} & {A_{22}} & {\cdots} & {A_{n 2}} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {A_{1 n}} & {A_{2 n}} & {\cdots} & {A_{n n}}\end{array}\right) A=A11A12A1nA21A22A2nAn1An2Ann( A i j A_{ij} Aij为矩阵 A ∗ A^* A的第 j j j行第 i i i列)

可以得到:
A ⋅ A ∗ = ( ∣ A ∣ 0 ⋯ 0 0 ∣ A ∣ ⋯ 0 ⋮ ⋮ ⋱ ⋮ 0 0 ⋯ ∣ A ∣ ) = ∣ A ∣ ⋅ I ⇒ A − 1 = 1 ∣ A ∣ A ∗ A \cdot A^{*}=\left(\begin{array}{cccc}{|A|} & {0} & {\cdots} & {0} \\ {0} & {|A|} & {\cdots} & {0} \\ {\vdots} & {\vdots} & {\ddots} & {\vdots} \\ {0} & {0} & {\cdots} & {|A|}\end{array}\right)=|A| \cdot I \Rightarrow A^{-1}=\frac{1}{|A|} A^{*} AA=A000A000A=AIA1=A1A

矩阵乘法

矩阵与矩阵相乘: A A A m × s m×s m×s的矩阵, B B B s × n s×n s×n的矩阵,那么, C = A × B C=A×B C=A×B m × n m×n m×n阶的矩阵,其中, c i j = ∑ k = 1 s a i k b k j c_{i j}=\sum_{k=1}^{s} a_{i k} b_{k j} cij=k=1saikbkj

矩阵与向量相乘: A A A m × n m×n m×n的矩阵, x \bold{x} x n × 1 n×1 n×1的向量,则 A x A\bold{x} Ax m × 1 m×1 m×1阶的向量,记 y ⃗ = A ⋅ x ⃗ \vec{y}=A \cdot \vec{x} y =Ax 。(从 n n n维到 m m m维空间点的线性变换)

矩阵的秩

m × n m×n m×n的矩阵 A A A中任取 k k k k k k列,不改变每个元素在 A A A中的相对位置,得到的 k k k阶方阵称为矩阵 A A A k k k阶子式。

如果矩阵 A A A有一个行列式不为 0 0 0 r r r阶子式 D D D,并且其所有的 r + 1 r+1 r+1阶子式(如果存在的话)的行列式都等于 0 0 0,那么, D D D称为矩阵 A A A的最高阶非零子式, r r r称为矩阵 A A A的秩,记做 R ( A ) = r R(A) =r R(A)=r

  • n × n n×n n×n的可逆矩阵,秩为 n n n,称为满秩矩阵。
  • 矩阵的秩等于它行(列)向量组的秩。

向量组

定义:对于由向量 ( a 1 , a 2 , … , a m ) \left(a_{1}, a_{2}, \dots, a_{m}\right) (a1,a2,,am) 组成的向量组 A A A和由向量 ( b 1 , b 2 , … , b n ) \left(b_{1}, b_{2}, \dots, b_{n}\right) (b1,b2,,bn)组成的向量组 B B B B B B组能由 A A A组线性表示,则称两个向量组等价,得到系数矩阵 K K K

( b 1 b 2 ⋯ b n ) = ( a 1 a 2 ⋯ a m ) ( k 11 k 12 ⋯ k 1 n k 21 k 22 ⋯ k 2 n ⋮ ⋮ ⋱ ⋮ k m 1 k m 2 ⋯ k m n ) \left.\begin{array}{lllll}{\left(b_{1} \quad b_{2}\right.} & {\cdots} & {\left.b_{n}\right)=\left(a_{1}\right.} & {a_{2}} & {\cdots} & {a_{m}}\end{array}\right)\left(\begin{array}{cccc}{k_{11}} & {k_{12}} & {\cdots} & {k_{1 n}} \\ {k_{21}} & {k_{22}} & {\cdots} &{k_{2 n}}\\ {\vdots} & {\vdots} & {\ddots} & {\vdots}\\ {k_{m 1}} & {k_{m 2}} & {\cdots} & {k_{m n}}\end{array}\right) (b1b2bn)=(a1a2am)k11k21km1k12k22km2k1nk2nkmn

正交阵

定义:若 n n n阶矩阵 A A A满足 A T A = I A^TA=I ATA=I,则称矩阵 A A A为正交矩阵,简称正交阵。
充要条件: A A A的列(行)向量都是单位向量,且两两相交。
正交变换: A A A为正交阵, x \bold{x} x为向量,则 A x A\bold{x} Ax称为正交变换。(不改变向量长度)

特征值和特征向量

对于 n n n阶矩阵 A A A,若数 λ \lambda λ n n n维非0列向量 x \bold{x} x满足 A x = λ x \mathrm{A\bold{x}}=\lambda \mathrm{\bold{x}} Ax=λx,则称 λ \lambda λ A A A的特征值, x \bold{x} x A A A的对应特征值 λ \lambda λ的特征向量。
( A − λ I ) x = 0 \quad\quad\quad\quad(A-\lambda I) x=0 (AλI)x=0 ∣ A − λ I ∣ = 0 \quad\quad\quad\quad\quad |A-\lambda I|=0 AλI=0
性质:

  • λ 1 + λ 2 + … + λ n = a 11 + a 22 + … + a n n \lambda_{1}+\lambda_{2}+\ldots+\lambda_{n}=a_{11}+a_{22}+\ldots+a_{n n} λ1+λ2++λn=a11+a22++ann(对角线元素和等于特征值之和,称为矩阵的迹)
  • λ 1 λ 2 … λ n = ∣ A ∣ \lambda_{1} \lambda_{2} \ldots \lambda_{n}=|\mathbf{A}| λ1λ2λn=A
  • λ 2 \lambda^2 λ2 A 2 A^2 A2的平均值(根据定义可证)
  • A A A可逆时, λ − 1 \lambda^{-1} λ1 A − 1 A^{-1} A1的特征值(根据定义可证)
  • 若特征值 λ 1 , λ 2 , … , λ m \lambda_{1}, \lambda_{2}, \ldots,\lambda_{m} λ1,λ2,,λm各不相等,则对应的特征向量线性 u 1 , u 2 , … , u m u_{1}, u_{2}, \ldots,u_{m} u1,u2,,um线性无关。
  • 实对称阵的特征值是实数,特征向量是实向量,并且正交。
  • 矩阵形式: A ⋅ ( u v ) = ( λ 1 0 0 λ 2 ) ( u v ) A \cdot(u \quad v)=\left(\begin{array}{ll}{\lambda_{1}} & {0} \\ {0} & {\lambda_{2}}\end{array}\right)(u \quad v) A(uv)=(λ100λ2)(uv)(u,v是两个特征向量)
  • 合同变换: P − 1 A P = P T A P = Λ P^{-1} A P=P^{T} A P=\Lambda P1AP=PTAP=Λ A A A为对称阵, P P P为特征向量组成的正交矩阵, Λ \Lambda Λ为特征值组成对角阵,可以由上式证明)

矩阵和向量求导

  • 向量对向量求导:
    ∂ A x ⃗ ∂ x ⃗ = A T \frac{\partial A \vec{x}}{\partial \vec{x}}=A^{T} x Ax =AT ∂ A x ⃗ ∂ x ⃗ T = A \quad\frac{\partial A \vec{x}}{\partial \vec{x}^{T}}=A x TAx =A ∂ ( x ⃗ T A ) ∂ x ⃗ = A \quad\frac{\partial\left(\vec{x}^{T} A\right)}{\partial \vec{x}}=A x (x TA)=A

  • 向量对标量求导:
    ∂ y ∂ x ⃗ = ∂ ( x ⃗ T ⋅ A ⋅ x ⃗ ) ∂ x ⃗ = ( A T + A ) ⋅ x ⃗ \frac{\partial y}{\partial \vec{x}}=\frac{\partial\left(\vec{x}^{T} \cdot A \cdot \vec{x}\right)}{\partial \vec{x}}=\left(A^{T}+A\right) \cdot \vec{x} x y=x (x TAx )=(AT+A)x

  • 标量对方阵的求导:
    ∂ ∣ A ∣ ∂ A = ( A ∗ ) T = ∣ A ∣ ⋅ ( A − 1 ) T \frac{\partial|A|}{\partial A}=\left(A^{*}\right)^{T}=|A| \cdot\left(A^{-1}\right)^{T} AA=(A)T=A(A1)T


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部