机器学习中矩阵向量求导

以下内容是根据刘建平的求导博客做的相关笔记

一、导数的定义与布局

1. 相关说明

在这里插入图片描述

2.导数布局

导数部分有分子布局分母布局两种情况。
分子布局和分母布局相差一个转置。

  • 标量对向量求导布局
    在这里插入图片描述
  • 向量对向量求导布局
    在这里插入图片描述
  • 求导布局总结
    在这里插入图片描述
  • 标量对向量或矩阵求导,以分母布局为主。向量对向量求导,以分母布局为主。

二、矩阵向量求导之定义法

写出单个元素间的求导关系,得出求导结果。
思路简单,适用于求解简单关系的导数

2.1 标量对向量求导

在这里插入图片描述

在这里插入图片描述

2.2 标量对矩阵求导

在这里插入图片描述

2.3 向量对向量求导

在这里插入图片描述

三、矩阵向量求导之微分法

3.1 矩阵微分

在这里插入图片描述

3.2 矩阵微分的性质

矩阵迹相关
在这里插入图片描述
在这里插入图片描述
A∗A∗=∣A∣A*A^{*}=\left|A\right|AA=A
A∗=∣A∣A−1A^{*}=\left|A\right|A^{-1}A=AA1
A∗A^{*}AAAA的伴随矩阵,AAA相应位置的代数余子式构成的矩阵

3.3使用微分法求解矩阵向量求导

在这里插入图片描述
在这里插入图片描述
d(tr(X))=tr(d(x))d(tr(X))=tr(d(x))d(tr(X))=tr(d(x))
(uv)′=u′v+uv′(uv)^{'}=u^{'}v+uv^{'}(uv)=uv+uv

四、链式法则

4.1 链式法则与矩阵相容

链式关系成立的条件是,相互关联的变量都是向量。
在这里插入图片描述
x\bm{x}xy\bm{y}y,z\bm{z}z都是向量时,用上面的链式法则公式直接求解。
当最终的变量是标量时,按上面公式计算会出现维度不相容的情况。需要按下面的方法计算:
在这里插入图片描述


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部