牛顿法与梯度下降法

2023-11-23 00:03:55

牛顿法与梯度下降法

martin

牛顿法与梯度下降法
- 牛顿法与梯度下降算法的适用范围
- 牛顿法
  - 一元函数二阶逼近
  - 多元函数二阶逼近
- 梯度下降法

牛顿法与梯度下降算法的适用范围

这两种算法都只能找到局部最小值，也就是说容易陷入局部最优。
两种算法都必须给出一个初始点。
牛顿法使用二阶逼近，梯度下降法使用一阶逼近。
牛顿法对局部凸的函数能找到极小值，对局部凹的函数能找到极大值，对局部不凸不凹的可能找到鞍点。
梯度下降法一般不会找到最大值，但同样可能会找到鞍点。
当初始点选取合理的情况下，牛顿法比梯度下降法收敛的速度快。
牛顿法要估计二阶导数，计算难度相对要大。

牛顿法

一元函数二阶逼近

首先在初始点 $x_0$ 处写出二阶泰勒级数：

f(x0+Δx)=f(x0)+f′(x0)Δx+f′′(x0)2Δx2+o(Δx2)=g(Δx)+o(Δx2) $f(x_0+\Delta x) = f(x_0)+f^{'}(x_0)\Delta x+{f^{''}(x_0)\over 2}\Delta x^2+o(\Delta x^2) = g(\Delta x)+o(\Delta x^2)$
我们知道关于

Δx $\Delta x$ 的二次函数

g(Δx) $g(\Delta x)$ 的极值点为

−f′(x0)f′′(x0) $-{f^{'}(x_0)\over f^{''}(x_0)}$ ，(可以类比二次函数，

y=ax2+bx+c $y = ax^2+bx+c$ ，它的极值点坐标为

−b2a $-{b\over 2a}$ ),那么本着逼近的精神

f(x) $f(x)$ 的极值点估计在

x0−−f′(x0)f′′(x0) $x_0--{f^{'}(x_0)\over f^{''}(x_0)}$ 附近，于是定义

x1=x0−−f′(x0)f′′(x0) $x_1 = x_0--{f^{'}(x_0)\over f^{''}(x_0)}$ ，并重复此步骤得到此序列：

xn+1=xn−f′(xn)f′′(xn) $x_{n+1} = x_n-{f^{'}(x_n)\over f^{''}(x_n)}$

多元函数二阶逼近

如果函数 $f(x)$ 是一个多元函数， $x$ 是一个向量，那么牛顿法序列变为：
$x_n+1 = xn - (\mathbb{H}f(x_n))^{-1}.\nabla f(x_n)$
思路与技巧完全相同，只是使用梯度 $\nabla f(x_n)$ 取代一阶导数 $f^{'}(x_n)$ ，使用Hessian矩阵 $\mathbb{H}f(x_n)$ 代替二阶导数 $f^{''}(x_n)$ 。
h.png-183.3kB

梯度下降法

参考我之前写的文章：http://blog.csdn.net/ice_martin/article/details/60972131

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 牛顿法-梯度下降法一些文章整理
下一篇 > 程序员健身日记20190920

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

牛顿法与梯度下降法