神经网络中的梯度检查

2023-09-19 04:21:15

梯度检查

怎么保证自己写的神经网络没有BUG呢？事实上这是一个非常重要的问题。一方面，千辛万苦想到一个算法，结果效果不理想，那么是算法本身错了还是代码实现错了呢？定位这种问题肯定要花费大量的时间和精力。另一方面，由于神经网络的复杂性，我们几乎无法事先知道神经网络的输入和输出，因此类似TDD(测试驱动开发)这样的开发方法似乎也不可行。

办法还是有滴，就是利用梯度检查来确认程序是否正确。梯度检查的思路如下：

对于梯度下降算法：
在这里插入图片描述
w就是我们要检查的权重，Ed就是经过激活函数处理以后的部分，这里我们激活函数以sigmod为例（数学公式编辑起来太麻烦了，直接粘贴了。）：

下面是具体的实现代码

def gradient_check(network, sample_feature, sample_label):'''梯度检查network: 神经网络对象sample_feature: 样本的特征sample_label: 样本的标签'''# 计算网络误差network_error = lambda vec1, vec2: \0.5 * reduce(lambda a, b: a + b, map(lambda v: (v[0] - v[1]) * (v[0] - v[1]),zip(vec1, vec2)))# 获取网络在当前样本下每个连接的梯度network.get_gradient(sample_feature, sample_label)# 对每个权重做梯度检查    for conn in network.connections.connections: # 获取指定连接的梯度actual_gradient = conn.get_gradient()# 增加一个很小的值，计算网络的误差epsilon = 0.0001conn.weight += epsilonerror1 = network_error(network.predict(sample_feature), sample_label)# 减去一个很小的值，计算网络的误差conn.weight -= 2 * epsilon # 刚才加过了一次，因此这里需要减去2倍error2 = network_error(network.predict(sample_feature), sample_label)# 根据式6计算期望的梯度值expected_gradient = (error2 - error1) / (2 * epsilon)# 打印print 'expected gradient: \t%f\nactual gradient: \t%f' % (expected_gradient, actual_gradient)

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 网络数据集-骨干网和校园网-IP流量
下一篇 > 网络------总结

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

神经网络中的梯度检查

梯度检查

相关文章