吴恩达【深度学习工程师】学习笔记(六)
2、改善深层神经网络:超参数调试、正则化以及优化;
3、结构化机器学习项目;
4、卷积神经网络;
5、序列模型。
1、训练/开发/测试集
2、偏差/方差
3、L2正则化
⎷
|
4、Dropout正则化
5、其他正则化方法
6、正则化输入
μ=1m∑i=1mX(i)
7、梯度消失和梯度爆炸
w[l] = np.random.randn(n[l],n[l-1])*np.sqrt(1/n[l-1]) - 1
w[l] = np.random.randn(n[l],n[l-1])*np.sqrt(2/n[l-1]) - 1
w[l] = np.random.randn(n[l],n[l-1])*np.sqrt(2/n[l-1]*n[l]) - 1
8、梯度检查
不要在整个训练过程中都进行梯度检查,仅仅作为debug使用。
如果梯度检查出现错误,找到对应出错的梯度,检查其推导是否出现错误。
注意不要忽略正则化项,计算近似梯度的时候要包括进去。
梯度检查时关闭dropout,检查完毕后再打开dropout。
随机初始化时运行梯度检查,经过一些训练后再进行梯度检查(不常用)。
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
