神经网络学习笔记-波尔兹曼(Boltzmann)机
Boltzmann机是一种反馈随机神经网络
两种输出状态,单极性0或1。输出状态的取值根据概率统计法则决定,这种概率统计法则类似Boltzmann分布,部分反馈
它在神经元状态变化中引入了统计概率,网络的平衡状态服从Boltzmann分布,网络运行机制基于模拟退火算法。
离散Hopfield神经网络+模拟退火+隐单元=Boltzman机
DHNN全反馈,转移函数:符号函数
BM机网络拓扑结构
可见节点、隐节点(不可见节点),部分反馈,对称权值,wij = wji,wii=0
神经元转移概率函数
神经元净输入为:
输出状态1的转移概率
Pj(1)=11+e−netj/T P j ( 1 ) = 1 1 + e − n e t j / T
输出状态0的转移概率
Pj(0)=1−Pj(1) P j ( 0 ) = 1 − P j ( 1 )
如果 netj=0 n e t j = 0 ,则 Pj(1)=Pj(0)=11+e0=0.5 P j ( 1 ) = P j ( 0 ) = 1 1 + e 0 = 0.5
netj n e t j 越大, Pj(1) P j ( 1 ) 越大; netj n e t j 越小, Pj(0) P j ( 0 ) 越大,单调增加
T越大曲线越平缓,越小越陡峭,T=0退化为符号函数
神经元状态概率与净输入和温度的关系
BM机能量函数与DHNN相同:
E(t)=−12XT(t)WX(t)+XT(t)T E ( t ) = − 1 2 X T ( t ) W X ( t ) + X T ( t ) T
=−12∑j=1n∑i=1nwijxixj+∑i=1nTixi = − 1 2 ∑ j = 1 n ∑ i = 1 n w i j x i x j + ∑ i = 1 n T i x i
设 BM 机按异步方式工作 ,每次第 j 个神经元改变状态 ,根据推导出的公式有:
ΔE(t)=−Δxj(t)netj(t) Δ E ( t ) = − Δ x j ( t ) n e t j ( t )
对于 BM 机 , 随着网络状态的演变 , 从概率的意义上网络的能量总是朝着减小的方向变化
尽管网络能量的总趋势是向着减小的方向演变 ,但不排除在有
些步神经元状态可能会按小概率取值 , 从而使网络能量暂时增加 。
正是因为有了这种可
能性 , BM 机才具有了从局部极小的低谷中跳出的 “爬山”能力 ,这一点是 BM 机与
D HNN 网能量变化的根本区别 。 由于采用了神经元状态按概率随机取值的工作方式 ,
BM 机的能量具有不断跳出位置较高的低谷搜索位置较低的新低谷的能力 。 这种运行方
式称为搜索机制 , 即网络在运行过程中不断地搜索更低的能量极小值 , 直到达到能量的全
局最小 。
BM 机的 Boltzmann 分布
设 xj=1 x j = 1 时对应的网络能量为 E1 E 1 , xj=0 x j = 0 时对应的网络能量为 E0 E 0 ,
Pj(0)Pj(1)=e−E0/Te−E1/T P j ( 0 ) P j ( 1 ) = e − E 0 / T e − E 1 / T
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
