深度学习基础-感知器

2023-09-27 22:13:36

感知器-神经网络的组成单元-神经元（神经元也叫做感知器），感知机是所有神经网络的基础，主要由全连接层组成，下面是感知机示意图。

输入一个感知器可以接收多个输入 $[x_{1},x_{2}, ... x_{n}]$ ，每个输入上有对应权值 $[w_{1},w_{2} ... ,w_{n}]$ ，此外还有一个偏置项 $b$ 。
激活函数 感知器的激活函数可以有很多选择，比如我们可以选择relu这个阶跃函数来作为激活函数：

$f(z) = \left\{\begin{matrix} 1 & if x > 0 & \\ 0 & otherwise& \end{matrix}\right.$

输出感知器的输出由下面这个公式来计算

$y = f(\sum_{i=1}^{n}w_{i}\cdot x_{i} + b )$

感知机的应用 其可以拟合任何的线性函数，任何线性分类或线性回归问题都可以用感知器来解决。但是感知机无法拟合非线性函数，比如异或。

感知机的训练 将权重项和偏置项初始化为0，然后，利用下面的感知机规则迭代的修改 $w_{i}$ 和 $b$ ，直到训练完成。

$w_{i}\leftarrow w_{i} + \Delta w_{i}$

$b\leftarrow b + \Delta b$

$\Delta w_{i} = \lambda * x_{i}*(t - y)$

$\Delta b = \lambda*(t - y)$

感知机和线性单元对比

对比
模型	感知器	线性单元
$h(x)$	$y = f(w^{T} \ast x)$ $f(z) = \left\{\begin{matrix} 1 & if x > 0 & \\ 0 & otherwise& \end{matrix}\right.$	$y = f(w^{T} \ast x)$ $f(z) = z$
训练规则	$w_{i}\leftarrow w_{i} + \Delta w_{i}$ $b\leftarrow b + \Delta b$	$w_{i}\leftarrow w_{i} + \Delta w_{i}$ $b\leftarrow b + \Delta b$

$w_{i}$ 是与输入 $x_{i}$ 对应的权重项， $b$ 是偏置项。事实上，可以把 $b$ 看作是值永远为1的输入 $w_{b}$ 所对应的权重。 $t$ 是训练样本的实际值，一般称之为label。而 $y$ 是感知器的输出值，它是根据公式 $f(z)$ 计算得出。 $\lambda$ 是一个称为学习速率的常数，其作用是控制每一步调整权的幅度。

每次从训练数据中取出一个样本的输入向量 $x$ ，使用感知器计算其输出 $y$ ，再根据上面的规则来调整权重。每处理一个样本就调整一次权重。经过多轮迭代后（即全部的训练数据被反复处理多轮），就可以训练出感知器的权重，使之实现目标函数。

实战：用感知机实现and运算

and运算训练集

x1	x2	y
0	0	0
0	1	0
1	0	0
1	1	1

训练代码

class Perceptron:def __init__(self, input_num):self.activator_fun = lambda x: 1 if x > 0 else 0  # reluself.weights = [0.0] * input_numself.bias = 0.0def __str__(self):return f'weights = {self.weights}, bias = {self.bias}'def predict(self, input_vec):"""y_pred = x1*w1 + x2*w2 + x3*w3 + ... + xn*wn + b:param input_vec: 输入向量:return:"""total = sum(list(map(lambda x: x[1] * self.weights[x[0]], list(enumerate(input_vec)))))y_pred = self.activator_fun(total + self.bias)# print(input_vec, self.weights, total, y_pred)return y_preddef train(self, input_vecs, labels, iteration, rate):""":param input_vecs: 输入特征:param labels::param iteration::param rate::return:"""for i in range(iteration):self._one_iteration(input_vecs, labels, rate)def _one_iteration(self, input_vecs, labels, rate):""":param input_vecs::param labels::param rate::return:"""samples = list(zip(input_vecs, labels))# 对每个样本，按照感知器规则更新权重for (input_vec, label) in samples:# 计算感知器在当前权重下的输出output = self.predict(input_vec)# 更新权重self._update_weights(input_vec, output, label, rate)def _update_weights(self, input_vec, output, label, rate):"""感知器权重更新wi = wi + learn_rate * (y_true - y_pred) * xib = b + learn_rate * (y_true - y_pred):param input_vec::param output::param label::param rate::return:"""delta = label - output  # 误差# 更新weightsself.weights = list(map(lambda x_w: rate * delta * x_w[0] + x_w[1],zip(input_vec, self.weights)))# 更新biasself.bias += rate * deltadef load_data():# 训练集 [1,1] -> 1, [0,0] -> 0, [1,0] -> 0, [0,1] -> 0input_vecs = [[1, 1], [0, 0], [1, 0], [0, 1]]labels = [1, 0, 1, 1]return input_vecs, labelsdef train():X, y = load_data()# 创建感知器model = Perceptron(len(X[0]))# 训练，迭代10轮, 学习速率为0.1model.train(X, y, 1, 5e-1)return modelif __name__ == '__main__':perception_model = train()print(perception_model)print(perception_model.predict([0, 0]))print(perception_model.predict([1, 0]))print(perception_model.predict([0, 1]))print(perception_model.predict([1, 1]))

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 转行做Linux运维工程师，简历的项目经验应该怎么写比较好？
下一篇 > 深度学习入门（一）：感知器

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

深度学习基础-感知器

相关文章