Pytorch搭建自定义神经网络

2023-11-22 18:34:18

简介

在日常的实验中，为了改变网络模型，我们一般会自己搭建网络，在基础上进行修改创新，本文主要介绍如何利用Pytorch搭建自定义的神经网络

nn.Module类

在Pytorch中搭建自己的网络模型，首先要继承nn.Module，通过继承的方式定义自己的模型。

init函数

在Python中__init__函数就是构造函数，在__init__函数中我们一般会定义模型中的一些结构，比如卷积层，池化层，全连接层等。这里会用到一个函数nn.Sequential，这个函数的目的是为了拼接各种卷积，全连接等（当然你也可以把里面的卷积等结构拆开写）。

forward函数

forward函数是重写了nn.Module中的forward函数，目的在于训练/预测数据，forward函数中有个参数x表示输入的数据，如果__init__函数中定义的参数没有问题，那么在forward中直接调用就可以，最后返回输出的结果即可。
上面的文字理解或许不是很好理解，下面我们看一下利用Pytorch搭建的AlextNet网络模型。

import torch.nn as nnclass AlexNet(nn.Module):def __init__(self):super(AlexNet, self).__init__()# 卷积层self.layers = nn.Sequential(# 第一层nn.Conv2d(3, 96, kernel_size=(3, 3)),nn.BatchNorm2d(96),nn.ReLU(True),nn.MaxPool2d(kernel_size=3, stride=2),# 第二层nn.Conv2d(96, 256, kernel_size=(3, 3)),nn.BatchNorm2d(256),nn.ReLU(True),nn.MaxPool2d(kernel_size=3, stride=2),# 第三层nn.Conv2d(256, 384, kernel_size=(3, 3), padding=1),nn.ReLU(True),# 第四层nn.Conv2d(384, 384, kernel_size=(3, 3), padding=1),nn.ReLU(True),# 第五层nn.Conv2d(384, 256, kernel_size=(3, 3), padding=1),nn.MaxPool2d(kernel_size=3, stride=2))# 全连接层self.fc = nn.Sequential(nn.Linear(1024, 2048),nn.Dropout(0.5),nn.Linear(2048, 2048),nn.Dropout(0.5),nn.Linear(2048, 10))def forward(self, x):x = self.layers(x)x = x.view(x.size(0), -1)x = self.fc(x)return x

分析

根据上面的介绍，首先继承nn.Module，然后编写__init__函数和forward函数。这里我详细的分析一下每行代码的意义。

nn.Conv2d：表示一个2D卷积层，nn.Conv2d(3, 96, kernel_size=(3, 3))表示这是一个2D卷积层，其中输入的是3通道，输出的是96通道，卷积核大小是(3,3)
nn.MaxPool2d：表示一个2D最大池化层，nn.MaxPool2d(kernel_size=3, stride=2)表示池化层大小为(3,3)，步长为2（注意：池化层不改变输入的维度）
nn.ReLU：表示使用relu作为激活函数
nn.BatchNorm2d：表示批归一化处理
nn.Linear()：全连接层，nn.Linear(2048, 10)表示输入为2048输出为10
nn.Dropout()：nn.Dropout(0.5)表示舍弃50%的参数

利用nn.Sequential把这些结构进行整合，最后在forward函数中进行调用，返回处理后的值即可。因此利用Pytorch搭建网络可以分为以下几步：

定义网络名称继承nn.Module
在构造方法中定义需要的结构
在forward函数中调用，并返回处理后的值

预测

利用刚才建立的网络模型在cifar10数据集上进行测试，加载数据集的方式不再赘述，下面主要介绍一下如何训练+预测。

生成已经建立的网络模型并利用GPU加速：alexNet = AlexNet().to(device)
定义优化器optimize = torch.optim.Adam(alexNet.parameters(), lr=0.01)
定义损失函数loss_function = nn.CrossEntropyLoss()
定义迭代次数开始预测
反向传播+优化器优化

预测代码如下：

import osimport torch
import torch.nn as nn
from torchvision import transforms
from torchvision import datasets
import torch.utils.data
from AlexNet import AlexNetdevice = torch.device("cuda")if __name__ == '__main__':download = Falseif 'res' not in os.listdir():download = Truetrain_set = datasets.CIFAR10(root='./res/data', transform=transforms.ToTensor(), train=True, download=download)test_set = datasets.CIFAR10(root='./res/data', transform=transforms.ToTensor(), train=False, download=download)train_set = torch.utils.data.DataLoader(dataset=train_set, batch_size=64, shuffle=True, num_workers=4)test_set = torch.utils.data.DataLoader(dataset=test_set, batch_size=64, shuffle=True, num_workers=4)alexNet = AlexNet().to(device)optimize = torch.optim.Adam(alexNet.parameters(), lr=0.01)loss_function = nn.CrossEntropyLoss()epochs = 5for epoch in range(epochs):loss_sum = 0.0for i, data in enumerate(train_set):inputs, labels = datainputs, labels = inputs.to(device), labels.to(device)optimize.zero_grad()outputs = alexNet(inputs)loss_per = loss_function(outputs, labels)loss_per.backward()optimize.step()loss_sum += loss_per.item()if i % 100 == 99:print('[Epoch:%d, batch:%d] train loss: %.03f' % (epoch + 1, i + 1, loss_sum / 100))loss_sum = 0.0total, right = 0, 0for i, data in enumerate(test_set):test_inputs, test_labels = datatest_inputs, test_labels = test_inputs.to(device), test_labels.to(device)test_outputs = alexNet(test_inputs)test_outputs = torch.max(test_outputs.data, 1)[1]total += test_outputs.size(0)right += (test_labels == test_outputs).sum()print("第{}轮的准确率为:{:.2f}%".format(epoch + 1, 100.0 * right.item() / total))

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

Pytorch搭建自定义神经网络

简介

nn.Module类

init函数

forward函数

分析

预测

相关文章