猫狗大战--经典图像分类题实战

2023-08-31 04:04:42

一、使用EfficientNet实现图像分类（pytorch）

1.1 EfficientNet基本原理

1.2 EfficientNet实战

1.2.1 新建项目，安装并导入EfficientNet的库

1.2.2 设置全局参数

1.2.3 图像预处理、读取数据、导入数据

1.2.4 设置模型

1.2.5 定义训练过程和验证过程并验证

1.2.6 预测

一、使用EfficientNet实现图像分类（pytorch）

参考：https://zhuanlan.zhihu.com/p/498713239

AI研习社练习赛链接：https://god.yanxishe.com/41?from=god_home_list

因为本电脑只有核显没有独显，只能设置在cpu上进行训练。

1.1 EfficientNet基本原理

添加

1.2 EfficientNet实战

1.2.1 新建项目，安装并导入EfficientNet的库

1.2.2 设置全局参数

设置BatchSize、学习率和epochs，判断是否有cuda环境，如果没有设置为cpu。最好是将EfficientNet对应版本的pth下载到C盘users里面的文件夹中，会比在运行代码的过程中从网上下载更便捷一些。如C:\Users\wugua\.cache\torch\hub\checkpoints里.

下载预训练的网址在网上都能搜到，以efficientnet-b3-5fb5a3c3.pth为例，直接搜索即可，大部分是在github上下。

这是一位超级好人分享的网盘链接，包含常用的各种预训练模型的链接：

网络库网盘链接

import torch.optim as optim
import torch
import torch.nn as nn
import torch.nn.parallel
import torch.optim
import torch.utils.data
import torch.utils.data.distributed
import torchvision.transforms as transforms
from dataset.dataset import DogCat
from torch.autograd import Variable
from efficientnet_pytorch import EfficientNet
# pip install efficientnet_pytorch# 设置全局参数
modellr = 1e-4
BATCH_SIZE = 32
EPOCHS = 10
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

1.2.3 图像预处理、读取数据、导入数据

train数据集的transform和验证集的transform分开做，train的图像处理出了resize和归一化之外，还可以设置图像的增强，比如旋转、随机擦除等一系列的操作，验证集则不需要做图像增强，另外不要盲目的做增强，不合理的增强手段很可能会带来负作用，甚至出现Loss不收敛的情况。

# 数据预处理transform = transforms.Compose([transforms.Resize((224, 224)),transforms.ToTensor(),transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])])
transform_test = transforms.Compose([transforms.Resize((224, 224)),transforms.ToTensor(),transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])
dataset_train = DogCat(r'E:\A-DengNiran\ML\efficientnet实战\fenlei\data\train', transforms=transform, train=True)
dataset_test = DogCat(r"E:\A-DengNiran\ML\efficientnet实战\fenlei\data\test", transforms=transform_test, train=False)# 读取数据print(dataset_train.imgs)# 导入数据train_loader = torch.utils.data.DataLoader(dataset_train, batch_size=BATCH_SIZE, shuffle=True)
test_loader = torch.utils.data.DataLoader(dataset_test, batch_size=BATCH_SIZE, shuffle=False)

DogCat()函数的调用，import了dataset.py文件，是对导入的data\train和data\test文件进行数据处理，代码如下：

# coding:utf8
import os
from PIL import Image
from torch.utils import data
from torchvision import transforms as T
from sklearn.model_selection import train_test_split
import globclass DogCat(data.Dataset):def __init__(self, root, transforms=None, train=True, test=False):"""主要目标： 获取所有图片的地址，并根据训练，验证，测试划分数据"""self.test = testself.transforms = transformsimgs = [os.path.join(root, img) for img in os.listdir(root)]if self.test:  # 如果是test数据集imgs = sorted(imgs, key=lambda x: int(x.split('.')[-2].split('\\')[-1]))else:   # 如果是train数据集imgs = sorted(imgs, key=lambda x: int(x.split('.')[-2]))if self.test:  # 如果是test数据集self.imgs = imgselse:   # 如果是train数据集，还要再拆分为训练集和测试集trainval_files, val_files = train_test_split(imgs, test_size=0.3, random_state=42)if train: self.imgs = trainval_fileselse:self.imgs = val_filesdef __getitem__(self, index):"""一次返回一张图片的数据"""img_path = self.imgs[index]if self.test:label =-1else:label = 1 if 'dog' in img_path.split('/')[-1] else 0data = Image.open(img_path)data = self.transforms(data)return data, labeldef __len__(self):return len(self.imgs)

1.2.4 设置模型

使用CrossEntropyLoss作为loss，模型采用efficientnet-B3。更改最后一层的全连接，将类别设置为2，然后将模型放到DEVICE。优化器选用Adam。

# 实例化模型并且移动到GPU
criterion = nn.CrossEntropyLoss()
model_ft = EfficientNet.from_pretrained('efficientnet-b3')
num_ftrs = model_ft._fc.in_features
model_ft._fc = nn.Linear(num_ftrs, 2)
model_ft.to(DEVICE)
# 选择简单暴力的Adam优化器，学习率调低
optimizer = optim.Adam(model_ft.parameters(), lr=modellr)def adjust_learning_rate(optimizer, epoch):"""Sets the learning rate to the initial LR decayed by 10 every 30 epochs"""modellrnew = modellr * (0.1 ** (epoch // 50))print("lr:", modellrnew)for param_group in optimizer.param_groups:param_group['lr'] = modellrnew

1.2.5 定义训练过程和验证过程并验证

# 定义训练过程def train(model, device, train_loader, optimizer, epoch):model.train()sum_loss = 0total_num = len(train_loader.dataset)print(total_num, len(train_loader))for batch_idx, (data, target) in enumerate(train_loader):data, target = Variable(data).to(device), Variable(target).to(device)output = model(data)loss = criterion(output, target)optimizer.zero_grad()loss.backward()optimizer.step()print_loss = loss.data.item()sum_loss += print_lossif (batch_idx + 1) % 50 == 0:print('Train Epoch: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(epoch, (batch_idx + 1) * len(data), len(train_loader.dataset),100. * (batch_idx + 1) / len(train_loader), loss.item()))ave_loss = sum_loss / len(train_loader)print('epoch:{},loss:{}'.format(epoch, ave_loss))# 验证过程
def val(model, device, test_loader):model.eval()test_loss = 0correct = 0total_num = len(test_loader.dataset)print(total_num, len(test_loader))with torch.no_grad():for data, target in test_loader:data, target = Variable(data).to(device), Variable(target).to(device)output = model(data)loss = criterion(output, target)_, pred = torch.max(output.data, 1)correct += torch.sum(pred == target)print_loss = loss.data.item()test_loss += print_losscorrect = correct.data.item()acc = correct / total_numavgloss = test_loss / len(test_loader)print('\nVal set: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(avgloss, correct, len(test_loader.dataset), 100 * acc))# 训练for epoch in range(1, EPOCHS + 1):adjust_learning_rate(optimizer, epoch)train(model_ft, DEVICE, train_loader, optimizer, epoch)val(model_ft, DEVICE, test_loader)
torch.save(model_ft, 'model.pth')

输出结果：

1.2.6 预测

放置在Test.py文件中

import torch.utils.data.distributed
import torchvision.transforms as transforms
import torchvision.datasets as datasets
from PIL import Image
from torch.autograd import Variable
import os
classes = ('cat', 'dog')
transform_test = transforms.Compose([transforms.Resize((224, 224)),transforms.ToTensor(),transforms.Normalize([0.5, 0.5, 0.5], [0.5, 0.5, 0.5])
])DEVICE = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model = torch.load("model.pth", map_location='cpu')
model.eval()
model.to(DEVICE)path='data/test/'
testList=os.listdir(path)
for file in testList:img=Image.open(path+file)img=transform_test(img)img.unsqueeze_(0) # 这是应该是因为网络的接收输入是一个mini-batch，image unsqueeze后第一个维度是留给batch size的img = Variable(img).to(DEVICE)  # variable是一种可以不断变化的变量，符合反向传播，参数更新的属性out=model(img)# Predict_, pred = torch.max(out.data, 1)print('Image Name:{},predict:{}'.format(file,classes[pred.data.item()]))

输出结果：

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 1-4 实现猫狗队列
下一篇 > 软件工程第四次作业猫狗大战挑战赛

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

猫狗大战--经典图像分类题实战

一、使用EfficientNet实现图像分类（pytorch）

1.1 EfficientNet基本原理

1.2 EfficientNet实战

1.2.1 新建项目，安装并导入EfficientNet的库

1.2.2 设置全局参数

1.2.3 图像预处理 、读取数据、导入数据

1.2.4 设置模型

1.2.5 定义训练过程和验证过程并验证

1.2.6 预测

相关文章

1.2.3 图像预处理、读取数据、导入数据