软件工程第四次作业猫狗大战挑战赛

2023-08-31 04:04:44

软件工程第四次作业猫狗大战挑战赛

第一部分谷歌 Colab 上完成猫狗大战VGG模型的迁移学习

对图像归一化进行处理

然后在图像中间进行裁剪

进行灰度在对图像进行归一化处理不知道这个参数是怎么来的前面用过 mean=（0.5 0.5 0.5）std=（0.5，0.5，0.5）刚好讲最大值和最小值放缩到（-1，1）

按照之前定义的vgg_format形式读取数据

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-733MzEsS-1666103871080)(C:\Users\zzf\AppData\Roaming\Typora\typora-user-images\image-20221017135906884.png)]

制作训练集和测试集

训练集一个batch是64 打乱顺序可以提高准确率

测试集一个batch是5 测试的时候可以按顺序

多线程来加速

loader_valid一共2000张一个batch是5所以进行400轮

可以看到这个图片的标签和这个图片的大小数量

因为之前截取的是中间的224 所以是两个224 然后一组有5个

这里定义了一个展示图片的小程序

讲第一组batch组合成为一张图片并且输出图片和label

这次实验是直接用了训练好的vgg模型

对于我们上一步展示的图片进行预测

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-RgRzn6Dk-1666103871082)(C:\Users\zzf\AppData\Roaming\Typora\typora-user-images\image-20221017162239305.png)]

打印结果看一下

发现最后的结果是5*1000的矩阵

这里是神经网络训练的比较强大有1000个类别

这里只需辨别是猫还是狗

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UoE3ijuI-1666103871082)(C:\Users\zzf\AppData\Roaming\Typora\typora-user-images\image-20221017162621985.png)]

上一轮结果很难懂是什么意思

但我们做分类问题将函数归一化

dim=1 按行处理

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-rkEqvVud-1666103871082)(C:\Users\zzf\AppData\Roaming\Typora\typora-user-images\image-20221017164119783.png)]

这里归一化的总和是1

打印训练的最大概率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-beUT34US-1666103871083)(C:\Users\zzf\AppData\Roaming\Typora\typora-user-images\image-20221017164222961.png)]

最后的结果和标签检查发现正确率很好

打印一下这个神经网络

特征提取的参数不需要修改

修改一下分类的函数

之前是分成1000类

现在只需要分成两类

因为用的这个模型最后分类比较多所以我们让最后一个全连接层的为2，我们只需要区分猫和狗就行

修改后和修改前

损失函数和学习率一般都是定义好的学习率一般都是0.001

采用梯度下降的方法

定义这个训练函数

传入定义好的模型数据数据大小 epochs 和优化函数

开始训练

将标签和输入传入

得到输出结果

这里好像没有用损失函数不知道直接调用这个criterion是默认的损失函数吗

然后是优化函数

先将梯度归零 optimizer.zero_grad()

然后反向传播计算得到每个参数的梯度值loss.backward()

最后通过梯度下降执行一步参数更新optimizer.step(）

传统的学习方式

得到预测最大可能性的下标

因为只有0和1

统计数据计算失误率和准确率

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-shkXofnK-1666103871085)(C:\Users\zzf\AppData\Roaming\Typora\typora-user-images\image-20221017184947262.png)]

开始训练

定义测试函数和之前的差别不大

这里展示了一下测试的结果

将8张图片制作成一张然后输出

第二部分

下载数据指定目录

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yTTAhH6n-1666103871086)(C:\Users\zzf\AppData\Roaming\Typora\typora-user-images\image-20221017201225516.png)]

解压

发现colab好像没有装解压rar的工具下载一下就好

开始制作lader数据集

我们发现

这里的数据结构不能直接调用datasets.ImageFolder 这个封装好的函数

所以我们现在有两种办法一是将文件目录结构改为官方接口的形式

二是自己重写dataset函数

我选择的第一种比较简单的一个选择分类

import os
import shutilpathlist=os.listdir('/content/data/cat_dog/train')for x in pathlist:res=x[:3]dir='/content/data/cat_dog/train'if res=="cat" :shutil.move(os.path.join(dir, x),'/content/data/cat_dog/train/cats')else  : shutil.move(os.path.join(dir, x),'/content/data/cat_dog/train/dogs')

这里是一个简单的分类将文件是cat的放入cats文件夹

是dog放入dogs文件夹

对文件做好分类我们就开始制作数据集

可以打印一些结果康康

我们可以看出 64一个batch 224*224

打出一个batch看一下

用vgg模型修改训练的输出层获得结果

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZgrxvdHs-1666103871088)(C:\Users\zzf\AppData\Roaming\Typora\typora-user-images\image-20221018143525718.png)]

虽然很不理解训练的数据多了为什么结果还没之前的优秀

接下来我们对测试集进行训练

这里就无所谓标签了

我们对数据进行简单dataset 用的还是之前的接口

我们对图片进行预测

得到结果

我们要输出一个csv

然后字典序就是 0 1 10 100 这样的顺序

我们可以看看dataloder里面的数据排序

然后做一个和里面顺序一样的一个list

两个list zip（）打包一下

用pands里面的dataframe做一个dataframe

可以看一下结果

然后将这个数据输出

不带索引不带序号的输出

然后就可以提交了

然后我就提交了莫名的得到了这个分数

后来我仔细的看了一下输出的顺序

答案要求的好像是从0-1999

我这里因为之前用的是str类型

所以排序就是0 1 10 100

这样得顺序

本来应该转换成int在排序一遍

涂了个省事

我直接用excel打开csv

然后手动排序

排完大概是这样.

然后在提交

最后得到了结果

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 猫狗大战--经典图像分类题实战
下一篇 > 《软件工程》-猫狗大战挑战赛

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

软件工程第四次作业 猫狗大战挑战赛