对labelme已经标注的图片和json文件做resize操作

2023-08-26 19:39:27

尝试解决的问题

项目中要使用实例分割网络将图片中的目标分割出来，但是原图普遍非常大，大部分是 (5000pixels * 6000pixels) 这样的规格，如果直接传到网络中进行训练，计算量会非常大。所以考虑先离线resize好了之后作为数据集再训练网络，而不是在输入网络之间才resize（这样会很浪费时间）。

实现代码

废话少说，直接上代码即可：代码逻辑大概为先统计文件夹中的是图片的文件格式，例如有 {'jpg', 'JPG', 'png'} 这三种，接着使用 glob 库找到包含这几种后缀格式的所有图片文件，对这些照片使用 cv2.resize() 函数进行等比例缩放，缩放后保存到目标文件夹去。另外也要对json格式的标注文件中的点坐标进行缩放，直接坐标乘以缩放比例即可。最后值得注意的一点是，json标注文件中的 ['imageData'] 字段也要改成resize之后的图片哦，不然使用labelme 打开后的图片还是原来没有resize前的图，polygons 的位置跟大小是不对的。

import cv2
import os
import glob
import json
import collections
import numpy as np
from labelme import utilsif __name__ == "__main__":src_dir = './srcDir'dst_dir = './dstDir'if not os.path.exists(dst_dir):os.makedirs(dst_dir)# 先收集一下文件夹中图片的格式列表，例如 ['.jpg', '.JPG']exts = dict()filesnames = os.listdir(src_dir)for filename in filesnames:name, ext = filename.split('.')if ext != 'json':if exts.__contains__(ext):exts[ext] += 1else:exts[ext] = 1anno = collections.OrderedDict()  # 这个可以保证保存的字典顺序和读取出来的是一样的，直接使用dict()的话顺序会很乱（小细节哦）for key in exts.keys():for img_file in glob.glob(os.path.join(src_dir, '*.' + key)):file_name = os.path.basename(img_file)print(f"Processing {file_name}")img = cv2.imread(img_file)(h, w, c) = img.shape   # 统计了一下，所有图片的宽度里面，1344是占比较多的宽度中最小的那个，因此# 都等比例地将宽resize为1344(这里可以自己修改)w_new = 1344h_new = int(h / w * w_new)  # 高度等比例缩放ratio = w_new / w  # 标注文件里的坐标乘以这个比例便可以得到新的坐标值img_resize = cv2.resize(img, (w_new, h_new))  # resize中的目标尺寸参数为(width, height)cv2.imwrite(os.path.join(dst_dir, file_name), img_resize)# 接下来处理标注文件json中的标注点的resizejson_file = os.path.join(src_dir, file_name.split('.')[0] + '.json')save_to = open(os.path.join(dst_dir, file_name.split('.')[0] + '.json'), 'w')with open(json_file, 'rb') as f:anno = json.load(f)for shape in anno["shapes"]:points = shape["points"]points = (np.array(points) * ratio).astype(int).tolist()shape["points"] = points# 注意下面的img_resize编码加密之前要记得将通道顺序由BGR变回RGBanno['imageData']=str(utils.img_arr_to_b64(img_resize[..., (2, 1, 0)]), encoding='utf-8')json.dump(anno, save_to, indent=4)print("Done")

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 如何查询个人信息代码呈现
下一篇 > Qqis中采用栅格工具生成XYZ瓦片（目录）简介

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

对labelme已经标注的图片和json文件做resize操作

尝试解决的问题

实现代码

相关文章