人脸关键点数据集 300W 数据整理

2023-11-24 18:10:55

人脸关键点数据集 300W 数据整理

由于300W 数据集里面的图片尺寸大小不一，而且关键点数据为 .pts 文件，这些使得进行神经网络学习的时候，数据集必须经过一定的处理，才能使用。
现在，我将使用 python 程序，将里面的图片尺寸全都转化为 500 * 500，同时读取并修改 .pts 文件的人脸关键点数据，最后将图片数据和人脸关键点数据保存为 numpy.ndarray 类型。

一. 导入模块

本次程序所使用的模块有：re, os, numpy, cv2, matplotlib

import re
import os
import numpy as np
import cv2 as cv
from matplotlib import pyplot as plt

二. 获得 300W 目录下所有的文件

获得 300W 目录下所有的文件

# 注意文件目录
file_path_indoor = "E:/300W/300W/01_Indoor/"
file_path_outdoor = "E:/300W/300W/02_Outdoor/"
# os.listdir() 可以获得指定的文件夹包含的文件或文件夹的名字的列表
indoor_file = os.listdir(file_path_indoor)
outdoor_file = os.listdir(file_path_outdoor)
print(indoor_file[0:10], "\n", outdoor_file[0:10])   # 打印 "G:/300W/01_Indoor/" 以及 "G:/300W/02_Outdoor/" 各 10 个文件

运行结果：

['indoor_001.png', 'indoor_001.pts', 'indoor_002.png', 'indoor_002.pts', 'indoor_003.png', 'indoor_003.pts', 'indoor_004.png', 'indoor_004.pts', 'indoor_005.png', 'indoor_005.pts'] 
['outdoor_001.png', 'outdoor_001.pts', 'outdoor_002.png', 'outdoor_002.pts', 'outdoor_003.png', 'outdoor_003.pts', 'outdoor_004.png', 'outdoor_004.pts', 'outdoor_005.png', 'outdoor_005.pts']

三. 建立相应 ndarray 数组来保存数据

要保存的数据有，人脸图片数据，人脸关键关数据，图片的缩放比例等。

image_size_h, image_size_w = 500, 500                                      # 用来保存图片的尺寸
files_num = int(len(indoor_file)/2) + int(len(outdoor_file)/2)            # 用来保存所有的图片数量
facial_keypoints = np.zeros([files_num, 68*2], dtype=np.float64)          # 用来保存人脸关键点数据
facial_image = np.zeros([files_num, image_size_h, image_size_w, 3], dtype=np.uint8)            # 用来保存人脸图片数据          
image_scale = np.zeros([files_num, 2], dtype=np.float64)                  # 用来保存图片的缩放比

四. 读取图片数据以及人脸关键点数据

主要通过 正则表达式 来获得 .pts 文件名，然后进行数据获取

count = 0   # 用来计数# 读取 "G:/300W/01_Indoor/" 里面的图片和人脸关键点数据
for i in indoor_file:ret = re.match(r"(.\w+)\.pts", i)    # 使用正则表达式读取 .pts 文件if ret:# 读取 pts 点pts_file = file_path_indoor  + iwith open(pts_file, "r") as f:pts_str = f.read()# 读取当中的关键点数据key_point = re.findall(r"\d+\.\d+", pts_str)# 将列表中的字符串转化为数字key_point = [float(x) for x in key_point]# 添加到 facial_keypointsfacial_keypoints[count] = key_point# 读取图片文件image_file = file_path_indoor + ret.group(1) + ".png"# 打开图片image = cv.imread(image_file, cv.IMREAD_COLOR)# 获取图片长和宽image_h, image_w = image.shape[:2]# 改变图片尺寸image = cv.resize(image, (image_size_h, image_size_w))# 得到缩放比image_scale[count] = [image_h/image_size_h, image_w/image_size_w]# 添加到 facial_imagefacial_image[count] = imagecount += 1# 读取 "G:/300W/01_Outdoor/" 里面的图片和人脸关键点数据
for i in outdoor_file:ret = re.match(r"(.\w+)\.pts", i)if ret:# 读取 pts 点pts_file = file_path_outdoor  + iwith open(pts_file, "r") as f:pts_str = f.read()# 读取当中的关键点数据key_point = re.findall(r"\d+\.\d+", pts_str)# 将列表中的字符串转化为数字key_point = [float(x) for x in key_point]# 添加到 facial_keypointsfacial_keypoints[count] = key_point# 读取图片文件image_file = file_path_outdoor + ret.group(1) + ".png"# 打开图片image = cv.imread(image_file, cv.IMREAD_COLOR)# 获取图片长和宽image_h, image_w = image.shape[:2]# 改变图片尺寸image = cv.resize(image, (image_size_h, image_size_w))# 得到缩放比image_scale[count] = [image_h/image_size_h, image_w/image_size_w]# 添加到 facial_imagefacial_image[count] = imagecount += 1

五. 对人脸关键点数据进行缩放

由于我们改变了图片的尺寸那么，我们也要对人脸关键点数据进行缩放

count = 0  # 用来计数for i in image_scale:facial_keypoint = facial_keypoints[count]        # 获取单个人脸关键点数据facial_keypoint[::2] = facial_keypoint[::2] / i[1] # 对人脸关键点数据的宽进行缩放facial_keypoint[1::2] = facial_keypoint[1::2] / i[0] # 对人脸关键点数据的长进行缩放count += 1

六. 效果查看

目前，我们的数据处理已经全部完成了，接下来，使用 matplotlib 来看一下效果

for j in range(10):    # 总共展示十张图片image = facial_image[j]    # 获取图片数据image = cv.cvtColor(image, cv.COLOR_BGR2RGB)   # 由于 matplotlib 支持的是 rgb 色彩空间，所以我们需要将 bgr 转化为 rgbfor i in range(0, 68):cv.circle(image, (int(facial_keypoints[j, 2*i]), int(facial_keypoints[j, 2*i+1])), 5, (255, 0, 0), -1)   # 进行打点plt.subplot(2, 5, j+1)plt.imshow(image)
plt.show()

运行结果：

六. 保存数据与载入

获取数据之后，我们就可以对这些 ndarray 数组进行保存了。

np.save("./facial_image.npy", facial_image)
np.save("./facial_keypoints.npy", facial_keypoints)

使用 np.save() 保存的数据，我们可以通过 np.load() 来载入。

facial_image = np.load(r"./facial_image.npy")
facial_keypoints = np.load(r"./facial_keypoints.npy")

七. 结语

如果文中有写的不对的地方，请大家指正。联系方式：lwl510ll@163.com
本文到这就结束了，最后感谢大家的观看。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > ios 内购越狱插件防护策略 iap 更安全
下一篇 > PCB设计规范-3W原则

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

人脸关键点数据集 300W 数据整理

人脸关键点数据集 300W 数据整理

一. 导入模块

二. 获得 300W 目录下所有的文件

三. 建立相应 ndarray 数组来保存数据

四. 读取图片数据以及人脸关键点数据

五. 对人脸关键点数据进行缩放

六. 效果查看

六. 保存数据与载入

七. 结语

相关文章