Tensorrt 加速 OpenPose

2023-09-27 18:37:52

在这里插入图片描述

关于OpenPose

OpenPose人体姿态识别项目是美国卡耐基梅隆大学（CMU）基于卷积神经网络和监督学习并以caffe为框架开发的开源库。可以实现人体动作、面部表情、手指运动等姿态估计。适用于单人和多人，具有极好的鲁棒性。是世界上首个基于深度学习的实时多人二维姿态估计应用，基于它的实例如雨后春笋般涌现。人体姿态估计技术在体育健身、动作采集、3D试衣、舆情监测等领域具有广阔的应用前景，人们更加熟悉的应用就是抖音尬舞机。

OpenPose 各显卡预计能达到的运行速度基准

在这里插入图片描述

OpenPose项目Github链接：https://github.com/CMU-Perceptual-Computing-Lab/openpose

基于Tensorrt 实现OpenPose

测试环境

win10 + VS2019 + opencv4.3 + tensorrt7.0 + cuda11.1 + cudnn8

实现过程

clone tensorrt-zoo: https://github.com/zerollzeng/tensorrt-zoo
clone tiny-tensorrt: https://github.com/zerollzeng/tiny-tensorrt/tree/7ac9c6c6863ca3435a3407a6241f276ad3c49672
将 tiny-tensorrt 拷贝到 tensorrt-zoo文件夹下，由于博主是在Linux下编译的，而我在 windows下编译的，所以我删除了cmake中的 -Wfloat-conversion
cmake 编译 , 配置下 tensorrt 、opencv等目录。然后我取消勾选了 BUILD_TEST, BUILD_PYTHON，我测试的显卡是1080Ti，所以SM设置 61 ，具体如下。
VS 打开项目，编译 tiny-tensorrt , testopenpose。
1. 编译 tiny-tensorrt ，修改下 tensorrt ,opencv , cuda 的 include, lib ，然后生成，编译成功会生成 tinytrt.dll
2. 同理编译 testopenpose, 生成 testopenpose.exe
将openpose body_25 caffe model 拷贝到exe目录，修改 prototxt : input_dim, 我输入的是 640 * 480, 可以自行设置，但必须是 16 倍数。
生成 engine, 并测试 .

 testopenpose.exe  --prototxt "models/pose/body_25/pose_deploy.prototxt" --caffemodel "models/pose/body_25/pose_iter_584000.caffemodel" --save_engine "engine/pose_body_25_640_480.engine" --input "image/test.jpg" --run_mode 1 --h 480 --w 640

在这里插入图片描述

根据body_25姿态图，我们给绘制成线，这样看的更直观一些。
连接线
点的顺序已经连接好了, 有需要的改改颜色就行, 这样看起来颜色搭配能舒服一些

void MakeLineImage(cv::Mat& image, std::vector<std::vector<cv::Point>>& res) {for (auto p : res){drawLine(image, p[17], p[15], cv::Scalar(155, 0, 153));drawLine(image, p[15], p[0], cv::Scalar(99, 2, 149));drawLine(image, p[0], p[16], cv::Scalar(153, 1, 101));drawLine(image, p[16], p[18], cv::Scalar(156, 1, 49));drawLine(image, p[0], p[1], cv::Scalar(51, 0, 152));drawLine(image, p[1], p[2], cv::Scalar(0, 51, 154));drawLine(image, p[2], p[3], cv::Scalar(1, 101, 153));drawLine(image, p[3], p[4], cv::Scalar(0, 154, 151));drawLine(image, p[1], p[5], cv::Scalar(1, 154, 99));drawLine(image, p[5], p[6], cv::Scalar(1, 150, 51));drawLine(image, p[6], p[7], cv::Scalar(0, 255, 255));drawLine(image, p[1], p[8], cv::Scalar(0, 159, 46));drawLine(image, p[8], p[9], cv::Scalar(154, 104, 3));drawLine(image, p[9], p[10], cv::Scalar(151, 50, 0));drawLine(image, p[10], p[11], cv::Scalar(154, 104, 3));drawLine(image, p[11], p[24], cv::Scalar(154, 104, 3));drawLine(image, p[11], p[22], cv::Scalar(154, 104, 3));drawLine(image, p[22], p[23], cv::Scalar(154, 104, 3));drawLine(image, p[8], p[12], cv::Scalar(154, 104, 5));drawLine(image, p[12], p[13], cv::Scalar(151, 50, 0));drawLine(image, p[13], p[14], cv::Scalar(161, 0, 0));drawLine(image, p[14], p[21], cv::Scalar(161, 0, 0));drawLine(image, p[14], p[19], cv::Scalar(161, 0, 0));drawLine(image, p[19], p[20], cv::Scalar(161, 0, 0));}
}std::vector<float> inputData;
processImage(image, inputData);
std::vector<float> result;
openPose_->DoInference(inputData, result);
std::vector<std::vector<cv::Point>> res;
int kNumOfBodyPoint = 25;
for (size_t i = 0; i < result.size() / 3 / kNumOfBodyPoint; i++) {if (i >= kMaxPerson)break;std::vector<cv::Point> p;for (size_t j = 0; j < kNumOfBodyPoint; j++){p.push_back(cv::Point(result[i * 3 * kNumOfBodyPoint + j * 3] * scale_w, result[i * 3 * kNumOfBodyPoint + j * 3 + 1] * scale_h));}res.push_back(p);
}
MakeLineImage(image,res);

在这里插入图片描述
1080ti 上测试运行速度差不多在 30ms左右 ( net: 640 * 480) , 如果缩小net , 速度会更快。

END

以上基本就是我整理的全部内容了，有兴趣的小伙伴可以参考参考。
如果有不对的地方，欢迎大神楼下留言指正。
最后非常感谢两位大神 :
1. https://github.com/zerollzeng/tensorrt-zoo
2. https://github.com/CMU-Perceptual-Computing-Lab/openpose

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > 图像匹配简介
下一篇 > openpose原理及安装教程（姿态识别）

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce