——对小车最佳路径计算算法的ray部署和测试

2023-10-23 00:15:51

lab4 报告

——对小车最佳路径计算算法的ray部署和测试

分析：

我们组的选题是ros-RT-thread系统，实现PC端ros负责复杂计算，stm32端ros负责控制电机等实时性任务，而PC端的复杂计算就可以用到本次实验中ray部署的分布式并行计算。

所以，我们把我们组最重要也是计算复杂性最高的小车最佳路径算法的程序进行了基于ray的部署和测试。

可以参考的指标：

1.响应时间(Rresponse Time）

响应时间就是从数据传入到结果输出之间的时间，这对于一个需要控制实时系统工作的程序是至关重要的，如果不能成功降低响应时间，这个系统的工作性能无疑是非常差的。

2.吞吐量（Throughput）

对于软件系统来说，“吞”进去的是请求，“吐”出来的是结果，而吞吐量反映的就是软件系统的“饭量”，也就是系统的处理能力，具体说来，就是指软件系统在每单位时间内能处理多少个事务/请求/单位数据等。当面对多个节点的控制时，吞吐量也十分重要。

3.资源使用率（Resource utilization）

常见的资源有：CPU占用率、内存使用率、磁盘I/O、网络I/O。

4.并发数（Concurrency Level ）

并发数体现了主节点能够处理的分支节点数，这对于ros-RT-thread的可扩展性非常重要。

5.错误率（ Error Rate ）

体现了程序出现错误的几率，这体现我们的实时系统的可靠性。

我们将选择响应时间、资源使用率和吞吐量进行测试。

ray单机部署

我们首先把程序通过ray部署到了单机上

import itertools
import rayray.init()@ray.remote
def distance(x1, y1, x2, y2):ans = (x1 - x2) * (x1 - x2) + (y1 - y2) * (y1 - y2)return ans@ray.remote
def shortest_way(Location, n): #求局域最优解dis = [[0.0] * 1005] * 1005#找到所给坐标点的最短访问序列，并返回调整过的坐标序列min_dis = 10000000000000for i in range(0, n):for j in range(0, n):dis[i][j] = (Location[2 * i] - Location[2 * j]) * (Location[2 * i] - Location[2 * j]) + (Location[2 * i + 1] - Location[2 * j + 1]) * (Location[2 * i + 1] - Location[2 * j + 1])......(略)return route@ray.remote
def merge_route(route1, route2): #把局域最优解和成全局近似最优解length1 = len(route1)length2 = len(route2)......(略)return new_route#存需要到达的点的位置
Location = [[1.5, 2.4, 3.2, 1.5, 2.8, 4.5, 8.3, 3.6, 4.8, 5.0]
, [3.5, 1.4, 6.2, 9.5, 1.8, 3.5, 6.3, 2.6, 7.8, 2.0]
......(略)def fun():route0 = shortest_way.remote(Location[0], 5)route1 = shortest_way.remote(Location[1], 5)new_route1 = merge_route.remote(route0, route1)route2 = shortest_way.remote(Location[2], 5)new_route2 = merge_route.remote(new_route1, route2)route3 = shortest_way.remote(Location[3], 5)new_route3 = merge_route.remote(new_route2, route3)route4 = shortest_way.remote(Location[4], 5)new_route4 = merge_route.remote(new_route3, route4)route5 = shortest_way.remote(Location[4], 5)new_route5 = merge_route.remote(new_route4, route5)route = ray.get(new_route5)print(route)fun()

这是运行结果的部分截图：
在这里插入图片描述

性能测试：

响应时间：

我们首先用timeit测试了总的响应时间：
在这里插入图片描述

由于环境的关系，各次测的值有所波动，大致记录了7次

编号	1	2	3	4	5	6	7	平均值
时间（s）	0.02387	0.02167	0.02341	0.02063	0.02524	0.02572	0.02344	0.02342

平均时间为0.02342

然后用cProfile测试了各个函数调用的延迟时间：
在这里插入图片描述

在这里插入图片描述

吞吐量：

通过改变处理数据的数量，并测试对应的处理时间，我们可以测试吞吐量。

同时处理5组数据：
在这里插入图片描述

同时处理10组数据：
在这里插入图片描述

同时处理15组数据：
在这里插入图片描述

同时处理20组数据：
在这里插入图片描述

可见目前随着数据量的线性增加，时间基本上按照线性增加。

内存占用情况：

通过 tracemalloc模块了解内存使用情况。

tracemalloc.start()
fun()
current, peak = tracemalloc.get_traced_memory()
print(f"Current memory usage is {current / 10 ** 6}MB; Peak was {peak / 10 ** 6}MB")
tracemalloc.stop()

运行结果（一组数据）：
在这里插入图片描述

5组数据：
在这里插入图片描述

10组数据：
在这里插入图片描述

可见随着数据的增加，内存占用差别并不是很大，主要的内存占用可能还是框架本身造成的。

优化：

优化方式1：改变ray框架函数调用结构，增加并行性

之前的代码中，函数调用的树用的是最直接的方法，导致调用的层数比较多，树比较高，接下来通过让函数调用树更加均衡，可以提高代码的并行效率。

def fun():route0 = shortest_way.remote(Location[0], 5)route1 = shortest_way.remote(Location[1], 5)route2 = shortest_way.remote(Location[2], 5)route3 = shortest_way.remote(Location[3], 5)route4 = shortest_way.remote(Location[4], 5)route5 = shortest_way.remote(Location[5], 5)route6 = shortest_way.remote(Location[6], 5)route7 = shortest_way.remote(Location[7], 5)new_route1 = merge_route.remote(route0, route1)new_route2 = merge_route.remote(route2, route3)new_route3 = merge_route.remote(route4, route5)new_route4 = merge_route.remote(route6, route7)layer2_route1 = merge_route.remote(new_route1, new_route2)layer2_route2 = merge_route.remote(new_route3, new_route4)final_route = merge_route.remote(layer2_route1, layer2_route2)route = ray.get(final_route)print(route)

测量了运行时间：

序号	1	2	3	4	5	6	7	平均时间
时间（s）	0.01938	0.02256	0.01898	0.02065	0.02113	0.02129	0.01902	0.02043

平均时间0.02043.

而优化前平均时间为0.02342，所以性能优化比为：
$\frac{0.02342}{0.02043} = 1.1464$
性能只提高了%14，并不是非常明显，还达不到要求。

由于我们的代码结构并不是十分复杂，好像也找不到什么其他优化的方式了，虽然也尝试了其他一些改进，但仍然达不到%20的要求，所以暂且只能这样了。

基于 Docker 完成分布式部署并进行性能测试:

实现过程：

首先通过

sudo apt-get install docker.io

在ubuntu上安装docker

然后通过

sudo docker pull ubuntu

下载unbuntu镜像

之后启动三个ubuntu容器

sudo docker run -it --name ubuntu-01 ubuntu bash
sudo docker run -it --name ubuntu-02 ubuntu bash
sudo docker run -it --name ubuntu-03 ubuntu bash

并检查IP地址

$ sudo docker inspect -f "{{ .NetworkSettings.IPAddress }}" ubuntu-01
172.17.0.2
$ sudo docker inspect -f "{{ .NetworkSettings.IPAddress }}" ubuntu-02
172.17.0.3
$ sudo docker inspect -f "{{ .NetworkSettings.IPAddress }}" ubuntu-03
172.17.0.4

之后在三个容器里都安装python、pip、ray

apt update && apt install python3 
apt install python3-pip
pip install ray -i http://pypi.douban.com/simple --trusted-host pypi.douban.com

把ubuntu-02作为主节点，运行

ray start --head --node-ip-address 172.17.0.3

另外两个container为从节点，运行

ray start --address='172.17.0.3:6379' --redis-password='5241590000000000'

然后再主节点中建立python文件，把一段测试代码复制进去，设置ray.init()的参数

from collections import Counter
import socket
import time
import ray
ray.init(address='172.17.0.3:6379', _redis_password='5241590000000000')
print('''This cluster consists o    f{} nodes in total{} CPU resources in total
'''.format(len(ray.nodes()), ray.cluster_resources()['CPU']))
@ray.remote
def f():time.sleep(0.001)# Return IP address.return socket.gethostbyname(socket.gethostname())
object_ids = [f.remote() for _ in range(10000)]
ip_addresses = ray.get(object_ids)
print('Tasks executed')
for ip_address, num_tasks in Counter(ip_addresses).items():print('    {} tasks on {}'.format(num_tasks, ip_address))

运行结果如图：
在这里插入图片描述

可以看到程序运行在了三个docker节点上

之后为需要测试的代码配环境，安装python库

pip install more-itertools -i https://pypi.tuna.tsinghua.edu.cn/simple/ --trusted-host pypi.tuna.tsinghua.edu.cn

建立python文件，把需要测试的代码复制进去，改变ray.init()的参数，运行

python3 ros_ray.py

运行结果如图所示
在这里插入图片描述

time = 1.501496350999015

时间长可能是因为这一次是在虚拟机上运行的原因（之前一直在Windows的pycharm上测试）

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

——对小车最佳路径计算算法的ray部署和测试

lab4 报告

——对小车最佳路径计算算法的ray部署和测试

分析：

可以参考的指标：

ray单机部署

性能测试：

响应时间：

吞吐量：

内存占用情况：

优化：

优化方式1：改变ray框架函数调用结构，增加并行性

基于 Docker 完成分布式部署并进行性能测试:

实现过程：

相关文章