曙光超算平台 如何使用 Tensorboard (乌镇中心)

在E-Shell中执行

1. salloc -p 队列名 -N 1 -n 32 --gres=dcu:4

salloc -p wzhdtest -N 1 -n 32 --gres=dcu:4

2. ssh 节点名

 ssh g01r3n07

3. conda deactivate

4. 查看当前所有模块

 module ava compiler    

从上图中加载某个dtk模块

 module load compiler/dtk/21.10 

注:乌镇没有rocm,需要加载dtk

5. 执行ifconfig获取当前节点ip地址

ifconfig

6. 开启tensorboard 服务

#进入虚拟环境

source pytorch_env.sh 

# 进入events所在目录

cd project/rng-kbqa/GrailQA/runs/

# 开启tensorboard 服务

tensorboard --logdir  . 

 

7. 打开VNC界面(创建图形界面)

 8. 右击选择Konsole窗口

9.  在命令行输入 firefox 

10. 在打开的firefox 浏览器中输入http://10.7.1.48:6006/ 或者  http://g01r3n07:6006/

 

注:申请的地方不同,对应的使用教程也会有差异,一定要仔细看!!此篇仅适用于乌镇中心!!


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部