RAPIDS

RAPIDS数据科学框架包括一系列库,用于完全在GPU中执行端到端数据科学管道。 它旨在为使用Python工作的数据科学家提供熟悉的外观和感觉。 这是一个代码片段,我们在其中读取CSV文件并输出一些描述性统计信息。

import cudf
gdf = cudf.read_csv(‘path/to/file.csv’)
for column in gdf.columns:print(column.mean())

RAPIDS使用优化的NVIDIA®CUDA®原语和高带宽GPU内存来加速数据准备和机器学习。 RAPIDS的目标不仅是加速典型数据科学工作流程的各个部分,还要加速完整的端到端工作流程。

我们建议您查看我们的Docker容器中的示例工作流程(如下所述),它说明了基本XGBoost模型培训和测试在RAPIDS中的简单性。

 

安装Conda包
使用cuDF的最快方法是通过conda。

准备:
*NVIDIA Pascal™GPU架构或更好
*CUDA 9.2或10.0
*Ubuntu 16.04或18.04


Conda安装
您可以使用Miniconda进行最小的conda安装,或使用Anaconda进行全面安装。 使用conda命令安装和更新cuDF:

$ conda install -c numba -c conda-forge -c rapidsai -c defaults cudf=0.2.0

运行RAPIDS容器
RAPIDS Docker容器配置为运行RAPIDS并提供示例数据/笔记本以快速入门。

准备:
*NVIDIA Pascal™GPU架构或更好
*CUDA 9.2或10.0
*Ubuntu 16.04或18.04
*Docker CE v18 +
*nvidia-docker v2 +
启动Container和Notebook Server

$ docker pull rapidsai/rapidsai:ubuntu1604_cuda92_py35
$ docker run --runtime=nvidia \--rm -it \-p 8888:8888 \-p 8787:8787 \-p 8786:8786 \rapidsai/rapidsai:ubuntu1604_cuda92_py35
jupyter@container:/$ cd rapids && source activate gdf
(gdf) jupyter@container:/$ tar -xzvf data/mortgage.tar.gz --directory=data
(gdf) jupyter@container:/$ bash utils/start_jupyter.sh

注意:这将在主机上的端口8888上运行JupyterLab,并使用默认的token/password。

高级用法
请参阅Docker Hub上的Docker README。

PAPIDS:https://rapids.ai/documentation.html

README:https://hub.docker.com/r/rapidsai/rapidsai/

GitHub:https://github.com/RAPIDSai

 


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部