Difference between revisions of "Docker User Guide"

From IIIS-Systems
Jump to: navigation, search
(Created page with "清华大学交叉信息研究院Docker(GPU Cluster)用户操作指南 = 申请集群资源 = OpenStack是一个开源的云计算管理平台项目,旨在为公共云...")
 
 
(33 intermediate revisions by the same user not shown)
Line 1: Line 1:
清华大学交叉信息研究院Docker(GPU Cluster)用户操作指南
+
清华大学交叉信息研究院Docker(GPU-Cluster)用户操作指南
 
+
 
    
 
    
= 申请集群资源 =
+
= 申请Docker(GPU-Cluster)资源 =
 +
 
 +
请登录www.shurenyun.com 注册一个账户。
 +
 
 +
请把注册的帐户信息(即:注册时填写的邮箱)发送给尹伟老师,尹伟老师的邮箱是yw@mail.tsinghua.edu.cn,尹老师进行授权后,即可使用Docker资源。
 +
 
 +
= 使用Docker资源 =
 +
 
 +
用户使用Docker(GPU-Cluster)资源,详细操作,如下:
 +
 
 +
使用注册的账户登录www.shurenyun.com,点击左侧导航栏中的“应用管理”,然后点击右上角的第一个图标,会出现“新建应用”,点击“新建应用”发布一个deeplearning:allinone的应用。
 +
 
 +
1)应用名称: 自定义
 +
 
 +
2)选择集群: gpu-share:GPU-cluster
 +
 
 +
3)镜像地址: demoregistry.dataman-inc.com/srypoc/deeplearning:allinone
 +
 
 +
4)镜像版本: allinone
 +
 
 +
5)网络模式: 网桥模式(这里必须选择网桥模式, 因为容器的暴露端口是22,主机模式会跟宿主机的22端口冲突)
 +
 
 +
6)容器规格: 1cpu,1024M(或者据情况而定)
 +
 
 +
7)容器个数:1
 +
 
 +
点击“容器个数”下面的V型按钮,打开“高级设置”,设置如下内容:
 +
 
 +
8)选择主机: 如果你必须使用GPU资源,最好选择标签gpu, 或者直接选择 10.1.0.[170,172,177,179,180]中的某一台或几台主机。
 +
 
 +
9)挂载点:点击添加挂接路径按钮,添加如下2项信息。
 +
 
 +
1>主机目录:/var/lib/docker/volumes/nvidia_driver_352.79/_data  映射到容器目录:/usr/local/nvidia
  
OpenStack是一个开源的云计算管理平台项目,旨在为公共云及私有云的建设与管理提供所需的软件,实现计算资源、网络资源、存储资源的共享。 清华大学交叉信息研究院使用OpenStack为用户提供计算资源。
+
2>主机目录:/mnt/data  映射到容器目录:/mnt/data 用户需要将持久化保持的数据放到该目录的某个文件夹下。(注:该目录是个nfs目录,数据将会被持久化存储到 ceph 上。由于当前版本数人云无法与ldap绑定,所以该目录里面的文件没有隔离机制,只能要求用户各自建立一个 home 目录来放置自己的文件)
  
需要使用集群资源的用户,请向集群管理员尹伟老师提交资源使用申请。提交申请的邮箱为:yw@mail.tsinghua.edu.cn
+
10)应用地址: 应用端口:22,协议为TCP,映射端口:52222(用户可以自定义端口号,端口范围1024-65535)。使用此方式配置的映射端口是变化的,为ssh访问带来不变。用户可以把映射端口固定下来,不让其变化。操作如下:
 +
在该处,不对“应用地址”进行配置。在第12)条的Docker参数中,添加额外的参数 Key: publish  Value: 22:32222  此例中32222为ssh的映射端口,后续使用ssh访问容器时,需要用该端口。
  
提交的信息包括:
+
11)环境变量: 可以不填写
  
1)账号名(系统会随机生成密码,用户登录系统后,可以自行修改密码)
+
12)Docker 参数: 单击“添加DOCKER参数”按钮,添加如下3个参数。
  
2)email
+
Key: device  对应的Value: /dev/nvidia-uvm
  
3)手机号
+
Key: device  对应的Value: /dev/nvidia0
  
4)申请资源的理由
+
Key: device  对应的Value: /dev/nvidiactl
  
5)资源使用期限
+
提示:如果需要固定ssh的映射端口,需要添加如下参数。
  
6)IIIS账号支持人的姓名 (学生请填写导师姓名,院外人员请填写IIIS联系人的信息。)
+
Key: publish  Value: 22:映射端口
  
= 使用集群资源 =
+
13)日志目录: 可以不修改
  
用户使用集群资源,需要先通过VPN连接集群网络,然后通过OpenStack使用集群资源。详细配置及操作,如下:
+
14)CMD: 输入需要执行的命令。
  
== VPN配置及使用 ==
+
点击“创建”
  
=== VPN介绍 ===
+
应用创建成功后, 通过ssh -p ${ssh的映射端口}root@${应用地址栏看到的IP}(这里的应该是 10.1.0.170),密码:password ,即可访问容器。
  
为了便于用户访问集群,并提高其安全性,我们提供了VPN访问。如果用户在集群中建立了虚拟机,希望在客户端机器上访问虚拟机(比如ping、ssh等),则需要建立VPN连接。
+
登录容器后,可以通过命令:caffe device_query -gpu all 来查看GPU信息

Latest revision as of 11:05, 24 June 2016

清华大学交叉信息研究院Docker(GPU-Cluster)用户操作指南

申请Docker(GPU-Cluster)资源

请登录www.shurenyun.com 注册一个账户。

请把注册的帐户信息(即:注册时填写的邮箱)发送给尹伟老师,尹伟老师的邮箱是yw@mail.tsinghua.edu.cn,尹老师进行授权后,即可使用Docker资源。

使用Docker资源

用户使用Docker(GPU-Cluster)资源,详细操作,如下:

使用注册的账户登录www.shurenyun.com,点击左侧导航栏中的“应用管理”,然后点击右上角的第一个图标,会出现“新建应用”,点击“新建应用”发布一个deeplearning:allinone的应用。

1)应用名称: 自定义

2)选择集群: gpu-share:GPU-cluster

3)镜像地址: demoregistry.dataman-inc.com/srypoc/deeplearning:allinone

4)镜像版本: allinone

5)网络模式: 网桥模式(这里必须选择网桥模式, 因为容器的暴露端口是22,主机模式会跟宿主机的22端口冲突)

6)容器规格: 1cpu,1024M(或者据情况而定)

7)容器个数:1

点击“容器个数”下面的V型按钮,打开“高级设置”,设置如下内容:

8)选择主机: 如果你必须使用GPU资源,最好选择标签gpu, 或者直接选择 10.1.0.[170,172,177,179,180]中的某一台或几台主机。

9)挂载点:点击添加挂接路径按钮,添加如下2项信息。

1>主机目录:/var/lib/docker/volumes/nvidia_driver_352.79/_data 映射到容器目录:/usr/local/nvidia

2>主机目录:/mnt/data 映射到容器目录:/mnt/data 用户需要将持久化保持的数据放到该目录的某个文件夹下。(注:该目录是个nfs目录,数据将会被持久化存储到 ceph 上。由于当前版本数人云无法与ldap绑定,所以该目录里面的文件没有隔离机制,只能要求用户各自建立一个 home 目录来放置自己的文件)

10)应用地址: 应用端口:22,协议为TCP,映射端口:52222(用户可以自定义端口号,端口范围1024-65535)。使用此方式配置的映射端口是变化的,为ssh访问带来不变。用户可以把映射端口固定下来,不让其变化。操作如下: 在该处,不对“应用地址”进行配置。在第12)条的Docker参数中,添加额外的参数 Key: publish Value: 22:32222 此例中32222为ssh的映射端口,后续使用ssh访问容器时,需要用该端口。

11)环境变量: 可以不填写

12)Docker 参数: 单击“添加DOCKER参数”按钮,添加如下3个参数。

Key: device 对应的Value: /dev/nvidia-uvm

Key: device 对应的Value: /dev/nvidia0

Key: device 对应的Value: /dev/nvidiactl

提示:如果需要固定ssh的映射端口,需要添加如下参数。

Key: publish Value: 22:映射端口

13)日志目录: 可以不修改

14)CMD: 输入需要执行的命令。

点击“创建”

应用创建成功后, 通过ssh -p ${ssh的映射端口}root@${应用地址栏看到的IP}(这里的应该是 10.1.0.170),密码:password ,即可访问容器。

登录容器后,可以通过命令:caffe device_query -gpu all 来查看GPU信息