Latest revision as of 11:05, 24 June 2016

清华大学交叉信息研究院Docker(GPU-Cluster)用户操作指南

申请Docker(GPU-Cluster)资源

请登录www.shurenyun.com 注册一个账户。

请把注册的帐户信息（即：注册时填写的邮箱）发送给尹伟老师，尹伟老师的邮箱是yw@mail.tsinghua.edu.cn，尹老师进行授权后，即可使用Docker资源。

使用Docker资源

用户使用Docker（GPU-Cluster）资源，详细操作，如下：

使用注册的账户登录www.shurenyun.com，点击左侧导航栏中的“应用管理”，然后点击右上角的第一个图标，会出现“新建应用”，点击“新建应用”发布一个deeplearning:allinone的应用。

1）应用名称：自定义

2）选择集群： gpu-share:GPU-cluster

3）镜像地址： demoregistry.dataman-inc.com/srypoc/deeplearning:allinone

4）镜像版本： allinone

5）网络模式：网桥模式（这里必须选择网桥模式，因为容器的暴露端口是22，主机模式会跟宿主机的22端口冲突）

6）容器规格： 1cpu，1024M（或者据情况而定）

7）容器个数：1

点击“容器个数”下面的V型按钮，打开“高级设置”，设置如下内容：

8）选择主机：如果你必须使用GPU资源，最好选择标签gpu, 或者直接选择 10.1.0.[170,172,177,179,180]中的某一台或几台主机。

9）挂载点：点击添加挂接路径按钮，添加如下2项信息。

1>主机目录：/var/lib/docker/volumes/nvidia_driver_352.79/_data 映射到容器目录：/usr/local/nvidia

2>主机目录：/mnt/data 映射到容器目录：/mnt/data 用户需要将持久化保持的数据放到该目录的某个文件夹下。(注：该目录是个nfs目录，数据将会被持久化存储到 ceph 上。由于当前版本数人云无法与ldap绑定，所以该目录里面的文件没有隔离机制，只能要求用户各自建立一个 home 目录来放置自己的文件)

10）应用地址：应用端口：22，协议为TCP，映射端口：52222（用户可以自定义端口号，端口范围1024-65535）。使用此方式配置的映射端口是变化的，为ssh访问带来不变。用户可以把映射端口固定下来，不让其变化。操作如下：在该处，不对“应用地址”进行配置。在第12）条的Docker参数中，添加额外的参数 Key: publish Value: 22:32222 此例中32222为ssh的映射端口，后续使用ssh访问容器时，需要用该端口。

11）环境变量：可以不填写

12）Docker 参数: 单击“添加DOCKER参数”按钮，添加如下3个参数。

Key: device 对应的Value: /dev/nvidia-uvm

Key: device 对应的Value: /dev/nvidia0

Key: device 对应的Value: /dev/nvidiactl

提示：如果需要固定ssh的映射端口，需要添加如下参数。

Key: publish Value: 22:映射端口

13）日志目录：可以不修改

14）CMD：输入需要执行的命令。

点击“创建”

应用创建成功后，通过ssh -p ${ssh的映射端口}root@${应用地址栏看到的IP}(这里的应该是 10.1.0.170)，密码：password ，即可访问容器。

登录容器后，可以通过命令：caffe device_query -gpu all 来查看GPU信息

Difference between revisions of "Docker User Guide"

Latest revision as of 11:05, 24 June 2016

申请Docker(GPU-Cluster)资源

使用Docker资源

Navigation menu

Personal tools

Namespaces

Variants

Views

More

Search

Navigation

Tools

@@ Line 1: / Line 1: @@
-清华大学交叉信息研究院Docker(GPU Cluster)用户操作指南
+清华大学交叉信息研究院Docker(GPU-Cluster)用户操作指南
-= 申请集群资源 =
+= 申请Docker(GPU-Cluster)资源 =
+请登录www.shurenyun.com 注册一个账户。
+请把注册的帐户信息（即：注册时填写的邮箱）发送给尹伟老师，尹伟老师的邮箱是yw@mail.tsinghua.edu.cn，尹老师进行授权后，即可使用Docker资源。
+= 使用Docker资源 =
+用户使用Docker（GPU-Cluster）资源，详细操作，如下：
+使用注册的账户登录www.shurenyun.com，点击左侧导航栏中的“应用管理”，然后点击右上角的第一个图标，会出现“新建应用”，点击“新建应用”发布一个deeplearning:allinone的应用。
+）应用名称： 自定义
+）选择集群： gpu-share:GPU-cluster
+）镜像地址： demoregistry.dataman-inc.com/srypoc/deeplearning:allinone
+）镜像版本： allinone
+）网络模式： 网桥模式（这里必须选择网桥模式， 因为容器的暴露端口是22，主机模式会跟宿主机的22端口冲突）
+）容器规格： 1cpu，1024M（或者据情况而定）
+）容器个数：1
+点击“容器个数”下面的V型按钮，打开“高级设置”，设置如下内容：
+）选择主机： 如果你必须使用GPU资源，最好选择标签gpu, 或者直接选择 10.1.0.[170,172,177,179,180]中的某一台或几台主机。
+）挂载点：点击添加挂接路径按钮，添加如下2项信息。
+>主机目录：/var/lib/docker/volumes/nvidia_driver_352.79/_data  映射到容器目录：/usr/local/nvidia
-OpenStack是一个开源的云计算管理平台项目，旨在为公共云及私有云的建设与管理提供所需的软件，实现计算资源、网络资源、存储资源的共享。 清华大学交叉信息研究院使用OpenStack为用户提供计算资源。
+>主机目录：/mnt/data  映射到容器目录：/mnt/data 用户需要将持久化保持的数据放到该目录的某个文件夹下。(注：该目录是个nfs目录，数据将会被持久化存储到 ceph 上。由于当前版本数人云无法与ldap绑定，所以该目录里面的文件没有隔离机制，只能要求用户各自建立一个 home 目录来放置自己的文件)
-需要使用集群资源的用户，请向集群管理员尹伟老师提交资源使用申请。提交申请的邮箱为：yw@mail.tsinghua.edu.cn
+）应用地址： 应用端口：22，协议为TCP，映射端口：52222（用户可以自定义端口号，端口范围1024-65535）。使用此方式配置的映射端口是变化的，为ssh访问带来不变。用户可以把映射端口固定下来，不让其变化。操作如下：
+在该处，不对“应用地址”进行配置。在第12）条的Docker参数中，添加额外的参数 Key: publish   Value: 22:32222  此例中32222为ssh的映射端口，后续使用ssh访问容器时，需要用该端口。
-提交的信息包括：
+）环境变量： 可以不填写
-）账号名（系统会随机生成密码，用户登录系统后，可以自行修改密码）
+）Docker 参数: 单击“添加DOCKER参数”按钮，添加如下3个参数。
-）email
+Key: device   对应的Value: /dev/nvidia-uvm
-）手机号
+Key: device   对应的Value: /dev/nvidia0
-）申请资源的理由
+Key: device   对应的Value: /dev/nvidiactl
-）资源使用期限
+提示：如果需要固定ssh的映射端口，需要添加如下参数。
-）IIIS账号支持人的姓名 （学生请填写导师姓名，院外人员请填写IIIS联系人的信息。）
+Key: publish   Value: 22:映射端口
-= 使用集群资源 =
+）日志目录： 可以不修改
-用户使用集群资源，需要先通过VPN连接集群网络，然后通过OpenStack使用集群资源。详细配置及操作，如下：
+）CMD： 输入需要执行的命令。
-== VPN配置及使用 ==
+点击“创建”
-=== VPN介绍 ===
+应用创建成功后， 通过ssh -p ${ssh的映射端口}root@${应用地址栏看到的IP}(这里的应该是 10.1.0.170)，密码：password ，即可访问容器。
-为了便于用户访问集群，并提高其安全性，我们提供了VPN访问。如果用户在集群中建立了虚拟机，希望在客户端机器上访问虚拟机（比如ping、ssh等），则需要建立VPN连接。
+登录容器后，可以通过命令：caffe device_query -gpu all 来查看GPU信息