K8S User Guide

From IIIS-Systems
Jump to: navigation, search

K8S用户指南

建立vpn连接

使用k8s集群之前,需要先建立vpn连接。关于vpn的配置及应用,请参见:

http://wiki.iiis.systems:9988/w/index.php/VPN_User_Guide

下载配置文件

使用harbor.iiis.co:31388下载配置文件,输入的用户名为vpn账号名,但不带@iiis.co后缀。

下载yaml文件

为了便于用户通过yaml文件在K8S下申请及使用资源,特提供yaml文件样例。用户可以根据需求,下载相应yaml文件,也可以修改yaml文件内容。

提示:yaml文件中拉取的镜像,操作系统为ubuntu18.04,包含如下软件:tensorflow1.15.3、horovod0.19.2、cuda10.0、cudnn7、python3.6。

yaml文件介绍,如下:

1)建立pod时,如果不需要持久存储数据,则可以选择的yaml文件为:ubuntu-tf-example.yaml

2)建立pod时,如果需要共享数据并实现多用户访问共享数据,则可以使用IP地址挂接nfs,此种方式没有隐私性和可靠性保证。满足该需求的yaml文件为:ubuntu-tf+nfs-no_pvc-direct-example.yaml

3)建立pod时,如果需要持久存储重要数据,对数据传输及读写性能要求不高(比如存储程序代码),并且不希望其他用户访问该数据,则可以使用基于pvc方式的nfs。满足该需求的yaml文件为:ubuntu-tf+nfs-direct-example.yaml

4)建立pod时,如果需要持久存储重要数据,对数据传输及读写性能要求较高(比如存储实验数据),并且不希望其他用户访问该数据,则可以使用基于pvc方式的cephfs。满足该需求的yaml文件为:ubuntu-tf+cephfs-direct-example.yaml

5)建立pod时,如果需要持久存储数据,既需要使用基于pvc方式的nfs,又需要使用基于pvc方式的cephfs。则可以选择的yaml文件为:ubuntu-tf+nfs+cephfs-example.yaml

6)建立pod时,想临时存放实验数据,对数据传输及读写性能要求较高。则可以选择的yaml文件为:ubuntu-tf+local-disk-example.yaml

7)建立pod时,如果需要使用torch,则可以选择的yaml文件为:ubuntu-runtime-torch.yaml

8) 修改用户quota的yaml文件为:quota.yaml

9)建立挂接nfs所需的pvc,其yaml文件为:nfs-pvc-example.yaml

10)建立挂接cephfs所需的pvc,其yaml文件为:cephfs-pvc-example.yaml

上述各yaml文件,下载地址为:

https://pan.baidu.com/s/18INpkkxoifemg0sPa6UEWQ

提取码为:cdm6

k8s常见问题及反馈

用户使用k8s集群时,如果遇到问题,可以把问题提交到github上,同时把问题反馈到微信群。

github地址为:github.com/iiisthu/gpupool