K8S User Guide
K8S用户指南
建立vpn连接
使用k8s集群之前,需要先建立vpn连接。关于vpn的配置及应用,请参见:
http://wiki.iiis.systems:9988/w/index.php/VPN_User_Guide
下载配置文件
使用harbor.iiis.co:31388下载配置文件,输入的用户名为vpn账号名,但不带@iiis.co后缀。
下载yaml文件
为了便于用户通过yaml文件在K8S下申请及使用资源,特提供yaml文件样例。用户可以根据需求,下载相应yaml文件,也可以修改yaml文件内容。
提示:yaml文件中拉取的镜像,操作系统为ubuntu18.04,包含如下软件:tensorflow1.15.3、horovod0.19.2、cuda10.0、cudnn7、python3.6。
yaml文件介绍,如下:
1)建立pod时,如果不需要持久存储数据,则可以选择的yaml文件为:ubuntu-tf-example.yaml
2)建立pod时,如果需要共享数据并实现多用户访问共享数据,则可以使用IP地址挂接nfs,此种方式没有隐私性和可靠性保证。满足该需求的yaml文件为:ubuntu-tf+nfs-no_pvc-direct-example.yaml
3)建立pod时,如果需要持久存储重要数据,对数据传输及读写性能要求不高(比如存储程序代码),并且不希望其他用户访问该数据,则可以使用基于pvc方式的nfs。满足该需求的yaml文件为:ubuntu-tf+nfs-direct-example.yaml
4)建立pod时,如果需要持久存储重要数据,对数据传输及读写性能要求较高(比如存储实验数据),并且不希望其他用户访问该数据,则可以使用基于pvc方式的cephfs。满足该需求的yaml文件为:ubuntu-tf+cephfs-direct-example.yaml
5)建立pod时,如果需要持久存储数据,既需要使用基于pvc方式的nfs,又需要使用基于pvc方式的cephfs。则可以选择的yaml文件为:ubuntu-tf+nfs+cephfs-example.yaml
6)建立pod时,想临时存放实验数据,对数据传输及读写性能要求较高。则可以选择的yaml文件为:ubuntu-tf+local-disk-example.yaml
7)建立pod时,如果需要使用torch,则可以选择的yaml文件为:ubuntu-runtime-torch.yaml
8) 修改用户quota的yaml文件为:quota.yaml
9)建立挂接nfs所需的pvc,其yaml文件为:nfs-pvc-example.yaml
10)建立挂接cephfs所需的pvc,其yaml文件为:cephfs-pvc-example.yaml
上述各yaml文件,下载地址为:
https://pan.baidu.com/s/18INpkkxoifemg0sPa6UEWQ
提取码为:cdm6
k8s常见问题及反馈
用户使用k8s集群时,如果遇到问题,可以把问题提交到github上,同时把问题反馈到微信群。
github地址为:github.com/iiisthu/gpupool