<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="en">
		<id>http://wiki.iiis.systems:9988/w/index.php?feed=atom&amp;namespace=0&amp;title=Special%3ANewPages</id>
		<title>IIIS-Systems - New pages [en]</title>
		<link rel="self" type="application/atom+xml" href="http://wiki.iiis.systems:9988/w/index.php?feed=atom&amp;namespace=0&amp;title=Special%3ANewPages"/>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php/Special:NewPages"/>
		<updated>2026-05-17T17:02:34Z</updated>
		<subtitle>From IIIS-Systems</subtitle>
		<generator>MediaWiki 1.24.0-rc.1</generator>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E7%B3%BB%E7%BB%9F%E6%95%99%E5%AD%A6%E5%AE%9E%E8%B7%B5%E5%B9%B3%E5%8F%B0%E6%93%8D%E4%BD%9C%E6%8C%87%E5%8D%97</id>
		<title>大模型系统教学实践平台操作指南</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php/%E5%A4%A7%E6%A8%A1%E5%9E%8B%E7%B3%BB%E7%BB%9F%E6%95%99%E5%AD%A6%E5%AE%9E%E8%B7%B5%E5%B9%B3%E5%8F%B0%E6%93%8D%E4%BD%9C%E6%8C%87%E5%8D%97"/>
				<updated>2023-11-30T06:58:14Z</updated>
		
		<summary type="html">&lt;p&gt;Yw: /* 创建pod（以Deployment类型pod为例） */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;清华大学交叉院大模型系统教学实践平台操作指南&lt;br /&gt;
&lt;br /&gt;
   &lt;br /&gt;
= 申请平台资源 =&lt;br /&gt;
&lt;br /&gt;
为了更好地培养学生使用、训练、研发大模型应用与系统框架实践能力，探索新的研究方向和趋势，清华大学交叉院特建设大模型系统教学实践平台，提供强大的算力支持。&lt;br /&gt;
&lt;br /&gt;
需要使用平台资源的用户，请将申请邮件发送至yw@mail.tsinghua.edu.cn，同时抄送给导师，请导师回复“同意”。&lt;br /&gt;
&lt;br /&gt;
提交的信息包括： &lt;br /&gt;
&lt;br /&gt;
1）账号名 &lt;br /&gt;
&lt;br /&gt;
2）姓名&lt;br /&gt;
&lt;br /&gt;
3）email&lt;br /&gt;
&lt;br /&gt;
4）手机号 &lt;br /&gt;
&lt;br /&gt;
5）申请资源的理由 &lt;br /&gt;
&lt;br /&gt;
6）资源使用期限 &lt;br /&gt;
&lt;br /&gt;
7）导师姓名&lt;br /&gt;
&lt;br /&gt;
8）备注：使用大模型平台&lt;br /&gt;
&lt;br /&gt;
= 使用平台资源 =	&lt;br /&gt;
&lt;br /&gt;
用户需要先通过VPN连接平台网络，然后访问平台资源。&lt;br /&gt;
&lt;br /&gt;
== VPN配置及使用 ==&lt;br /&gt;
&lt;br /&gt;
为了便于用户访问集群，并提高其安全性，我们提供了VPN服务。如果用户在集群中建立了虚拟机，希望在客户端机器上访问虚拟机（比如ping、ssh等），则需要先建立VPN连接。&lt;br /&gt;
&lt;br /&gt;
关于VPN配置及应用，请参见如下链接：&lt;br /&gt;
&lt;br /&gt;
http://wiki.iiis.systems:9988/w/index.php/VPN_User_Guide&lt;br /&gt;
&lt;br /&gt;
&amp;lt;!---== VPN配置及使用 ==&lt;br /&gt;
&lt;br /&gt;
=== VPN介绍 ===&lt;br /&gt;
&lt;br /&gt;
为了便于用户访问集群，并提高其安全性，我们提供了VPN访问。如果用户在集群中建立了虚拟机，希望在客户端机器上访问虚拟机（比如ping、ssh等），则需要建立VPN连接。&lt;br /&gt;
&lt;br /&gt;
=== VPN配置 ===&lt;br /&gt;
&lt;br /&gt;
对于VPN的具体配置，分两种情形：Windows系统上配置VPN、MAC系统上配置VPN。&lt;br /&gt;
&lt;br /&gt;
1&amp;gt;Windows系统上配置VPN&lt;br /&gt;
&lt;br /&gt;
如果你使用的是Windows 10系统，请按照下面的链接自行修改。&lt;br /&gt;
&lt;br /&gt;
http://blog.csdn.net/lc_1994/article/details/50662909&lt;br /&gt;
&lt;br /&gt;
用户先要确认Windows系统是32位系统，还是64位系统。基于此，安装相应的Cisco Vpn Client软件。&lt;br /&gt;
&lt;br /&gt;
64位Windows系统对应的Cisco Vpn Client软件下载地址为：&lt;br /&gt;
&lt;br /&gt;
http://pan.baidu.com/s/1skkBr5N&lt;br /&gt;
&lt;br /&gt;
安装后，运行该软件。单击主界面上的“NEW”按钮，新建VPN连接，界面如图。&lt;br /&gt;
&lt;br /&gt;
[[Image:1.jpg]]&lt;br /&gt;
&lt;br /&gt;
Connection Entry为VPN连接名。用户自己命名。&lt;br /&gt;
&lt;br /&gt;
Description为描述信息，可不填写。&lt;br /&gt;
&lt;br /&gt;
Host为VPN服务器地址，填写gw.iiis.co。如果你在校内，可以尝试使用thu.iiis.co （不能在校外访问，可能有些校内网段不行。）&lt;br /&gt;
&lt;br /&gt;
Group Authentication下的Name栏填写test；Password栏填写123456。&lt;br /&gt;
&lt;br /&gt;
配置完成后的界面，单击Save保存。&lt;br /&gt;
&lt;br /&gt;
双击刚刚建立的连接，会出现用户名和密码的输入界面，在该界面下，输入用户的VPN帐号和密码，即可连接成功，如图。&lt;br /&gt;
&lt;br /&gt;
[[Image:2.jpg]]&lt;br /&gt;
&lt;br /&gt;
2&amp;gt;MAC系统上配置VPN&lt;br /&gt;
&lt;br /&gt;
安装MAC系统的客户机，无需安装第三方软件。利用系统自带的VPN组件，即可建立VPN连接。具体操作如下：&lt;br /&gt;
&lt;br /&gt;
打开“网络偏好设置”，建立一个新的VPN连接，配置如图。接口选择VPN；VPN类型选择Cisco IPSec；服务器名称，用户自定义设置。&lt;br /&gt;
&lt;br /&gt;
[[Image:3.jpg]]&lt;br /&gt;
&lt;br /&gt;
单击“鉴定设置”，设置共享的密钥为123456，群组名称为test，如图&lt;br /&gt;
&lt;br /&gt;
[[Image:4.jpg]]&lt;br /&gt;
&lt;br /&gt;
设置完成后，连接VPN，会出现用户名和密码的输入界面，如下图。在该界面下，输入用户的VPN帐号和密码，即可连接成功。&lt;br /&gt;
&lt;br /&gt;
[[Image:20.jpg]]&lt;br /&gt;
&lt;br /&gt;
=== VPN的常见故障及解决办法 ===&lt;br /&gt;
&lt;br /&gt;
3）VPN的常见故障及解决办法&lt;br /&gt;
&lt;br /&gt;
1&amp;gt;如果无法连接VPN，一般的排除办法如下：&lt;br /&gt;
&lt;br /&gt;
•测试客户机与VPN服务器之间的网络连通性： ping  gw.iiis.co。&lt;br /&gt;
&lt;br /&gt;
•查看客户机的防火墙及安全策略。&lt;br /&gt;
&lt;br /&gt;
2&amp;gt;如果能够出现用户名和密码输入界面，但无法连接成功。说明用户名和密码的输入有误，请仔细核查。---&amp;gt;&lt;br /&gt;
&lt;br /&gt;
== 平台基本操作 ==&lt;br /&gt;
&lt;br /&gt;
=== 平台访问方式 ===&lt;br /&gt;
&lt;br /&gt;
1）平台访问方式&lt;br /&gt;
&lt;br /&gt;
通过URL访问平台，URL为： http://10.1.0.207，登录后界面如图。&lt;br /&gt;
&lt;br /&gt;
[[image:t1.jpg]]&lt;br /&gt;
&lt;br /&gt;
选择身份及用户的命名空间后，即可进入主页面，如下图。&lt;br /&gt;
&lt;br /&gt;
[[image:t2.jpg]]&lt;br /&gt;
&lt;br /&gt;
=== 配置镜像仓库登陆密钥 ===&lt;br /&gt;
&lt;br /&gt;
单击左侧导航栏中的“配置中心”下的“密文”，点击“创建Secret”，输入信息如下：&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[image:t3new.jpg]]&lt;br /&gt;
&lt;br /&gt;
=== 创建pod（以Deployment类型pod为例） ===&lt;br /&gt;
&lt;br /&gt;
1&amp;gt;点击左侧导航栏中“应用程序”下的“工作负载”，然后点击“创建部署”。其“基本信息选项卡”配置如下图：&lt;br /&gt;
&lt;br /&gt;
[[image:t4.jpg]]&lt;br /&gt;
&lt;br /&gt;
2&amp;gt;“容器信息”选项卡配置如下图：&lt;br /&gt;
&lt;br /&gt;
提示：镜像为 harbor.ai.iiis.co/share/pytorch/pytorch:2.1.1-cuda12.1-cudnn8-runtime-ssh&lt;br /&gt;
&lt;br /&gt;
[[image:t5new.jpg]]&lt;br /&gt;
&lt;br /&gt;
3&amp;gt;“存储挂载”选项卡配置（挂载nfs实现用户代码、用户程序等数据持久性存储）中，点击“添加数据卷”，配置如下图：&lt;br /&gt;
&lt;br /&gt;
[[image:t6.jpg]]&lt;br /&gt;
&lt;br /&gt;
4&amp;gt;上述配置完成后，点击“保存”，按提示点击“确定”，即可创建pod，创建后，单击bash，便可进入pod。&lt;br /&gt;
&lt;br /&gt;
= 镜像仓库操作 =&lt;br /&gt;
&lt;br /&gt;
通过URL访问平台，URL为： https://10.1.0.207，登录后可以新建项目，操作如下图。&lt;br /&gt;
&lt;br /&gt;
[[image:t9.jpg]]&lt;br /&gt;
&lt;br /&gt;
= 故障或问题反馈 =&lt;br /&gt;
&lt;br /&gt;
用户在使用平台过程中，如遇到故障或操作方面的问题，请及时在微信群中进行反馈。&lt;/div&gt;</summary>
		<author><name>Yw</name></author>	</entry>

	<entry>
		<id>http://wiki.iiis.systems:9988/w/index.php/K8S_User_Guide</id>
		<title>K8S User Guide</title>
		<link rel="alternate" type="text/html" href="http://wiki.iiis.systems:9988/w/index.php/K8S_User_Guide"/>
				<updated>2021-11-24T04:41:02Z</updated>
		
		<summary type="html">&lt;p&gt;Yw: /* k8s常见问题及反馈 */&lt;/p&gt;
&lt;hr /&gt;
&lt;div&gt;= K8S用户指南 =&lt;br /&gt;
&lt;br /&gt;
== 建立vpn连接 ==&lt;br /&gt;
&lt;br /&gt;
使用k8s集群之前，需要先建立vpn连接。关于vpn的配置及应用，请参见：&lt;br /&gt;
&lt;br /&gt;
http://wiki.iiis.systems:9988/w/index.php/VPN_User_Guide&lt;br /&gt;
&lt;br /&gt;
== 下载配置文件 ==&lt;br /&gt;
&lt;br /&gt;
使用harbor.iiis.co:31388下载配置文件，输入的用户名为vpn账号名，但不带@iiis.co后缀。&lt;br /&gt;
&lt;br /&gt;
== 下载yaml文件 ==&lt;br /&gt;
&lt;br /&gt;
为了便于用户通过yaml文件在K8S下申请及使用资源，特提供yaml文件样例。用户可以根据需求，下载相应yaml文件，也可以修改yaml文件内容。&lt;br /&gt;
&lt;br /&gt;
提示：yaml文件中拉取的镜像，操作系统为ubuntu18.04，包含如下软件：tensorflow1.15.3、horovod0.19.2、cuda10.0、cudnn7、python3.6。&lt;br /&gt;
&lt;br /&gt;
yaml文件介绍，如下：&lt;br /&gt;
&lt;br /&gt;
1）建立pod时，如果不需要持久存储数据，则可以选择的yaml文件为：ubuntu-tf-example.yaml&lt;br /&gt;
&lt;br /&gt;
2）建立pod时，如果需要共享数据并实现多用户访问共享数据，则可以使用IP地址挂接nfs，此种方式没有隐私性和可靠性保证。满足该需求的yaml文件为：ubuntu-tf+nfs-no_pvc-direct-example.yaml&lt;br /&gt;
&lt;br /&gt;
3）建立pod时，如果需要持久存储重要数据，对数据传输及读写性能要求不高（比如存储程序代码），并且不希望其他用户访问该数据，则可以使用基于pvc方式的nfs。满足该需求的yaml文件为：ubuntu-tf+nfs-direct-example.yaml&lt;br /&gt;
&lt;br /&gt;
4）建立pod时，如果需要持久存储重要数据，对数据传输及读写性能要求较高（比如存储实验数据），并且不希望其他用户访问该数据，则可以使用基于pvc方式的cephfs。满足该需求的yaml文件为：ubuntu-tf+cephfs-direct-example.yaml&lt;br /&gt;
&lt;br /&gt;
5）建立pod时，如果需要持久存储数据，既需要使用基于pvc方式的nfs，又需要使用基于pvc方式的cephfs。则可以选择的yaml文件为：ubuntu-tf+nfs+cephfs-example.yaml&lt;br /&gt;
&lt;br /&gt;
6）建立pod时，想临时存放实验数据，对数据传输及读写性能要求较高。则可以选择的yaml文件为：ubuntu-tf+local-disk-example.yaml&lt;br /&gt;
&lt;br /&gt;
7）建立pod时，如果需要使用torch，则可以选择的yaml文件为：ubuntu-runtime-torch.yaml&lt;br /&gt;
&lt;br /&gt;
8) 修改用户quota的yaml文件为：quota.yaml&lt;br /&gt;
&lt;br /&gt;
9）建立挂接nfs所需的pvc，其yaml文件为：nfs-pvc-example.yaml&lt;br /&gt;
&lt;br /&gt;
10）建立挂接cephfs所需的pvc，其yaml文件为：cephfs-pvc-example.yaml&lt;br /&gt;
&lt;br /&gt;
上述各yaml文件，下载地址为：&lt;br /&gt;
&lt;br /&gt;
https://pan.baidu.com/s/18INpkkxoifemg0sPa6UEWQ&lt;br /&gt;
&lt;br /&gt;
提取码为：cdm6&lt;br /&gt;
&lt;br /&gt;
== k8s常见问题及反馈 ==&lt;br /&gt;
&lt;br /&gt;
用户使用k8s集群时，如果遇到问题，可以把问题提交到github上，同时把问题反馈到微信群。&lt;br /&gt;
&lt;br /&gt;
github地址为：github.com/iiisthu/gpupool&lt;/div&gt;</summary>
		<author><name>Yw</name></author>	</entry>

	</feed>