协同创作者:

  • 23硕-电子信息-李义 兼服务器管理员 liyi269@mail2.sysu.edu.cn 19120330113

特别注意:

提交作业并使用完容器后,务必及时关闭!!!
管理员可观察到历史使用记录,若发现多次浪费时长的不合理使用,将被约谈批评!!

平台登录

天河二号超算中心-星光使用平台 https://starlight.nscc-gz.cn/

入门必看

  1. 星光在线文档 https://starlight.nscc-gz.cn/api/doc/#/README

星光培训使⽤演⽰.pdf

使用过程中存在问题:

image.png

一般都在20-30分钟内回复!

本地已有环境,想迁移?

anaconda迁移深度学习虚拟环境 and 在云服务器上配置(上)-阿里云开发者社区

pip缺少包?没有anaconda?装软件没有sudo权限?

  1. 星光在线文档 https://starlight.nscc-gz.cn/api/doc/#/README

image.png

使用手册:

无论使用星逸/启明集群,请务必仔细阅读第一个天河星光用户使用手册
天河星光使用手册.pdf

  1. 天河星光用户使用手册v0.60 https://starlight.nscc-gz.cn/api/mei/acorn/3372b458-7a61-445a-be7f-c4c4e78c4ac9

  2. 启明系统简明使用手册 https://starlight.nscc-gz.cn/api/mei/acorn/3e53bdba-54cb-4ea5-bc1e-720ad495e3e3

    1. 推荐使用启明系统(可自由选择CPU/GPU/内存)
    2. 对新上手使用的同学而言,在摸熟悉软件/配置环境的过程中,均建议提交作业采用CPU方式,选择最低配置(1核/5GB内存,仅花费1.20核时/小时),避免浪费核时。image.png
  3. 星逸-智能AI集群简明使用手册 https://starlight.nscc-gz.cn/api/mei/acorn/76a29a71-f388-4bac-b23a-fd7236393813

    1. 星逸集群只有A800显卡,选择有限。推荐需要高算力同学使用
  4. 山石VPN使用手册-2019 https://starlight.nscc-gz.cn/api/mei/acorn/221b43ce-447e-4ccf-87e1-a46629c3fe9f

VPN安装文件-scvpn.zip

  1. VPN使用目的主要在于连接登录节点。登录节点可以方便管理自己的数据以及环境,且使用登录节点时并不算钱,只有实际申请计算资源时才算钱
  2. VPN目前只有sysu_tzhang_1主账号有独立的账号及连接密码。后续如有需要,将为各位成员开通子账号VPN权限
  3. (仅适用启明)经测试,可以通过申请一个最便宜的启明资源,提交作业并通过SSH方式连接到容器后,使用命令 cd .. 也能返回上一级用户目录,随后进行环境配置或数据上传。这种方式可避免对VPN的需求。具体操作参考天河星光用户使用手册v0.60 4.2.2.2节 SSH 远程登录作业
  4. 连接到星逸/启明集群的VPN软件都是山石VPN,但两个集群的IP地址并不相同。具体IP地址参考如上的使用手册
  1. 星光在线文档 https://starlight.nscc-gz.cn/api/doc/#/README

    1. 该文档与天河星光用户使用手册内容比较贴近,可互相补充查看
  2. 更多文档,请查看首页指南

image.png

镜像构建

推荐大家使用星光平台-应用列表中已有的Ubuntu镜像,在上面安装好环境后,再点击构建镜像,即可保存到自己的镜像仓库中。此方法由于星光官方对ubuntu镜像做了优化,可自由选择SSH(MobaXtern)ttyd(命令行转到 Web 执行)交互方式image.png

也可直接pull 官方镜像(官方网站https://www.docker.com/products/docker-hub/上搜索想要的镜像,并拉取),由于需要翻墙,星光有时不能直接构建成功,可以通过一些国内镜像网站如dockerproxy等。

Pull下来的官方镜像通常没有开放SSH、tty等交互方式,需自行开启,比较繁琐。
可参考:天河星光用户使用手册 4.2.2.3 添加访问入口

平台注册绑定

星光平台注册: https://starlight.nscc-gz.cn/#/register?redirect=%2Fuser-center%2Fuser-info 邮箱/手机号

  • 天河HPC账号:指的是系统分配的子账号,如sysu_tzhang_1这样的格式
  • 私钥口令:由超算中心分配,目前分配了1-10子账号。如下图.id文件所示
  • 目前已有子账号及用户绑定
    • 子账号目前总共申请15个,如后续需求增加,可能存在多人同时使用一个子账号的情况
    • 账号属实验室公共资产,毕业后请及时告知管理员绑定账号及密码,方便后面同学使用
超算账号 使用人 注册邮箱/手机号
sysu_tzhang_1 张涛教授 13512509493
sysu_tzhang_2 22硕-林其欣 13610223232
sysu_tzhang_3 23硕-李义 1806231865@qq.com
sysu_tzhang_4 23硕-李挺 15694746038
sysu_tzhang_5 21博-李昌镐 lichh33@mail2.sysu.edu.cn
sysu_tzhang_6 24硕-袁子茜 15879552534
sysu_tzhang_7 22博-邓薄文
sysu_tzhang_8 24硕-邓舒楠
sysu_tzhang_9 23硕-刘桢谋 13570090539
sysu_tzhang_10 22硕-邹一苇 zouyw3@mail2.sysu.edu.cn
sysu_tzhang_11 23硕-李挺 liting226@mail2.sysu.edu.cn
sysu_tzhang_12 22博-王润竹

子账号与主账号(用户和租户)

租户:sysu_tzhang,具有管理员权限
用户:sysu_tzhang_1~ sysu_tzhang_10
空间共享:

  • 主账号(sysu_tzhang_1)与子账号(2~9)共享星光系统的核时、存储空间、镜像仓库空间
  • 主账号与子账号具有独立的用户空间
    • 例如,主账号与子账号们在启明集群/GPUFS下合计有1T的存储空间,可以是两者各自可以使用500GB存储空间,但彼此的数据是隔离的
    • image.png

想用vscode连接容器?

vscode连接k8s_venus_v2.docx


0 条评论

发表回复

Avatar placeholder

您的邮箱地址不会被公开。 必填项已用 * 标注