前言¶
目标读者¶
本教程面向计算集群的新用户提供快速入门指导,涵盖从账号申请到作业提交的核心流程。如果您已有集群使用经验,可以跳过基础章节,直接查阅代码编译和作业提交等高级操作部分。
阅读指南¶
为便于查阅,本手册采用以下排版规范:
- 环境变量:
PATH - 命令操作:
sinfo -al -
配置文件内容:
-
命令输出或普通文件内容:
-
完整的代码文件:
核心内容¶
在接下来的章节中,您将学习如何高效安全地使用集群资源,包括:
- 账号申请:通过在线申请系统开通账户和计算集群账号,查看已使用的机时费
- 环境配置:通过 module 命令加载 CUDA、Anaconda3 等基础环境
- 代码编译:在用户登录节点使用用编译器正确编译 C/C++、CUDA 等代码
- 作业提交:合理申请 CPU/GPU/内存资源,通过 Slurm 系统提交任务
重要守则¶
使用集群时请务必遵守:
- 仅将计算资源用于科研或学习等用途;
- 不在用户登录节点裸跑任务,始终通过 Slurm 作业调度系统申请资源和运行作业;
- 提前预估资源需求,结束任务后及时释放资源。