资源描述
单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,中国人民解放军国防科技大学计算机学院,国家超级计算长沙中心,用户手册,如何使用中心资源,申请账号,首先进入中心网站,了解中心提供的计算资源和服务,然后联系中心工作人员,获取,用户上机申请表,,按照,用户上机申请表填写说明,完成填写,经单位领导签字加盖公章后送至中心才能完成最后注册。,中心对,用户上机申请表,进行审查后,为用户开通账号,用户即可使用中心资源了。,如何使用中心资源,使用形式,内网登录:在中心终端机房,采用,X windows,、,SshClient,、,putty,等远程登录工具直接登录使用中心资源;,外网登录:在可以连接,Internet,的终端机上,在,IE,浏览器中输入,通过,SSLVPN,用户登录系统使用中心资源,外网登录另外的方法:在本机上安装SSL VPN独立客户端,然后打开。如图所示,机群基本操作,远程登录,step1:,利用,putty,进入登录服务器,(,以计算阵列()为例,):,机群基本操作,step2:,点击,open,后进入以下界面,:,机群基本操作,step3:,输入你的用户名及密码,:,机群基本操作,用户登录服务器后,默认进入到与用户名同名的目录下,进入到,/vol6/home/user_name,机群基本操作,基本操作,1),进入目录,:cd,2),建文件夹,:mkdir,3),查看目录信息,:ls ll,4),删除文件,:rm,文件名,5),拷贝文件,:,cp options source,dest,6),改变文件,/,目录属性,:chmod,7),设置文件,/,目录拥有者,:chown,8),搜索文件,:find,grep,9),进程管理,:ps top w who,10),压缩解压缩,:tar,gzip,11,)修改密码:,passwd,机群基本操作,vi,编辑器,Vi,提供三种操作模式,:,命令模式、插入模式、末行模式,三种模式可通过,ESC,键进行相互转换。,:,q!,离开,vi,,并放弃刚在缓冲区内编辑的内容,:,wq,将缓冲区内的资料写入磁盘中,并离开,vi,:,x,同,wq,:,w,将缓冲区内的资料写入磁盘中,但并不离开,vi,:,q,离开,vi,,若文件被修改过,则会被要求确认是否放弃修改的内容,机群基本操作,:,set nu,设定资料的行号。,:,set nonu,取消行号设定。,:,10,20w test,将第,10,行至第,20,行的资料写入,test,文件。,:,10,20wtest,将第,10,行至第,20,行的资料加在,test,文件之后。,删除、复制及搬移,:,10,20d,删除第,10,行至第,20,行的资料。,:,10d,删除第,10,行的资料。,:,%d,删除整个编辑缓冲区。,:,10,20co30,将第,10,行至第,20,行的资料复制至第,30,行之后。,:,10,20mo30,将第,10,行至第,20,行的资料搬移至第,30,行之后。,用户作业管理,作业提交基本流程,Step1,:用户准备数据输入与作业脚本文件;,Step2:ftp,上传数据文件至用户目录;,用户可用任意,ftp,工具将数据上传或下载数据,用户名密码即为你登录机群时使用的用户名和密码,用户作业管理,Step3,:登录机群服务器,用,yhinfo,命令查看节点的信息,:,用户作业管理,yhinfo,可以显示节点的一些信息,具体说明如下,:,(,1,),PARTITION:,表示节点的分组情况;默认的组会有组名前加上*号,例如:以上情况下,,work,就是默认的组,若不指定,作业会自动加载到默认组中的节点,如需要到将作业加载到特殊的组别需要添加相应参数;,(,2,),AVAIL,:表示节点默认的状态,,up,表示可用;,(,3,),NODE,:表示作业占用的节点数;,(,4,),STATE,:表示节点目前的状态;,(,5,),NODELIST,:表示作业占用的节点列表;,用户作业管理,状态,含 义,备 注,down,节点故障,不可用,用户不要在登录节点上运行作业,alloc,节点已分配,不可用,drain,排空标志,不可用,但已经在节点上运行的作业不受影响,idle,节点空闲,可用,下表是节点状态的具体信息:,用户作业管理,Step4:,编译,调试作业,;,集群上安装了包括,gcc,icc,等常用的编译器,用户可以根据自身的需要进行选择。如果是并行程序,编译命令应使用以下命令:,mpicc:,用于对,c,语言写的并行程序;,Mpicxx:,用于使用,c+,语言编写的并行程序;,Mpif77,,,mpif90:,用于使用,fortran,语文编写的程序;后缀的选择与你使用的,fortran,语言版本有关;,具体命令,(,以,C,语言程序为例,),:,mpicc o cpi,(编译后的可执行代码),cpi.c(,原程序,),用户作业管理,Step5:,利用命令,yhrun/yhbatch,提交作业,:,提交作业命令:,yhrun,常用参数如下,:,-n,-ntasks=ntasks,指定提交作业的任务数,-N,-nodes=N,指定作业需要占用的节点数;,-x,-exclude=hosts.,指定作业在除某个节点外的节点运行;,-w node,指定作业在某些节点运行,-p,partition name,组 名,用户作业管理,-i,-input=in,标准输入重载,-o,-output=out,标准输出重载,-e,-error=err,标准错误重载,例:,%yhrun/yhbatch n 4 my_program,提交作业,my_program,,任务数为,4,,由系统指定节点。,%yhrun/yhbatch -N 2 my_program,指定作业,my_program,在两个节点上运行,具体节点不指定。,%yhrun/yhbatch n 2 w node 6 my_program,提交作业,my_program,在,node6,上运行。,%yhrun/yhbatch -n 8 N 1 w node1 -p test myprogram,提交作业,my_program,在,test,组中的,node1,上运行作业,.,用户作业管理,yhbatch,是提交批处理作业的命令,使作业在后台运行,作用,yhbatch,命令提交时,用户需要确认提交的作业为批处理格式的作业脚本,具体使用,yhbatch,方法为如下:,(,1,)进行用户作业所在的目录并编写可运行批处理作业的脚本:,#cd path(,用户作业所在的目录,),#vi task(,用户根据需要自行命名,),#,!,/bin/sh,/usr/bin/yhrun /path/job_name(path,为用户作业的全路径,),(,2,)将作业脚本的属性改为可执行,#chmod+x task,(,3,)用,yhbatch,方式发作业:,#yhbatch n 16 N 2 w node1-2./task,(,4,)如果提交成功,系统会在屏幕上出现与以下内容相似的提示:,yhbatch:Submitted batch job 23371,同时,系统会在当前目录下生成一个类似于,slurm-23371.out,的文件,系统会将,拟输出到屏幕的内容保存到这个文件中,其中,23371,是作业,ID,号。,用户作业管理,注意,:,任务数,n=,节点数,N*,单个节点的,CPU,核数,.,yhrun -N 1-n 8 -w node4 job_name,用户在提交作业时,一定要指明所需的节点数,即在命令行设置参数,-N,以防作业提交出错,.,用户作业管理,作业提交后,可用命令,yhqueue,查看作业是否提交成功,:,用户作业管理,当用户需要在作业运行时结束作业,可以利用,yhcancel,命令,但用户只能删除自己的作业,无法对其他用户的作业进行操作,.,%yhcancel 15578,结束作业号为,15578,的作业,.,如果需要将作业放到后台运行,可以使用命令,:yhbatch,主要的参数与,yhrun,相同,.,用户作业管理,用户如果因为自身需要不能用作业管理器提交作业(如起图形界面、需要登录到计算结点运行一些测试程序)时,请先使用以下命令占住你需要使用的结点,然后再使用这些结点运行你自己的程序。如用,testzj,用户运行以下命令:,yhalloc-n 16-N 2-w node4-5-p fluent,运行成功后会出现以下的提示:,yhalloc:Granted job allocation 43786,用,yhinfo,查看:,JOBID PARTITION NAME USER ST TIME NODES NODELIST(REASON),43786 fluent bash testgh R 0:02 2 node4-5,用户作业管理,用户使用,yhalloc,命令后不要退出当前的,shell,,否则,占用的结点会被释放掉,即会出现以下提示:,yhalloc:Relinquishing job allocation 43786,如果程序完成后,需要停止占用结点,可以使用,yhcancel jobid,命令或,yhalloc,作业停止。,yhcancel 43786,屏幕上会出现:,yhalloc:Job allocation 43786 has been revoked.,这表示你占用的结点已经退出,其它用户可以使用这些结点了。,用户作业管理,说明:,1.,用户可以自行下载自己需要的软件,将它安装在自己的目录之下,;,下载的软件应为,linux(64,位,),版本。,2.,在未经中心允许的情况下,禁止用户在登录节点上直接运行作业脚本或登录到其他计算节点上直接运行作业脚本。,3.,中心用户手册,会根据中心的实际情况及用户的使用机器的情况及时更新,请用户注意查看。,4.,提交任务数不能超过二十个,最多使用,100,个结点。,5.,定期清理用户目录下的数据,不能超过,500GB,。,用户在使
展开阅读全文