NATIVE驱动程序
通过参数--driver NATIVE提供给AMEHPCStudyStart脚本的NATIVE驱动程序内部不使用调度器。在此模式下,所有计算节点上的作业启动由HPC框架自身负责(即不依赖任何队列系统)。因此必须提供两个额外参数:
-
包含节点名称和每个节点并行作业数的机器文件(--machinefile参数)
-
用于跨集群节点间启动作业的远程shell(--remote-shell参数)
以下章节将详细讨论这两个附加参数。
远程shell
通过--remote-shell参数指定跨节点作业启动方式。默认使用调度器的远程shell,因此在使用NATIVE驱动(无调度器)时必须显式指定该参数。可选值有三种:
-
sched:使用调度器跨节点启动作业
注意:NATIVE驱动不可使用此选项(因无调度器支持)
-
ssh:仅限Linux系统
-
mpi:使用mpiexec跨节点启动作业,仅限Windows系统
机器文件
使用NATIVE驱动时,必须为AMEHPCStudyStart脚本提供机器文件参数。此时需手动提供通常由调度器维护的计算节点信息和CPU可用数量。机器文件需包含:
-
计算节点名称(需确保网络可达)
-
每个节点的并行作业数(可选)
-
STDSIMManager在各节点的基准TCP端口(可选)
若机器文件中未指定作业数,则必须提供AMEHPCStudyStart的jobspernode参数。
机器文件格式如下所示,每行应包含计算节点名称、STDSIMManager基准TCP端口和作业数:
node1:40001 3
node2:40001 3
上述机器文件定义了两个计算节点:"node1"和"node2",基准TCP STDSIMManager端口为40001,每个节点在研究中可使用3个CPU核心。
译文质量与官方无关,仅做辅助学习使用,帮助大家更方便高效的掌握工具.文档网址:www.tech-doc.cn;公众号:Amesim学习与应用、译匠工厂