www.tech-doc.cn NATIVE驱动程序

NATIVE驱动程序


通过参数--driver NATIVE提供给AMEHPCStudyStart脚本的NATIVE驱动程序内部不使用调度器。在此模式下,所有计算节点上的作业启动由HPC框架自身负责(即不依赖任何队列系统)。因此必须提供两个额外参数:

以下章节将详细讨论这两个附加参数。

远程shell

通过--remote-shell参数指定跨节点作业启动方式。默认使用调度器的远程shell,因此在使用NATIVE驱动(无调度器)时必须显式指定该参数。可选值有三种:

  • sched:使用调度器跨节点启动作业

    注意:

    NATIVE驱动不可使用此选项(因无调度器支持)

  • ssh:仅限Linux系统

  • mpi:使用mpiexec跨节点启动作业,仅限Windows系统

机器文件

使用NATIVE驱动时,必须为AMEHPCStudyStart脚本提供机器文件参数。此时需手动提供通常由调度器维护的计算节点信息和CPU可用数量。机器文件需包含:

  • 计算节点名称(需确保网络可达)

  • 每个节点的并行作业数(可选)

  • STDSIMManager在各节点的基准TCP端口(可选)

若机器文件中未指定作业数,则必须提供AMEHPCStudyStartjobspernode参数。

机器文件格式如下所示,每行应包含计算节点名称、STDSIMManager基准TCP端口和作业数:

node1:40001 3

node2:40001 3 

上述机器文件定义了两个计算节点:"node1"和"node2",基准TCP STDSIMManager端口为40001,每个节点在研究中可使用3个CPU核心。