www.tech-doc.cn 监控作业执行

监控作业执行


AMEHPCJobHandler是一个监控工具,用于显示已提交Simcenter Amesim研究的进度和状态。

用法: AMEHPCJobHandler.py [-h] [--sched {SLURM,UGE,LSF,PBS,NATIVE}]
                           [--jobid JOBID] [--jobdir JOBDIR]
                           {sched_job_status,sched_job_cancel,job_progress}

位置参数:
  {sched_job_status,sched_job_cancel,job_progress}
                        要执行的命令

可选参数:
  -h, --help            显示帮助信息并退出
  --sched {SLURM,UGE,LSF,PBS,NATIVE}
                        批处理作业调度器
  --jobid JOBID         作业ID
  --jobdir JOBDIR       作业目录(sched_job_status和
                        job_progress命令必需)

具体来说,当使用job_progress选项调用AMEHPCJobHandler时,它会返回五类信息:

当使用sched_job_status选项并指定jobid参数调用AMEHPCJobHandler时,它会返回特定作业的状态。可用的状态包括:

PENDING

作业正在排队等待执行。可能会保持挂起状态,等待资源可用。

RUNNING

作业当前正在执行。

COMPLETED

作业已完成,结果可用。

CANCELED

作业已被所有者或系统管理员取消。

RUN_ERROR

调度器报告作业处于错误状态。这与模拟状态无关。

UNKNOWN

Simcenter Amesim HPC框架无法从调度器获取状态信息。例如命令可能未知或存在安装问题。

SUSPENDED

请咨询系统管理员(不适用于SLURM调度器)。

已提交研究的状态

请注意,该工具提供的是作业的瞬时状态。要跟踪作业的演变过程,请连续多次运行该工具(例如在Linux上使用"watch"命令)。