监控作业执行
AMEHPCJobHandler是一个监控工具,用于显示已提交Simcenter Amesim研究的进度和状态。
用法: AMEHPCJobHandler.py [-h] [--sched {SLURM,UGE,LSF,PBS,NATIVE}]
[--jobid JOBID] [--jobdir JOBDIR]
{sched_job_status,sched_job_cancel,job_progress}
位置参数:
{sched_job_status,sched_job_cancel,job_progress}
要执行的命令
可选参数:
-h, --help 显示帮助信息并退出
--sched {SLURM,UGE,LSF,PBS,NATIVE}
批处理作业调度器
--jobid JOBID 作业ID
--jobdir JOBDIR 作业目录(sched_job_status和
job_progress命令必需)
具体来说,当使用job_progress选项调用AMEHPCJobHandler时,它会返回五类信息:
-
job_progress_ratio(已完成作业的百分比)
-
job_nb_runs(总运行次数)
-
job_simulated_runs(已模拟运行次数)
-
job_failed_runs(失败运行次数)
-
job_aborted_runs(中止运行次数)
当使用sched_job_status选项并指定jobid参数调用AMEHPCJobHandler时,它会返回特定作业的状态。可用的状态包括:
PENDING |
作业正在排队等待执行。可能会保持挂起状态,等待资源可用。 |
RUNNING |
作业当前正在执行。 |
COMPLETED |
作业已完成,结果可用。 |
CANCELED |
作业已被所有者或系统管理员取消。 |
RUN_ERROR |
调度器报告作业处于错误状态。这与模拟状态无关。 |
UNKNOWN |
Simcenter Amesim HPC框架无法从调度器获取状态信息。例如命令可能未知或存在安装问题。 |
SUSPENDED |
请咨询系统管理员(不适用于SLURM调度器)。 |
已提交研究的状态
请注意,该工具提供的是作业的瞬时状态。要跟踪作业的演变过程,请连续多次运行该工具(例如在Linux上使用"watch"命令)。
译文质量与官方无关,仅做辅助学习使用,帮助大家更方便高效的掌握工具.文档网址:www.tech-doc.cn;公众号:Amesim学习与应用、译匠工厂