了解作业和任务状态

更新时间: 2014年1月

应用到: Microsoft HPC Pack 2008 R2, Microsoft HPC Pack 2012, Microsoft HPC Pack 2012 R2, Windows HPC Server 2008 R2

在 Windows HPC Server 2008 R2 中,作业和任务具有几乎完全相同的生命周期状态。主要的生命周期状态为“正在配置”、“已排队”、“正在运行”、“已完成”、“失败”和“已取消”。作业和任务也经过短暂的过渡状态。下表概述了所有生命周期状态。

HPC 作业计划程序服务可以对作业和任务进行排队、分配资源、为计算节点分派任务,以及监视作业、任务和节点的状态。有关详细信息,请参阅配置 HPC 作业计划程序服务

下表概述了所有生命周期状态。

作业状态和任务状态

状态 定义

正在配置

作业或任务位于系统中,但还未提交到队列。

已提交

作业或任务已提交且正在等待验证,然后才能进行排队。

正在验证

作业计划程序服务正在验证作业或任务。在验证期间,作业计划程序服务会确认权限、将默认设置应用于作业所有者未指定的所有属性,并针对约束验证各个属性。默认设置和约束由作业模板定义。有关作业模板的详细信息,请参阅作业模板。作业计划程序服务还会确认作业属性是否涵盖所有任务属性(例如,没有任何任务的运行时间长于作业的运行时间)。

验证期间,作业可能还会经过一个由群集管理员定义的自定义提交筛选器应用程序。有关详细信息,请参阅了解激活和提交筛选器

如果作业通过验证,则其状态会变为“已排队”。如果作业未通过验证,则会显示一条错误消息,且作业状态会变为“失败”。

已排队

作业或任务通过了验证,且正在等待安排和激活(运行)。

运行作业时,“基本”任务或“参数清除”子任务会被作业计划程序取代,作业状态将返回到“已排队”状态(除非任务不可重新运行,这时作业状态将标记为“失败”)。

调度

此状态仅适用于任务。作业计划程序服务已为任务分配资源并正在与已分配的节点联系,以开始运行任务。启动该任务时,它将进入“运行”状态。

正在运行

作业或任务正在一个或多个节点上运行。

即将完成

作业或任务已完成,正在进行作业或任务清除。

已完成

作业或任务已成功完成。

失败

作业或任务未能完成、已停止运行或返回一个非零退出代码。

此外,在以下情况下,正在运行的任务被标记为“失败”:

  • 作业所有者或群集管理员取消该任务。

  • 由于任务超出最长运行时间,作业计划程序服务会取消该任务。

  • 作业计划程序服务取代一个未标记为可重新运行的任务。

  • 作业计划程序服务取代一个按每个资源为基础启动的子任务(节点准备节点发布服务子任务)。

如果由于群集故障未能启动作业或任务,则该作业或任务会自动重试指定的次数,直到标记为“失败”。

正在取消

作业或任务已取消,正在进行清除。

已取消

作业所有者、群集管理员或作业计划程序服务已取消该作业。例如,作业计划程序服务可以取消超出运行时间或被取代的作业。

作业所有者或群集管理员已在任务开始运行前取消该任务。如果取消正在运行的任务,则该任务被标记为“失败”。

要取消作业或任务,请参阅取消作业或任务强制取消作业或任务

显示: