定义为作业排除的节点

更新时间: 2014年1月

应用到: Microsoft HPC Pack 2008 R2, Microsoft HPC Pack 2012, Microsoft HPC Pack 2012 R2, Windows HPC Server 2008 R2

如果您注意到作业中的任务始终在某个特定节点上失败,则可以通过将该节点添加到“排除的节点”作业属性中,以将其从作业中排除。在“排除的节点”中指定节点时:

  • 作业中正在已添加到“排除的节点”的节点上运行的任务将被取消,并标记为“失败”(“节点发布”任务除外)。

  • 发布节点之前,“节点发布”任务在排除的节点上运行。

  • 作业中的任何任务均不会在“排除的节点”中列出的节点上启动。

  • 如果向“排除的节点”列表中添加节点会导致作业低于最低资源要求,则作业将被取消并重新排队。

对于您拥有的任何活动作业,均可在“排除的节点”作业属性中添加或删除节点,也可以清除该列表。下面列出了使用 HPC PowerShell 或命令提示符修改和查看“排除的节点”列表的命令。

在 HPC PowerShell 中,使用以下 cmdlet:

  • Set-HpcJob –JobId <yourJobID> /addExludedNodes <nodeName>, <nodename>

  • Set-HpcJob –JobId <yourJobID> /removeExcludedNodes <nodeName>, <nodename>

  • Set-HpcJob –JobId <yourJobID> /clearExcludedNodes

  • (Get-HpcJob –JobId <yourJobID>).ExcludedNodes

  • 或者,若要查看所有的作业属性,请使用 Get-HpcJob –JobId <yourJobID>|fl

在命令提示符下,使用以下命令:

  • job modify <yourJobID> /addExludedNodes <nodeName>, <nodename>

  • job modify <yourJobID> /removeExcludedNodes <nodeName>, <nodename>

  • job modify <yourJobID> /clearExcludedNodes

  • job view <yourJobID> /detailed|find “excludednodes” /i

  • 或者,若要查看所有的作业属性,请使用 job view <yourJobID> /detailed

note注意
对于 SOA 作业,代理节点会按照 EndPointNotFoundRetryPeriod 设置(在服务配置文件中)自动更新和维护排除节点的列表。此设置指定服务主机应重试加载服务的时间以及代理应等待连接的时间。如果过了这段时间,则代理会将该节点(服务主机)添加到“排除的节点”列表中。服务配置还包括 maxExcludedNodes 设置,该设置指定在会话失败之前可排除的节点数。

显示: