监视节点

更新时间: 2014年1月

应用到: Microsoft HPC Pack 2008 R2, Microsoft HPC Pack 2012, Microsoft HPC Pack 2012 R2, Windows HPC Server 2008 R2

监视和维护群集运行状况的关键步骤是发现与正常操作状态或性能的任何偏离。HPC 群集管理器使您能够直观查看群集和节点状态、识别问题节点以及深究节点细节以便作进一步调查。

此主题中的内容:

在“节点管理”中,可以使用节点“列表”视图或节点“热映射”视图直观监视群集。在“图表和报告”中,监视图表会显示有关节点运行状况和群集利用率的当前和最新数据。有关详细信息,请参阅:

“列表”和“热映射”视图为发现问题区域提供了入口点。双击计算节点可以查看诸如硬件、操作系统属性和当前性能指标此类详细信息。还可以选择一个或多个节点,然后深究节点细节,以调查性能。

跟踪最近或正在进行的群集操作是另一件对管理群集意义重大的监视任务。有关详细信息,请参阅:

在 HPC 作业管理器中,可以使用“透视到”操作使节点、作业、操作和诊断之间的监视信息相关联。例如,可以在视图窗格中选择一个或多个节点,然后透视到“所选节点的作业”。这将转到按您选择的节点进行筛选的作业列表视图。

受支持的透视路径是:

  • 节点:透视到作业、测试结果和操作。

  • 作业:透视到节点。

  • 测试结果:透视到失败的节点和操作。

HPC 群集管理器提供了几个内置图表和报告,用于随时间的推移监视和分析群集资源使用情况以及作业和节点统计信息。HPCReporting 数据库还支持自定义报告。有关详细信息,请参阅图表和报告

显示: