数据中心 频道

Windows HPC 2008如何实现高性能

  管理

  与内置的 HPC 群集管理器中,您可以轻松地配置和管理群集计算节点、 监视的节点上运行的作业,确定在使用产能在任何给定的点时间和控制哪些作业类型在任何特定的节点运行的节点。 进一步,cluscfg 实用工具使用户可以获得眼-是-统计,包括多少处理器正在使用中、 多少都空闲时,和的计算节点需要维护。

  clusrun 命令允许您浏览在任何给定的时间运行的作业数以及快速查看多少计算节点和 CPU 正在使用。 还可以打开在 HPC 群集管理器控制台查看仍中队列、 已完成的作业和那些 stalling 作为一个整体,群集上运行的作业以及作业的列表。 如果作业 stalling,您可以钻取下一个作业或任务调查原因。

  我们的经验计算群集上失败作业的常见的原因包括不佳已安装的文件共享或信任在多个计算机节点上的共享上的未设置 ; 不良设置在计算节点上的访问控制列表权限和 Windows PowerShell 脚本的执行不适当的权限设置。 解决这些问题是相对简单。

  HPC 群集管理器控制台,可以查看运行状况的一个快照也更直观地直观的热所示中的所有计算节点映射视图。 此处,您可以快速获取的方式资源被占用每个节点上所有提交的作业的概述。 也可以在所有计算节点上一次 (请参见 图 3 ) 执行的诊断测试,并这些测试结果提供使用跨整个组节点解决问题或单独的组的相关信息则群集管理员。 进一步,HPC 2008 还提供了非常有用的图形显示在不同的时间段 (图 4) 中显示计算群集使用。 这些饼图和关键性能指标允许相关的决策者可以确定是否服务器并且 IT 资源会正确分配。

  图 3 测试可以执行跨所有计算节点一次 。
 图 4 有用的信息是随时可用

  利用 Windows PowerShell

  使用 HPC 2008,您不可以只提交作业以交互方式进行 HPC 群集管理器控制台通过计划程序,您可也执行此操作通过命令行,或通过 Windows PowerShell 使用户能够自动执行通过任务计划程序 C# 的系统调用的作业也 Windows PowerShell 调用。

  我们的项目,则可以使用主要的 Windows PowerShell 脚本,查询网络的文件共享。 共享用作图像处理系统之后要执行的实验已存入一个输入目录的等待处理的文件。 该脚本将继续通过检查 post-process 输出文件的输出目录中。 如果输入的文件已不还处理 (这就是如果输出文件中找不到输出目录),该脚本将生成单独的子脚本专门提交 HPC 计划程序,通过命令行的各个作业。 主要的 Windows PowerShell 脚本然后重复提交到计划程序的所有类子脚本通过其管道到 job.exe,HPC 命令行的作业提交可执行文件。 作业计划程序可以提交任何作业或使用的参数,各种可以用于在群集上运行应用程序的选项一灵活组 HPC 计算群集的任务。

0
相关文章