找回密码
 注册
查看: 2667|回复: 0

高性能计算的两极:千万亿次和个人HPC

[复制链接]
发表于 2009-3-25 09:51:25 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?注册

x
国家并行计算机工程技术研究中心金怡濂院士在其《高性能计算机的现状与发展》报告中谈到,高性能计算机发展到今天,大规模并行计算机已经成为主流产品。

  10月30日,在无锡的2008年全国高性能计算学术年会上,国家并行计算机工程技术研究中心金怡濂院士在其《高性能计算机的现状与发展》报告中谈到,高性能计算机发展到今天,大规模并行计算机已经成为主流产品,特别是上世纪90年代以来,高性能计算机的发展异常迅速,其性能平均每四年提高一个量级。但他同时也指出,随着系统规模越来越大,千万亿次计算时代的高性能计算机正在面临扩展性、可靠性、高功耗、均衡性等方面的挑战。针对这些挑战,IT168服务器频道记者现场采访了参加此次会议的英特尔高性能计算机解决方案设计师Tom Metzger和英特尔公司高性能计算软件经理Sanjay Goil博士。 [相关链接:2008年全国高性能计算学术年会视频专题]
  功耗电费攀升 英特尔三方面着手
  在高性能计算领域,因为用户对于计算性能的需求是无止境的,这使得计算机系统的规模越做越大,系统功耗也成为超级计算机发展面临的重要挑战。金怡濂院士谈到,当今全球百万亿次级超级计算机系统功耗都在1000千瓦左右,全球运算速度最快的千万亿次RoadRunner运行功耗高达2350千瓦。由于一台千万亿次超级计算机系统的功耗多达数兆瓦,使得每年电费开销高达数千万元人民币以上。功耗已经成为令高性能计算用户头疼的大问题。
  而目前包括美国、欧盟、日本、法国和中国都已经发布了千万亿次机的计划。预计中国的千万亿次机器将在2010年到2011年间出现。
  对此,英特尔高性能计算机解决方案设计师Tom Metzger谈到,“英特尔会从芯片、服务器和基础设施三个层面入手,我们相信摩尔定律一定会继续推动能效比的不断提升。”
  从这两年所推出的产品技术来看,英特尔也确实在朝这一方向努力。比如在制程工艺上,从65纳米向45纳米转换,不仅从晶体管层面解决了漏电问题,而且可以让芯片做得更小,性能更高,这使得45纳米产品可以用更少的时间完成相同的任务,从而减少能源的消耗。另外,英特尔在芯片中也在不断增强能源管理功能,如对能耗按需管理,把不忙的处理器核的功耗降低,以便于提升繁忙的处理器核的主频。而在基础架构方面,英特尔认为一定要和整个产业的伙伴进行共同合作,才能让整个生态系统共同走向绿色计算。
  大规模、多核异构系统 软件编程是关键
  金院士在报告中指出,当高性能计算机的系统规模扩展超过数万个处理器、数十万个处理器核时,延时将变成一个非常重要的问题,需要采用低度互连。同时,未来千万亿次计算机系统的复杂性也将远远超过现有规模,因而迫切需要重新设计编程模型,以适应系统的大规模扩展和求解问题的大规模扩展,并确保其高效性和高并行度。
  对于超大规模系统和多核异构系统的可扩展性问题,英特尔公司高性能计算软件经理Sanjay Goil博士认为,关键的一点是“要让今天编写的高性能计算软件代码也可以在未来的多核或众核平台上进一步使用,要让软件迁移和扩展变得更加容易。”
CPU与I/O发展不均衡 可按应用区别对待
  由于CPU的发展速度明显快于存储I/O的发展速度,使得在大规模多核并行系统中出现了“I/O墙”和“存储器墙”的问题,即存储器性能与处理器性能差距越来越大,以及本地带宽及延迟和全局带宽及延迟的不一致性导致存储器提供数据的能力和处理器计算能力互不协调,从而形成了“存储器墙”。金院士指出,在千万亿次超级计算机系统中,要想确保系统从I/O输入到I/O输出均保持均衡的带宽设计,会比现在更加困难。
  Tom Metzger则从应用角度分析了这个问题,他谈到,对于CPU主频敏感型应用,如生命科学、金融模拟等,现有的平台已经足够应对;而对于在HPC市场中仅占到20%左右的I/O带宽敏感型应用如CAE、油田勘探、气象模拟等,英特尔即将推出的新一代架构的Nehalem,由于在芯片中采用了点对点传输、集成内存控制器等,使得在I/O带宽上增长了4倍之多,因此这类应用会从Nehalem获益。

  英特尔中国公司亚太客户响应团队技术经理何万青博士告诉记者,目前英特尔的高性能计算开发工具可用于分析和优化已有MPI编程模式的性能。同时英特尔也发布了自己的MPI2.0,接口不变,编程模式不变,但更加适合多核环境,在进程与内核之间可以实现更好的绑定。另外英特尔针对Open MPI也在与业界伙伴进行合作。
  我们看到,多核/众核异构系统越来越受到超大规模计算机的青睐,如IBM的RoadRunner把POWER PC、CELL和AMD的皓龙混合在了一起;在芯片层面,包括英特尔、AMD和nVIDIA等都在研制异构多核/众核芯片。
  Sanjay Goil表示,英特尔一定会做异构的多核芯片,但与对手“异构的内核,异构的编程环境”不同,英特尔会坚持走“异构的内核,相同的编程环境”这样一条道路,也就是说,不管是哪种内核,所使用的编程模式都应该是一样的。虽然现在业界已经出现了一些异构系统,但这些异构系统除了在Linpack测试时有较出色的表现,在实际应用中并不好测试,因此需要强大的软件工具的支持,降低异构环境下的软件编程难度。
  千万亿次机只是冰山一角 更应强调高性能计算普及
  其实,高性能计算产业可以用大海中的冰山来形容,无论是国际TOP500中每秒千万亿次的IBM走鹃超级计算机,还是国内TOP100中速度最快的曙光5000A超级计算机,都只是这座冰山露出海面的一角。整个产业要想取得健康、快速的发展,位于海平面下的更加巨大的中低端产品和用户应该得到足够的重视。
  英特尔认为,对于商业化公司来说,业务重点会放到处于中间档次、强调高性价比的主流产品上面。而要想实现高性能计算的广泛普及,一方面要让集群系统更加容易部署和使用,另一方面必须要有足够的人才了解“如何在多核平台上进行并行编程”。
  英特尔中国服务器产品经理顾凡介绍说,目前英特尔全球软件团队正在与全球各地的大学进行并行计算课程方面的合作,中国在全球排在前三位,共有183个大学参与这项合作,这些人才的出现可以让中国的ISV在并行编程方向与世界处于同一起跑线上。另外,英特尔的Cluster Ready计划也已经执行了一年多,该计划联合多家软硬件合作伙伴,对集群系统所使用的不同网络、不同软件版本等进行测试认证,从而让用户真正可以实现一站式采购,简化集群系统的采购、部署和使用过程。
  另外,特别值得一提的是,在此次年会上,个人高性能计算机也受到了广泛关注。中国科大陈国良院士在大会上做了《pHPC:一种普及型高性能计算机》的报告。他指出,高性能计算的一个发展方向是可扩展系统,当前主要是研究千万亿次计算的关键技术;而另一个发展方向就是普及型系统,我们为此提出了称为PHPC(Personal High Performance Computer)的个人高性能计算机的一组技术。“适合办公室环境、规模化产品、用户为中心的使用模式、面向生产率的编程模式”是PHPC的主要特征。
  对此,Tom Metzger告诉记者,英特尔也坚信这块市场的存在,未来会有很多用户进入这块市场。英特尔美国的工程师已经全程参与了Cray CX1台式HPC的规划设计。不过,Tom Metzger也谈到,对于这种适用于办公室环境的小规模集群系统,用户应该关注的重点是生产力、简单易用性、性价比和静音,而未来英特尔众核处理器产品的出现,可以让单个Socket实现非常高的性能,同时保证低功耗和软件的易编程性。
  据了解,目前市场上的个人高性能计算机主要包括泰安台风、曙光PHPC100、Cray CX1以及同时适用于商用计算和HPC环境的刀片服务器,如超微的OfficeBlade和IBM的BladeCenter S等。中科大和中科院计算所也联合进行了基于龙芯CPU的“KD-50”万亿次个人高性能计算机系列的设计。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

快速回复 返回顶部 返回列表