前端总线的弊病:多核心高性能计算表现不济

ZDNet 服务器频道 更新时间:2008-05-05 作者: 来源:北方网

本文关键词:Opteron IBM Intel 处理器 服务器 高性能计算 多核 前端总线

ZDNetChina服务器站 2008-05-05 评测

  来自美国加州大学伯克利分校科学计算部门、劳伦斯伯克利国家实验室的研究人员们最近向IEEE递交了一份报告,在其中探讨了多核心超级计算机架构在格子Boltzmann模拟优化项目上的可扩展性。IEEE认为报告非常精彩,甚至可以颁个奖,不过Intel看到报告可能不会太高兴:至少在这次的考察中,Xeon和Itanium 2处理器表现非常一般,Cell BE则是最好的。

  这次对比的处理器包括AMD Santa Rosa Opteron、Intel Clovertown Xeon/Itanium 2、Sun Niagara 2、索尼-东芝-IBM(STI) Cell BE,均为多核心架构产物。研究人员们首先对模拟程序本身进行了深入优化,据称可比原来的LBMHD代码提速14倍之多。

    

  格子Boltzmann模拟

  根据这份报告得出的结论,Cell BE的高性能计算表现最好,比如计算能力16.7GFlops、内存带宽16.7GB/s,多核心扩展性几乎是100%;接下来是Niagara 2和Opteron,借助HyperTransport总线技术,Opteron的扩展性也接近于线性(遗憾的是这里只测试了双核心Opteron,没有四核心的巴塞罗那);Xeon和Itanium 2垫底,内存带宽只有5.1/3.6GB/s,扩展性也是非常差,Xeon就只有43%。

  另外颇具讽刺意味的是,Itanium 2系统的功耗却是最高的,达500W之多,而Cell和Opteron相对最节能,分别只有285W和300W。新Xeon表现也不错,330W的功耗并不算高,而Niagara 2的450W就不低了。

    

  系统配置

    

  性能比较

    

  多核心扩展性能比较

    

  多核心扩展性能比较

  格子Boltzmann模拟程序对系统内存带宽对需求非常高,因此使用前端总线技术的Intel处理器就处于不利地位了。在这次测试中,各方使用的内存配置分别是Intel FB-DIMM DDR2-667、AMD DDR2-667、Sun FB-DIMM DDR2-667、STI Rambus XDR。很显然,XDR的高频和高带宽优势非常明显,Intel的前端总线技术则存在很大的局限性。只有在Nehalem架构引入QPI互连总线、DDR3内存控制器之后,Intel处理器才有望摆脱这种困境。

  结论很明显,如果你需要运行对内存带宽非常敏感的应用程序,那么Intel的Xeon和Itanium 2处理器绝对不是最佳选择,Cell、Niagara 2、Opteron都可以满足需求。当然了,对超级计算机的总体性能来说内存带宽只是一个方面,不是全部,因此也不能全盘否定前端总线技术。事实上在超级计算机领域,Intel的技术也是相当领先的,从超级计算机五百强中占据354个席位的统计上就可见一斑。

  Intel方面拒绝就此发表评论,表示对论文里的内容不熟悉。

用户评论

  • 用户名
  • 评论内容
技术关注
当前技术类目:
安腾处理器本类技术关注比例:
16服务器关注排行:167
66企业级技术关注度:66--

安腾处理器技术相关文章:

文章类型收录数量
2 安腾处理器的成功案例:
8 安腾处理器的相关产品:

服务器频道 Opteron 最新报道

服务器频道 IBM 最新报道

服务器频道 Intel 最新报道

服务器频道 处理器 最新报道

爱卡汽车网 | CNET科技资讯网 | CWEEK | 蜂鸟网 | GameSpot China | 个人电脑 | 开发者在线 | PChome | Solidot | SPN |
投影顾问网 | 万维家电网 | 网友世界 | 西域IT | ZDNet China | 中关村在线 | 中小企业成长网
CNET Networks
Copyright © 1997-2007 CNET Networks 版权所有。 ZDNet 是CNET Networks公司注册服务商标。
中华人民共和国电信与信息服务业务经营许可证编号:京ICP证010391号