|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?注册
x
随着中国经济高速发展,中国已经成为“世界制造中心”,但我们的制造还大多数属于简单的浅层面。大部分产品是在国外研发设计,在国内生产。未来市场激烈竞争加剧,必然需要不断创新和追求完美的自主研发设计,在工程计算领域,用户对CAE(计算机辅助工程)技术的信任度和依赖性越来越高,CAE应用范围和深度在不断拓展、延伸。单一或少量零、部件的CAE分析逐渐过渡到了系统级的仿真计算(如整车);单一物理场的研究演变多物理场耦合问题的研究;单一目标的求解发展为多目标、甚至直接探求问题机理的求解计算……工程计算的规模和复杂度正迅速膨胀,专业CAE应用对计算机性能的要求也相应提高
CAE包括的FEA(有限元分析)和CFD(计算流体力学)分析手段,在工程设计和分析中,已经成为解决复杂的工程分析计算问题的有效途径,现在从汽车到航天飞机几乎所有的设计制造都已离不开有限元分析和计算流体力学计算,其在机械制造、材料加工、航空航天、汽车、土木建筑、电子电器,国防军工,船舶,铁道,石化,能源,科学研究等各个领域的广泛使用已使设计水平发生了质的飞跃。随着计算机运行速度与存储容量不断地增加,CAE所能解决问题的尺度与复杂度也逐渐加大,目前已能够为用户解决各种复杂的工程问题。
CAE的HPC(高性能计算)应用软件使用最广泛是ANSYS、Fluent、CFX(流体)以及LS-DYNA(碰撞)等,用户使用这些软件进行复杂和大规模问题的求解,对计算机内存、处理器和I/O带宽的要求非常高。早期的数值分析软件是在大中型计算机上开发和运行的,后来又发展到以工程工作站(EWS,Engineering Work Station)上,它们都是用UNIX操作系统,所有这些成本太高,非一般单位的工程设计人员所能拥有的,现在不同了,四核64位处理器普及配合微软的高性能计算Windows系统,将极大地降低高性能计算的应用门槛,让更多的工程技术和研发人员有机会享受高性能计算的强大性能,高性能计算不再是高成本的时代了
这是一款目前世界最快的跑车,如果你驾驶这部在机场跑道和飞机等速起跑,那是多么爽快的事情,今天我们用最快的处理器-Xeon W5580,打造一款能够进行高性能计算的高速工作站,让这台机器的运算速度在工程设计发挥极致。这套配置是将当前服务器最高规格产品合理的搭配,构成一台高性能运算工作站
产品型号:XASUN X5500 T23224AB
参考配置
配件
| 品牌和型号
| 数量
| CPU
| 四核Xeon W5580
3.2G/8MB/6.4GTs/超线程/Turbo
| 2
| 风扇
| Intel 原装风扇
| 1
| 主板
| Intel S5520SC
| 1
| 内存
| 4G DDR3 1333 RECC
| 6
| 显卡
| Nvidia FX1700 512M DDR3 256位
| 1
| 硬盘
| ST 146G SAS,15000转
| 1
| 机箱
| XASUN T2
| 1
| 电源
| 1000W EPS
| 1
| 报价
| 48000元
| |
XASUN超级工作站的技术要点
CAE对系统的浮点运算性能和内存带宽要求非常高,影响计算性能的主要环节是:CPU运算单元→ CPU二级缓存→ 前端总线 → 北桥芯片→ 内存→ 硬盘,每一个环节都不能忽视,最新英特尔Nehalem架构的四核Xeon5500处理器,拥有众多性能卓越的技术,包括基于Core架构的酷睿CPU核心,多达8MB的共享 L2 缓存、高速QPI总线架构。众多的先进技术实现了Intel Xeon W5580超强的计算性能,比Xeon 5400性能提升很多,为确保工作站高速高效还要合理的成本
CPU采用2颗Xeon W5580,8×3.2G频率、8M二级缓存、QPI 6.4GTs,1333Mhz前端总线频率,整台工作站拥有八个计算单元,从而处理器的峰值速度达到3.2G×4×8=102.4Gflop/S,1024次/秒
主板采用intel S5520SC 支持最新四核Xeon5500系列,PCI-E16X 2代显卡,六通道内存
内存容量24G,6根4G内存构成六通道,有限元分析软件的计算速度提升完全靠大内存的支持,只有内存足够大,才能把所有数据一次放进内存,才能最快对数据计算和得到结果,否则当物理内存不足的时候,系统就会使用虚拟内存(磁盘部分作为虚拟内存),这样降大大降低性能
硬盘采用目前最高转速15000转,SAS接口,充分保证速度读写对频繁数据访问要求,CAE应用在初始化、中间结果保存和计算结果输出时都会有密集的数据IO操作,而且目前并行计算程序的IO操作大多还是串行进行的,因此IO的性能经常是并行计算程序的瓶颈所在,所以SAS15000转这个目前最快的硬盘是非常必要的,如果资金允许,可以在通过RAID进一步提升读取速度,通过多块磁盘RAID,磁盘的IO速度可以成倍提高。
显卡Quadro VX200 一款高端专业图形处理解决方案,计算产生的数据则需做可视化处理,经由适当的计算机绘图技术将结果表示出来。
将上述产品结合搭建的四核Xeon高性能计算工作站,满足了软件对硬件的高性能、经济实用,并具有灵活配置调整,相对于品牌工作站来讲配置更合理,价格更便宜,性能得到最大满足。
基于FEA/CFD工作站关键配件选型
CPU 四核 Xeon W5580 4 x 3.2G /8M L2/6.4GTs
Nehalem新技术详解
1 .QPI总线技术
在Nehalem之前,Intel一直使用FSB前端总线作为处理器与芯片组连接的桥梁,虽然1600Mhz的前端总线对于桌面级数据处理来说已是绰绰有余,但对于数据量庞大的服务器来说,其仍然是性能的瓶颈。Nehalem因此引入了全新的串行总线QPI,QPI总线是基于数据包传输(packet-based)。其拥有高带宽、低延迟的点到点互连技术等特点,它的传输速度可以达到每秒6.4G次数据。与FSB最大的不同在于,QPI不仅仅可以负责CPU与北桥通信,还可以实现CPU与CPU之间的相互连通。正如前文中所提到的Nehalem模块化的特点,对于不同市场的Nehalem,可以具有不同的QPI总线条数。比如桌面市场的CPU,具有1条或者半条QPI总线(半条可能是用10bit位宽或单向);DP服务器(双CPU插座)的CPU,每个具有2条QPI总线;而MP服务器(4个或8个CPU插座)的,则每个具有4条或更多的QPI总线。
2.内存控制器
在AMD整合了内存控制器长达5年之久后,Intel终于按捺不住了。为了进一步降低处理器访问内存的延迟以提高处理器的性能,Intel也引入了内存控制器的概念。
Intel 整合内存控制器(IMC)示意图 3.同步多线程技术
Intel的整合内存控制器(integrated memory controller),可以支持3通道的DDR3内存运行在1.33GT/s(DDR3-1333),这样总共的峰值带宽就可以达到32GB/s。三通道的DDR3内存,其每通道都能够独立操作,其处理器所集成的内存控制器需要乱序执行来降低延迟。
不过,高性能也是有高付出的,在高端平台上,必须要三条DDR3内存才能够打开三通道,而且三通道内存也并没有加入DDR2的设计,因此用户只能够选择DDR3内存来感受内存延迟降低的快感。
自从奔腾4时期开始,超线程技术便已经是家喻户晓了。在当时31级流水线的P4上面,为了提高处理器的性能,细化的流水线可以操作不同的任务进程。然而,在14级流水线下的Core上面,超线程技术消失了。不过这一切都是暂时的。因为Nehalem又重新引入了类似于·超线程技术的同步多线程技术。
Nehalem同步多线程技术图解
Nehalem的同步多线程(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同时执行2个线程。这样就可以压缩多任务处理时所需要的总时间。同步多线程功能的好处是只需要消耗很小的核心面积代价,就可以在多任务的情况下提供显著的性能提升,比起完全再添加一个物理核心来说要划算得多。并且,Nehalem因为L3大缓存的设计及内存控制器的集成使之拥有了更大的缓存和更大的内存带宽,而且基于Core微架构中表现优秀的分支预测设计能够更加有效的发挥多线程的性能。。。。。。。
北京太阳HPC应用中心
北京中关村E世界财富中心C座880室
电话:15811284832 010-62680056,82486297
联系人:李彪
[ 本帖最后由 lbanl 于 2009-7-7 02:13 编辑 ] |
|