|
楼主 |
发表于 2007-4-3 10:10:42
|
显示全部楼层
有感于canter的并行,将自己的并行计算经验跟大家分享一下,适合低成本cfd科研
3,有盘集群的设置
对于inter双核处理器,本人的感觉就一个字,爽,不过还是言规正传吧,对于有盘的集群,使用是非常灵活的,可以选用任意数目机器,用任意机器作任务启动的master,至于按装cfx的事情,本人感觉cfx5.6已经足够用了,因为只是使用solver功能,安装高版本只需要在pre用,建模画网格本人一直用icem(现在最新版本11.0),已经足够强大了,具体过程如下:
先在每个机器上安装操作系统(废话,呵呵),然后安装cfx,这个可以参照canter的文章,不过我觉得5.6足够了,只需要在同一个目录下建立两个子目录,一个叫5.6,一个叫Licensing,然后在win下破解license,再拷贝到Licensing目录下就好了,安装5.6后不用安装linux的license-setup,没用的。按完cfx后就是最重要的设置并行了:
我分成几步,大家也许看得比较清楚
1.打开系统服务中的rsh,rlogin,rexec服务,并且重新激活xinetd,其实关于rsh的开启网上很多文章供大家参考,命令行我就不打了
2。最重要的将所有节点通过ip连起来,可以任意选择一个做ip服务器,前提是需要在你选定服务器里设置一个服务ip,例如192.168.0.1,掩码填255.255.255.0,dns网关啥的都不填,其它的机器则在ip里填192.168.0.*(*为1-253任意),网关和dns都填192.168.0.1,这样的话就够添了一个局域网络
3.将左右机器互相加入自己rsh用户列表里,这样的话彼此就可以相互rsh了,也就可以使用cfx的并行功能了,具体命令号为&echo "192.168.0.*空格root"空>>空/root/.rhosts
4。还有一点就是要在网络管理里把主机名和对应的ip地址填好,例如192.168.0.1-dlut1,每个机器都把所有的节点信息填一便,至此,前期工作就搞定了,是不是很麻烦亚,所以我比较喜欢无盘集群,就配置主节点就好了
5启动并行的命令行,转到def的目录下,然后终端输入/....../5.6/bin/cfx5solve -def -par-dist "dlut1*2,dlut2*2,...." -part * -size 1.2 &
其中-part后面的*表示你共有多少个节点来计算,比如我用4个机器计算,就是-part 8,因为每个机器双核心
6关于网卡,对于局域网来说,网卡的要求就是普通pci千兆网卡就可以了,不然的话通讯时间很长,影响并行效率,交换机就用普通的全千兆交换机(千元以内)就好了
|
|