宝德助力北理工高性能集群系统建设
近年来,高教体系的专项科研项目依托国家863计划,气象建模、模拟撞车试验、人类基因组图谱绘制以及模拟核爆炸等各种与人类生命息息相关的重要领域都要用到 HPC 。高性能计算(HPC)本身通常用于处理世界上最复杂和艰巨的计算难题,并往往能够彻底解决这些问题。突飞猛进的性能、急剧下降的成本以及势如潮涌的需求等众多因素,促使 HPC 迅速走出科研实验室,步入主流商业领域。
由于2004年以来,宝德科技已经和北京大学、国家气象局、南京师范大学、华南工业大学等多家科研单位进行了HPC的项目合作,在高校的科研计划中关注到北京理工大学需要类似的计算压力设备,从而开始针对性的洽谈和合作。
立足宝德前期的成功合作案例和经验,在INTEL的大力支持下,宝德通过长达2个月的校方应用方向和需求分析,运用INTEL解决方案中心的测试条件,同时兼顾后期校方的更大规模网格计算的扩展需要,针对性的推出了POWER 8000 HPC应用方案;从CPU/内存/硬盘/容灾/网络拓扑/系统带宽/管理平台/电源系统/机房管理等多个方面,宝德HPC解决方案充分结合客户的实际需要,北京理工大学高性能计算计算集群系统是一个是基于网络、面向科研等的大型高性能并行计算系统,该系统的基础是主控节点、计算节点等硬件基础平台的建设和互联系统的建设。
宝德科技为北京理工大学高性能集群系统可提供标准的Intel服务器平台系统,先进的高性能服务器集群系统,具有实时多任务并行操作的高性能、高可用性、高稳定性、可靠性、可扩展性等优势。英特尔服务器采用标准的Intel IA架构机架式设计,及根据系统环境的各种物理机械、电磁兼容性设计及冗余设计等,都严格按照国家规范进行。
宝德与Intel联合成立的Intel Solution Center(ISC)设有正规的测试实验室,从产品、系统的研发开始就严把质量关,在网络环境下对各种新产品、新的解决方案系统进行各种满负荷的系统级模拟测试,保证为市场不断提供高稳定、高可用的服务器平台系统。
宝德IA 64位双路安腾2为计算节点的宝德Power Cluster8000I高性能计算机系统,采用免费OSCAR中间件实现节点管理、任务分发和集群监控,使用Infiniband MPI的优化通信库模块来实现节点之间的进程通信,近乎达到大型机中多进程间消息传输机制的效率,再加上一套完整的Intel优化编译工具和函数库等软件来优化数科院的应用,使系统的性能得到充分的发挥,成为高校高性能计算系统推广的表率之一。
采用基于Itanium2处理器的计算平台和Infiniband互联网络,在多个测试实例中,用Intel编译器编译应用程序和MPI库函数比用GNU编译器获得53%-60%的性能提升;
在相同测试条件下,采用Infiniband互联网络比采用GigE网络有30.2%-38.6%的性能提升。在Infiniband计算网络环境中,处理器负荷很高,接近99%,而在GigE网络计算环境中,处理器负荷下降到60&-70%,因此,我们可以推断,如果增加计算节点数,在Infiniband网络环境中得到的性能提升会更高。