高性能计算推动科研加速
2012年01月20日 10:51 程 红 来源:中国教育报 热点专题 手机看新闻
清华大学生命科学学院选用戴尔HPCC系统开展结构生物学研究
成立于2009年的清华大学生命科学学院(以下简称“清华生命学院”)其前身是创立于1923年的清华大学生物系。经过清华老一辈科学家的不懈努力,新成立的清华生命学院即拥有生物物理与结构生物学、生物化学与分子生物学、细胞发育生物学、遗传学、植物分子生物学、海洋生物学、神经生物学、生物信息学、微生物学、肿瘤生物学等近二十个研究方向。同时还拥有多个国家级、省部级重点实验室,包括:生物膜与膜生物工程国家重点实验室(共建)、抗肿瘤蛋白质药物国家工程实验室、蛋白质科学教育部重点实验室、生物信息学教育部重点实验室等。
在研究创新方面,清华生命学院本着面向未来、积极开拓、精益求精的原则,不断谋求新的发展。2009年末,为进一步提升科学研究的效率,尤其是在结构生物学领域再创辉煌,清华生命学院决定采用戴尔高性能计算群集方案(HPCC-High Performance Computing Cluster)为结构生物学研究提供一个更为高效的研究平台,创造更为良好的研究环境。
2010年初,清华生命学院经过广泛考察、慎重选型、反复测算最终决定引进1套大规模的44计算节点的戴尔HPCC系统,该系统由“计算节点”、“管理节点&I/O节点”、“存储后台”“计算与管理网络”4个主要部分构成:其中HPCC系统的计算节点由11台戴尔PowerEdgeTM C6100机架式服务器担任,每台C6100机箱内配置有4台刀片服务器,每台刀片配置了两颗2.4GHz英特尔R至强R5645 六核处理器、24GB内存(6x4GB)、1块3.5英寸7.2K RPM SATAII硬盘,2块Broadcom 10/100/1000Mbps 自适应以太网卡(支持TOE offload 引擎技术)
在软件方面,上述44个节点全部安装了Redhat Linux AS 5.4操作系统,并采用了Rocks管理软件,以及Intel程序编译环境,如C、C++、Fortran、MPI、mpich、OpenMP等,还有厂商优化过的数学程序库(如:MKL、ACML、BLAS、LAPACK、Scalapack、FFT程序库等),在应用层面,清华生命学院则采用NAMD,Spider,Maq等专业软件系统进行结构生物学的研究计算。
“戴尔C6100服务器+Infiniband网络”为核心的HPCC系统于2010年3月完成组装和调试,目前已运行了1年多的时间,整体运行状况非常平稳。清华大学生命学院崔野老师是这套HPCC系统的主要管理者,他对系统的表现给予了充分的肯定。崔野老师介绍说:“目前,生命学院结构生物研究的主要计算任务均由这套HPCC系统来完成。该系统的上线,有效地保障了我们在大分子研究方面的计算效率,与传统的机架式服务器组成的HPCC相比,采用戴尔C6100服务器我们可以节省50%的空间,节省30%以上的电力消耗,这可以让我们的运营成本得到有效的控制。”
崔野老师接着介绍说:“从实际效果看,戴尔HPCC运行稳定,数据处理速度很快,完全能够满足我们开展大规模科学计算的要求。我们当前工作的重点是利用HPCC系统进行大分子蛋白质结构的研究计算,这种研究时效性强,紧迫性高,任务繁重,要求HPCC系统必须具有超强的计算能力,而戴尔HPCC的浮点运算速度峰值可以达到每秒五万亿次(5TFLOPS),我们对这样的计算能力感到十分满意。此外从发展的角度来看,戴尔HPCC系统的高效性为日后结构生物学研究工作的深入打下了非常扎实的基础。”
综合化的专业服务是清华生命学院选择戴尔HPCC方案的重要原因之一。崔野老师介绍说:“因为我们的研究任务重,时间要求紧,我们需要将全部的精力投入到结构生物学研究之中,因此我们需要的是一个完整的HPCC系统,需要的是一个交钥匙型的工程,在这方面戴尔做得十分到位。首先,在项目的规划阶段戴尔就成立了专门的项目小组,该小组始终站在我们用户的角度,从我们的应用需求出发,从我们的预算出发,不断地为我们修正和完善方案;其次,在项目的实施阶段,戴尔承担了硬件系统上架、软件安装、网络调试等HPCC系统的全套建设任务;在维护阶段,戴尔联合Redhat、Intel等厂商为我们提供了端到端的技术支持服务。在戴尔的大力协作下,我们最终得到了一套高效、集约、稳定的HPCC方案。”(程 红)


