
背景
近年來,伴隨著越來越多的生命科學及物理學家們將數值計算和數值模擬作為其重要的科學研究和手段,高校中的高性能計算需求與日俱
增。上海交大作為傳統理工科強校,校內對計算資源的需求尤其迫切,傳統的單純由 CPU 構建的超級計算機,無論在可支持的計算規模
還是在計算效率上都無法滿足這么巨大的需求。相較于 CPU,GPU 具有支持高并發并行計算的特點。以分子動力學模擬為例,許多應用在
GPU 上能獲得更高的性能,從而縮短模擬周期以及擴大模擬規模,這都將極大推動科研人員的研究進展。
挑戰
分子動力學模擬是一種物質微觀領域的模擬方法,它通過計算機模擬微觀粒子(主要是原子、分子)之間的相互作用及運動過程來
得到計算系統的結構和特性。分子動力學模擬作為獲得液體、固體分子性質的常用計算手段,廣泛應用于化學、物理、醫藥、材料、生物等眾
多領域中。分子動力學模擬體系的復雜性和精確性的需求,使得計算量巨大,而基于傳統的CPU計算設備購置成本高,其有限的計算能力一直是制約
這方面研究發展的瓶頸 。
解決 方案
上海交通大學 π集群機分 CPU與 GPU兩類節點,各類節點上運行的應用程序分布情況分別如圖 1、圖 2 所示。顯而易見,Gromacs是上海
交通大學 π集群機兩類節點中使用比例較多的軟件,尤其是 GPU節點更為顯著。事實上,Gromacs也是分子動力學模擬領域使用非常廣泛
的開源軟件,主要用于蛋白質、核酸等的模擬,對 GPU支持也非常好。目前在交大生命學院、自然科學研究院使用較多,將來可能會在
生物制藥方面具有應用前景。



圖 1 應用程序采用 π集群 CPU節點的分布情況
x

圖 2 應用程序采用 π集群 GPU節點的分布情況
成效
平臺:π 集群,分子動力學模擬分別在以下兩類計算機系統中進行:
1) 單 CPU節點 2路 E5-2670 CPU, 節點間使用 56Gb FDRInfiniband 網絡互聯。
2) 單 GPU節點 2 路 E5-2670 CPU+2 Kepler K20/K40,節點間使用 56Gb FDR Infiniband網絡互聯。
使用算例:分別使用 46000/92000/184000個 atoms模擬。
加速效果: 至少 2倍以上的加速效果(CPU節點使用 16線程)。
影響
上海交通大學于 2011 年成為全球第 16 個 CUDA 卓越中心,并于 2014年獲得 CUDA 卓越中心年度成就獎提名。其擁有的超級計算機 π 位列國
內高校第一,是唯一配置了超過 100 塊 Kepler K20 的超級計算機,也是國內少有的 GPU 利用率高于 CPU 利用率的超級計算機。2014 年至今已
有多篇在 π GPU 集群上進行的分子動力學應用相關的高水平論文得到發表,上海交大的案例為 GPU 在國內高性能計算領域的實用起到了推動作用。