中美卯勁爭奪超級計算機世界冠軍

超級計算機(Supercomputer)是指速度極快、功能極強的計算機,主要用於研發新型戰略武器和航天技術、設計飛機和艦船以及其它需要巨量計算的課題,例如天氣預報、地震預測、地質勘探數據分析、新葯研發、生命科學研究、汽車碰撞模擬等等。它反映了一個國家在科學、技術、材料、工藝和加工能力等諸方面的綜合水平。從某種意義來說,誰掌握了超級計算機的領先地位,誰就掌握了世界頂級的高科技,誰就掌握了下一次戰爭的主導權。所以,幾十年來超級計算機一直是大國之間互相競爭的中心。

2015年7月15日本報中半島版刊登老朽的《一場靜悄悄的爭奪戰》一文,介紹了當時名列世界前三名的超級計算機:

投入年份 名稱 地點 速度(PFLOPS)
2011 天河-1A 天津國家超級計算機中心 2.57
2012 Titan 田納西州橡樹嶺國家實驗室 17.6
2014 天河-2 銀河 天津國防科技大學 33.9

表格右列的數字是超級計算機最重要的參數,即它的運算速度,單位是PFLOPS (Peta Floating-Point Operations Per Second) 表示每秒進行10的15次方(1000萬億)次高精度浮點數字運算。不難看出,當時世界上前三名的超級計算機被中國佔了2個,而最先進的超級計算機是國防科技大學的天河-2 型銀河機,比美國的Titan幾乎快了一倍。

2016年6月,中國無錫超級計算機中心宣布,新一代的神威•太湖之光(Sunway TaihuLight)超級計算機正式投入使用,把超級計算機的運算速度進一步提高到105PFLOPS,峰值125PFLOPS。據研發神威•太湖之光的中國並行計算機工程與技術研究中心(National Research Center of Parallel Computer Engineering & Technology)報告,該機的中央處理器總共使用了40960個由中國自行設計的SW26010多核處理器芯片,每一個芯片包含256個64位RISC(簡化指令系統)處理器核以及4個用於系統管理的輔助核,整個系統中總共有1065萬個並行處理的CPU核。這些核通過一個芯片的內部網絡進行通信,而不是採用傳統的緩存結構。該機的內存1.31 PB(總帶寬5591 TB/s),外存20 PB。由於國產芯片耗電偏高,致使該機總功率高達15兆瓦,在全球超級計算機功耗效率(以每千瓦的指令數計算)排名表上屈居第16位。

2018年6月,位於田納西州東部的橡樹嶺國家實驗室(Oak Ridge National Lab)宣布,由IBM公司製造的Summit超級計算機正式投入使用。該機的運算速度達到200PFLOPS,超過神威•太湖之光一倍以上,是目前全球最強大的計算機。該機使用37000多個處理器,其中包括9000多個IBM的傳統CPU和將近28000個Nvidia公司製造的圖形處理器,相互之間由185英里長的光纜連接,整個系統用每分鐘4000加侖的循環水冷卻。橡樹嶺國家實驗室主任Thomas Zacharia說,這樣大量使用圖形處理器在超級計算機中是很少見的,主要是為了提高系統在處理困難的科學問題時的學習能力。 “我們建造的是世界上最強大的超級計算機,也是世界上最聰明的人工智能機器。”

橡樹嶺國家實驗室的研究人員在Summit超級計算機的早期測試中曾經進行過一項分析人類基因組序列變異的項目。他們聲稱這是科學計算首次達到那樣大的計算規模。最近,研究人員發現,圖形處理芯片可以為一種稱為深層神經網絡的機器學習技術提供更多的動力。Facebook利用這種技術進行的一次人工智能實驗分析了數十億張Instagram照片,僅用數百個圖形處理芯片近一個月的時間就完成了。Summit還將被用於能源部的一個項目,利用2200萬退伍軍人的醫療記錄,其中包括約25萬人的完整的基因組序列,深度研究化學和生物方面的問題。

今年10月,Lawrence Livermore國家實驗室宣布,運算速度為125PFLOPS的Sierra超級計算機正式投入運行。至此,美國在世界上最強大的3台超級計算機中已經擁有兩台,打破了自2013年6月以來中國保持了5年多的優勢。這台由IBM和Nvidia聯合開發的所謂的“異構型heterogenous”超級計算機能夠在中央處理器CPU和圖形處理器GPU之間高速傳送數據。該機主要用來支持美國的三個國家實驗室(勞倫斯利弗莫爾Lawrence Livermore、桑迪亞Sandia和洛斯阿拉莫斯Los Alamos)進行核安全研究。美國的戰略核武器系統正在老化,但是必須保持可以立即投入使用的狀態,這就是Sierra超級計算機的主要使命。

可以預見,美國在超級計算機領域的領先局面只是暫時的,因為美國雖然技術上略勝一籌,可是研發超級計算機的速度卻大大落後於中國。這種狀況從Sierra超級計算機長達6年的研發過程可見一斑。2012年底,由美國能源部和利弗莫爾Livermore、橡樹嶺Oak Ridge和阿貢Argonne等3個國家實驗室聯合立項研發Sierra。在研發過程中,除了技術上的挑戰以外,該項目遭遇的最大困難是經費不足。由於全球智能手機需求上升導致內存器件價格飆升,僅2016年最後三個月內存器件價格就翻了一番,使得Sierra項目一度陷入困境。經過協商,IBM不得不修改其網絡以彌補損失,勉強使項目開支保持在預算1.5億美元之內。另一個例子是一台名為Aurora的超級計算機。2015年4月,Intel宣布奪得一項2億美元的主合同,要爲位於伊利諾斯州的阿貢國家實驗室研製Aurora。該機採用西雅圖的Cray公司的架構,把上萬個Intel最先進的中央處理器(CPU)連在一起,實現運算速度180PFLOPS。當時計劃該機在2018年投入使用,但是由於成本一再超出預算,時間一拖再拖,顯然已經無法實現預定的計劃了。

記者 湯毅堅

Leave a Reply

This site uses Akismet to reduce spam. Learn how your comment data is processed.