新聞中心
云原生超級計算已經到來:何為云原生超級計算機?
作者:佚名 2021-04-15 10:57:05
服務器
芯片
云原生
云原生 作為與統一通信框架(UCF)聯盟合作項目的一部分,洛斯阿拉莫斯國家實驗室正在助力實現加速數據算法的能力。俄亥俄州立大學正在更新消息傳遞接口(MPI)軟件,以增強科學仿真。

據 NVIDIA消息,在英國,劍橋大學正在構建一臺云原生超級計算機。在美國,有兩個研究團隊正在分別開發(fā)云原生超級計算的關鍵軟件部分。
作為與統一通信框架(UCF)聯盟合作項目的一部分,洛斯阿拉莫斯國家實驗室正在助力實現加速數據算法的能力。俄亥俄州立大學正在更新消息傳遞接口(MPI)軟件,以增強科學仿真。
NVIDIA 正在通過最新的DGX SuperPOD向全球用戶提供云原生超級計算機。DGX SuperPOD現已投入生產,它包含NVIDIA BlueField-2 DPU(數據處理器)等關鍵組成部分。
那么,何為云原生超級計算?
就像銳滋的花生醬夾心巧克力一樣,云原生超級計算融合了兩項業(yè)界領先的技術優(yōu)點。
云原生超級計算機融合了高性能計算的強大算力和云服務的安全性與易用性。
換個角度看,云原生超級計算提供了一個性能強如TOP500超級計算機的HPC云,它在保障不犧牲應用性能的同時允許多用戶安全共享。
BlueField DPU通過支持安全、通信和管理任務的卸載來創(chuàng)建高效的云原生超級計算機。
云原生超級計算機有何功能?
云原生超級計算機有兩個關鍵功能。
首先,它允許多用戶共享一臺超級計算機,同時保證每個用戶的應用的安全性和私密性。這種能力被稱為“多租戶隔離”,在當今的商業(yè)云計算服務中十分普遍,但一般不會出現在技術和科學應用的HPC系統中,因為在這些系統中,裸性能的優(yōu)先級最高,而安全服務會降低系統效率。
其次,云原生超級計算機使用DPU來處理存儲、租戶隔離安全和系統管理等任務。這樣可以卸載CPU,使其專注于處理任務,從而最大限度地提高系統的整體性能。
如此,一臺超級計算機便可以在不損失性能的情況下,實現云原生服務。未來DPU將處理更多的卸載任務,從而使系統在運行HPC和AI應用時時刻保持最高的運行效率。
云原生超級計算機如何運行?
如今,超級計算機通常有兩個“大腦”——CPU和加速器(一般為GPU)。
加速器集合了數千個處理核,可為AI和HPC應用中最重要的并行運算提供加速。CPU是針對需要快速串行處理的算法部分而設計的,但隨著其管理的系統日益龐大且日漸復雜,通信的層數不斷增多,導致CPU的負擔越來越重。
云原生超級計算機引入第三個“大腦”——DPU,旨在幫助構建更快、更高效的系統。DPU能夠卸載安全、通信、存儲等需要由現代系統管理的工作。
超級計算機的專用通道
在傳統超級計算機中,運行中的計算任務有時不得不暫停等待CPU去處理通信任務,這是業(yè)界熟知的一個問題,被稱為系統噪聲。
在云原生超級計算機中,計算和通信是并行處理的。這就像在高速公路上開設第三條車道一樣,能夠讓所有流量變得更加順暢。
俄亥俄州立大學MVAPICH實驗室是HPC通信領域的專業(yè)機構。該實驗室的早期測試顯示,在云原生超級計算機執(zhí)行某些HPC作業(yè)的速度是傳統計算機的1.4倍。該實驗室還展示,云原生超級計算機實現了計算和通信功能的100%重合,這比現有的HPC系統高出99%。
云原生超級計算之專家視角
這就是全球各地陸續(xù)推出云原生超級計算的原因。
劍橋大學高性能計算總監(jiān)Paul Calleja表示:“我們正在打造歐洲首臺科研云原生超級計算機,以提供裸金屬性能與云原生InfiniBand服務?!?/p>
“按照2020年11月TOP500榜單,這套系統將躋身前100名。它將使我們的研究人員能夠運用超級計算架構領域的最新成果來充分優(yōu)化他們的應用?!?/p>
HPC專家正在為云原生超級計算機的進一步發(fā)展鋪路。
統一通信框架聯盟總監(jiān)Steve Poole表示:“由工業(yè)界和學術界領先成員組成的UCF聯盟正在創(chuàng)建實現未來云原生超級計算所需的生產級通信框架和開放標準。”該聯盟成員包括來自Arm、IBM、NVIDIA、美國國家實驗室和多所美國大學的代表。
俄亥俄州立大學計算機科學與工程系教授兼網絡計算實驗室主任Dhabaleswar K.(DK)Panda表示:“我們的測試表明,云原生超級計算機的架構效率能夠將超級計算機的HPC性能提升至新的高度,并實現新的安全功能?!?/p>
當前標題:云原生超級計算已經到來:何為云原生超級計算機?
瀏覽路徑:http://www.5511xx.com/article/cdighsh.html


咨詢
建站咨詢
