快科技10月23日消息,大型科學研究領域的高性能運算,因其極高的吞吐量需求,都離不開超級計算機,如何優化也是一門學問。
比如分子量子行為模擬,相互作用狀態數量會指數級增長,因此要麼藉助量子計算機(但不成熟),要麼簡化處理以適配現有超級計算機(但太複雜)。
據報道,來自「神威」團隊的中國科學家,成功將現有「海光lite」(Oceanlite)超級計算機與AI結合,實現了真實分子尺度下的複雜量子化學的建模運算。
可以說,這既是一項科學突破,也是一項技術突破。
在量子力學中,用來描述量子態的是波函數(Ψ),它決定了量子系統的所有可能構型及其對應機率,例如分子中電子等粒子的位置、自旋或能級。
對量子態進行建模極具挑戰性,因為其狀態空間會隨粒子數量呈指數級急劇擴張,傳統超級計算機很難甚至不可能完成。
為此,科學家們不得不採用多種近似方法,簡化量子方程,同時保留描述分子結構、反應、能量所需要的精度,但是現有基於波函數近似的方法在規模上存在局限,只能用於小分子體系。
為了研究具有強電子關聯的多體量子系統,比如包含數十個電子、超過100個自旋軌道等,物理學家提出了採用現代機器學習替代神經網絡量子態(NNQS)等模型,近似模擬分子內電子的所有可能構型與運動。
這種方法有望將AI擴展性與量子精度結合,突破傳統方法的研究領域。
來自中國「神威」團隊的研究人員,自主研發了NNQS框架,模擬過程通過訓練神經網絡來近似分子波函數,進而確定電子最可能出現的位置。
對於每一種採樣得到的電子排布,系統會計算局部能量,並調整網絡參數,直至其預測結果與分子真實量子能量模式相符。
這款專屬NNQS框架是為中國「海光lite」超級計算機量身定製的,它搭載了384核心的申威SW26010-Pro處理器,支持FP16半精度浮點、FP32單精度浮點、FP64雙精度浮點數據格式,具備百億億次級算力。
不過,它是專為高性能計算(HPC)設計的獨特架構,缺乏足夠的AI設計,因此研究人員必須考慮負載並行處理方式,以及數據處理機制。
因此,研究人員專門設計了一種分層通信模型,由管理核心協調處理器與節點之間的通信,同時由數百萬個輕量級的雙路路計算處理單元(CPE)執行局部量子計算,這些單元都配備了512位向量引擎。
此外,他們還開發了動態負載均衡算法,以避免因計算負載不均勻而導致部分核心閒浪費置。
最終,團隊在3700萬個CPE核心上運行代碼,實現了92%的強擴展性、98%的弱擴展性,實現了近乎完美的軟硬體協同,對中國超級計算而言是一項重大成就。
截至目前,這項包含120個自旋軌道的分子系統模擬,是全球範圍內在傳統超級計算機上完成的規模最大的AI驅動量子化學計算,標誌著中國在AI與量子科技領域取得了突破性進展。