北大陳幟團(tuán)隊(duì)獲得2025超算年度最佳應(yīng)用獎(jiǎng)
2025-08-21 07:122025年8月15日,在中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)主辦的第21屆CCF全國(guó)高性能計(jì)算學(xué)術(shù)年會(huì)上,經(jīng)過(guò)五支入圍最終評(píng)選的團(tuán)隊(duì)激烈角逐,北京大學(xué)力學(xué)與工程科學(xué)學(xué)院陳幟研究員帶領(lǐng)的DeepFlame團(tuán)隊(duì)脫穎而出,其主導(dǎo)開(kāi)展的“深度學(xué)習(xí)賦能的超大規(guī)模高精度火箭發(fā)動(dòng)機(jī)超臨界燃燒流體模擬”工作奪得“CCF HPC China 2025超算年度最佳應(yīng)用”獎(jiǎng)項(xiàng)。該獎(jiǎng)項(xiàng)是中國(guó)高性能計(jì)算領(lǐng)域最具權(quán)威性和影響力的獎(jiǎng)項(xiàng)之一,在國(guó)內(nèi)被譽(yù)為與戈登貝爾獎(jiǎng)比肩的重磅榮譽(yù)。該獎(jiǎng)項(xiàng)每年僅授予一到兩項(xiàng)成果,旨在表彰超算應(yīng)用中取得重大創(chuàng)新突破、具備突出科學(xué)價(jià)值與工程影響力的成果,代表了我國(guó)高性能計(jì)算應(yīng)用研究的最高水準(zhǔn)。
獲獎(jiǎng)團(tuán)隊(duì)成員(從左至右):陳幟、毛潤(rùn)澤、郭卓強(qiáng)、賈偉樂(lè)
本次獲獎(jiǎng)工作由陳幟團(tuán)隊(duì)研發(fā)的智能計(jì)算軟件 DeepFlame完成。作為首個(gè)耦合AI模型與高性能計(jì)算技術(shù)的反應(yīng)流體仿真平臺(tái),DeepFlame 致力于推動(dòng)數(shù)值模擬領(lǐng)域的AI for Science研究。自2022年發(fā)布V0.1公測(cè)版以來(lái),軟件已持續(xù)迭代三年,先后完成對(duì)英偉達(dá)GPU、華為 Kunpeng、曙光 DCU等國(guó)內(nèi)外硬件的適配與優(yōu)化,受到學(xué)界與產(chǎn)業(yè)界的廣泛關(guān)注。相關(guān)成果曾2022和2023連續(xù)兩年榮獲中國(guó)科學(xué)院“先導(dǎo)杯”全國(guó)應(yīng)用大賽一等獎(jiǎng)。
計(jì)算性能提升
在本次工作中,參賽團(tuán)隊(duì)對(duì)DeepFlame軟件進(jìn)行了進(jìn)一步高性能優(yōu)化與改進(jìn),實(shí)現(xiàn)了迄今最大規(guī)模的火箭燃燒模擬(考慮超臨界效應(yīng)和詳細(xì)化學(xué)精度),計(jì)算域包含近萬(wàn)億網(wǎng)格,并行規(guī)模達(dá)到4000萬(wàn)核(國(guó)產(chǎn)神威超算整機(jī)),峰值浮點(diǎn)運(yùn)算性能創(chuàng)紀(jì)錄地超過(guò)1EFlops(百億億次每秒)。與現(xiàn)有最先進(jìn)方法相比,DeepFlame將計(jì)算加速提升了三個(gè)數(shù)量級(jí)(超1000倍),并將現(xiàn)有燃燒模擬技術(shù)的網(wǎng)格規(guī)模拓展了四個(gè)量級(jí),并行節(jié)點(diǎn)數(shù)拓展三個(gè)量級(jí),充分展現(xiàn)了國(guó)產(chǎn)超算與自主軟件在重大工程應(yīng)用中的強(qiáng)大潛力。該工作已被國(guó)際高性能計(jì)算頂級(jí)會(huì)議——International Conference for High Performance Computing, Networking, Storage and Analysis (SC25) 接收。
具體而言,本次工作在方法與實(shí)現(xiàn)上均取得了重要突破。首先,團(tuán)隊(duì)提出了基于流形增強(qiáng)采樣的物理嵌入剛性神經(jīng)算子,有效提升了DeepFlame計(jì)算過(guò)程中AI模型的穩(wěn)定性與精度。其次,面向超大規(guī)模并行需求及國(guó)產(chǎn)神威超算的硬件特性,研發(fā)了兩階段并行策略,并提出了基于算子合并的多運(yùn)行時(shí)I/O優(yōu)化方法,顯著改善了超大規(guī)模計(jì)算的輸入輸出效率。在數(shù)值求解層面,團(tuán)隊(duì)通過(guò)引入定制稀疏矩陣格式與線程級(jí)網(wǎng)格重排,構(gòu)建了適配國(guó)產(chǎn)眾核架構(gòu)的高效隱式偏微分方程求解器;同時(shí),對(duì)神經(jīng)網(wǎng)絡(luò)推理算子進(jìn)行了定制化優(yōu)化,實(shí)現(xiàn)了AI模型與數(shù)值計(jì)算的高效融合。這些創(chuàng)新不僅顯著增強(qiáng)了DeepFlame在超大規(guī)模計(jì)算中的性能與魯棒性,也為AI for Science與科學(xué)計(jì)算的發(fā)展提供了具有代表性的范例與方法論參考。
本項(xiàng)工作得到了國(guó)家自然科學(xué)基金“可解釋、可通用的下一代人工智能方法重大研究計(jì)劃”“人工智能賦能工程科學(xué)前沿探索專項(xiàng)”、北京大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心的資助,以及藍(lán)箭航天空間科技有限公司、華為技術(shù)有限公司、嶗山國(guó)家實(shí)驗(yàn)室等合作伙伴的大力支持。北京大學(xué)力學(xué)與工程科學(xué)學(xué)院博士生毛潤(rùn)澤和中國(guó)科學(xué)院計(jì)算技術(shù)研究所博士生郭卓強(qiáng)為共同第一作者,陳幟和中國(guó)科學(xué)院計(jì)算技術(shù)研究所賈偉樂(lè)研究員為共同通訊作者。
信息來(lái)源: 北大力學(xué)與工程科學(xué)學(xué)院