面向国产超级计算机的 “全隐式求解器算法” 获应用

来源: 中国科学报 / 作者: 2021-02-22
0 1

偏微分方程的隐式求解器在大规模科学与工程计算中具有广泛用途,是提高不少具体应用问题实际计算效率的关键。近年来,随着高性能计算机计算能力的突飞猛进,硬件体系结构日趋复杂,传统并行隐式求解算法已经难以适应新型体系结构的发展趋势,隐式求解器的设计和应用遇到了前所未有的挑战。

在重大研究计划的资助下,北京大学数学科学学院杨超与合作者提出一类具有数百上千万处理器核可扩展能力的全隐式求解器算法,在国产大型异构众核超级计算机上取得了显著应用效果。

研究团队提出一类新型异构区域分裂算法,在经典区域分裂算法基础上设计了异构区域剖分策略,充分发挥了异构计算单元各自不同的计算能力,并有效减少了子区域之间的数据移动开销。此后研究团队进一步基于瀑布型多层区域分裂框架,设计了高效多层粗网格矫正算法,提升了隐式求解器的收敛性。在此基础上,研究团队提出一套新型流水线并行不完全矩阵分解算法用于子区域问题求解,该算法巧妙利用了原始问题的几何信息,避免了非规则数据索引,增强了并行度和数据局部性。

异构区域分裂算法被应用于 HPCG 基准测试,在 “天河 2 号” 超级计算机整机 312 万核上实现了 623 Tflops 性能,帮助 “天河 2 号” 取得 2014 年 11 月 HPCG 排名榜第一名。“天河”研制单位国防科技大学评价该工作“超越美国 Intel 公司提供的优化版软件,达到世界领先水平”。

随后,在国产 “神威 · 太湖之光” 超级计算机上,研究人员将该算法应用于非静力大气动力学模拟中,扩展至整机 1049 万核,完成了 7700 多亿未知数问题的模拟。最终,“千万核可扩展非静力大气动力学全隐式模拟”研究成果获 2016 度美国计算机学会 “戈登贝尔” 奖,一举实现了我国在这一国际高性能计算应用最高奖项上零的突破,并入选了由两院院士评选的 2016 中国十大科技进展新闻。

“千万核可扩展非静力大气动力学全隐式模拟”研究成果得到了来自国内外多方面的积极评价,被评价为同领域 “为数不多”“高度有效” 的相关成果。“神威 · 太湖之光”研制单位国家并行计算机工程技术研究中心评价该成果是“我国高性能计算领域跨单位、跨学科合作的结晶,对我国高性能计算应用与发展具有引领和示范意义,并对我国下一代高性能计算机的研制有重要启示”。

声明:本网所有文章(包括图片和音视频资料)系出于传递更多信息之目的,且明确注明来源和作者,不希望被转载的媒体或个人可与我们联系(edit@bio360.net ),我们将立即进行删除处理。所有文章仅代表作者观点,不代表本站立场。

文章评论(0)
使用匿名身份评论
  • 暂无评论,请抢占。