科技流网
您的位置:科技流网 > 业界

依托鲲鹏处理器矩阵算力中科大陈俊仕团队破解稀疏计算效率

阅读量:7121   添加时间:2025-11-29 20:30   内容来源:科技快报网   

从电路模拟的复杂推演到量子化学的微观分析,大规模稀疏线性方程组的高效求解是科学计算领域的核心需求。但传统稀疏直接求解器因数据非零元分布稀疏且不规则,导致运算低效、算力浪费等问题。近日,中国科学技术大学计算机科学与技术学院特任副研究员陈俊仕团队,在鲲鹏昇腾科教创新卓越中心的算力支持下,创新研发出面向鲲鹏处理器矩阵算力基于密集kernel的LU直接求解器,以密集运算方式实现了稀疏计算的高效求解,成功突破传统运算瓶颈。

该研究创新构建了一种面向稀疏矩阵计算的密集计算范式,系统化解构了传统稀疏直接求解器的性能瓶颈。团队通过将分散的非零元整合为更加规整的密集数据块,将不规则稀疏矩阵映射为统一稠密的大块结构,进而采用基于稠密矩阵运算的数值分解算法,取代传统稀疏运算中聚合非零小分块的碎片化计算模式,显著降低了由不规则内存访问引发的计算与调度开销,最终实现了计算效率与硬件利用率的协同优化。

该方案的顺利落地,深度依赖于鲲鹏平台的计算特性。硬件层面,鲲鹏920新型号集成专用矩阵运算单元,原生具备高密度数值分解运算的高效承载能力,可精准匹配密集数据块的集中化处理需求;其多核架构为大规模密集数据块的并行运算提供了坚实基础,避免算力闲置或过载。软件层面,鲲鹏 KML 数学库针对密集型矩阵运算进行深度优化,通过底层算法与硬件架构的协同,进一步放大了密集运算模式的性能潜力。经 70 余个跨领域测试集验证,该方案性能较SuperLU 求解器平均加速32.2倍,在基础硬件配置下实现了平均 9.6 倍性能加速,大幅压缩了科学计算的时间成本。

目前,相关研究成果已发表于 CCF B 类国际会议 Euro-Par 2025,其核心技术已申请中国发明专利并获得授权。此次成果是鲲鹏平台在科学计算领域的典型实践,该方法对于现代高性能处理器上稀疏计算问题的高效求解、充分地发挥处理器上的矩阵运算单元具有很好的应用价值。未来,随着鲲鹏生态的持续完善,其在高性能计算领域的赋能作用将进一步凸显,助力更多科研团队突破技术难关,推动科研成果加速落地转化。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

推荐内容
  • 果然就是战未来!锐龙5 9600X新补丁对比测试:14款游戏

    一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...

  • 140至186万元,红旗金葵花在北京展“国雅”风貌

    继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...

  • 花10万块买一台手机值吗?华为Mate XT非凡大师三折叠全

    一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...

  • 稳定7100MB/s!雷克沙ARES 8TB SSD评测:机

    一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...

  • 23小时续航创造历史!华硕灵耀14 Air+酷睿Ultra

    一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...

  • 600TB残酷写入测试!忆恒创源PBlaze7 7A40评测

    一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...