科技流网
您的位置:科技流网 > 业界

北电数智优化算力资源配置,提升算力中心利用率

阅读量:4595   添加时间:2026-02-01 07:23   内容来源:科技快报网   

近年来,全国范围的算力基础设施建设如火如荼地进行中,除了北京、上海、深圳等一线城市,各个县域级地区也在积极加速布局。但由于性能不足、无法满足AI大模型时代的特点场景算力需求、数据中心和当地产业需求不匹配等问题,算力中心的整体利用率仅有50%左右、闲置率较高,仅以算力规模、集群规模来衡量算力性能,显然已无法适应数字经济快速发展的需求。

北京电子数智科技有限责任公司提出了“算力最优解”理念,并基于人工智能行业的发展与算力需求的迭代,进一步细化算力评价标准。北电数智认为“算力最优解”需要做到“三加一保障”,即加速单芯片算力,加强混元异构集群性能,加大通信能力,保障智算集群训练安全、稳定运行。

北电数智是#12032;家专注于原创性、颠覆性、引领性科技创新的人工智能科技企业,在算力、算法和数据等方面实现了全栈产品和解决方案布局,并于2024年5月,获得甲子光年“AI算力层创新企业奖”。

加速单芯片计算能力,真正实现“好用”

目前国产GPU的算力性能并不低,但大部分客户反馈国产芯片仍然不够“好用”。这是因为目前国内已生产和应用的GPU产品主要是针对上一代算法而设计,在满足AI大模型相关算子的需求层面仍需进一步提升,需要通过丰富算子库、编译器等软件方式,对单芯片的算力进行加速。北电数智前进·AI异构计算平台具有多重优化功能,能够通过模型量化加速、模型超参数调优、稀疏化推理等模型优化能力,算子融合加速、计算图优化、硬件访存优化等编译优化方式,加速单芯片的计算能力,增加国产算力芯片的自适应能力。

多芯片混元异构或成主流,让合适的芯片做合适的事

现阶段,智算中心多以单一芯片厂商为算力主要供应,算力供给不足的问题不可避免。混元异构能解决单一芯片厂商产能供给不足的困境,同时能提供更高性价比的算力解决方案。不同芯片由于架构设计不同,天然适用于不同的训练推理任务,如果可以针对不同的任务配置对应芯片,整体算力解决方案的性价比将大大提升。然而,异构合池训练会存在精度误差、同步等问题。系统需要在算力不均匀情况下,根据模型特征、负载实时状态、集群硬件特点对任务进行均匀或非均匀的切分。

北电数智前进·AI异构计算平台可通过算子级模型拆分方法优化模型性能;通过基于自动机器学习算法的硬件感知自动调优的方式,自动调整模型的配置和参数,找到在特定芯片下的最佳性能和效果;其框架可支持AI大模型分布到多GPU上进行计算,提高模型的训练和推理效率,确保每种芯片都能承担与其算力相匹配的任务。

打通集合通信库解决通信问题,提升AI大模型训练性能

在万卡集群时代,通信能力直接制约着AI大模型训练时的数据传输效率。高效、稳定、低延迟的网络对于智算中心的建设和运行意义重大。在硬件层面,NVLink、HCCS互联等方式可以有效提高卡间互联通信能力;在协议层面,通过RDMA降低多机端到端的通信时延,提高节点间传输速率,有效改善智算集群的通信效率。此外,在软件层面,集合通信库控制着各GPU、各服务器之间的数据通信,异构卡的通信库差异会为异构卡之间带来通信难题。北电数智通过打通各厂家的集合通信库来解决不同GPU芯片之间的通信问题,对通信库进行深度适配和优化,通过标准化的分布式通信接口确保异构集群内的信息交换;并且通过时间重叠等策略,将计算过程和通信过程互相重叠,减少通信延迟对整体训练性能的影响。

广泛纳管,保证算力集群稳定运行

万卡集群有较多的硬件种类和数量,每一颗元器件都有硬件失效率,每个硬件的失效都会影响到整体智算集群训练。想要实现算力最优解,就需要一个高效可靠的智能云管平台,提供实时智能监控来实现分钟级的软硬件故障定位,并实现故障的自动检测和修复。北电数智前进·AI异构计算平台支持多款国产芯片的广泛纳管,帮助用户实现对不同品牌、类型AI加速卡的统一管理,以确保各类AI芯片的无缝集成和优化利用。广泛的纳管能力也让用户能够根据具体需求,灵活地调整资源配置,优化算力供给满足各类训练推理任务。

“三加一保障”是北电数智在AI大模型渗透千行百业的当下提出的算力最优解方案,不仅可以优化算力的配置、提升算力资源的利用率,还为企业走向智能化、AI化提供了实现路径。值得一提的是,2024年8月21日,“前进·AI异构计算平台”还入选了北京首批“人工智能+”应用场景案例,标志着项目在应用落地方面又迈出了坚实的一步。未来,北电数智也将继续为各行业提供成本低、高性能、稳定的算力供应,为数字中国的建设贡献力量。

更多精彩内容,可关注“北电数智AI江湖”#12073;程序。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

推荐内容
  • 果然就是战未来!锐龙5 9600X新补丁对比测试:14款游戏

    一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...

  • 140至186万元,红旗金葵花在北京展“国雅”风貌

    继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...

  • 花10万块买一台手机值吗?华为Mate XT非凡大师三折叠全

    一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...

  • 稳定7100MB/s!雷克沙ARES 8TB SSD评测:机

    一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...

  • 23小时续航创造历史!华硕灵耀14 Air+酷睿Ultra

    一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...

  • 600TB残酷写入测试!忆恒创源PBlaze7 7A40评测

    一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...