科技流网
您的位置:科技流网 > 业界

上海搭建大模型“中试训练场”

阅读量:8678   添加时间:2025-04-07 11:33   内容来源:光明网   

算力、基模、语料齐备,大模型垂类应用推进,大幅降低大模型使用门槛

年初,上海重磅发布人工智能“模塑申城”实施方案,聚焦“5+6”领域和行业,大力推进大模型垂类应用。记者最新获悉,该方案进展顺利,医疗、制造两个重点行业已率先破题,构建起助推垂类应用落地的功能性平台。教育行业的功能性平台也即将发布。

速度之外,功能性平台本身亦引发关注。它们的定位,在于大模型垂类应用“中试训练场”,旨在大幅降低大模型使用门槛。

落地不易

在东方医院,被喂了6000本医学教材的AI“医生伴侣”,已在辅助医生进行诊断;在振华重工基地,大量并行交付海外的港机项目,正由多任务智能体协助统筹进度。

大模型在不容出错的医疗和工业领域,正表现出卓越执行力。但殊不知,它们“出道”前却颇多曲折。

“模型训练一般需要1至2个月,但此前,资源匹配及各项准备工作的耗时,可能是真正训练的数倍。”一家大模型垂类应用服务商向记者详述工业用户为降本增效而苦练大模型的“漫漫长路”——

制造业一旦决定问计于大模型,往往自建团队,第一步是寻找算力。基于现实考虑,企业多半会选择中外芯片“混搭”,这就牵出新的问题,即要在多元异构的算力下丝滑地完成大模型训练,这绝非易事,需要专业公司帮助进行混合训练、推理加速和算力调度。另一方面,模型厂商各有强项,有些擅长视频、图形和语音处理,有些在长文本记忆、推理运算上有优势。为此,应用方又需要挨个试验评估,才能找到最适配的,其中“交学费”在所难免。

通常而言,企业跑到这一阶段,基本无力再跑。少数不甘心的企业,会接续财力和资源,向外寻找专业人员,具体工作包括:开发工具链与中间件、外挂知识库、对模型进行反复精调和预训练等。与此同时,企业还需要为获取高质量语料而奔走……以上诸多环节,每个环节略有偏差,最终训练出的智能体便可能“失之千里”。

因此,制造业潜心投入6至12个月,结果大模型垂类应用始终难以交付的情况非常多见。

按需“中试”

不难想象,大量垂类应用需求方都走过类似“弯路”。在上海市人工智能行业协会秘书长钟俊浩看来,产业界大可不必“重复造轮子”。

那么,有没有可能搭建一个平台,将前辈“踩坑”“交学费”后泣血实践出的成熟方案和诸多工具,进行集中归纳展示,让应用方按需取用,看到捷径的可能?

事实上,早在“模塑申城”实施方案正式发布前,一个致力于减少大模型试验成本、帮助企业高效实现产品化的“中试训练场”,就已经由政府部门牵头推进起来。

今年1月4日亮相的上海新型工业化MaaS平台便是成果之一。该平台的发起单位包括上海市经信委、上海市委网信办、上海联通、上海市先导产业促进中心、上海市人工智能行业协会、上海市互联网业联合会、西门子(中国)有限公司、上海库帕思科技有限公司、上海稀宇极智科技有限公司、上海无问芯穹智能科技有限公司、上海羚数智能科技有限公司等。

从阵容可见,平台集结了运营商、算力、行业语料、基础模型及应用服务商等,涵盖大模型垂类应用所需各类基础能力。

记者发现,去年11月成立的上海医疗领域公共服务大MaaS平台、今年1月3日成立的天工人工智能工业平台,都遵循这一逻辑。

关键在于,这些平台足够垂直、足够专业。如新型工业化MaaS平台,已天然剔除了与工业领域大模型不相关的“轮子”。平台上陈列的图形生成式工具,均偏重于工程图纸分类识别及生成,而非针对电商、游戏等2C端的图形生成。平台上五大场景,即研发设计、生产制造、装备运维、运营服务、供应链管理等,无不是为工业场景定做。

“这些平台如同成衣店,已陈列了大中小号各款服装,应用方可入店试衣,并按需购买。不用再像过去那样,把各款衣服先一路买下来,回家逐件试是否合身,白白浪费钱。”钟俊浩说。

据透露,除医疗、工业行业之外,第三类“中试训练场”有望在教育行业诞生。

系统打法

“中试训练场”,只是上海“模塑申城”系统性打法中的一环。

上海垂类应用加速度的背后,有着上海算力基础设施、基础模型、语料、资本、人才等要素的全面布局与支撑。

大模型训练遵循“尺度定律”,即训练计算量、训练数据规模、模型参数量,与模型效能之间存在正向关联。简言之,就是“大力出奇迹”。为此早在2023年,上海就超前提出了10万卡以上超大规模智算算力投入。而此次人工智能“模塑申城”实施方案中,又提出到2025年,全市智算规模力争突破100EFLOPS。这相当于30万张英伟达A100芯片的算力,规模超过目前北京和深圳算力规模的总和。

超大规模算力,致力于训练出上海自己的基础模型。记者获悉,经数年苦练,上海“1+3”基础模型格局基本形成,包括上海人工智能实验室书生·浦语大模型,以及商汤、MiniMax、阶跃星辰模型。

语料方面,上海成立了全国首家人工智能语料公司“库帕思”。

由此,算力、基模、语料,已然齐备。有此底气,去年8月起,上海开始强力推进大模型垂类应用,敲定“5+6”领域及行业,“5”指智能终端、科学智能、在线新经济、自动驾驶、具身智能5个关键领域;“6”指金融、制造、教育、医疗、文旅、城市治理6个重点行业。上海市人工智能行业协会也随之转变角色,从过去致力于生态搭建,转向专注于产业平台建设。

此外,围绕产业对接,上海相继成立225亿元人工智能母基金、600亿元人工智能国家大基金,以及100亿元人工智能生态基金,逐渐形成近千亿元级的基金规模。

“所有努力,都在于以全要素支撑保障,来解决人工智能‘叫好不叫座、发光不发热’问题。”钟俊浩说。

殊不知,“中试训练场”的目标已写入“模塑申城”方案中,即到今年底,上海要建成50个具有显著成效的行业开放语料库示范应用成果。种种迹象表明,而今,上海俨然将整座城市变成了一座人工智能大厂。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

推荐内容
  • 果然就是战未来!锐龙5 9600X新补丁对比测试:14款游戏

    一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...

  • 140至186万元,红旗金葵花在北京展“国雅”风貌

    继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...

  • 花10万块买一台手机值吗?华为Mate XT非凡大师三折叠全

    一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...

  • 稳定7100MB/s!雷克沙ARES 8TB SSD评测:机

    一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...

  • 23小时续航创造历史!华硕灵耀14 Air+酷睿Ultra

    一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...

  • 600TB残酷写入测试!忆恒创源PBlaze7 7A40评测

    一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...