科技流网
您的位置:科技流网 > 业界

全球首个通用智能人“通通”2.0升级迭代已初步达到5-6岁儿童发展水平

阅读量:7253   添加时间:2025-03-29 17:42   内容来源:中国网   

日前,在2025中关村论坛通用人工智能论坛上,北京通用人工智能研究院研究成果重磅发布,覆盖通用智能体+行业智能体+社会智能体三大智能体矩阵。其成果以“原创技术-产业赋能-社会智能”三级联动模式,推动人工智能从单一智能向社会智能转变。

据介绍,此次发布的成果涉及了全球首个通用智能人“通通”2.0升级迭代;全球通用人工智能数理定义、评级标准与测试平台通智测试;通通到我家——三维场景重建与具身智能数据构建平台;通用人工智能行业智能体工场(TongAgents);从“小女孩”到“大社会”,大型社会模拟器等。

北京通用人工智能研究院院长,北京大学人工智能研究院、智能学院院长朱松纯谈到,人工智能的科技创新分为五个层次,五个层级如同冰山结构,“水面以上部分”包括执行层、算法层和模型层,是外在表现,是容易了解与实践的部分,相对而言也比较容易通过算法创新来改变和发展,比如DeepSeek和OpenAI。而“水面以下部分”包括理论层和哲学层,是智能内在的、难以测量的部分。它们不太容易通过表层的影响而得到改变,但却对智能的发展起着关键性的作用。理论层即人工智能的数理框架,哲学层则关乎智能的本质。“通通”是由价值、因果驱动的 AGI系统原型,其突破性就在于实现了由底层哲学层与理论层到顶层的全栈式创新架构。

据介绍,此次备受瞩目的“通通”2.0相较于通通1.0版本,其在语言、认知、动作、学习、情绪、交互方面实现了多种核心能力的升级。

其中,在价值与心智驱动的多轮对话方面,“通通”2.0版本实现了一个有自身价值观、世界观的小女孩,在理解对话目标意图的基础上,遵循自身价值和人格,利用对话策略来引导对话的走向,从而达到自身的目的。在价值调控对话生成、消除模型幻觉、保持对话前后连贯性以及“言行一致”等方面取得突破。

基于交互反馈的推理和学习方面,“通通”2.0可以实时响应外界场景的变化,进行反思和重新规划,对已有任务进行挂起、恢复、修改或取消等处理,同时动态生成新的任务规划。不仅如此,不同于当前大语言模型普遍采用的离线数据驱动的学习模式,通通在和场景交互及与人类的多模态对话(他人教)过程中,能动态更新自身的知识库,价值函数和技能,使得它初步具备类人的持续反思和成长的能力。

多智能体交互方面,研究人员为“通通”打造了幼儿园、六口之家等多智能体场景,并在场景中设置了各自独立,具备自身价值、能力、人设、状态的多个智能体,使通通拥有了自己的家人和朋友。在这种多智能体场景中,通通不仅需要理解周围环境,还需要理解环境中其他智能体,识别他们的身份、性格和自身的关系、彼此之间的关系和物品的关系、当前动作、意图、气氛等,并在此基础之上进行自身的任务规划,包括发起和响应对话,实施帮助、捣乱等复杂行为交互。

此外,为了测试通用智能体的能力,通研院自主设计开发的通智测试是一个专为评估通用人工智能(AGI)而设计的综合评测体系,该体系包含一个六维度(视觉、语言、认知、运动、学习、价值)、五层级(初级自身价值、高级自身价值、多智能体互动的价值、基础社交价值、高级社交价值)的智能体评级标准,以及一个支撑该评级标准实现的智能体虚拟测试平台。通智测试基于“论绩、论迹、论理、论心”四论标准,即以结果为核心的基础评价、关注行为过程与轨迹、聚焦推理路径的合理性、探究动机与价值观的正确性,实现了“通用能力测试-专项能力测试-行业应用测试”三位一体。

经过TongTest86项综合任务对“通通”进行的阶段性测试结果显示,与人类儿童发展阶段对比,“通通”主要能力维度已初步达到5-6岁发展水平,相当于幼儿园小朋友的水平。

未来“通通”将成为通用底座支撑各类垂直应用场景,进一步学习行业特定的知识和技能,形成千万个“通用智能人”赋能千行百业,同时与具身智能机器人相结合,为智能制造、智慧城市、养老陪护、数字助理、家用机器人等领域带来革命性的变化,更好地服务居民日常生活。

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

推荐内容
  • 果然就是战未来!锐龙5 9600X新补丁对比测试:14款游戏

    一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...

  • 140至186万元,红旗金葵花在北京展“国雅”风貌

    继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...

  • 花10万块买一台手机值吗?华为Mate XT非凡大师三折叠全

    一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...

  • 稳定7100MB/s!雷克沙ARES 8TB SSD评测:机

    一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...

  • 23小时续航创造历史!华硕灵耀14 Air+酷睿Ultra

    一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...

  • 600TB残酷写入测试!忆恒创源PBlaze7 7A40评测

    一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...