科技流网
您的位置:科技流网 > 业界

大语言模型“吵架水平”超越人类

阅读量:4495   添加时间:2025-09-22 06:17   内容来源:光明网   

科学家发现,在线辩论中,GPT-4一类的大语言模型如能根据对手的个性化信息调整论据,其说服力将比人类高64.4%。研究显示,GPT-4具有生成有针对性和说服力论据的能力,并提出应进一步研究如何降低其用于说服时的风险。相关研究5月19日发表于《自然-人类行为》。

有研究显示,随着人类与LLM的对话日益普遍,LLM可能变得更有说服力,即能改变一个人的信念或观点。然而,之前并不清楚这些模型能否根据个性化信息进行调整,提出更能针对辩论对手的论点。

瑞士洛桑联邦理工学院的Francesco Salvi和同事分别将900名美国人与另一个人或GPT-4配对,使双方辩论各种社会政治议题。在有些配对中,辩论对手——无论是人工智能还是人类,均能获得关于他们辩友的人口统计学信息,包括性别、年龄、族裔、教育水平、就业状况,以及政治立场,从而让其论点更有针对性。在得知辩论对手的个人信息后,Salvi和同事发现GPT-4的说服力比人类高64.4%。不过,如果没有个人数据,GPT-4的说服能力与人类不相上下。

该研究的辩论采取了一种结构性方法,而现实世界辩论的自由度更高,且辩论有时间限制。研究者指出,研究结果揭示了人工智能驱动的工具影响人类观点的潜力,可能对在线平台的设计具有借鉴意义。

相关论文信息:

《中国科学报》

声明:本网转发此文章,旨在为读者提供更多信息资讯,所涉内容不构成投资、消费建议。文章事实如有疑问,请与有关方核实,文章观点非本网观点,仅供读者参考。

推荐内容
  • 果然就是战未来!锐龙5 9600X新补丁对比测试:14款游戏

    一、前言:新KB5041587补丁到底可以提升多少游戏性能!Zen5可以说是AMD多年来底层架构变化最大的处理器。根据AMD的说法,在制程工艺不变的情况,IPC提升幅度接近20%,游戏帧率也有10%左右的提升。不过等到锐龙9000处理器正式...

  • 140至186万元,红旗金葵花在北京展“国雅”风貌

    继广州车展正式上市后,红旗金葵花国雅的区域上市陆续进行,这次来到了北京。早在今年4月的北京车展上,红旗汽车发布了全新品牌——金葵花,并带来四款“国字号”产品:国礼、国雅、国耀、国悦,其中作为国产顶尖大型豪华轿车的金葵花国雅备受瞩目。随后在1...

  • 花10万块买一台手机值吗?华为Mate XT非凡大师三折叠全

    一、前言:花10万块买一台手机值吗?在这篇评测接近完稿的时候,我瞅了一眼华为官网的预约人数,已经超过了685万人。早先供应链多个渠道透露,华为MateXT非凡大师的备货量大约为100万台(首批)。这也意味着,9月20日10:08分正式开售之...

  • 稳定7100MB/s!雷克沙ARES 8TB SSD评测:机

    一、前言:机械硬盘在电脑中还有位置吗?如今的笔记本几乎全部默认预装SSD,大多数人装机也首选SSD,但对于有着大容量数据、稳健存储需求的用户而言,一块大容量机械硬盘仍是第一选择,毕竟其单位容量的成本远低于SSD。如今的SSD主流容量才1-2...

  • 23小时续航创造历史!华硕灵耀14 Air+酷睿Ultra

    一、前言:能效为王的酷睿Ultra200V系列处理器ARM平台的功耗远低于X86平台,ARM处理器笔记本(比如MacBookAir)的续航远高于X86+Windows笔记本!在我们看来,这些似乎就是理所当然、天经地义的事情,毕竟几十来年一直...

  • 600TB残酷写入测试!忆恒创源PBlaze7 7A40评测

    一、前言:性能全面领先的国产企业级PCIe5.0SSD一年前,我们曾测试过忆恒创源PBlaze779406.4TB,它是当时最强的企业级PCIe5.0SSD,不仅率先实现了10GB/s的顺序写性能,高达14GB/s的顺序读取速度也几乎完全榨...