当前位置: 首页  >> 智能环球  >> 查看详情

大语言模型仍无法可靠区分信念与事实 为高风险领域应用敲警钟

来源: 科技日报   日期:2025-11-07  责编: 殷绪江  
分享:
   在最新一期《自然·机器智能》发表的一篇论文中,美国斯坦福大学研究提醒:大语言模型(LLM)在识别用户错误信念方面存在明显局限性,仍无法可靠区分信念还是事实。研究表明,当用户的个人信念与客观事实发生冲突时,LLM往往难以可靠地作出准确判断。这一发现为其在高风险领域(如医学、法律和科学决策)的应用敲响警钟,强调需要审慎对待模型输出结果,特别是在处理涉及主观认知与事实偏差的复杂场景时,否则LLM有可能会支持错误决策、加剧虚假信息的传播。
  团队分析了24种LLM(包括DeepSeek和GPT-4o)在13000个问题中如何回应事实和个人信念。当要求它们验证事实性数据的真或假时,较新的LLM平均准确率分别为91.1%或91.5%,较老的模型平均准确率分别为84.8%或71.5%。当要求模型回应第一人称信念(“我相信……”)时,团队观察到LLM相较于真实信念,更难识别虚假信念。具体而言,较新的模型(2024年5月GPT-4o发布及其后)平均识别第一人称虚假信念的概率比识别第一人称真实信念低34.3%。相较第一人称真实信念,较老的模型(GPT-4o发布前)识别第一人称虚假信念的概率平均低38.6%。
  团队指出,LLM往往选择在事实上纠正用户而非识别出信念。在识别第三人称信念(“Mary相信……”)时,较新的LLM准确性降低4.6%,而较老的模型降低15.5%。研究总结说,LLM必须能成功区分事实与信念的细微差别及其真假,从而对用户查询作出有效回应并防止错误信息传播。
  【总编辑圈点】
  当前大语言模型虽在表面语言任务上表现优异,但缺乏人类的基础社交智能,在事实与信念识别上的误差,不仅反映出技术瓶颈,更暴露出AI在复杂社会语境中应用的潜在风险。如文中指出的医疗咨询、法律判断等场景,模型若无法辨析当事人主观认知与客观事实,会出现离谱的错位,造成严重后果。该研究揭示出模型在认知层面的关键缺陷,对AI的发展方向具有重要警示意义。这也提醒我们,下一代AI需要融入对人类认知模式的理解,只有当模型能真正理解信念的复杂性时,才能成为值得信赖的智能伙伴。




 


手机端
点一点或扫一扫

咨询、采访、合作、投稿等请致电:13911566744(含微信)

 
【免责声明】: 凡注明 “环球科技网” 字样的图片或文字内容均属于本网站专稿,如需转载图片请保留 “环球科技网” 水印,转载文字内容请注明来源“环球科技网”;凡本网注明“来源:XXX(非环球科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其作品内容的实质真实性负责,转载信息版权属于原媒体及作者。如转载内容涉及版权或者其他问题,请投诉至邮箱;1978751725@qq.com 

本网公告:环球科技网从不发布负面新闻资讯,也绝不会发布负面信息。如发现负面信息链接请甄别是否为环球科技网所发。
本网系北京伯乐传媒广告有限公司主办、所有。本网唯一域名(www.hqkjw.cn),其它域名链接均为假冒。望广大网民及企业主认真甄别。





 





     
 
 


 

相关文章

  • 人工智能新能源等技术迅速发展 无人机“飞向”千行百业 人工智能新能源等技术迅速发展 无人机“飞向”千行百业 2025-11-03 10:49:20

       近年来,人工智能(AI)、5G、新能源等技术迅速发展。无人机与大模型、锂电池等产业开展融合创新,机型迭代速度加快,逐步构建起满足不同应用场景需求、低成本、高可靠、高性能、高安全的产品体系。“动力电池是无人机的‘心脏’,决定了无人机能否飞得远。”中国科学院大连化学物理研究所研究员陈忠伟说... [阅读]

  • “人工智能+”为经济增长注入强劲动力 “人工智能+”为经济增长注入强劲动力 2025-10-31 09:59:28

       10月28日公布的《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》(下称《建议》)明确,全面实施“人工智能+”行动,全方位赋能千行百业。多位专家和企业人士在接受《经济参考报》记者采访时表示,政策驱动下,人工智能正深度渗透各个领域,为经济增长注入强劲动力,将成为“十五五”时期... [阅读]

  • LiFi水下光通讯遥控泳池机器人Z1 Pro引领智能清洁新趋势 LiFi水下光通讯遥控泳池机器人Z1 Pro引领智能清洁新趋势 2025-10-27 16:10:56

       【环球科技网】在智能家居和清洁设备高速发展的今天,泳池清洁行业也正迎来全新的技术革命。泳湾科技再次以创新驱动,推出全球首款搭载LiFi Remote Control(水下光通讯遥控) 的旗舰泳池机器人Z1 Pro并在IFA 2025德国柏林展上亮相,引发行业高度关注。这款产品的发布,标志着泳池机器人从传统自动清扫迈向实时可控、交互式... [阅读]

  • 六成全球专利领跑!人工智能激活数字经济新引擎 六成全球专利领跑!人工智能激活数字经济新引擎 2025-10-23 10:09:29

       生产线上每1.7秒产出一组电芯,缺陷率大幅下降;机器人“电子鼻、机械眼”实时监测耕地土壤和农作物状况;影像大模型一次扫描,可完成多器官病灶筛查与诊断……这些先进的智慧场景,由我国人工智能“专利网”编织成现实。“十四五”以来,我国在数字... [阅读]

新闻排行榜