当前位置: 首页  >> 智能环球  >> 查看详情

大模型既要“吃得饱”更要“吃得好”

来源: 科技日报   日期:2025-03-03  责编: 殷绪江  
分享:
   前段时间,网络上流传着一些由大模型生成的“异次元篇章”。比如,有人让大模型续写《红楼梦》情节时,竟得出一幕“贾宝玉倒拔垂杨柳”的奇景,令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”,是因为大模型不仅学习了原著,还“广纳博采”了不少错误信息。
  这些人工智能(AI)生成的“胡言乱语”虽是网友们茶余饭后的笑谈,但提醒我们要清醒认识到其背后折射出的问题:数据质量是大模型应用成败的关键。以个性化推荐AI系统为例,一些企业在开发过程中,虽然收集了大量的用户行为数据,但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息,数据的量增加了,但系统推荐的准确性并没有显著提升。《自然》杂志(Nature)刊登的一篇有关大模型可靠性研究的文章指出,一个西班牙研究团队发现,包括OpenAI公司的GPT在内的几个大模型升级后,虽然参数量更大了,误答情况却更严重了。因此,大模型长得壮不壮,不仅取决于“食量”(即数据的数量),更在于食物的“质量”(即数据的质量)——吃得饱并不等同于吃得好。
  数据是大模型的基石,在数据质量不高、可靠性缺失的情况下,一味追求大模型参数量的增加,不仅无法提升模型性能,反而会放大偏差和谬误,产生更多不可信数据。如此一来,势必造成计算与存储资源的浪费,增加开发和维护成本,降低用户信任度。更为严重的是,这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中,还可能引发不可预测的风险和隐患。以油气勘探为例,基于大模型给出的错误预测进行开采可能导致数亿元的资金损失,并对自然环境造成不可逆转的破坏。
  提升大模型性能,关键是处理好数据“质”和“量”的关系,构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制,加强对数据质量的监控和评估,确保数据的准确性、完整性和一致性。此外,还应注重跨领域合作,引入数据科学家、AI算法工程师等多方力量,开展大模型算法合作、制定数据共享和隐私安全保密协议,推动大模型产学研用生态建设。
  如今,大模型的发展已迈入多模态融合阶段。通过加强数据治理,优化人工智能学习、训练和验证的“基础食材”,端上大规模、高质量、多模态数据集的“丰盛大餐”,必将助力大模型能力的提升,让人工智能更好地赋能千行百业、造福人类社会。(作者/刘 合)




 

【免责声明】:
   凡注明 “环球科技网” 字样的图片或文字内容均属于本网站专稿,如需转载图片请保留 “环球科技网” 水印,转载文字内容请注明来源“环球科技网”;凡本网注明“来源:XXX(非环球科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其作品内容的实质真实性负责,转载信息版权属于原媒体及作者。如转载内容涉及版权或者其他问题,请投诉至邮箱;1978751725@qq.com 
本网公告
环球科技网从不发布负面新闻资讯,也绝不会发布负面信息。如发现负面信息链接请甄别是否为环球科技网所发。
本网系北京伯乐传媒广告有限公司主办、所有。本网唯一域名(www.hqkjw.cn),其它域名链接均为假冒。望广大网民及企业主认真甄别。


咨询、采访、合作、投稿等请致电:13911566744(含微信)

     
 
 


 

相关文章

  • 大语言模型意识水平测评报告显示:DeepSeek-R1语义一致性表现较好 大语言模型意识水平测评报告显示:DeepSeek-R1语义一致性表现较好 2025-03-03 11:07:05

       2月25日,记者从世界人工意识协会国际人工智能DIKWP测评标准委员会获悉,由该协会主导、全球10余个国家与地区的90多家机构和企业参与的《全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告(100题版)》(以下简称《报告》)日前出炉。   《报告》的核心亮点在于全球首创的意识水平测评体系。《报... [阅读]

  • 聚焦中国AI大模型之一:阿里巴巴专家解读AI与手机深度融合前景 聚焦中国AI大模型之一:阿里巴巴专家解读AI与手机深度融合前景 2025-02-28 15:24:37

       新年伊始,国产AI大模型的显著进步引发全球关注。微观层面,我们可以向大模型提问获取答案或者让它撰写文稿,将大模型逐渐嵌入手机等智能终端,发展辅助工作学习的专用大模型……宏观来看,人类又要如何与AI相处,如何实现科技平权、让更多人享受大模型带来的便利?本期的《中国经济面面观》,请与我们一同发现AI大模型的无... [阅读]

  • 我们需要什么样的人工智能 我们需要什么样的人工智能 2025-02-27 15:12:55

       百年未有之大变局下,我们加快了寻找答案、走向新域的步伐。这一进程中,层出不穷的技术“候选者”为解决问题而来,其中,人工智能(AI)是风头最劲的一位。   但面对这位备受全球科技界眷顾的选手时,我们依旧要冷静思索:中国,需要怎样的AI?因为AI发展道路怎么走,对我们的步调至关重要。   社会主义的本质,是解放、... [阅读]

  • DeepSeek“开源周”打响发令枪 AI进入“开源盛世” DeepSeek“开源周”打响发令枪 AI进入“开源盛世” 2025-02-27 15:03:44

       2月21日,国内知名AI公司深度求索(DeepSeek)发布“开源周”计划,在2月24日—28日每日开源新内容,总共5个代码库。DeepSeek官方的GitHub代码提交记录成了AI开发者眼中的“赛博烟花”,打响了AI新一轮开源竞赛的发令枪。   “这里没有象牙... [阅读]

新闻排行榜