当前位置： 首页 >> 智能环球 >> 查看详情

大模型既要“吃得饱”更要“吃得好”

来源： 科技日报 日期：2025-03-03 责编： 殷绪江

前段时间，网络上流传着一些由大模型生成的“异次元篇章”。比如，有人让大模型续写《红楼梦》情节时，竟得出一幕“贾宝玉倒拔垂杨柳”的奇景，令人啼笑皆非。之所以会出现这种“混搭”和“幻觉”，是因为大模型不仅学习了原著，还“广纳博采”了不少错误信息。
　　这些人工智能（AI）生成的“胡言乱语”虽是网友们茶余饭后的笑谈，但提醒我们要清醒认识到其背后折射出的问题：数据质量是大模型应用成败的关键。以个性化推荐AI系统为例，一些企业在开发过程中，虽然收集了大量的用户行为数据，但数据中充斥着错误的标注、重复的数据以及相互矛盾的信息，数据的量增加了，但系统推荐的准确性并没有显著提升。《自然》杂志（Nature）刊登的一篇有关大模型可靠性研究的文章指出，一个西班牙研究团队发现，包括OpenAI公司的GPT在内的几个大模型升级后，虽然参数量更大了，误答情况却更严重了。因此，大模型长得壮不壮，不仅取决于“食量”（即数据的数量），更在于食物的“质量”（即数据的质量）——吃得饱并不等同于吃得好。
　　数据是大模型的基石，在数据质量不高、可靠性缺失的情况下，一味追求大模型参数量的增加，不仅无法提升模型性能，反而会放大偏差和谬误，产生更多不可信数据。如此一来，势必造成计算与存储资源的浪费，增加开发和维护成本，降低用户信任度。更为严重的是，这种“大模型幻觉”和“灾难性遗忘”现象如果发生在精确性要求极高的工业生产领域中，还可能引发不可预测的风险和隐患。以油气勘探为例，基于大模型给出的错误预测进行开采可能导致数亿元的资金损失，并对自然环境造成不可逆转的破坏。
　　提升大模型性能，关键是处理好数据“质”和“量”的关系，构建大规模、高质量的数据集。应建立完善的数据收集、清洗、验证和存储机制，加强对数据质量的监控和评估，确保数据的准确性、完整性和一致性。此外，还应注重跨领域合作，引入数据科学家、AI算法工程师等多方力量，开展大模型算法合作、制定数据共享和隐私安全保密协议，推动大模型产学研用生态建设。
　　如今，大模型的发展已迈入多模态融合阶段。通过加强数据治理，优化人工智能学习、训练和验证的“基础食材”，端上大规模、高质量、多模态数据集的“丰盛大餐”，必将助力大模型能力的提升，让人工智能更好地赋能千行百业、造福人类社会。（作者/刘合）

标签：人工智能科技 AI 大模型 GPT

上一文章：人工智能正逐步渗透到生活工作的方方面面

下一文章：当机器人照镜子，它看见了什么

手机端 点一点或扫一扫
咨询、采访、合作、投稿等请致电：13911566744（含微信）

凡注明 “环球科技网” 字样的图片或文字内容均属于本网站专稿，如需转载图片请保留 “环球科技网” 水印，转载文字内容请注明来源“环球科技网”；凡本网注明“来源：XXX(非环球科技网)”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其作品内容的实质真实性负责，转载信息版权属于原媒体及作者。如转载内容涉及版权或者其他问题，请投诉至邮箱；1978751725@qq.com
本网公告：本网系北京伯乐传媒广告有限公司主办、所持有。唯一域名（www.hqkjw.cn），其它域名链接均为假冒。望广大网民及企业主认真甄别。

大语言模型意识水平测评报告显示：DeepSeek-R1语义一致性表现较好 2025-03-03 11:07:05
2月25日，记者从世界人工意识协会国际人工智能DIKWP测评标准委员会获悉，由该协会主导、全球10余个国家与地区的90多家机构和企业参与的《全球首个大语言模型意识水平“识商”白盒DIKWP测评2025报告（100题版）》（以下简称《报告》）日前出炉。　　《报告》的核心亮点在于全球首创的意识水平测评体系。《报... [阅读]
聚焦中国AI大模型之一：阿里巴巴专家解读AI与手机深度融合前景 2025-02-28 15:24:37
新年伊始，国产AI大模型的显著进步引发全球关注。微观层面，我们可以向大模型提问获取答案或者让它撰写文稿，将大模型逐渐嵌入手机等智能终端，发展辅助工作学习的专用大模型……宏观来看，人类又要如何与AI相处，如何实现科技平权、让更多人享受大模型带来的便利？本期的《中国经济面面观》，请与我们一同发现AI大模型的无... [阅读]
我们需要什么样的人工智能 2025-02-27 15:12:55
百年未有之大变局下，我们加快了寻找答案、走向新域的步伐。这一进程中，层出不穷的技术“候选者”为解决问题而来，其中，人工智能（AI）是风头最劲的一位。　　但面对这位备受全球科技界眷顾的选手时，我们依旧要冷静思索：中国，需要怎样的AI？因为AI发展道路怎么走，对我们的步调至关重要。　　社会主义的本质，是解放、... [阅读]
DeepSeek“开源周”打响发令枪　AI进入“开源盛世” 2025-02-27 15:03:44
2月21日，国内知名AI公司深度求索（DeepSeek）发布“开源周”计划，在2月24日—28日每日开源新内容，总共5个代码库。DeepSeek官方的GitHub代码提交记录成了AI开发者眼中的“赛博烟花”，打响了AI新一轮开源竞赛的发令枪。　　“这里没有象牙... [阅读]

大模型既要“吃得饱”更要“吃得好”

相关文章

新闻排行榜

热门新闻

推荐新闻

商务合作

友情链接

自媒体矩阵