当前位置： 首页 >> 智能环球 >> 查看详情

用AI生成数据训练AI或导致模型崩溃

来源： 科技日报 日期：2024-07-27 责编： 殷绪江

《自然》24日正式发表的一篇研究论文指出了一个人工智能（AI）严重问题：用AI生成的数据集训练未来几代机器学习模型，可能会严重“污染”它们的输出，这被称为“模型崩溃”。研究显示，原始内容会在9次迭代以后，变成不相关的“胡言乱语”（演示中一个建筑文本最终变成了野兔的名字），这凸显出使用可靠数据训练AI模型的重要性。

　　生成式AI工具越来越受欢迎，如大语言模型等，这类工具主要用人类生成的输入进行训练。不过，随着这些AI模型在互联网不断壮大，计算机生成内容可能会以递归循环的形式被用于训练其他AI模型或其自身。

　　包括英国牛津大学在内的联合团队一直在进行相关研究，并在去年论文预印本中提出这一概念。在正式发表的论文中，他们用数学模型演示了AI可能会出现的“模型崩溃”。他们证明了一个AI会忽略训练数据中的某些输出（如不太常见的文本），导致其只用一部分数据集来自我训练。

　　团队分析了AI模型会如何处理主要由AI生成的数据集。他们发现，给模型输入AI生成的数据，会减弱今后几代模型的学习能力，最终导致了“模型崩溃”。他们测试的几乎所有递归训练语言模型，都容易出现问题。比如，一个用中世纪建筑文本作为原始输入的测试，到第9代的输出已经是一串野兔的名字。

　　团队指出，用前几代生成的数据集去训练AI，崩溃是一个不可避免的结局。他们认为，必须对数据进行严格过滤。与此同时，这也意味着依赖人类生成内容的AI模型，或许能训练出更高效的AI模型。

　　对AI来说，“模型崩溃”就像癌症一样，甚至分早期与晚期。在早期时，被“喂”了生成数据的AI会开始失去一些原始正确数据；但在晚期，被“喂”了生成数据的AI会“口吐狂言”——给出完全不符合现实，也和底层数据一点不相关的结果，就像本文中的例子一样。更可怕的是，“模型崩溃”的AI极其固执，错误几乎难以矫正。它会持续强化，最终把错误结果认为是正确的。这一问题值得所有关注生成式AI的人们警惕，因为它等于是在“毒化”AI对真实世界的认知。

标签：人工智能科技 AI 大模型 GPT

上一文章：北京发布“人工智能＋”行动计划

下一文章：人形机器人产业“火热”背后的冷思考

【免责声明】：

凡注明 “环球科技网” 字样的图片或文字内容均属于本网站专稿，如需转载图片请保留 “环球科技网” 水印，转载文字内容请注明来源“环球科技网”；凡本网注明“来源：XXX(非环球科技网)”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其作品内容的实质真实性负责，转载信息版权属于原媒体及作者。如转载内容涉及版权或者其他问题，请投诉至邮箱；1978751725@qq.com

本网公告
环球科技网从不发布负面新闻资讯，也绝不会发布负面信息。如发现负面信息链接请甄别是否为环球科技网所发。
本网系北京伯乐传媒广告有限公司主办、所有。本网唯一域名（www.hqkjw.cn），其它域名链接均为假冒。望广大网民及企业主认真甄别。

咨询、采访、合作、投稿等请致电：13911566744（含微信）

人形机器人产业“火热”背后的冷思考 2024-07-26 10:01:28
随着人工智能技术逐步成熟和机器人产业快速发展，越来越多人形机器人逐渐进入公众视野。面对人形机器人的“热”，行业人士表示应有冷思考，对于人形机器人行业的“一高五难”需有清楚认知，推动人形机器人发展需以应用驱动研究。人形机器人热度高　　前不久在上海举办的2024世界人工智能大会... [阅读]
国际奥委会：人工智能有望革新体育人才选拔方式 2024-07-26 09:48:56
新华社巴黎7月24日电（记者何磊静）记者从国际奥委会24日召开的发布会上获悉，国际奥委会正积极挖掘人工智能技术在奥林匹克运动中的应用潜力，其中包括如何利用人工智能更好地选拔年轻体育人才。　　“我们已经确定了超过180个潜在的人工智能应用场景，要最大限度地发挥出它们的影响力。”国际奥委会首席信息科技官伊拉里... [阅读]
低空经济不断融入生产生活 “飞”到百姓身边 2024-07-24 16:48:10
近年来，低空经济不断融入生产生活。截至目前，持有现行有效民用无人驾驶航空器运营合格证的无人机企业总数超1.4万家，持有无人机操控员执照的人员数量超22.5万人。今年上半年，新注册的无人机将近60.8万架，较去年年底增长48%；无人机累计飞行小时数达981.6万小时，较去年同期增加13.4万小时。　　当前，低空经济有哪些高频应用场... [阅读]
中国机器人产业发展迅猛，引发外媒广泛关注 2024-07-22 10:27:18
“中国大力发展机器人产业，本土品牌纷纷推出高性价比产品，并逐步渗透韩国市场。”韩国《中央日报》近日刊文说。该报道在关注中国机器人产业的同时，还提及中国正在发展新质生产力——这是由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生的当代先进生产力。　　近年来，中国机器人产业发... [阅读]

用AI生成数据训练AI或导致模型崩溃

相关文章

新闻排行榜

热门新闻

推荐新闻

商务合作

友情链接

自媒体矩阵