中国人工智能(AI)企业深度求索(DeepSeek)日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国开放人工智能研究中心(OpenAI)开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响波及资本市场。业界人士认为,DeepSeek模型有望激发一波创新浪潮,推动全球AI继续进步。
据深度求索公司官网介绍,DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有很少标注数据的情况下极大提升了模型的推理能力,在数学、代码、自然语言推理等任务上,测评性能与GPT-o1模型正式版接近。
国际投行摩根士丹利表示,“更大(的模型)不再等于更聪明”,DeepSeek通过显著提高数据质量和改进模型架构,展示了一条与之前大模型不同的高效训练途径。摩根士丹利说,DeepSeek的模型现在低成本优势突出,与国际知名大模型相比,其成本大约低了一个数量级。
高盛集团也认为,DeepSeek新模型的成本远低于现有模型,这意味着开发利用大模型的门槛降低,互联网巨头将面临初创公司的潜在竞争。
英国《金融时报》发表的一篇评论文章指出,DeepSeek挑战了人工智能产业在过去一段时间的核心信念,即认为更强大的硬件才是推动人工智能发展的关键。
摩根士丹利认为,DeepSeek的模型表明,前沿AI能力可能不需要大量计算资源就能实现。通过巧妙的工程设计和高效的训练方法,高效利用资源可能比纯粹的计算能力更重要。这可能会激发一波创新浪潮,各家企业会探索具有成本效益的AI开发和部署方法。
DeepSeek的模型是开源共享的。近日,全球知名开源平台抱抱脸公司等多个团队已宣布复现了DeepSeek-R1的训练过程。美国“元”公司首席AI科学家杨立昆在社交媒体上发文说,DeepSeek-R1的面世,意味着开源模型正在超越闭源模型。
英国《金融时报》的评论文章说,开源模型DeepSeek-R1对全球用户产生极大吸引力,有利于推动人工智能技术的开发和应用。文章说,对于大多数商业用户来说,拥有一款足够可靠并且好用的模型比拥有绝对领先的模型更重要。“并不是每个司机都需要一辆法拉利。像R1这样模型的推理能力进步,可能会为与客户互动或处理工作任务的‘智能体’带来突破性变化。”如果能以更低的成本拥有这些模型,企业的盈利能力将提升。
瑞士瑞银集团指出,如果AI训练和推理成本显著降低,预计更多终端用户将利用AI来改善他们的业务或开发新的用途。(记者 吴晓凌)
2025年1月28日,深度探索DeepSeek发布,在世界产生巨大反响,DeepSeek在知识问答、长文本处理、代码生成和数学能力等方面达到顶尖水平,实现中国人工智能技术的突破性进展,开源大模型对全球人工智能产业格局产生深远影响。当前,以大模型为代表的人工智能飞速发展实现了从“复制”到“创造&rd... [阅读]
2月3日,春节假期即将画上句号之际,深圳石岩丰翼无人机运营中心内,一位地勤工作人员正将一箱箱新鲜的车厘子仔细打包。随后,这些承载着美味与祝福的年货将搭乘无人机,穿越城市的天际线,精准无误地送达到收件人手中。 在科技飞速发展的当下,无人机送快递正从概念设想变为现实。这一创新的配送模式不仅极大地缩短了配送时间,... [阅读]
【环球科技网】1月26日,360集团创始人周鸿祎宣布发起“刺激消费 推广国产品牌——纳米AI搜索送百辆新能源汽车回馈用户嘉年华”活动,送车活动1月26日开始在纳米AI搜索APP站内报名,预计2025年2月12日(农历元宵节)当天抽奖送出首批国产新能源车,此次活动预计将持续一年。 ... [阅读]
与清丽秀美的凉水河为伴,跨过北京亦庄“地标”文博大桥,奔跑在“网红打卡地”泡桐大道……2025年4月,全球首个人形机器人马拉松将在亦庄开跑。这场比赛中,将有12000名半程马拉松比赛选手和近20家全国人形机器人企业代表队共同参赛跑过20余公里,让各界感受到&... [阅读]
2025-03-07
2025-03-07
2025-03-07
2025-03-06
2025-03-06
2025-03-07
2025-03-07
2025-03-07
2025-03-06
2025-03-06