当前位置: 首页  >> 智能环球  >> 查看详情

“惊喜、惊诧、惊叹”的DeepSeek:掀翻“刻板印象”的中国初创力量

来源: 人民邮电报   日期:2025-02-14  责编: 殷绪江  
分享:
 “DeepSeek生成的新春祝福请查收”“请用最犀利的语言锐评一下湖人队和独行侠队达成的最新交易”“英伟达股价暴跌和你有关系吗”……从春节假期开始,DeepSeek(深度求索)的名字一下子火“出圈”,相关信息持续刷屏。
  随着对DeepSeek-V1、R1等系列模型的挖掘,超低成本、开源驱动、创新训练、本土AI等关键词引发了Deep-Seek的全球热潮。AI竞逐不断升温,发展态势瞬息万变,背后是不断掀翻“刻板印象”的中国初创力量。有惊喜,是因为DeepSeek以较低成本实现了性能领先,掀翻了“更强模型必须更高算力、更高成本”的“刻板印象”。
  根据测试数据,与OpenAI相比,DeepSeek-V3的能力与GPT-4o相近;在后训练阶段大规模使用强化学习技术后,DeepSeek-R1与o1不分高下。然而,如此领先的性能,根据其技术论文,V3的训练GPU成本仅为557.6万美元,所用GPU小时仅为278.8万个,低于标杆开源模型Llama-3.1所花费的10%。
  更低的训练成本、更强的模型性能,使得DeepSeek的推理定价大幅降低至仅约OpenAI的3%,从而快速赢得用户的青睐。作为“土生土长”的中国AI,DeepSeek不仅是首个登顶中国区和美国区苹果应用商店免费榜的国产应用,还创造了史上最快突破日活跃用户3000万大关的纪录。
  有惊诧,是因为DeepSeek“奇袭”硅谷,掀翻了AI前沿领域“美国引领、中国跟随”的“刻板印象”。戏剧性的是,与DeepSeek-R1发布近乎同一时间,美国总统特朗普宣布美国政府将与OpenAI、甲骨文和软银合作,共同投资5000亿美元用于支持美国的人工智能基础设施建设,进一步巩固并彰显美国的“AI霸权”。
  而DeepSeek的“横空出世”,解构了OpenAI的闭源“高墙”,绕过了英伟达高性能算力卡的禁售“封锁”,让美国在AI领域的“小院高墙”出现了裂痕,促使美国反思AI产业软硬件封锁是否有用和超高投入的AI发展路线是否正确。
  有惊叹,是因为DeepSeek选择将模型开源,以共享推动AI创新与生态繁荣,掀翻了“闭源AI更领先”的“刻板印象”。近年来,AI大模型闭源与开源的路线之争越发激烈,其核心矛盾在于如何解决大模型的投入与盈利的可持续问题。选择开源还是闭源,企业各有其考量,也有两方同时布局的选项。
  显然,DeepSeek选择开源,对它维持自身的技术优势是不利的,但无疑对提振开源热情、壮大开源社区、繁荣AI生态是有利的。特别是开源AI大模型的自主定制、成本较低、社区活跃等特点,将极大激发我国在各应用场景部署、使用并进一步开发AI大模型的主动性。此外,引导更加开放、透明、共享的AI开源发展,将成为我国破局“小院高墙”“脱钩断链”的关键一招。
  “DeepSeek的成功并非仅仅是中国AI的胜利,还是开源模型战胜了专有模型。”图灵奖获得者、Meta首席人工智能科学家杨立昆(Yann LeCun)对DeepSeek及中国AI发展成果不吝赞美,OpenAI、英伟达、微软、Meta等AI巨头也对DeepSeek高度重视。
  从AI基础设施厂商、国产芯片厂商,到三家基础电信企业、阿里云、华为云、亚马逊AWS、微软Azure等国内外云计算巨头全面接入DeepSeek开源大模型,国家超算互联网平台正式上线,再到多媒体传媒、工业软件、自动驾驶等应用爆发——DeepSeek的成功,充分诠释了一家初创企业的“颠覆式”创新能产生怎样的“爆发力”。
  DeepSeek团队的成功,不仅有望成为2025年中国AI应用全面爆发的启动点,还将极大鼓舞正在各领域积极寻求创新突破的年轻人,他们将成为我国在新一轮科技革命和产业变革中竞逐制高点的核心力量。
  业界预计,2025年我国有望培养大模型应用开发人才30万~50万人,从“人口红利”转向“工程师红利”的趋势不断显现。高素质的人才队伍中必将涌现一批敢于创新、善于创新的初创团队,从高校到企业,他们将聚焦垂直领域,无论是技术创新还是工程创新,在推动科技创新和产业创新融合发展的春天来临时,他们将是承载希望、茁壮成长的“雨后春笋”。





 

【免责声明】:
   凡注明 “环球科技网” 字样的图片或文字内容均属于本网站专稿,如需转载图片请保留 “环球科技网” 水印,转载文字内容请注明来源“环球科技网”;凡本网注明“来源:XXX(非环球科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其作品内容的实质真实性负责,转载信息版权属于原媒体及作者。如转载内容涉及版权或者其他问题,请投诉至邮箱;1978751725@qq.com 
本网公告
环球科技网从不发布负面新闻资讯,也绝不会发布负面信息。如发现负面信息链接请甄别是否为环球科技网所发。
本网系北京伯乐传媒广告有限公司主办、所有。本网唯一域名(www.hqkjw.cn),其它域名链接均为假冒。望广大网民及企业主认真甄别。


咨询、采访、合作、投稿等请致电:13911566744(含微信)

     
 
 


 

相关文章

  • 以系统观念培养人工智能人才 以系统观念培养人工智能人才 2025-02-14 11:08:32

       新年伊始,我国AI技术不仅在科研突破、技术治理上取得新进展,还在通信、文化演出等场景实现规模化落地,引发各界广泛关注。创造这些骄人成绩的核心技术人才,许多都来自国内高校,且很多都是应届博士生、在读博士生和刚毕业不久的年轻人。这些年轻人凭借扎实的专业知识和创新精神,在人工智能领域取得了令人瞩目的成果,打破了外界对海外人才垄断高端科技研... [阅读]

  • DeepSeek“出圈”有望加速AI普及 DeepSeek“出圈”有望加速AI普及 2025-02-13 10:01:43

    近日,中国AI初创企业深度求索(DeepSeek)发布的开源模型DeepSeek-R1爆火全球,其以推理能力强、性价比突出的特点区别于过往的AI模型,一经发布就以破圈之势引发广泛关注。业内人士认为,在DeepSeek高性价比API服务和模型开源的策略下,DeepSeek-R1有望带动全行业持续降本,助力AI应用全面落地和繁荣;同时,可能推动投资者重新评估中国... [阅读]

  • 京东云发布DeepSeek大模型一体机 双引擎及千余种插件 京东云发布DeepSeek大模型一体机 双引擎及千余种插件 2025-02-10 15:20:43

       2月8日消息,京东云发布 DeepSeek大模型一体机,具备国产算力全适配、支持丰富大模型参数规格、AI应用开箱即用等核心特性。    从官方获悉,该一体机内置智能体+知识库双引擎,预置海量智能体配置模板、100多个行业解决方案模板以及1000多种插件,支持本地知识库快速构建,可通过“模型指令+知识... [阅读]

  • DeepSeek有望激发 新一波人工智能创新浪潮 DeepSeek有望激发 新一波人工智能创新浪潮 2025-02-07 10:27:40

       中国人工智能(AI)企业深度求索(DeepSeek)日前发布其最新开源模型DeepSeek-R1,用较低的成本达到了接近于美国开放人工智能研究中心(OpenAI)开发的GPT-o1的性能。这一进展破解了全球人工智能产业长期以来“堆算力”的路径依赖,其影响波及资本市场。业界人士认为,DeepSeek模型有望激发... [阅读]

新闻排行榜