当前位置: 首页  >> 智能环球  >> 查看详情

同尺寸多项第一!三六零开源升级版自研大模型360Zhinao2-7B

来源: 环球科技网  日期:2024-12-03  责编: 殷绪江  
分享:
   【环球科技网】近日,三六零自研AI大模型360智脑7B参数升级版(360Zhinao2-7B)正式开源,现已上线Github开源社区(github.com/Qihoo360/360zhinao2),可免费商用。该模型是继今年4月 360Zhinao1-7B 开源后的重要更新,通过全新的多阶段训练方式和更优质的数据处理策略,新开源360智脑模型不仅提升了中英文通用能力,还显著增强了模型的数学逻辑推理能力。据评测,相对于前一版本,其在基础模型训练和对齐训练两大核心环节上均取得重大进展,实现在国内外同尺寸开源模型中,中文能力第一、IF指令遵循7B第一,复杂数学推理能力第一;此外,模型的长文本微调能力,在各个长文本benchmark 上位列第一梯队。
   360Zhinao2-7B 在多项性能评估基准中表现卓越。基于开源工具 OpenCompass 的评估,360Zhinao2-7B 在中文领域的 C 考试和复杂数学推理数据集 math 上,该模型以10B以下开源模型第一的排名展现了超强的竞争力。此外,在C3、lcsts等中文阅读和摘要任务中,该模型也取得了领先成绩。360Zhinao2-7B 在 IF、MT-bench、CF-Bench三个流行评测上,模型都具备竞争力,比如在 IF (prompt strict) 上,在7B尺寸上得分最高。
   优异的模型效果评测结果,基于 360Zhinao2-7B 多项核心技术革新。首先,预训练数据优化:通过语义去重和多样化处理,大幅提升网页数据的均衡性;同时,通过大规模合成,弥补了数学和代码数据的不足。其次,模型结构升级:引入GQA机制,显著提升推理效率。第三,对齐训练强化:采用iterative DPO,off policy DPO以及PPO三种进化方式分别对齐,再采用先内插再外插的方法,极致提升模型的天花板。结合高质量人工标注的微调数据以及可验证的复杂指令遵循数据,大幅增强了模型在实际应用场景中的指令遵循能力。
   此次 360Zhinao2-7B 开源,包含基础模型和强化对齐的聊天模型,以及模型的微调训练代码,推理代码等全套工具集也被一并开源,大模型相关开发者可做到“开箱即用”。无论是在学术研究还是在教育、医疗、智能客服等商业场景中,都具备高度实用性。
   自三六零推出开源大模型以来,一直致力于构建开放、共享的AI生态。此次 360Zhinao2-7B 为广大开发者提供了低成本、高性能的创新机会,和性能强劲、稳定性高的技术基石,是三六零对技术社区的又一次支持。随着AI技术在全球范围内的迅猛发展,三六零将继续以开放的心态与行业伙伴共同探索更多可能性。




 

【免责声明】:
   凡注明 “环球科技网” 字样的图片或文字内容均属于本网站专稿,如需转载图片请保留 “环球科技网” 水印,转载文字内容请注明来源“环球科技网”;凡本网注明“来源:XXX(非环球科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其作品内容的实质真实性负责,转载信息版权属于原媒体及作者。如转载内容涉及版权或者其他问题,请投诉至邮箱;1978751725@qq.com 
本网公告
环球科技网从不发布负面新闻资讯,也绝不会发布负面信息。如发现负面信息链接请甄别是否为环球科技网所发。
本网系北京伯乐传媒广告有限公司主办、所有。本网唯一域名(www.hqkjw.cn),其它域名链接均为假冒。望广大网民及企业主认真甄别。


咨询、采访、合作、投稿等请致电:13911566744(含微信)

     
 
 


 

相关文章

  • 周鸿祎谈AI前景:革新基础科学、自动驾驶、机器人和能源产业 周鸿祎谈AI前景:革新基础科学、自动驾驶、机器人和能源产业 2024-10-28 14:15:33

       【环球科技网】日前,嘉宾商学旗下标杆企业深度访学课程嘉宾派携国内知名企业家学员赴360集团访学,并接受360集团创始人周鸿祎授课。此次周鸿祎的授课内容主要围绕“拥抱大模型,打造新质生产力”这一主题,从大模型的发展趋势、运行机制以及应用落地方法论等角度进行阐述,旨在呼吁企业建立AI认知,抓住人工智能时代带来的高... [阅读]

  • 周鸿祎南开演讲:AI还需要5-10年才能给人类社会带来质的飞跃 周鸿祎南开演讲:AI还需要5-10年才能给人类社会带来质的飞跃 2024-10-18 10:54:24

       【环球科技网】近日,360集团创始人周鸿祎受邀参加南开大学建校105周年纪念活动并发表演讲,分享了对人工智能未来发展的见解。他表示,开年的16个AI趋势比如大模型同时越做越小、企业级大模型市场崛起等预测都已被验证,人工智能成为打造新质生产力的核心引擎;AI成为诺贝尔奖最大赢家,验证了“AI For Science&rdq... [阅读]

  • 360AI搜索“慢思考模式”上线 成为国内首个“慢思考”AI产品 360AI搜索“慢思考模式”上线 成为国内首个“慢思考”AI产品 2024-09-27 09:35:45

       【环球科技网】近日,360AI搜索上线基于 CoE 技术架构的“慢思考模式”,成为国内首个具备慢思考能力的AI产品、全球首个具备慢思考能力的搜索引擎。在慢思考模式下,360AI搜索能够大幅提升回答质量,完成多数 AI ChatBot 无法完成的复杂任务;同时得益于反思者等模型角色设置,提高了用户提问容错率,实... [阅读]

  • OpenAI o1思维链模式与360“慢思考”理念不谋而合 OpenAI o1思维链模式与360“慢思考”理念不谋而合 2024-09-16 22:21:40

       【环球科技网】这一次,中美两国的人工智能企业在研发思路上终于站在了同一条起跑线,中国企业的起跑时间甚至更早一些。9月13日,OpenAI发布具有推理能力的人工智能模型“o1”,备受行业瞩目。o1通过模仿人类的思维过程,强化学习和“思维链”技术,引导模型自主解决问题。这一特点在解决复杂问... [阅读]