当前位置: 首页  >> 智能环球  >> 查看详情

视频生成器Sora让人喜忧交加

来源: 科技日报   日期:2024-02-20  责编: 殷绪江  
分享:
   继推出ChatGPT后,龙年伊始,OpenAI公司又推出了最新人工智能(AI)模型——文本-视频程序Sora。这款工具可根据简单的文本描述,生成类似好莱坞电影般的逼真而又充满想象力的视频。英国《新科学家》杂志网站在2月17日的文章中指出,对Sora的到来,人们可能“既爱又怕”。不少科学家欢呼其到来,认为它将进一步推动技术进步。但也有人担心,Sora会被别有用心之人用来制造深度伪造视频,加剧错误和虚假信息的泛滥。
两大技术孵化强大功能
   Sora日语意为“天空”,其背后的团队之所以选择这个名字,是因为它“让人联想到无限的创造潜力”。该系统是生成式AI的一个最新实例。生成式AI可即时创建文本、图像和声音。
   Sora目前可单独使用文本指令,或将文本与图像相结合,来创建长达60秒的视频,而且是一镜到底。比如一段演示视频依据如下文字描述生成:一位时尚女性漫步于充满城市标牌的东京街道上,道路两边霓虹灯闪烁,透出阵阵暖意。Sora不仅准确呈现了细节,还生成了具有丰富情感的角色。
   目前OpenAI官网上已更新了48个视频,包括一只狗在雪地里嬉戏,车辆在路上行驶,以及更奇幻的场景,如鲨鱼在城市摩天大楼之间游泳等。有专家认为,Sora的表现优于其他类似模型,标志着文本-视频技术的巨大飞跃。为实现更高水平的真实感,Sora结合了两种不同的AI技术。一是类似于DALL-E等AI图像生成器中使用的扩散模型,这些模型学习将随机图像像素转换为相干图像;二是“转换器架构”技术,其被用于将序列数据依据上下文内容拼接在一起。例如,大型语言模型使用转换器架构将零散的单词组装成人们可理解的句子。OpenAI将视频片段分解为视觉“时空补丁”,Sora的转换器架构可处理这些补丁。英伟达公司高级研究科学家范麟熙在社交媒体平台X上称,Sora是一个可模拟现实世界的“数据驱动的物理引擎”。
仍有诸多完善空间
   尽管Sora生成的视频令人印象深刻,但并非完美无缺。OpenAI公司坦承,目前Sora模型也有弱点。它可能难以准确模拟复杂场景的物理特性,且可能无法理解因果关系。例如,该系统最近生成了一个人吃饼干的视频,但饼干怎么吃也没变小,被咬的饼干也神奇地没有咬痕。此外,该模型还可能混淆文字提示的空间细节,也可能难以精确描述随时间推移发生的事件。美国普林斯顿大学的阿凡德·纳拉亚南指出,Sora生成的视频在描绘有大量动作的复杂场景时仍然会出现一些奇怪的小问题。
或使人真伪难辨
   除了加快经验丰富的电影制作人的工作速度外,Sora还可能快速廉价的制造网络虚假信息,使人们在互联网上更难分辨真伪。OpenAI公司仍在试图了解Sora的危险性,因此尚未向公众发布该系统。相反,他们正在与为数不多的学者和其他外部研究人员分享这项技术,希望借助这些专家的智慧,找到该系统可能被滥用的方式。
   OpenAI针对Sora开展的“红队”演习中,专家们试图破坏AI模型的保护措施,以评估其被滥用的可能性。OpenAI发言人表示,目前参与测试Sora的都是“在错误信息、仇恨内容和偏见等领域的专家”。这项测试至关重要,因为Sora可能会被别有用心者用来生成虚假视频,以骚扰他人,甚至影响政治选举。学术界、商界、政府以及AI专家都很担心,AI生成的“深度伪造”内容可能会造成虚假和错误信息的广泛传播。
   美国加州大学伯克利分校的哈尼·法里德认为,与生成式AI领域的其他技术一样,人们有理由相信,文本-视频技术会持续改进。因为一旦Sora与由AI驱动的语音克隆技术相结合,将为不怀好意者提供全新工具,并创建出逼真的深度伪造内容,这将让人们越来越难以区分真伪。
   OpenAI已经在该系统生成的视频中加上了水印,表明这些视频是由AI生成的。但该公司也承认,这些水印可被移除,水印可能难以被发现。
   OpenAI发言人强调称,在将Sora用于OpenAI的产品之前,该公司正在采取几项重要的安全措施。例如,该公司已使用了自动化流程,旨在防止其商业AI模型生成针对政客和名人的虚假内容。





 


 
 
【免责声明】:
   凡注明 “环球科技网” 字样的图片或文字内容均属于本网站专稿,如需转载图片请保留 “环球科技网” 水印,转载文字内容请注明来源“环球科技网”;凡本网注明“来源:XXX(非环球科技网)”的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其作品内容的实质真实性负责,转载信息版权属于原媒体及作者。如转载内容涉及版权或者其他问题,请投诉至邮箱;1978751725@qq.com 
本网公告
环球科技网从不发布负面新闻资讯,也绝不会发布负面信息。如发现负面信息链接请甄别是否为环球科技网所发。
本网系北京伯乐传媒广告有限公司主办、所有。本网唯一域名(www.hqkjw.cn),其它域名链接均为假冒。望广大网民及企业主认真甄别。


咨询、采访、合作、投稿等请致电:13911566744(含微信)

     
 
 


 

相关文章

  • AI大模型加速迭代 产业链公司获机构重点布局 AI大模型加速迭代 产业链公司获机构重点布局 2024-02-19 14:02:24

       始于去年的AI(人工智能)大模型浪潮热度再次升温。农历春节期间,AI领域利好不断,以Open AI为首的诸多国内外互联网龙头公司均迎来AI大模型技术的新进展。多家机构及业内人士称,看好未来AIGC(人工智能生成内容)产业发展前景以及算力市场的增长空间,产业链内多家公司已获得机构重点关注及提前布局。   AI大模... [阅读]

  • OpenAI视频生成刷屏,人工智能时代教育何去何从 OpenAI视频生成刷屏,人工智能时代教育何去何从 2024-02-19 13:45:00

       开发出热门聊天机器人ChatGPT后,OpenAI继续在生成式人工智能上玩出新花样。2月16日凌晨,OpenAI再次扔出一枚深水炸弹,发布了首个文生视频模型Sora。据介绍,Sora可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以及富有情感的多个角色。目前官网上已经更新了48个视频demo,在这些demo中... [阅读]

  • 人工智能或成全球芯片行业复苏关键动力 人工智能或成全球芯片行业复苏关键动力 2024-02-02 16:28:54

       过去几年,全球芯片产业陷入低迷,整个行业供大于求,芯片库存压力加大。2023年下半年,芯片行业有回暖迹象,但全年表现依然不佳,充满挑战。   据市场调查机构Gartner的初步统计,2023年全球半导体营收总额为5330亿美元,同比下降11.1%。在排名前25的大厂中,只有9家实现了收入增长,10家甚至出现了两... [阅读]

  • 周鸿祎与长江商学院EMBA学员交流:2024年的主旋律是如何用大模型 周鸿祎与长江商学院EMBA学员交流:2024年的主旋律是如何用大模型 2024-01-25 15:36:29

       【环球科技网】“2023年的主旋律是如何做大模型,2024年的主旋律是如何用大模型”,1月24日,三六零(601360.SH,下称“360”)集团创始人周鸿祎受邀参加长江商学院EMBA至诚讲坛活动,以“2024大模型机遇年,企业如何拥抱AI”为题,面向企业家、创... [阅读]