AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

Sora的出现,将刚过完春节的我们又拉到了一场新的“科技春晚”中。2 月 16 日,OpenAI 宣布推出首个文生视频大模型——Sora,该模型可以“根据文本指令创建逼真且富有想象力的场景”,并且最长可达一分钟。

这一举动所带来的影响丝毫不小于去年GPT-4问世后的爆火,不论是同属AI赛道的国内外公司还是看热闹不嫌事大的明星,甚至还有企图利用信息差卖课的骗子,都让Sora的热度居高不下。而Sora所带来的影响还在持续,可谓是有人欢喜有人愁。

一、威尔·史密斯本尊整活Sora

在Sora出现后,不少科技圈名人都发出了惊叹,马斯克甚至直接在社交平台上发布短评“GG humans”。当所有人都在震惊于Sora的强大能力,同时为人类今后所担忧的时候,有人已经看热闹不嫌事大的开始“火上浇油”了。

大家还记得那个曾拍摄过《当幸福来敲门》和《黑衣人》等众多好莱坞大片的巨星威尔·史密斯吗?今天,全体AI社区都被威尔·史密斯发出的这段视频震惊了!

你以为,上面是一年前的AI视频,下面是如今的Sora生成的AI视频?但其实全网都被他骗到了,下方所谓的AI视频并无OpenAI水印,同时还是由其本人官方账号发出的。

AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

所以这就是个由威尔·史密斯本人出镜表演的视频,并非Sora生成的AI视频,有趣的是他还假装很震惊,配上“形势已经失控了!”的文字,似乎在为人类的未来或是个人隐私所担忧。只能说不愧是好莱坞巨星,亲自上阵,给大伙整了个大活,还结结实实骗过了不少网友。

这似乎也从侧面体现了Sora的强大早已在短短几天内深入人心,因此一众网友才会被威尔·史密斯的整活视频所欺骗。但其实出于对生成真实人像安全问题的顾虑,OpenAI从未回应过这类请求。在已公开的Sora视频里,最接近可比的是“一个男人吃汉堡”。

AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

可以看到,被咬了一口的汉堡正确出现咬痕,展示了Sora对人与食物互动的理解。这种AI对于物理世界的深度理解还在各个方面有所体现,也正是因为这点才会让人们感到震惊,毕竟此前的Pika等同赛道产品可没有如此强大的理解能力。

对于Sora的问世,许多人不同于威尔·史密斯的整活,而是发现了一些不一样的“商机”。

二、Sora的更多“商机”

很难想象,刚刚问世的Sora能和苹果Vision Pro进行联动。有 github 网友@AndrewMayne将OpenAI案例视频转化成了适用 Vision Pro空间视频。

AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

AndrewMayne 创建了两个视频轨道,一个用于左眼,一个用于右眼,并根据视频移动的方向稍微改变了轨道的时间。这会创建模拟立体 3D 效果,并且仅适用于存在横向运动的视频。为了将视频转换为适用于 Vision Pro 的 Apple Spatial 视频格式,其使用了 Mike Swansons 的空间视频转换工具

在苹果Vision Pro 上的实际体验也相当不错,双目视差带来的立体感,在海浪的冲击中带来更加身临其境的体验。在不追求非常细致的视觉效果下,凭借批量化、高效率的 Sora 生成的 AI 视频可以有效填补空间视频的空白市场。

而相比于发掘Sora和Vision Pro之间联系的商机,一些心术不正之人却找到了利用Sora热度的“商机”。

AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

没错,这个所谓的“商机”就是卖999的限时特价的课程,这都不是普通的“割韭菜”了,这是直接利用信息差进行诈骗了。众所周知,Sora这个产品在AI视频领域,说是划时代的产品也不为过。但是,它只是个”期货”产品,只有官方、以及极少数的测试大佬,手握产品权限,可以试用到。而距离真正能向大众开放,至少还有2~3个月的时间。

毕竟,从他们的技术文档还有整体的节奏看,离真正的产品化,包括做好安全对齐,还有一段不短的路要走。但是,产品都还没见到,卖课的,就闻风而动了。“Sora专属提示词教程”、“Sora内容创作SOP”等等,这些骗子真是不放过任何一个赚钱的“商机”啊。

相比于个人对Sora的震惊或是“利用”,其实真正受到影响的还是AI同行们,只是这些同行中有人欢喜有人愁。

三、Sora发布后,同行很兴奋

Pika Labs成立于2023年4月,同年11月发布首个产品Pika 1.0。Pika1.0能够生成和编辑3D动画、动漫、卡通和电影,并且普通用户还可以对其进行加工,被视为一款零门槛“视频生成神器”。

AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

在Sora发布之前,Runway和Pika都被认为是视频生成赛道的佼佼者。Sora发布之后,很多人认为,它凭一己之力已经轻松“吊打”且即将“干翻”这两家新兴独角兽公司,并对创业者的命运表示担忧。

然而,他们自己对此却似乎兴奋更多于恐惧。Pika创始人郭文景独家回应称,“我们觉得这是一个很振奋人心的消息,我们已经在筹备直接冲,将直接对标Sora。”郭文景还透露,目前已经在招人了,具体计划暂时还不能对外透露。

除了Pika外,一些文生视频的同行也吃到了一波红利,文生视频概念股集体涨停。AI相关投融资也迎来一波小高峰,国内大模型创企月之暗面传出融资超10亿美元,加拿大AI创企Cohere被曝正洽谈5-10亿美元新融资,Quora、Sakana等AI创企接连拿下数千万美元融资。

AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

据不完全统计,2023年11月-2024年1月全球共诞生4家AI独角兽,包括美国AI语音合成公司ElevenLabs、印度AI模型创企Krutrim、法国开源模型创企Mistral AI以及国内大模型创企零一万物。随着新融资尘埃落定,月之暗面等公司也有望立刻升级为新晋A1独角兽。前天,ElevenLabs也凭借Al配音版Sora视频出圈,再吸一波热度。

除了一些国外同行们吃到了红利外,其实更多的情况是众多AI创企的骑虎难下,Sora的横空出世,对张一鸣来说,亦喜亦忧。

四、Sora让剪映何去何从?

面对来自Sora的“降维打击”,AI视频领域的创业者中,有的如Runway CEO克里斯托瓦尔·巴伦苏埃拉一样,做好了“Game On”的准备,有的如Pika创始人郭文景一样,开始筹备对标Sora的新产品,也有人如Stability AI CEO埃马德·莫斯塔克一样,不由感慨“阿尔特曼真是一个魔术师”,并将Sora视为AI视频界的GPT-3时刻。

但对字节跳动来说,这似乎是个喜忧参半的消息,因为 Sora所处的视频生成赛道,正是眼下字节跳动旗下剪映所瞄准的AI创新方向。2月份从抖音转岗剪映后,抖音前CEO张楠即将推出一个AI生图和视频的产品。

近日,据财联社报道,在OpenAI发布Sora之前,字节跳动就曾低调推出了一款视频模型产品Boximator的消息并不属实。Boximator可以通过文本控制生成视频中人物或物体的动作,但目前尚不完善且不支持产品落地。

AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

字节跳动相关人士回应称,Boximator是视频生成领域控制对象运动的技术方法研究项目,目前还无法作为完善的产品落地,距离国外领先的视频生成模型在画面质量、保真率、视频时长等方面还有很大差距。

正打算在AI生成视频领域大干一番的张楠,还没等到产品落地的那一刻,其内部再创业的计划,便率先遭遇了Sora的当头一击。不过若是换一种思路呢?尽管在推出类似文生视频产品方面落后一步,但对张楠来说,反过来也迎来了一个摸着Sora过河的机会。只是,留给张一鸣和张楠孵化下一个AI视频生成独角兽的时间,越发紧张了。

Sora打了所有人一个措手不及,Pika、剪映等部分同行或许还有追赶的机会,但更多的AI创企则是愈发的开始走下坡路了。

五、大厂入局让AI创企再次“哀鸿遍野”

正如此前OpenAI推出GPT商店时引发AI创企“哀鸿遍野”一样,此次OpenAI、谷歌、Meta几乎同一时间接连发布重磅模型,再次引发业界争论:AI创企还有出路吗?

这个问题的答案我们目前还不得而知,但能够确认的是,在一些AI创企砥砺前行的同时,已经有一些企业走上了下坡路。

首当其冲的是明星独角兽Stability AI,虽然其一直在不断发布新模型,但持续的高管离职、投资者的质疑体现了其内部管理的混乱。

2023年11月,Stability AI被曝出由于财务状况压力巨大正在寻求出售。此外,其重要投资者美国对冲基金Coatue Management还在10月致信管理层,要求CEO埃马德·莫斯塔克(Emad Mostaque)辞职。

Stability AI不是唯一被曝考虑出售的AI创企。据外媒The Information报道,近几个月来,AI搜索创企Perplexity至少与4家公司讨论了收购事宜,企业级AI助手Writer已与3家寻求收购的公司接洽。

大比例的裁员也是AI创企泡沫破裂的迹象之一。生成式AI独角兽Jasper、AI语音识别创企Deepgram等首批明星AI创企在近半年纷纷宣布裁员。

AI 视频界的 GPT-3 时刻已来 面对Sora,张一鸣面临新挑战?

下坡路的尽头是创企的坟墓。据不完全统计,2023年11月-2024年1月,有4家AI创企宣布关停。其中有大厂独立出来的团队,有明星产品创始人新成立的公司,也有已经走过十余年的“老牌”企业。

六、写在最后

Apple Vision Pro 带来了空间计算革命的全新愿景,将人们的现实体验提升到了一个全新的层次。通过结合 3D 空间场景与混合现实的内容展示形式,它不断地挑战和刷新人们对于视觉认知的界限。

从生成式人工智能文字对话工具 ChatGPT、图像生成器 DALL-E,到视频生成的王炸 Sora,OpenAI 正在重塑互联网内容生产形式。

2024注定是不平凡的一年,从硬件到软件的革新,似乎在迎接更加科幻的时代。在科技飞速发展的浪潮下,不论是个人还是企业,或许都将迎来天翻地覆的变化。

作者:孙浩南

来源公众号:元宇宙新声


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部