/AIGC的下一个风口是视频?Runway Gen-2全新上线

AIGC的下一个风口是视频?Runway Gen-2全新上线

 


你只需要输入一个简单的文字提示,就可以生成一段三秒的视频。


这在过去看来是遥不可及的事情,如今却被Runway Gen-2轻松实现。



 


这种超前的视频AIGC,是不是在暗示着人工智能创作电影和视频的未来?





     

 


周一,总部位于纽约的 Runway 宣布推出其 Gen 2 系统,该系统可以根据用户提示的几句话生成视频短片。


用户可以输入他们想要看到的内容的描述,它会生成一个大约 3 秒的视频剪辑,显示该内容或类似内容。


在上周与 Runway 联合创始人兼首席执行官 Cris Valenzuela 的独家现场演示中,这位记者对 Gen 2 进行了测试,建议提示“沙漠景观的无人机镜头”。



 


几分钟之内,Gen 2 生成了一段只有几秒钟长且有点失真的视频,但不可否认的是,它看起来像是无人机拍摄的沙漠景观。


地平线上有蓝天和云彩,太阳在视频帧的右角升起(或落下),它的光线突出了下面的棕色沙丘。


从文本到视频的创意其实早就存在,甚至Alphabet Inc. 的谷歌和 Meta Platforms Inc. 都在去年展示了他们自己的文本转视频成果。



   

   


主题包括泰迪熊洗碗和湖上的帆船,但两家公司都没有宣布计划将工作转移到研究阶段之外。


Runway 自 2018 年以来一直致力于开发人工智能工具,并于去年年底筹集了 5000 万美元。这家初创公司帮助创建了 Stable Diffusion 的原始版本,这是一种文本到图像的 AI 模型,此后由 Stability AI 公司推广和进一步开发。


所以,Runway算是成功将文本到视频项目落地的吃螃蟹的第一人。






     

 


接下来,我们来详细了解 Gen-2 将任何图像、视频剪辑或文本提示变成引人入胜的影片的不同方式。


模块一:文本生成视频,仅使用文本提示即可以生成你想象的任何风格合成视频。只要你能说出来,那么你就能直观地看到它。


Prompt:傍晚的阳光透过纽约市阁楼的窗户窥视。



 


模块二:文本+图片生成视频,即通过文本与图片输入的双重结合,生成最终的视频。


输入一张自己想要的男生照片,再结合相应的Prompt进行生成。



 


Prompt:一个男人走在街上的低角度镜头,周围酒吧的霓虹灯照亮了他。



 


模块三:图片生成视频,即只用图片来完成视频生成。



 


总体上来看,Runway的三大新模块已经能一定程度上满足用户对生成视频的需求。






       

     


Runway 根据自己的提示生成的其他几个视频显示了该系统当前的一些优点和缺点:一个眼球的特写图像看起来清晰且非常像人,而一个徒步旅行者穿过丛林的片段显示它可能仍然在生成逼真的腿部和行走动作方面存在问题。 



     


Valenzuela 说,该模型还没有完全“弄清楚”如何准确地描绘移动的物体。


“你可以生成一场汽车追逐,但有时汽车可能会飞走,”他说。


虽然冗长的提示可能会导致使用 DALL-E 或 Stable Diffusion 等文本到图像模型的更详细的图像,但 Valenzuela 说 Gen 2 越简单越好。



     


他认为 Gen 2 是为艺术家、设计师和电影制作人提供的一种方式 另一种工具可以帮助他们完成创作过程,并使这些工具比过去更实惠、更容易获得。


Gen-2建立在名为 Gen-1 的现有 AI 模型之上,原有的 AI 模型要求用户上传视频作为输入源,它将使用该视频生成一个新的且无声的 3 秒视频。 


使用 Gen-2 AI 模型创建的视频也是无声的,但 Valenzuela 表示该公司正在研究音频生成,希望最终创建一个可以生成图像和声音的系统。






       

     


Gen-2 的首次亮相展示了初创公司在所谓的生成 AI 上前进的速度和凶猛程度,这些系统接收用户输入并生成文本或图像等新内容。



     


其中一些系统——例如 Stable Diffusion,以及 OpenAI Inc. 的图像生成 Dall-E 和聊天机器人 ChatGPT——在最近几个月已经公开可用并广受欢迎。


与此同时,它们的扩散引起了法律和伦理方面的担忧。


加州大学伯克利分校的数字取证专家兼教授 Hany Farid 看了一些由 Gen 2 生成的视频,并称它们“非常酷”,但补充说用它创建视频只是时间问题,且可能导致技术的滥用。


“人们会试图用它做坏事,”法里德说。



     


Runway 结合使用 AI 和人工审核来防止用户使用 Gen 2 生成包含色情、暴力内容或侵犯版权的视频,尽管这些方法并非万无一失。


与其他 AI 行业一样,该技术正在迅速发展。


虽然 Gen 2 的图像质量目前有点模糊和不稳定,让人很容易感觉到 Gen 2 制作的视频有一些不同,但 Valenzuela 预计它会很快得到改善。


“现在还早,”他说。“随着时间的推移,这个模型会变得更好。”



       

     


AIGC的迅猛发展,也引起了行业内外的人士和普通打工人的警惕。



     


“我的工作会被AI替代吗?”


“这么多工具,我要用什么来辅助我的工作流程呢?”


一系列的问题如火山喷发般涌出,那么答案在哪里呢?


OF COURSE想当然在本周五和周六连开两场AIGC讲座,为你答疑解惑!

现场名额有限,先到先得!


     

 


未经授权 请勿转载

参考资料:

https://research.runwayml.com/gen2




本文来自微信公众号“OF COURSE想当然”(ID:ofcourse_cn)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。