人工智能视频生成的快速改进似乎不会很快放缓,b谷歌宣布以Veo 2的形式对自己的视频制作进行重大升级。在此之前,Veo于5月推出,OpenAI本月早些时候向公众推出了Sora AI视频生成器。
谷歌说,Veo 2在用户偏好和迅速坚持方面击败了Sora和其他竞争对手——你可以在Veo 2网站上看到相关的图表——新型号带来了“增强的真实感和保真度”,以及更好的运动处理和改进的相机控制。
根据谷歌的说法,Veo 2通过“对现实世界物理和人类运动和表情的细微差别的更好理解”提高了它的视频生成能力,所以听起来你会在你的剪辑中看到更少的奇怪。
这款新机型对电影和电影的语言也有更好的把握。这意味着提示可以包括特定的电影类型,特定类型的镜头或特定的电影效果。现在支持“低角度跟踪镜头”、“特写镜头”或“浅景深”等术语,这可以帮助生成更符合提示的视频。
视频的分辨率可以达到4K(从1080p升级而来),现在可以长达几分钟。谷歌展示的一些例子剪辑看起来令人印象深刻:我们有倒饮料,狗在游泳池里骑充气玩具,卡通人物对着镜头说话,科学家凝视着显微镜。
然而,它并非完美无瑕,谷歌承认Veo 2在复杂场景中的一致性方面仍然存在问题。这是AI视频生成器的一个整体问题——它们不理解现实世界的物理和空间,即使它们可以根据大量的训练数据做一个粗略的近似。你会注意到,这些视频都没有显示出镜头外的东西,然后又回来了,很可能是因为AI会忘记它或以不同的方式渲染它。
获得Veo 2的过程与获得第一款Veo的过程相同:你需要在网上找到谷歌实验室的VideoFX工具,并在等候名单上注册。目前,你需要在美国试用Veo 2,而且你需要年满18岁。
谷歌承诺将在明年扩大Veo 2的可用性,包括将其放入YouTube短片供创作者使用,但目前它还不能在谷歌Gemini等其他工具中使用(谷歌Gemini提供对最新Imagen 3艺术生成器模型的访问)。
由于我目前无法访问Veo 2,所以我不能给你太多关于现有限制的细节。谷歌表示,“每个用户每天只能播放一定数量的视频”,但目前还不清楚每天可以播放多少个视频,或者可以播放多长时间。OpenAI允许ChatGPT Plus用户每月最多制作50个视频,长度上限为5秒,分辨率限制为720p。
你制作的任何视频都将带有一个“看不见的合成水印”,可以识别它们是人工智能生成的——b谷歌试图将Veo 2被用来欺骗观众和传播错误信息的风险降至最低的一部分(谷歌说,安全问题也是缓慢推出的部分原因)。