当地时间 10 月 15 日,就在 OpenAI 于上月底推出全新的 Sora 2 后不到三周,谷歌也端出了自家视频生成模型的最新版本——Veo 3.1。
根据谷歌官方博客公布的信息,Veo 3.1 作为今年 5 月推出的 Veo 3 的迭代更新,主打“更丰富的音频、更强的叙事控制和增强的真实感”。这次更新同步登陆了谷歌旗下的多个平台,包括面向普通创作者的 Flow 影视制作工具、供开发者使用的 Gemini API 以及企业级的 Vertex AI 平台。
从技术规格上看,Veo 3.1 延续了前代的基础架构,支持 720p 和 1080p 两种分辨率输出,帧率固定在 24fps。单次生成可以选择 4 秒、6 秒或 8 秒三种时长,通过“Extend”延展功能,用户理论上可以将视频延长至 148 秒。
音频能力的提升是 Veo 3.1 此次更新的重点之一。在之前的版本中,诸如“Frames to Video”(首尾帧插值)、“Ingredients to Video”(多图像合成)和“Extend”(场景延展)等功能都不支持原生音频生成,用户必须在后期手动添加配乐或音效。现在这些功能全部打通了音频通道,可以根据画面内容自动生成对应的环境音、对话和音效。
此次更新中,谷歌还引入了几项新的编辑功能。“Insert”功能允许用户向现有场景中添加任何元素——从写实的细节到奇幻的生物都可以,系统会自动处理阴影和场景光照,使新增内容能够自然融入。还有”Remove“让用户可以无缝移除场景中的任意对象或角色,系统会重建背景和周围环境。这些功能如果成熟,将极大地改变视频后期制作的工作流程,但目前“Remove”功能尚未在 Flow 中上线,依旧处于“即将到来”的状态中。
值得一提的是,Veo 3.1 终于开始支持竖屏 16:9 视频的生成。此前 Veo 3 只能输出横屏 720p 内容,这在以 TikTok 和 Instagram Reels 为代表的短视频时代显得有些格格不入。谷歌此前曾承诺将 Veo 的视频生成能力整合到 YouTube Shorts 中,支持竖屏格式的 Veo 3.1 或许正是为兑现这一承诺做准备。
不过,从目前的社区实测与反馈来看,除了功能上的丰富,Veo 3.1 在生成质量上貌似没有特别大的提升(毕竟 Veo 3 本身的质量其实已经不错了)。AI 工具公司 Otherside AI 的创始人 Matt Shumer 在 X 上直言不讳地表达了失望,他认为 Veo 3.1“明显不如 Sora 2”,并且“价格贵得多”。
图丨相关推文(X)
有博主在详细测试后指出,Veo 3.1 在音效和对话生成上确有改进,特别是环境音的空间感更强了,但系统仍然缺乏自定义语音支持,用户无法选择特定的生成语音风格,这对需要品牌一致性的商业项目来说是个硬伤。当摄像机角度变化时,Veo 3.1 生成的人物面部特征和服装细节容易出现不连贯,需要创作者精心设计提示词来规避,而 Sora 2 在这方面的处理要自然得多。
笔者也进行了一些简单的测试,发现 Veo 3.1 在画面精致程度、物理真实性等方面维持了 Veo 3 一贯的出色表现。
例如在驾驶跑车的场景中,它的表现依旧出色。无论是车身的光泽、海边公路的光影变化,还是高速行驶带来的动态模糊,Veo 3.1 都处理得比较到位,延续了它在制作电影感、广告级大片上的优势。
在之前 Sora 2 上爆火的“AI 街头采访”这类场景里,Veo 3.1 的表现也相当不错。从我生成的视频来看,人物的口型与语音基本能对应上,表情和神态也比较自然,背景的路人活动也合情合理,没有出现明显的穿帮。
但一旦场景变得更复杂,尤其是在短视频场景下,其短板就开始暴露了...
当笔者尝试生成一个老年人在网吧打游戏的段子视频,虽然主要的内容都已经实现,但细节上的毛病不少,视频里出现的中文文字依旧是乱码。
更重要的是,作为主打功能的音频,表现很不稳定。有时生成的视频完全没声音;有时虽然有对话,但个别(中文)字词的读音明显是错的,听起来非常别扭。
有网友就评价道,Veo 的视频像是高预算制作的广告片,画面精致但总有种“太完美”的疏离感(以及偶尔的“油腻感”);Sora 2 则更像是 TikTok 或 Instagram Reels 上的素人视频,有瑕疵、有抖动,但恰恰因此显得真实可信(而且 Sora 2 那种与生俱来的、莫名的幽默感,似乎还没有其他视频生成软件能够匹敌)。这种差异在生成社交媒体内容时尤为明显——当用户需要那种手持拍摄的即兴感时,Veo 的“电影化”反而成了负担。笔者猜测,某种程度上,这可能也与 Veo 3 的训练数据来自 YouTube 而非 TikTok 等短视频平台有关。
总体来看,Veo 3.1 更多的是在工具性上的丰富,对于需要高质量商业素材、稳定视觉风格的专业用户来说,它依然是可靠的选择。但如果目标是制作社交媒体爆款,需要真人视频的随性感,市场上已经有了更合适的选项。毕竟它也只是 0.1 的小版本提升,更大幅度的提高,可能还是要在 Veo 4 上才能看到了。
参考资料:
1.https://blog.google/technology/ai/veo-updates-flow/
2.https://venturebeat.com/ai/google-releases-new-ai-video-model-veo-3-1-in-flow-and-api-what-it-means-for
3.https://x.com/mattshumer_/status/1978503288992461205
运营/排版:何晨龙
相关文章
2025-10-170阅读
2025-10-170阅读
2025-10-170阅读
2025-10-170阅读
2025-10-170阅读
2025-10-170阅读
2025-10-170阅读
2025-10-170阅读
2025-10-170阅读
2025-10-170阅读