贝博app网页版

电脑版下载

98922
3

贝博app网页版截图J8B1X4R6M2L9T5Q3W7PZ

内容详情

贝博app网页版

当地时间 10 月 15 日，就在 OpenAI 于上月底推出全新的 Sora 2 后不到三周，谷歌也端出了自家视频生成模型的最新版本——Veo 3.1。

根据谷歌官方博客公布的信息，Veo 3.1 作为今年 5 月推出的 Veo 3 的迭代更新，主打“更丰富的音频、更强的叙事控制和增强的真实感”。这次更新同步登陆了谷歌旗下的多个平台，包括面向普通创作者的 Flow 影视制作工具、供开发者使用的 Gemini API 以及企业级的 Vertex AI 平台。

从技术规格上看，Veo 3.1 延续了前代的基础架构，支持 720p 和 1080p 两种分辨率输出，帧率固定在 24fps。单次生成可以选择 4 秒、6 秒或 8 秒三种时长，通过“Extend”延展功能，用户理论上可以将视频延长至 148 秒。

音频能力的提升是 Veo 3.1 此次更新的重点之一。在之前的版本中，诸如“Frames to Video”（首尾帧插值）、“Ingredients to Video”（多图像合成）和“Extend”（场景延展）等功能都不支持原生音频生成，用户必须在后期手动添加配乐或音效。现在这些功能全部打通了音频通道，可以根据画面内容自动生成对应的环境音、对话和音效。

此次更新中，谷歌还引入了几项新的编辑功能。“Insert”功能允许用户向现有场景中添加任何元素——从写实的细节到奇幻的生物都可以，系统会自动处理阴影和场景光照，使新增内容能够自然融入。还有”Remove“让用户可以无缝移除场景中的任意对象或角色，系统会重建背景和周围环境。这些功能如果成熟，将极大地改变视频后期制作的工作流程，但目前“Remove”功能尚未在 Flow 中上线，依旧处于“即将到来”的状态中。

值得一提的是，Veo 3.1 终于开始支持竖屏 16:9 视频的生成。此前 Veo 3 只能输出横屏 720p 内容，这在以 TikTok 和 Instagram Reels 为代表的短视频时代显得有些格格不入。谷歌此前曾承诺将 Veo 的视频生成能力整合到 YouTube Shorts 中，支持竖屏格式的 Veo 3.1 或许正是为兑现这一承诺做准备。

不过，从目前的社区实测与反馈来看，除了功能上的丰富，Veo 3.1 在生成质量上貌似没有特别大的提升（毕竟 Veo 3 本身的质量其实已经不错了）。AI 工具公司 Otherside AI 的创始人 Matt Shumer 在 X 上直言不讳地表达了失望，他认为 Veo 3.1“明显不如 Sora 2”，并且“价格贵得多”。

图丨相关推文（来源：X）

有博主在详细测试后指出，Veo 3.1 在音效和对话生成上确有改进，特别是环境音的空间感更强了，但系统仍然缺乏自定义语音支持，用户无法选择特定的生成语音风格，这对需要品牌一致性的商业项目来说是个硬伤。当摄像机角度变化时，Veo 3.1 生成的人物面部特征和服装细节容易出现不连贯，需要创作者精心设计提示词来规避，而 Sora 2 在这方面的处理要自然得多。

笔者也进行了一些简单的测试，发现 Veo 3.1 在画面精致程度、物理真实性等方面维持了 Veo 3 一贯的出色表现。

例如在驾驶跑车的场景中，它的表现依旧出色。无论是车身的光泽、海边公路的光影变化，还是高速行驶带来的动态模糊，Veo 3.1 都处理得比较到位，延续了它在制作电影感、广告级大片上的优势。

在之前 Sora 2 上爆火的“AI 街头采访”这类场景里，Veo 3.1 的表现也相当不错。从我生成的视频来看，人物的口型与语音基本能对应上，表情和神态也比较自然，背景的路人活动也合情合理，没有出现明显的穿帮。

但一旦场景变得更复杂，尤其是在短视频场景下，其短板就开始暴露了...

当笔者尝试生成一个老年人在网吧打游戏的段子视频，虽然主要的内容都已经实现，但细节上的毛病不少，视频里出现的中文文字依旧是乱码。

更重要的是，作为主打功能的音频，表现很不稳定。有时生成的视频完全没声音；有时虽然有对话，但个别（中文）字词的读音明显是错的，听起来非常别扭。

有网友就评价道，Veo 的视频像是高预算制作的广告片，画面精致但总有种“太完美”的疏离感（以及偶尔的“油腻感”）；Sora 2 则更像是 TikTok 或 Instagram Reels 上的素人视频，有瑕疵、有抖动，但恰恰因此显得真实可信（而且 Sora 2 那种与生俱来的、莫名的幽默感，似乎还没有其他视频生成软件能够匹敌）。这种差异在生成社交媒体内容时尤为明显——当用户需要那种手持拍摄的即兴感时，Veo 的“电影化”反而成了负担。笔者猜测，某种程度上，这可能也与 Veo 3 的训练数据来自 YouTube 而非 TikTok 等短视频平台有关。

总体来看，Veo 3.1 新万博体育：的是在工具性上的丰富，对于需要高质量商业素材、稳定视觉风格的专业用户来说，它依然是可靠的选择。但如果目标是制作社交媒体爆款，需要真人视频的随性感，市场上已经有了更合适的选项。毕竟它也只是 0.1 的小版本提升，更大幅度的提高，可能还是要在 Veo 4 上才能看到了。

参考资料：

1.https://blog.google/technology/ai/veo-updates-flow/

2.https://venturebeat.com/ai/google-releases-new-ai-video-model-veo-3-1-in-flow-and-api-what-it-means-for

3.https://x.com/mattshumer_/status/1978503288992461205

运营/排版：何晨龙