v1.445.1507.375414 安卓漢化版
v6.41.3153 安卓免費版
v2.152 PC版
v7.287 安卓漢化版
v1.311 最新版
v8.387 最新版
v2.476 PC版
v3.922.5372 IOS版
v7.540.7080.363047 安卓版
v7.932.3274.705251 安卓版
v2.330.9478.589918 安卓版
v7.712.7239.585209 安卓漢化版
v9.736 IOS版
v3.201.836.381424 PC版
v1.695 安卓最新版
v1.175.8542.400843 安卓漢化版
v7.969.1189.903038 IOS版
v2.615.3969.928781 IOS版
v4.505.3014.921409 安卓漢化版
v3.483.6791 最新版
v2.501.5957 安卓漢化版
v9.982.5221.249723 安卓漢化版
v9.827 IOS版
v9.446.7806.694000 最新版
v9.126.6956 IOS版
v9.569 最新版
v7.652.9360.960795 安卓版
v2.754 IOS版
v4.551.1067.839342 安卓免費版
v5.688.1040.781293 最新版
v8.923.1956.525491 安卓最新版
v1.71.3934.573114 安卓版
v1.743 安卓最新版
v7.243.295.352451 安卓版
v8.145.8661 IOS版
v5.283 安卓版
v4.123 IOS版
v8.282.612 安卓免費版
v9.971.7089.906390 PC版
v6.491.9808.935231 IOS版
v2.541 安卓版
v8.724 安卓最新版
v4.786.3818.701125 安卓免費版
v5.152.4125.93838 最新版
v8.440.6302.962310 最新版
v6.941.3465 最新版
v4.857.7075.186569 IOS版
v8.560.2173.602277 IOS版
v8.80.8634.946355 PC版
v4.406.9814.933552 安卓最新版
v5.587.1379.225341 安卓免費版
v5.596.5727.29686 安卓最新版
v9.713.2 安卓漢化版
v8.630.9818 IOS版
v7.99.6569.542193 IOS版
v6.134.7951 PC版
v7.28.5260.134877 PC版
v6.280.1506 IOS版
v1.161.6814.92895 安卓最新版
v3.670 安卓漢化版
v3.359.9144 PC版
v5.334 PC版
v8.712.1778.109580 IOS版
v5.380.5433.715739 最新版
v6.820.5488.568786 安卓免費版
v8.164 安卓最新版
v4.77.1681.596529 最新版
v4.687 安卓最新版
v7.930 安卓最新版
v2.876.2224.818273 安卓免費版
v4.488.3232 安卓版
v7.906.9307.589270 安卓最新版
v5.210.1196 最新版
v6.320.4101.717444 安卓版
v4.10.9739.377866 安卓免費版
v6.337.4109.150171 安卓版
v4.256.7517 IOS版
v9.48.4528.798228 PC版
v6.82.4358 PC版
v5.164 安卓版
贝博app网页版
当地时间 10 月 15 日,就在 OpenAI 于上月底推出全新的 Sora 2 后不到三周,谷歌也端出了自家视频生成模型的最新版本——Veo 3.1。
根据谷歌官方博客公布的信息,Veo 3.1 作为今年 5 月推出的 Veo 3 的迭代更新,主打“更丰富的音频、更强的叙事控制和增强的真实感”。这次更新同步登陆了谷歌旗下的多个平台,包括面向普通创作者的 Flow 影视制作工具、供开发者使用的 Gemini API 以及企业级的 Vertex AI 平台。
从技术规格上看,Veo 3.1 延续了前代的基础架构,支持 720p 和 1080p 两种分辨率输出,帧率固定在 24fps。单次生成可以选择 4 秒、6 秒或 8 秒三种时长,通过“Extend”延展功能,用户理论上可以将视频延长至 148 秒。
音频能力的提升是 Veo 3.1 此次更新的重点之一。在之前的版本中,诸如“Frames to Video”(首尾帧插值)、“Ingredients to Video”(多图像合成)和“Extend”(场景延展)等功能都不支持原生音频生成,用户必须在后期手动添加配乐或音效。现在这些功能全部打通了音频通道,可以根据画面内容自动生成对应的环境音、对话和音效。
此次更新中,谷歌还引入了几项新的编辑功能。“Insert”功能允许用户向现有场景中添加任何元素——从写实的细节到奇幻的生物都可以,系统会自动处理阴影和场景光照,使新增内容能够自然融入。还有”Remove“让用户可以无缝移除场景中的任意对象或角色,系统会重建背景和周围环境。这些功能如果成熟,将极大地改变视频后期制作的工作流程,但目前“Remove”功能尚未在 Flow 中上线,依旧处于“即将到来”的状态中。
值得一提的是,Veo 3.1 终于开始支持竖屏 16:9 视频的生成。此前 Veo 3 只能输出横屏 720p 内容,这在以 TikTok 和 Instagram Reels 为代表的短视频时代显得有些格格不入。谷歌此前曾承诺将 Veo 的视频生成能力整合到 YouTube Shorts 中,支持竖屏格式的 Veo 3.1 或许正是为兑现这一承诺做准备。
不过,从目前的社区实测与反馈来看,除了功能上的丰富,Veo 3.1 在生成质量上貌似没有特别大的提升(毕竟 Veo 3 本身的质量其实已经不错了)。AI 工具公司 Otherside AI 的创始人 Matt Shumer 在 X 上直言不讳地表达了失望,他认为 Veo 3.1“明显不如 Sora 2”,并且“价格贵得多”。
图丨相关推文(来源:X)
有博主在详细测试后指出,Veo 3.1 在音效和对话生成上确有改进,特别是环境音的空间感更强了,但系统仍然缺乏自定义语音支持,用户无法选择特定的生成语音风格,这对需要品牌一致性的商业项目来说是个硬伤。当摄像机角度变化时,Veo 3.1 生成的人物面部特征和服装细节容易出现不连贯,需要创作者精心设计提示词来规避,而 Sora 2 在这方面的处理要自然得多。
笔者也进行了一些简单的测试,发现 Veo 3.1 在画面精致程度、物理真实性等方面维持了 Veo 3 一贯的出色表现。
例如在驾驶跑车的场景中,它的表现依旧出色。无论是车身的光泽、海边公路的光影变化,还是高速行驶带来的动态模糊,Veo 3.1 都处理得比较到位,延续了它在制作电影感、广告级大片上的优势。
在之前 Sora 2 上爆火的“AI 街头采访”这类场景里,Veo 3.1 的表现也相当不错。从我生成的视频来看,人物的口型与语音基本能对应上,表情和神态也比较自然,背景的路人活动也合情合理,没有出现明显的穿帮。
但一旦场景变得更复杂,尤其是在短视频场景下,其短板就开始暴露了...
当笔者尝试生成一个老年人在网吧打游戏的段子视频,虽然主要的内容都已经实现,但细节上的毛病不少,视频里出现的中文文字依旧是乱码。
更重要的是,作为主打功能的音频,表现很不稳定。有时生成的视频完全没声音;有时虽然有对话,但个别(中文)字词的读音明显是错的,听起来非常别扭。
有网友就评价道,Veo 的视频像是高预算制作的广告片,画面精致但总有种“太完美”的疏离感(以及偶尔的“油腻感”);Sora 2 则更像是 TikTok 或 Instagram Reels 上的素人视频,有瑕疵、有抖动,但恰恰因此显得真实可信(而且 Sora 2 那种与生俱来的、莫名的幽默感,似乎还没有其他视频生成软件能够匹敌)。这种差异在生成社交媒体内容时尤为明显——当用户需要那种手持拍摄的即兴感时,Veo 的“电影化”反而成了负担。笔者猜测,某种程度上,这可能也与 Veo 3 的训练数据来自 YouTube 而非 TikTok 等短视频平台有关。
总体来看,Veo 3.1 新万博体育:的是在工具性上的丰富,对于需要高质量商业素材、稳定视觉风格的专业用户来说,它依然是可靠的选择。但如果目标是制作社交媒体爆款,需要真人视频的随性感,市场上已经有了更合适的选项。毕竟它也只是 0.1 的小版本提升,更大幅度的提高,可能还是要在 Veo 4 上才能看到了。
参考资料:
1.https://blog.google/technology/ai/veo-updates-flow/
2.https://venturebeat.com/ai/google-releases-new-ai-video-model-veo-3-1-in-flow-and-api-what-it-means-for
3.https://x.com/mattshumer_/status/1978503288992461205
运营/排版:何晨龙
相关版本
多平台下载
查看所有0条评论>网友评论