首页 > 汽车笔记 > 汽车笔记 > Sora最强对手登场,谷歌Veo 3.1正式发布,主打电影级画质与精准可控

Sora最强对手登场,谷歌Veo 3.1正式发布,主打电影级画质与精准可控

发布时间:2025-10-17 09:57:18来源: 18811119908

10月16日消息,在OpenAI的Sora引发全网热议之际,谷歌正式发布了新一代AI视频生成模型Veo 3.1,试图在这场AI视频大战中扳回一城。

 

美国时间周三,谷歌宣布这款旗舰级视频生成工具已面向付费Gemini用户开放,同时支持Flow电影制作平台、Gemini API及Vertex AI平台调用。

谷歌此次更新为其AI视频生成器带来了对象级编辑(Object-level Editing)、多图像场景控制、首尾帧过渡和更丰富的背景音频等功能,让用户在处理每次提示时都能获得更强的创作控制力和电影级画质。

如果说Sora 2是AI界的“抖音”,以快速便捷取胜,那么Veo 3.1就是“奈飞”,它更注重品质、沉浸感与专业控制。这或许标志着迄今为止最实用的AI视频生成工具已经到来。

精准掌控:从“接受结果”到“塑造愿景”

与Sora 2的“生成即所得”不同,Veo 3.1让用户能够精细调整每一个细节。谷歌通过提升分辨率和加速生成,真正将电影制作的能力交到了用户手中。其核心突破体现在:

· 对象编辑:可在任何场景中添加或移除物体,如同视频版的“智能填充”(Content-Aware Fill)。

· 场景延伸:可将视频突破原始结尾,并保留环境音效,实现无缝叙事延续。

· 智能过渡:只需提供首尾两张静态图像,即可生成电影级的开场或结尾转场。

· 多图引导:通过多张参考图像精准控制角色、物件与场景氛围。

对象级编辑:重构叙事的新维度

对象级精准编辑堪称本次最亮眼的升级。用户现在可以像专业剪辑师一样,通过添加或移除物体、人物甚至景观来改变故事走向。

“插入物体”功能现已开放,“移除物体”功能也即将推出。这些升级让场景编辑变得直观简单,无论是让森林中凭空出现猫头鹰与树木,还是将汽车替换为宇宙飞船,都只需简单操作。任何不协调的元素都能通过指向和提示轻松消除。

更令人印象深刻的是,Veo 3.1能够自动处理场景光照与阴影,确保所有编辑都自然融入画面。

四大独门利器:Veo的差异化优势

Veo的真正竞争力在于其模块化创意工具集,让AI成为专业视频工作流的一部分:

· 素材转视频(Ingredients to Video):输入多张参考图像,Veo将其融合成连贯场景,用户全程掌控风格与元素。

· 首尾帧过渡(First & Last Frame):提供首尾静态图,模型便可自动生成流畅转场,完美呈现情绪转换、瞬间移动等效果。

· 场景延伸(Scene Extension):可延续现有视频的叙事,并保持视觉风格与背景音频的连贯性。

· 物体插删(Insert/Remove Object):实现精细化的世界构建与故事讲述,无论是清理画面还是添加新元素皆可。

音频升级:沉浸式叙事新体验

除了画质提升,Veo 3.1在音频方面也有重大突破。新模型提供更丰富的背景音效和更强的叙事理解能力,能够更自然地遵循电影叙事结构。从此,场景能够承载情绪、节奏与基调。

相比之下,Sora仍在节奏把控和语音控制方面存在局限。而Veo 3.1承诺能够理解上下文语境,如同用户的私人制片助理般协助场景创作。

透明定价,成本可控

目前Veo 3.1处于预览阶段,仅面向Gemini API付费用户开放。计费标准延续前代:

· 标准版:每秒视频0.40美元

· Fast版:每秒视频0.15美元

Veo 3.1采用按需计费模式,仅对成功生成的视频收费,无免费额度。这种透明的定价策略便于企业团队进行预算管理。

该模型支持720p/1080p分辨率输出,帧率为24fps。基础时长为4-8秒,通过“延伸”功能最长可达148秒。

特别值得一提的是,企业用户上传产品图像或品牌风格参考后,系统能够精准复现并保持这些视觉元素在不同生成内容中的一致性,这对零售、广告等行业的内容标准化生产极具价值。

全面集成到谷歌生态系统

更新后的视频AI模型将全面接入谷歌生态系统。用户既可通过Gemini应用使用Veo 3.1及其Fast版本进行创作,开发者也能通过Vertex AI平台和Gemini API调用该模型。

今年初亮相的Veo已引发行业震动,在Veo 2发布仅数月后,新一代模型就在视频质量上实现了跨越式进步。显然,YouTube海量的视频资源为AI模型训练提供了得天独厚的条件,如今谷歌又携一系列新功能快步推出了Veo 3.1。

谷歌表示,Veo 3.1对提示词的理解更加精准,不仅能生成更优质的视频内容,还能减少无效计算消耗。作为Veo 3标志性功能的音频系统也得到进一步优化。虽然前代模型的文本转视频功能仅限于生成720p横屏视频,但为适应互联网上日益增长的竖屏内容需求,Veo 3.1已同时支持横屏与16:9竖屏视频生成

此前谷歌曾承诺将把Veo视频工具整合至YouTube Shorts中,这类短视频与TikTok一样采用竖屏格式。Veo 3.1的发布无疑为这一承诺的落地铺平了道路。可以预见,符合平台格式要求的Veo生成视频未来在TikTok上的出现频率也将大幅提升。

此举也让谷歌在与老对手OpenAI的竞争中保持了火力,后者近期刚在移动端应用中集成了新版视频AI。

汽车笔记更多>>

6999起三星S26系列发布丨硬件防窥屏 安卓机皇? 三星研发部门负责人解释Galaxy S26系列手机未原生集成磁吸功能 魅族科技宣布战略转型,将暂停国内手机新产品自研硬件项目 魅族第一个停更!内存涨价潮下手机厂商承压 华为清华联手,研发28nm存内计算芯片 又一国产全模态视频大模型杀入Artificial Analysis榜单Top 2 苹果警告旧版Home家庭架构今起停用 OPPO K14x 5G手机海外发布,配置与售价全曝光 华为nova16系列再次确认:三芯分层+方形前摄革新,定价诚意拉满 OPPO Find X10系列配置曝光:2nm芯、双2亿主摄,堆料不讲武德 ColorOS再次发力:二月体验升级大揭秘,覆盖众多机型! 小米17 Max再次被确认:取消副屏和加大电池,两亿像素也没跑了 iQOO Z11系列突然入网:90W+9000mAh,还有LCD屏幕! 三星Galaxy S26系列完整规格曝光,预计2月25日正式发布 京东高端手机Top10,华为Mate 80六连冠,iQOO 15 Ultra大亮 CounterPoint报告2025全球手机存量:8大品牌破2亿 分析师:苹果iPhone 18 Pro系列起售价将与前代持平 苹果即将移除iTunes愿望清单功能,提醒用户迁移内容 苹果预计本月推出搭载M5 Pro/Max芯片的新款MacBook Pro笔记本电脑 联想拯救者Y700 2026款小平板配置曝光:骁龙8E5处理器配8.8英寸3K LCD屏 SK海力士、闪迪:2025Q4 NAND闪存平均单价上涨30%以上 PGYTech蒲公英RetroVa摄影套件亮相,适配苹果iPhone多机型 Mate 80卖爆!华为拿到1月中国手机市场份额第一名:份额提升至18.6% 人民日报头版力挺,OPPO折叠屏技术引苹果学习! 《后厂村AI派》正式启动:Pitch Your Next Move! 中途退学的艺术生,开发Web 3D项目,周下载量破400万 印奇挂帅后,阶跃星辰最强开源模型登场!六大国产AI芯片已适配 Moltbook漏洞大到可以冒充Karpathy发帖,黑客都急了 苹果妙控键盘固件更新,覆盖M4/M5款iPad Pro与M3 Air机型 昔日HDD巨头Conner重生回归!进军外置存储与手机周边