近年来,人工智能技术迅猛发展,尤其在视频生成和动画领域取得突破性进展。谷歌作为科技领军企业,持续推动人工智能技术落地,近日正式发布了全新Veo 2 AI视频模型,现已对Gemini高级用户开放,使付费用户能够创造高质量的AI生成视频。Veo 2不仅具备强大的画面生成能力,还能够理解现实生活中的物理规律、捕捉人类情感的细微变化,并实现多样化的镜头表现,如低角度镜头、特写镜头和浅景深效果,为用户带来更为丰富和真实的视频体验。 Veo 2最初于去年12月发布,凭借其先进的技术吸引了众多关注。尽管它能生成长达数分钟、4K分辨率的视频,但目前在Gemini高级用户服务中受到限制,仅支持720p分辨率的8秒短视频生成。这种时长限制可能是为了平衡服务器负载和用户体验,同时也反映了当前AI视频生成技术在计算资源和生成速度方面的限制。
用户可在谷歌聊天机器人中从模型下拉菜单选择Veo 2,输入详细的视频描述,系统便能根据指令生成相应内容。谷歌鼓励用户撰写简短故事作为提示,借助AI赋能实现视频创作。虽然短视频时长有限,但通过精心的策划和创意设计,仍能够产出具有吸引力和表达力的视觉内容。谷歌采用了提醒机制,当用户接近每月生成视频的限制时,系统会发出提示。尽管谷歌未公开具体配额标准,这种做法对于管理资源和维护平台稳定运行有积极意义,但用户期望获得更多透明度,以更好地规划创作策略。 除了Gemini高级用户,Google One AI Premium订阅者也能通过Whisk平台访问Veo 2模型。
Whisk是谷歌旗下的AI媒体生成工具,支持用户生成图像和动画。新推出的Whisk Animate功能利用Veo 2技术将静态图像进行动画化处理,用户可以先生成心仪的图片,然后添加动画指令让图片“活”起来。这一功能不仅支持AI生成的图像,用户上传的非AI创作图片也能进行动态化,有助于丰富多媒体内容的表现形式。 谷歌在公开演示中展示了Veo 2的多种应用场景,例如将不同风格的男子吃冰淇淋动画化,包括3D艺术、像素风格、插画和写实渲染等。不过,当前模型仍存在明显的AI视频生成痕迹,比如图像细节上的瑕疵、元素突变及动作连续性的不足。举例来说,一些动画中冰淇淋可能未被真实咬食,或动作与场景不完全契合。
尽管如此,这些短片为创作者带来了新的灵感来源,展示了AI技术在视觉创作中的潜力和不足。 Veo 2的出现为各类用户打开了新的创作窗口,尤其适合内容创作者、社交媒体运营人员以及希望快速制作短视频的用户。它简化了视频制作流程,降低了技术门槛,让普通用户也能利用AI创造具备沉浸感的故事和情绪表达。此外,Whisk Animate的推出,拓展了静态内容的表现力,为数字营销、广告设计、教育培训等领域提供了创新解决方案。 然而,Veo 2的定价也成为一部分用户关注的焦点。每月20美元的订阅费用对于部分爱好者来说或许不算昂贵,但在功能受限且月度生成数不公开的背景下,用户希望看到更具性价比的使用方案。
未来若谷歌能持续优化模型性能,提升视频时长和分辨率,扩大使用配额,同时增强透明度和客户服务体验,将进一步巩固其市场竞争力。 对于AI视频生成技术而言,Veo 2代表了谷歌在多模态内容创作领域的重要里程碑。它不仅展示了AI对现实世界物理及情绪理解的进步,还体现了人机协作创作的新趋势。随着技术不断成熟,更多智能视频解决方案将涌现,为影视制作、游戏开发、虚拟现实等行业带来深刻变革。回顾过去几年,AI视觉生成从静态图像扩展到动态视频,标志着人工智能在创意产业的渗透日趋深入。 谷歌的策略是将高端模型融合进订阅体系,通过优质服务吸引用户,形成可持续的商业生态。
Gemini和Google One AI Premium的整合让用户在一个平台内享受到多样化的AI工具,有助于提升整体用户粘性和产品体验。未来,我们或将见证更多新功能如实时互动视频生成、个性化视频定制等在这一生态中的诞生。 总体来看,Veo 2的发布及其在Gemini高级用户和Google One AI Premium用户中的推广,标志着谷歌在AI视频生成领域取得了关键进展。它不仅赋能付费用户以更简单高效的方式创作视频内容,也为整个行业的创新提供了宝贵参考。尽管存在使用限制和技术不足,Veo 2无疑是人工智能应用迈向成熟的重要一步。随着AI技术持续迭代,视频创作将变得更加智能、便捷,激发更多创意灵感,推动数字媒体生态进入新时代。
。