Gemini Omni 已在 Gemini App 上线
Google 已公开介绍 Gemini Omni Flash,并将其定位为在 Gemini App 中使用的全模态视频生成能力,核心表达是 any input to video。
这一节点意味着页面内容应从发布前的前瞻介绍,转向入口、会员、使用限制、教程和代充值咨询等更实际的信息。
核心要点
- 支持文本、图片、音频与视频输入
- 面向 Google AI Plus、Pro 与 Ultra 用户开放
- 对话式编辑和原生音频成为重点
用一条更可靠的时间线,串起 Veo、Gemini、Flow、Google AI 订阅和 Gemini Omni 上线,避免把传闻、概念和正式开放时间混在一起。
Google 已公开介绍 Gemini Omni Flash,并将其定位为在 Gemini App 中使用的全模态视频生成能力,核心表达是 any input to video。
这一节点意味着页面内容应从发布前的前瞻介绍,转向入口、会员、使用限制、教程和代充值咨询等更实际的信息。
在 2024 年的 Google I/O 相关公开资料里,Veo 首次成为重点关键词之一,Google 开始将视频生成能力与 Gemini、Imagen 等模型放在统一叙事中介绍。
这一阶段更像能力展示期。对普通用户而言,理解产品关系、公开方向和核心能力,比过早关注具体交付形式更重要。
2025 年的公开信息显示,Gemini 高阶会员与 Whisk 先后承接了 Veo 2 的体验入口,随后 Google 又推出 Flow,把镜头叙事、分镜和创作流程进一步产品化。
这意味着用户在理解 Gemini 视频生态时,不能只看模型名称,还要同时理解入口、使用人群、创作流程与不同工具之间的关系。
后续官方资料更频繁地强调 native audio、multi-image reference、video-to-video 和 conversational editing,这说明产品方向已经从“能不能生成”转向“能不能持续编辑和稳定生产内容”。
这也说明 Gemini 视频生态正在从演示型能力走向更强调创作者效率、全模态输入和持续生产的阶段。