Gemini Omni AI 视频工作室
使用 Google Gemini Omni Flash 创建与编辑 AI 视频。先创建可复用角色与音色,再用文本、图片、源视频、角色 ID 和音频 ID 组合多模态生成。
最多 7 个图片位(视频占 2 位,每个角色 ID 占 1 位)
预估费用:$2.25
生成结果
视频生成通常需要 1–3 分钟。 请勿关闭此页面
对话式场景变换
演示片段来自 Google I/O 2026 Gemini Omni 官方展示
官方案例
Google Gemini Omni 官方演示
以下片段来自 Google I/O 2026 Gemini Omni 官方展示 — 对话式视频编辑、参考图风格引导,以及语音驱动的多模态生成。
对话式场景变换
从真实素材出发,逐步用语言重塑环境 — 泡泡结构变为结构泡沫,多轮编辑后画面仍保持连贯。
为什么选择 Gemini Omni
Google 多模态视频创作模型
Gemini Omni Flash 将 Gemini 推理能力与生成式视频结合,支持文本、图片、视频、角色与语音输入。
多模态视频生成
通过提示词及最多 7 张参考图、1 段源视频、1 个音频 ID、3 个角色 ID,生成 4–10 秒、720P/1080P/4K 视频。
对话式视频编辑
上传源视频,用自然语言变换场景、动作、机位与特效,同时保持画面连贯。
可复用角色资产
通过人像与描述创建稳定的角色 ID,并在后续 Gemini Omni 视频中复用,保持角色一致。
自定义音色配置
基于预设音色及可选音色描述、示例对白,生成可复用的音频 ID。
真实场景逻辑
Gemini Omni 将视觉创作与物理、叙事和上下文结合,输出更有意图、更少随机感。
透明按量计费
定价按 Kie.ai 官方美元标价 ×3(100 积分=1 美元)。视频 4 秒 720P 起 135 积分,角色 20 积分,音频 15 积分。
使用方法
三步开始创作
在同一工作室中使用 Video、Character、Audio 三个标签页
创建可复用资产
在 Character 标签页用人像创建角色 ID,或在 Audio 标签页用预设音色与描述创建音频 ID。
编写视频提示词
在 Video 标签页描述场景,添加参考图或源视频,并按需粘贴角色/音频 ID。
生成并下载
选择分辨率、时长与画幅比后生成。积分在提交时预扣;视频任务失败会自动退款。
常见问题
Gemini Omni 常见问题
关于本平台 Gemini Omni 的常见问题
视频价格如何计算?
无源视频:720P/1080P 为 4/6/8/10 秒分别 135/180/225/270 积分;4K 为 315/360/405/450 积分。有源视频:720P/1080P 每次 360 积分,4K 每次 540 积分。均为 Kie.ai 美元标价 ×3(100 积分=1 美元)。
角色和音频多少钱?
创建 1 个可复用角色 ID:20 积分。创建 1 个可复用音色配置:15 积分。均为固定单次费用,按 Kie 成本 3 倍定价。
Gemini Omni Video 支持哪些输入?
必填提示词,可选最多 7 个参考图位(视频占 2 位、每个角色 ID 占 1 位)、1 段裁剪源视频、最多 3 个角色 ID、1 个音频 ID。
可以编辑已有素材吗?
可以。在 Video 标签页上传源视频。有视频输入时,输出时长由模型自动决定,时长选项不可用。
支持哪些分辨率与时长?
分辨率:720p、1080p、4k。无源视频时可选 4/6/8/10 秒。画幅比:16:9 或 9:16。
生成需要多久?
大多数视频任务 1–3 分钟完成。角色与音频资产创建通常更快,并立即返回 ID。