Gemini

Gemini Omni AI 视频工作室

使用 Google Gemini Omni Flash 创建与编辑 AI 视频。先创建可复用角色与音色,再用文本、图片、源视频、角色 ID 和音频 ID 组合多模态生成。

模块
0/20000
参考图片(0/7)

最多 7 个图片位(视频占 2 位,每个角色 ID 占 1 位)

源视频(可选)
可选
可选
分辨率
时长

预估费用:$2.25

画幅比
可选
所需积分:225

生成结果

视频生成通常需要 1–3 分钟。 请勿关闭此页面

对话式场景变换

演示片段来自 Google I/O 2026 Gemini Omni 官方展示

官方案例

Google Gemini Omni 官方演示

以下片段来自 Google I/O 2026 Gemini Omni 官方展示 — 对话式视频编辑、参考图风格引导,以及语音驱动的多模态生成。

对话式场景变换

从真实素材出发,逐步用语言重塑环境 — 泡泡结构变为结构泡沫,多轮编辑后画面仍保持连贯。

为什么选择 Gemini Omni

Google 多模态视频创作模型

Gemini Omni Flash 将 Gemini 推理能力与生成式视频结合,支持文本、图片、视频、角色与语音输入。

多模态视频生成

通过提示词及最多 7 张参考图、1 段源视频、1 个音频 ID、3 个角色 ID,生成 4–10 秒、720P/1080P/4K 视频。

对话式视频编辑

上传源视频,用自然语言变换场景、动作、机位与特效,同时保持画面连贯。

可复用角色资产

通过人像与描述创建稳定的角色 ID,并在后续 Gemini Omni 视频中复用,保持角色一致。

自定义音色配置

基于预设音色及可选音色描述、示例对白,生成可复用的音频 ID。

真实场景逻辑

Gemini Omni 将视觉创作与物理、叙事和上下文结合,输出更有意图、更少随机感。

透明按量计费

定价按 Kie.ai 官方美元标价 ×3(100 积分=1 美元)。视频 4 秒 720P 起 135 积分,角色 20 积分,音频 15 积分。

使用方法

三步开始创作

在同一工作室中使用 Video、Character、Audio 三个标签页

1

创建可复用资产

在 Character 标签页用人像创建角色 ID,或在 Audio 标签页用预设音色与描述创建音频 ID。

2

编写视频提示词

在 Video 标签页描述场景,添加参考图或源视频,并按需粘贴角色/音频 ID。

3

生成并下载

选择分辨率、时长与画幅比后生成。积分在提交时预扣;视频任务失败会自动退款。

常见问题

Gemini Omni 常见问题

关于本平台 Gemini Omni 的常见问题

1

视频价格如何计算?

无源视频:720P/1080P 为 4/6/8/10 秒分别 135/180/225/270 积分;4K 为 315/360/405/450 积分。有源视频:720P/1080P 每次 360 积分,4K 每次 540 积分。均为 Kie.ai 美元标价 ×3(100 积分=1 美元)。

2

角色和音频多少钱?

创建 1 个可复用角色 ID:20 积分。创建 1 个可复用音色配置:15 积分。均为固定单次费用,按 Kie 成本 3 倍定价。

3

Gemini Omni Video 支持哪些输入?

必填提示词,可选最多 7 个参考图位(视频占 2 位、每个角色 ID 占 1 位)、1 段裁剪源视频、最多 3 个角色 ID、1 个音频 ID。

4

可以编辑已有素材吗?

可以。在 Video 标签页上传源视频。有视频输入时,输出时长由模型自动决定,时长选项不可用。

5

支持哪些分辨率与时长?

分辨率:720p、1080p、4k。无源视频时可选 4/6/8/10 秒。画幅比:16:9 或 9:16。

6

生成需要多久?

大多数视频任务 1–3 分钟完成。角色与音频资产创建通常更快,并立即返回 ID。

立即开始

开始使用 Gemini Omni 创作

在同一页面创建角色、音色与电影级 AI 视频。