T
traeai
登录
返回首页
Lenny's Newsletter

Gemini Omni:15分钟内用AI克隆你自己

7.2Score
Gemini Omni:15分钟内用AI克隆你自己

TL;DR · AI 摘要

使用Google Flow结合Gemini Omni模型,可在15分钟内完成从人脸扫描到生成1分钟AI数字人视频的全流程。该工具通过角色一致性功能解决多镜头连贯问题,并利用AI辅助生成分镜脚本,显著降低无视频制作经验者的创作门槛,但目前在微表情和物理规律模拟上仍存在恐怖谷效应。

核心要点

  • Google Flow配合Gemini Omni模型,支持5分钟内完成人脸扫描与AI分身创建。
  • 利用AI作为创意制片人自动生成故事板,可将1分钟宣传视频制作压缩至15分钟。
  • 当前AI视频生成在情绪表达和物理交互上存在瑕疵,需人工后期拼接修正。

结构提纲

按章节快速跳转。

  1. 通过Google Flow扫描人脸并调用Gemini Omni模型,实测15分钟内可生成完整的1分钟AI数字人宣传视频。

  2. 将AI作为创意制片人自动拆解脚本并生成分镜,解决了非专业创作者的视频叙事结构难题。

  3. 利用Character Consistency功能确保同一数字人在7个不同场景中保持面部特征与着装的高度统一。

  4. 记录了误生成静态图片而非视频的常见问题,以及通过调整提示词参数恢复视频生成的解决方案。

  5. AI克隆体在复杂情绪和物理交互上存在恐怖谷效应,必须依赖内置编辑工具进行片段拼接与节奏调整。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Gemini Omni AI分身实战
    • 核心工作流
      • Google Flow人脸扫描
      • Gemini Omni视频生成
      • AI辅助分镜设计
    • 关键技术点
      • 角色一致性控制
      • 图生视频故障修复
      • 内置剪辑拼接
    • 效果与局限
      • 15分钟产出1分钟视频
      • 零技能门槛创作
      • 情绪/物理恐怖谷效应

金句 / Highlights

值得收藏与分享的关键句。

  • 我扫描了一个二维码,克隆了我的脸,并在大约15分钟内使用Google Flow和Gemini Omni发布了一个宣传视频。

    Transcript 0:00

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 视频AI工具通过充当AI创意制片人,为没有任何视频制作技能的人释放了创造可能性。

    What you’ll learn

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 当AI克隆体无法完美呈现情绪或物理规律时会出现恐怖谷时刻,这需要手动拼接来弥补。

    What you’ll learn

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 角色一致性功能对于生成多个具有相同化身且不发生视觉漂移的视频场景至关重要。

    What you’ll learn

    ⬇︎ 下载 PNG𝕏 分享到 X
#Gemini Omni#Google Flow#AI视频生成#数字分身#AIGC工作流
打开原文

标题:Gemini Omni:15 分钟内用 AI 克隆你自己

URL 来源:https://www.lennysnewsletter.com/p/gemini-omni-clone-yourself-with-ai

发布时间:2026-06-03T12:04:09+00:00

Markdown 内容:

Gemini Omni:15 分钟内用 AI 克隆你自己

视频 4

播放速度

字幕

分享文章

在当前时间点分享

从 0:00 开始分享

0:00

/

文字记录

0:00

Claire Vo

今天我要做一期非常特别的节目,我将为自己创建一个视频数字分身,并在大约 15 分钟内制作出一个长达一分钟的完整视频,主角正是你们最爱的播客主持人——Claire Vo。让我们开始吧!本期节目由……赞助播出。

0:17

Merge 为您呈现。构建 AI 产品是一回事,真正的挑战在于其周边的一切:连接团队和客户依赖的工具、让智能体(Agent)在拥有适当权限的情况下执行操作,以及在上线后保持系统的可靠性和成本效益。大多数团队最终只能自己拼凑这些基础设施。

0:38

因此,你无法专注于真正关心的产品,反而被集成、权限管理、路由以及底层的所有基础设施所牵绊。Merge 是面向生产级 AI 的基础设施层。它连接数千种工具,为智能体提供在其中安全操作的途径,并优化模型路由和支出,而无需您自行构建或维护任何设施。

1:00

OpenAI、Dropbox 和 Ramp 已经在使用 Merge 来快速迭代并正确构建 AI。访问 merge.dev/howiai 即可免费开始构建。这期《How I AI》将是一场冒险,因为老实说,我并不确定这次尝试能否成功。

1:19

我将重新体验几周前曾简要介绍过的产品——Google Flow,以及全新的 Gemini Omni 视频生成模型。我将竭尽全力创建一个自己的 AI 数字分身,然后利用 AI 对其进行动画驱动,或者更准确地说,以电影级的方式进行创作。这就是 Google Flow。

Gemini Omni:15 分钟内用 AI 克隆你自己

🎙️ 现场测试 Google 的 Gemini Omni 数字分身功能——我扫描了一个二维码,克隆了自己的面孔,并发布了一支宣传短片

Claire Vo

2026 年 6 月 3 日

文字记录

视频 5

在这期实验性节目中,我记录了自己使用 Google Flow 和全新 Gemini Omni 视频生成模型实时创建 AI 数字分身的尝试。我演示了整个过程——从用手机扫描面部到为播客生成完整的 1 分钟宣传视频,全程仅耗时约 15 分钟。

在 [YouTube](https://youtu.be/UNZczH0gpHc)、[Spotify](https://open.spotify.com/episode/6kCCHaEAEHT2Q1iyCedszz) 或 [Apple Podcasts](https://podcasts.apple.com/us/podcast/gemini-omni-clone-yourself-with-ai-in-under-15-minutes/id1809663079?i=1000770958331) 上收听或观看

您将了解到:

  1. 如何在 5 分钟内使用 Google Flow 创建 AI 数字分身
  1. 为什么视频 AI 工具能为毫无视频制作经验的人开启创意大门
  1. 使用 AI 作为您的创意制作人,逐步生成完整故事板的流程
  1. 如何利用角色一致性功能,使用同一个数字分身生成多个视频场景
  1. 当您的 AI 克隆体在情感表达或物理规律上表现不够完美时,您会遇到的“恐怖谷”时刻
  1. 如何使用内置编辑工具将 AI 生成的场景拼接成完整视频
  • * *

本期节目赞助商:

图片 5

[Merge](https://www.merge.dev/howiai)——生产级 AI 的连接基础设施

[Jira Product Discovery](https://atlassian.com/howiai)——基于洞察确定优先级,充满信心地构建产品

本期节目涵盖内容:

(00:00) Google Flow 和 Gemini Omni 入门

(01:38) 数字分身创建流程:扫描与照片采集

(02:55) 使用 Flow 构思宣传视频故事板

(06:59) 使用数字分身生成第一个视频场景

(08:41) 故障排除:意外生成了图像而非视频

(09:32) 生成完整视频所需的全部七个场景

(11:37) 审查数字分身视频效果

(13:13) 在浏览器编辑器中拼接视频

(14:32) 完整的《How I AI》宣传视频展示

(15:32) 哪些方法有效,哪些无效

(19:04) 总结思考

提及的工具:

• Google Flow:https://labs.google/fx/tools/flow

• Gemini Omni:https://gemini.google/overview/video-generation/

• Veo 3:https://deepmind.google/technologies/veo/

关注 Claire Vo:

ChatPRD:https://www.chatprd.ai/

个人网站:https://clairevo.com/

LinkedIn:https://www.linkedin.com/in/clairevo/

X:https://x.com/clairevo

https://penname.co/ 制作与推广。如需咨询播客赞助事宜,请发送邮件至 jordan@penname.co。

4 个赞

[](https://substack.com/note/p-199768832/restacks?utm_source=substack&utm_content=facepile-restacks)

#### 关于本视频的讨论

评论 转发

图片 10:用户头像

我的 AI 用法

《我的 AI 用法》由 Claire Vo 主持,专为那些希望了解如何真正利用这些神奇新工具来提升工作质量和效率的人而设。在每一期节目中,嘉宾都会分享他们在工作或生活中使用 AI 的具体、实用且高效的方法。每期节目时长约 30 分钟,包含实时屏幕共享,以及你可以立即复用的技巧、窍门和工作流。如果你想揭开 AI 的神秘面纱,掌握在这个新时代蓬勃发展所需的技能,那么这档播客正是为你准备的。

《我的 AI 用法》由 Claire Vo 主持,专为那些希望了解如何真正利用这些神奇新工具来提升工作质量和效率的人而设。在每一期节目中,嘉宾都会分享他们在工作或生活中使用 AI 的具体、实用且高效的方法。每期节目时长约 30 分钟,包含实时屏幕共享,以及你可以立即复用的技巧、窍门和工作流。如果你想揭开 AI 的神秘面纱,掌握在这个新时代蓬勃发展所需的技能,那么这档播客正是为你准备的。

收听平台

Substack App

Apple Podcasts

Spotify

YouTube

Overcast

Pocket Casts

RSS Feed

本期嘉宾

Claire Vo

撰写 Claire’s Substack订阅

近期节目

图片 13

零技术基础开发 iPhone 应用 | Bryce Rattner Keithley

6月1日•Claire Vo

图片 14

Claude Opus 4.8 来了,真如传闻般强大吗?

5月28日•Claire Vo

图片 15

让你睡觉时也能工作的 Codex 功能

5月27日•Claire Vo

图片 16

Claude Cowork 背后的工程师如何使用 Claude | Felix Rieseberg(Anthropic)

5月25日•Claire Vo

图片 17

Google I/O 2026 发布了什么(首日 30 分钟回顾)

5月20日•Claire Vo

图片 18

HTML 是新的 Markdown:Anthropic 工程师如何用 Claude Code 构建产品 | Thariq Shihipar

5月18日•Claire Vo

图片 19

规格驱动开发:Notion 的 AI 工程工作流 | Ryan Nystrom

5月11日•Claire Vo

想听更多内容?

AI 可能会生成不准确的信息,请核实重要内容