扩散模型在视频生成中的应用
文章深入解析了扩散模型在视频生成中的应用,探讨了其核心机制、架构设计和最新进展。
入选理由:视频生成比图像生成更复杂,需要更强的时间一致性
概念
别名:扩散模型
一类基于随机微分方程(SDE)的生成模型,通过逐步去噪从噪声分布生成数据。
已跟踪 3 条高相关材料
最近变化
2026-05-26 · 提出三种可解析求解的wavelet-based score模型:独立基线、带通(band-tide)、局部耦合模型
为什么值得关注
Diffusion Models 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
Diffusion Models for Video Generation
Lil'Log · 8.5 分
文章深入解析了扩散模型在视频生成中的应用,探讨了其核心机制、架构设计和最新进展。
Where the Score Lives: What Wavelets Reveal About Diffusion Models
Microsoft Research · 7.8 分
波函数(wavelet)参数化可解释地建模扩散模型的得分函数(score),揭示局部交互对去噪性能影响最强,且在高分辨率下波函数优势显著;该框架非为超越训练模型,而是作为理论探针理解泛化机制。
Continuous Latent Diffusion Language Model paper: https://t.co/qgUyX7D1Mr
AK(@_akhaliq) · 7.2 分
Continuous Latent Diffusion Language Model(CLDLM)通过连续潜在空间建模,实现了更高效的语言生成与推理,相比传统离散扩散模型在生成质量与速度上均有显著提升,尤其适用于高分辨率文本生成任务。
已收录 3 条与 Diffusion Models 相关的内容,按评分排序。
文章深入解析了扩散模型在视频生成中的应用,探讨了其核心机制、架构设计和最新进展。
入选理由:视频生成比图像生成更复杂,需要更强的时间一致性
小波参数化可解释建模扩散模型得分函数,揭示局部交互对去噪性能影响最强,高分辨率下小波优势显著;该框架是理论探针,非为超越训练模型。
入选理由:提出三种可解析求解的wavelet-based score模型:独立基线、带通(band-tide)、局部耦合模型
连续潜在扩散语言模型(CLDLM)通过连续潜空间建模,显著提升生成速度与质量,适用于高分辨率文本生成。
入选理由:CLDLM 使用连续潜在变量,使语言生成过程更平滑,减少离散化误差。