📁 Generative Models · 生成模型
生成模型 · 让机器从无到有造内容 · VAE / GAN / Flow / Diffusion
判别模型学的是”怎么区分”——给一张图,回答它是猫还是狗,只关心类别之间那条边界。生成模型反过来,学的是”怎么造”——它要学会数据本身的分布,学到之后能凭空生成训练集里从不存在的全新样本。今天所有的 AI 画图、AI 生成视频、AI 配音,底座都是生成模型。
四类主流方法,各自用不同的思路逼近”真实数据分布”:
| 方法 | 核心思路 | 一句话直觉 |
|---|---|---|
| VAE 变分自编码器 | 编码到隐空间再解码还原 | 把图压成一串数字,再从数字里采样造新图 |
| GAN 生成对抗网络 | 生成器与判别器互相博弈 | 造假的和打假的左右互搏,直到以假乱真 |
| Flow 归一化流 | 可逆变换连接简单分布与真实分布 | 用数学上可逆的变换把高斯噪声”捏”成图像 |
| Diffusion 扩散模型 | 加噪再学习逐步去噪 | 把图揉成雪花,再训练网络一步步还原 |
其中扩散模型是当下绝对主角——Stable Diffusion、Midjourney、Sora 全建立在它之上。理解这个版块,就是理解”生成式 AI 引擎”到底怎么转。
TODO
- 生成模型 vs 判别模型:到底差在哪
- 自编码器 AE 与变分自编码器 VAE
- 生成对抗网络 GAN 与训练稳定性问题
- 归一化流 Normalizing Flow
- 扩散模型 Diffusion(DDPM 原理)
- 从 Diffusion 到文生图:Stable Diffusion 简介
No content yet. Stay tuned!