📁 Generative Models · 生成模型

生成模型 · 让机器从无到有造内容 · VAE / GAN / Flow / Diffusion

判别模型学的是”怎么区分”——给一张图,回答它是猫还是狗,只关心类别之间那条边界。生成模型反过来,学的是”怎么造”——它要学会数据本身的分布,学到之后能凭空生成训练集里从不存在的全新样本。今天所有的 AI 画图、AI 生成视频、AI 配音,底座都是生成模型。

四类主流方法,各自用不同的思路逼近”真实数据分布”:

方法核心思路一句话直觉
VAE 变分自编码器编码到隐空间再解码还原把图压成一串数字,再从数字里采样造新图
GAN 生成对抗网络生成器与判别器互相博弈造假的和打假的左右互搏,直到以假乱真
Flow 归一化流可逆变换连接简单分布与真实分布用数学上可逆的变换把高斯噪声”捏”成图像
Diffusion 扩散模型加噪再学习逐步去噪把图揉成雪花,再训练网络一步步还原

其中扩散模型是当下绝对主角——Stable Diffusion、Midjourney、Sora 全建立在它之上。理解这个版块,就是理解”生成式 AI 引擎”到底怎么转。

TODO

  • 生成模型 vs 判别模型:到底差在哪
  • 自编码器 AE 与变分自编码器 VAE
  • 生成对抗网络 GAN 与训练稳定性问题
  • 归一化流 Normalizing Flow
  • 扩散模型 Diffusion(DDPM 原理)
  • 从 Diffusion 到文生图:Stable Diffusion 简介

No content yet. Stay tuned!

评论