Stable Diffusion 稳定扩散模型

Stable Diffusion是由Stability AI开发的潜在扩散模型,能够根据文本描述生成详细的图像。

架构

  • 潜在空间扩散:在压缩的潜在空间中应用扩散过程
  • 文本条件:使用CLIP文本嵌入来引导生成过程
  • VAE:将图像编码到潜在空间并解码回来
  • UNet:在潜在空间中执行去噪过程

主要特点

  • 文本到图像生成
  • 图像到图像转换
  • 图像修复和扩展
  • 微调能力

应用

  • 创意艺术生成
  • 设计原型制作
  • 内容创作
  • 图像编辑

参考文献