/AI 作画《NBA球星动漫头像》| 用stable diffusion生成

AI 作画《NBA球星动漫头像》| 用stable diffusion生成


扩散模型原理

  • 扩散模型是一种概率模型,通过逐步去噪一个正态分布变量来学习数据分布p(x),对应于学习长度为t的固定马尔可夫链的反向过程。模型可以通过训练去噪自编码器
    来实现(T = 1…T),它们被训练来预测其输入
    的去噪变体,而
    是输入
    的噪声版本,其训练函数:

  • 扩散模型原理方面,包括:前向的加噪
    和逆向的去噪

  • 前向的加噪:给定初始数据(比如图像)
    ,一步一步加噪得到

    、···、

    、···、
    ,最后的
    完全是一个正太分布噪音数据。其中,每一步的加噪,不妨记为
    分布表示;对应地,实际的去噪分布记为

  • 逆向的去噪(生成)
    一步一步去噪,得到
    、···、

    、···、

    ,不妨记为
    分布表示;

  • 事实上,扩散模型的训练就是用网络(待学习参数为
    )预测所加的噪音变量分布。用KL散度衡量实际的去噪分布
    和由网络学习的去噪分布
    :即。经一系列推导化简、等价为
    。这里的
    是高斯噪声,预测网络以含噪图片
    作为输入,预测所添加的噪声。

  • 即可以理解为,扩散模型的训练目标是,希望预测的噪声和真实噪声一致

NBA球星动漫头像生成

  • 我们来测试一下当前diffusion里最著名的 stable diffusion,它的文本生成图像能力。
  • 并且输入的文本不包含任何限制或修饰,完全把想象空间交给模型!
  • 注意,加入更多的修饰词,应该效果会好些。

姚明

库里

詹姆斯

奥尼尔

乔丹

杜兰特

科比

猜您喜欢:

 戳我,查看GAN的系列专辑~!
一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models
ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

   

本文来自微信公众号“机器学习与AI生成创作”作者:bryant8(ID:AI_bryant8)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。