本书以AI图像生成为主线,串联讲解了Stable Diffusion、DALL·E、Imagen、Midjourney等模型的技术方案,并带着读者训练一个自己专属的AI图像生成模型。
本书共6章。第1章先介绍身边的AIGC产品,再讲解AI图像生成相关的深度学习基础知识,包括神经网络和多模态模型的基础知识。第2章讲解AI图像生成技术,从VAE到GAN到基于流的模型再到扩散模型的演化,并详细介绍扩散模型的算法原理和组成模块。第3章讲解Stable Diffusion模型的核心技术。第4章讲解DALL·E 2、Imagen、DeepFloyd和Stable Diffusion图像变体模型的核心技术。第5章讲解Midjourney、SDXL和DALL·E 3的核心技术。第6章是项目实战,使用LoRA技术对Stable Diffusion模型进行微调,得到特定风格的AI图像生成模型。
展开