本书循序渐进地阐述了多模态大模型的核心开发技术与应用实战的知识。全书共10章,分别讲解了多模态技术概述、多模态模型与框架、多模态数据处理、多模态表示学习、多模态嵌入表示、多模态大模型的训练、多模态大模型的评估与验证、基于多模态大模型的翻译系统、基于多模态大模型的音视频广义零样本学习系统、基于Diffusion Transformer的文生图系统。全书简洁而不失技术深度,内容丰富全面,案例翔实,以通俗易懂的文字介绍了复杂的知识体系,易于阅读,是学习多模态大模型开发的实用教程。
本书适用于已经了解了Python语言基础语法,想进一步学习大模型开发、自然语言处理、计算机视觉处理、机器学习、深度学习技术的读者,还可以作为各类院校相关专业师生的学习用书和培训学校的教材。
展开