本书深度探讨了当今科技领域最引人注目的大规模语言模型相关技术,内容主要围绕大规模语言模型构建、评估和应用展开,分为以下四部分:第1~5章主要介绍大规模语言模型的发展历程及其训练相关内容,包括语言模型的基本架构、大规模语言模型的高效微调技术、人类反馈强化学习和模型的分布式训练;第6和7章主要介绍大规模语言模型的推理优化技术、推理加速框架和模型的评估;第8~10章主要介绍大规模语言模型扩展和应用,包括大规模语言模型和知识的融合、多模态大规模语言模型的技术介绍和其智能体扩展应用,以及大规模语言模型的垂直领域应用;第11章主要介绍大规模语言模型研究的困难、挑战和未来潜在研究方向。
本书面向技术爱好者、从业者、学术研究者和一般读者。它提供大规模语言模型相关的全面介绍,帮助从业人员和专业人士了解大规模语言模型的应用及技术原理,支持学术界研究前沿技术,并以通俗的语言帮助读者理解这一技术及其对生活的影响。
展开