本书全面探讨了大语言模型(通常可简称“大模型”)在应用开发中的核心技术与实现。内容涵盖了大语言模型的基本原理、微调与优化技术、复杂项目开发流程及高效实用的工程实践案例,通过结构化的模块设计和详细的代码解析,帮助读者快速掌握相关技术并应用于真实场景,搭建从理论到实践的完整知识体系。
本书分为四部分,共10章,系统梳理了大语言模型的核心架构与原理,深入讲解了Transformer模型的构造与训练机制,全面介绍了现代微调方法(如LoRA、P-Tuning等)以及模型量化、编译与推理优化的关键技术。针对应用场景,本书结合多个企业级实际案例,包括电商智能客服平台、编程辅助插件、寻人检索数据库和硬件开发工程师助理等,详细展示了从需求分析、数据处理、模型选择到上线部署的完整开发流程。这些案例不仅强调技术实现,还融入了工程实践中常见的问题与解决方案,为读者提供了丰富的参考资料。
本书适合对大语言模型感兴趣的技术爱好者、希望深入研究模型微调与优化的科研人员、从事人工智能开发的工程师和产品经理,同时也适合高等院校相关专业学习大语言模型的师生。同时,随书附赠案例代码、教学视频及授课用PPT,读者可通过扫封底二维码获取。无论是初学者学习理论基础、学生探索前沿技术,还是工程师在一线工作中进行实践开发,本书都能提供系统化的知识体系和实用的开发技能。
展开