信阅平台

产品特色

编辑推荐

展开

作者简介

展开

内容介绍

本书系统讲解了大模型的技术体系与应用实践。全书在深入解析Transformer和GPT系列模型的核心原理的基础上，介绍了中国优秀大模型DeepSeek的基本情况，重点讲解Llama开源模型的训练调优及行业应用开发，并对文生图、文生视频乃至多模态等前沿技术进行了探讨。本书注重理论与实践相结合，通过精选开源项目案例，引导读者在代码实践中理解技术本质。本书适合人工智能相关专业学生参考，也可供对大模型开发感兴趣的技术人员及爱好者阅读学习。

展开

精彩书评

展开

精彩书摘

展开

第一章大语言模型基础知识
第一节 LLM基础
一、LLM概述
二、大模型存在的问题
三、检索增强生成（RAG）
四、大模型的改进方法
第二节 GPT模型介绍
一、GPT模型的发展历程
二、GPT模型的关键论文
三、GPT模型的结构可视化
第三节开源、工具和实战
第二章大语言模型的技术细节
第一节大语言模型的全局视图
第二节注意力机制
一、自注意力机制
二、多头注意力机制
第三节编码、嵌入和神经网络
一、位置编码
二、旋转位置编码
三、字段编码
四、前馈网络
五、层归一化
第四节权重、参数和训练策略
一、权重
二、Transformer的训练策略和优化方法
三、Transformer模型的正则化技术
四、注意力机制的变种和改进
五、Transformer模型微调的常见策略
第五节更多原理剖析
一、零样本提示
二、少量样本提示
三、Transformer模型中的残差连接
四、文本生成源码解读
第六节大模型的能与不能
一、人工智能的大工业时代
二、ChatGPT不等于人工智能
第七节图示Transformer和实战GPT
一、图示Transformer
二、实战GPT
第八节实战：手动部署大模型
第三章开源大模型和Llama实战
第一节 Llama的结构
第二节运行Llama
第三节 Llama微调
一、微调的步骤
二、微调的方法
三、微调所需的基础知识
第四节实战：大语言模型(LLM)微调框架
第四章中文Llama模型
第一节中文数据准备
一、中文数据处理的技术
二、中文数据处理的过程
三、中文数据处理的工具
第二节基于中文数据的模型训练
一、指令数据搜集和处理
二、AdaLoRA算法剖析
三、大模型指令微调之量化
四、大模型压缩技术
五、大模型蒸馏技术
第三节模型评测
第四节人类反馈的集成
第五节实战：中文应用开发
一、基于Llama的医学大模型的开源项目
二、基于Llama的法律大模型的开源项目
三、基于Llama的金融大模型的开源项目
四、基于Llama的科技论文大模型的
开源项目
第五章实战大语言模型应用
第一节大模型的基础设施创新
一、数据库创新开源项目
二、将自然语言问题转换为 SQL 查询
三、将大模型数据查询SQL化
第二节基于大模型的应用创新
一、基于LLM的开源代码编写助手
二、开源数据交互工具
三、领先的文档GPT开源项目
第三节大模型的优化和发展创新
一、开源的大模型用户分析平台
二、低代码方式搭建大模型
三、开源搜索增强RAG项目
第四节 Agent技术
一、微软开源的强大Agent——AutoGen
二、让Agent去完成RPA
三、让Agent去标注数据——Adala
第六章开源文生图
第一节文生图技术概述
一、生成对抗网络（GANs）介绍
二、GANs在图片生成方面的应用
三、GANs图片应用的说明和原理
第二节开源文生图模型介绍
一、Stable Diffusion介绍
二、LDMs介绍
三、DALL-E和Stable Diffusion
第三节开源文生图模型技术要点
一、LDMs的源代码导读
二、用一个案例说明Stable Diffusion
三、实战：部署开源项目stable-diffusion-webui
第四节实战：打造基于开源的文生图应用
第七章开源文生视频
第一节开源文生视频介绍
第二节文生视频技术难点和路线
一、文生视频技术难点
二、开源文生视频路线
第三节开源文生视频应用
第八章开源多模态
第一节多模态介绍
第二节多模态的技术细节
一、GPT-4o的多模态介绍
二、视觉指令调整
第三节开源多模态案例
一、LLaVA实现GPT-4V级别的开源多模态
二、开源LLaVA-1.5介绍
三、MGM：一个强大的多模态大模型
第九章 DeepSeek实战
第一节 DeepSeek核心技术介绍
一、混合专家架构
二、多头潜在注意力机制
三、混合精度训练
第二节 DeepSeek-R1模型复现
第三节 DeepSeek-V3本地化源码级部署
一、使用 DeepSeek-Infer 进行推理演示
二、基于华为硬件的DeepSeek部署
第四节基于DeepSeek的开源应用
一、基于DeepSeek的PPT生成系统
二、DeepSeek支持的可视化BI解决方案
三、DeepSeek支持的健康分析平台
四、DeepSeek支持的智能测试用例生成平台
五、可本地化部署的企业级DeepSeek知识管理平台
六、基于DeepSeek的智能体RPA

展开