第一章 大语言模型基础知识
第一节 LLM基础
一、LLM概述
二、大模型存在的问题
三、检索增强生成(RAG)
四、大模型的改进方法
第二节 GPT模型介绍
一、GPT模型的发展历程
二、GPT模型的关键论文
三、GPT模型的结构可视化
第三节 开源、工具和实战
第二章 大语言模型的技术细节
第一节 大语言模型的全局视图
第二节 注意力机制
一、自注意力机制
二、多头注意力机制
第三节 编码、嵌入和神经网络
一、位置编码
二、旋转位置编码
三、字段编码
四、前馈网络
五、层归一化
第四节 权重、参数和训练策略
一、权重
二、Transformer的训练策略和优化方法
三、Transformer模型的正则化技术
四、注意力机制的变种和改进
五、Transformer模型微调的常见策略
第五节 更多原理剖析
一、零样本提示
二、少量样本提示
三、Transformer模型中的残差连接
四、文本生成源码解读
第六节 大模型的能与不能
一、人工智能的大工业时代
二、ChatGPT不等于人工智能
第七节 图示Transformer和实战GPT
一、图示Transformer
二、实战GPT
第八节 实战:手动部署大模型
第三章 开源大模型和Llama实战
第一节 Llama的结构
第二节 运行Llama
第三节 Llama微调
一、微调的步骤
二、微调的方法
三、微调所需的基础知识
第四节 实战:大语言模型(LLM)微调框架
第四章 中文Llama模型
第一节 中文数据准备
一、中文数据处理的技术
二、中文数据处理的过程
三、中文数据处理的工具
第二节 基于中文数据的模型训练
一、指令数据搜集和处理
二、AdaLoRA算法剖析
三、大模型指令微调之量化
四、大模型压缩技术
五、大模型蒸馏技术
第三节 模型评测
第四节 人类反馈的集成
第五节 实战:中文应用开发
一、基于Llama的医学大模型的开源项目
二、基于Llama的法律大模型的开源项目
三、基于Llama的金融大模型的开源项目
四、基于Llama的科技论文大模型的
开源项目
第五章 实战大语言模型应用
第一节 大模型的基础设施创新
一、数据库创新开源项目
二、将自然语言问题转换为 SQL 查询
三、将大模型数据查询SQL化
第二节 基于大模型的应用创新
一、基于LLM的开源代码编写助手
二、开源数据交互工具
三、领先的文档GPT开源项目
第三节 大模型的优化和发展创新
一、开源的大模型用户分析平台
二、低代码方式搭建大模型
三、开源搜索增强RAG项目
第四节 Agent技术
一、微软开源的强大Agent——AutoGen
二、让Agent去完成RPA
三、让Agent去标注数据——Adala
第六章 开源文生图
第一节 文生图技术概述
一、生成对抗网络(GANs)介绍
二、GANs在图片生成方面的应用
三、GANs图片应用的说明和原理
第二节 开源文生图模型介绍
一、Stable Diffusion介绍
二、LDMs介绍
三、DALL-E和Stable Diffusion
第三节 开源文生图模型技术要点
一、LDMs的源代码导读
二、用一个案例说明Stable Diffusion
三、实战:部署开源项目stable-diffusion-webui
第四节 实战:打造基于开源的文生图应用
第七章 开源文生视频
第一节 开源文生视频介绍
第二节 文生视频技术难点和路线
一、文生视频技术难点
二、开源文生视频路线
第三节 开源文生视频应用
第八章 开源多模态
第一节 多模态介绍
第二节 多模态的技术细节
一、GPT-4o的多模态介绍
二、视觉指令调整
第三节 开源多模态案例
一、LLaVA实现GPT-4V级别的开源多模态
二、开源LLaVA-1.5介绍
三、MGM:一个强大的多模态大模型
第九章 DeepSeek实战
第一节 DeepSeek核心技术介绍
一、混合专家架构
二、多头潜在注意力机制
三、混合精度训练
第二节 DeepSeek-R1模型复现
第三节 DeepSeek-V3本地化源码级部署
一、使用 DeepSeek-Infer 进行推理演示
二、基于华为硬件的DeepSeek部署
第四节 基于DeepSeek的开源应用
一、基于DeepSeek的PPT生成系统
二、DeepSeek支持的可视化BI解决方案
三、DeepSeek支持的健康分析平台
四、DeepSeek支持的智能测试用例生成平台
五、可本地化部署的企业级DeepSeek知识管理平台
六、基于DeepSeek的智能体RPA
展开