信阅平台

产品特色

编辑推荐

展开

作者简介

展开

内容介绍

本书旨在提供一份全面、易懂的DeepSeek大模型实战内容，通过深入浅出的讲解，帮助读者快速掌握DeepSeek的核心技术和应用场景。本书不仅涵盖了DeepSeek的技术原理、架构设计和训练方法，还详细介绍了如何通过API调用、本地部署和云服务等方式将DeepSeek集成到实践项目中。此外，本书通过大量实例和案例分析，展示了DeepSeek在不同领域的应用实践，帮助读者更好地理解和应用这一强大的工具。本书图文并茂，理论翔实，案例丰富，适合从事DeepSeek开发的科研人员以及广大的开发者作为技术参考和培训资料，亦可作为高校本科生和研究生的教材。

展开

精彩书评

展开

精彩书摘

展开

第1章 DeepSeek初探
1.1 大模型的定义
1.2 从GPT到DeepSeek
1.2.1 GPT模型的发展脉络
1.2.2 DeepSeek模型的发展脉络
1.2.3 技术突破：从全球竞速到本土创新
1.2.4 应用生态的进化：从工具到生态伙伴
1.3 DeepSeek的核心能力和独特优势
1.3.1 核心能力
1.3.2 独特优势
1.4 DeepSeek的应用场景
1.4.1 智能客服
1.4.2 辅助办公
1.4.3 智能家居
1.4.4 医疗诊断
1.4.5 教育学习
1.4.6 金融投资
1.4.7 智能政务
1.5 DeepSeek带来的机遇
1.5.1 DeepSeek模型带给个人的机遇
1.5.2 DeepSeek带给中小企业的机遇
小结
第2章 DeepSeek的模型架构
2.1 DeepSeek-V3/R1模型的架构
2.2 混合专家
2.2.1 稠密MoE架构和稀疏MoE架构
2.2.2 DeepSeekMoE
2.2.3 无辅助损耗负载均衡
2.3 多头潜在注意力
2.3.1 键值缓存简介
2.3.2 RoPE简介
2.3.3 传统MHA的缓存机制的不足
2.3.4 低秩键值联合压缩的注意力机制
2.4 多Token预测
2.4.1 块级并行解码策略
2.4.2 Meta的MTP方法
2.4.3 DeepSeek的MTP方法
小结
第3章 DeepSeek的训练架构
3.1 DeepSeek的训练
3.1.1 基础技术
3.1.2 训练过程
3.2 DeepSeek在硬件层面的训练亮点
3.2.1 FP8混合精度训练
3.2.2 DualPipe算法
3.3 DeepSeek在算法层面的训练亮点
3.3.1 组相对策略优化
3.3.2 知识蒸馏
3.4 DeepSeek的数据优化手段
小结
第4章高质量提示词
4.1 提示词概述
4.1.1 提示词的定义
4.1.2 提示词的种类
4.2 新手常见误区和陷阱
4.3 提示词的设计技巧
4.3.1 STAR法则：让问题更有条理
4.3.2 5W2H法则：全面提问的利器
4.3.3 CO-STAR框架：精准表达需求
4.3.4 CRISPE框架：激发创意和拓展深度
4.3.5 BROKE框架：目标导向和持续优化
4.3.6 借助大模型优化提示词
4.4 企业层面的提示词应用场景
4.4.1 传播策略制定
4.4.2 执行发展制定
4.4.3 品牌故事生成
4.4.4 产品定位
小结
第5章面向个人的DeepSeek部署
5.1 DeepSeek的模型
5.1.1 DeepSeek模型的常见版本
5.1.2 DeepSeek模型的版本说明
5.1.3 DeepSeek模型的开源协议
5.2 硬件需求和配置建议
5.2.1 存储精度
5.2.2 显存占用估算
5.3 软件环境安装和配置
5.3.1 Ollama安装
5.3.2 使用Ollama部署DeepSeek模型
5.3.3 Ollama常用API
5.4 DeepSeek模型下载和部署
5.4.1 Hugging Face社区简介
5.4.2 模型下载
5.4.3 常见大模型文件类型
5.5 使用Web UI构建对话界面
5.5.1 Open-WebUI
5.5.2 Hollama
5.5.3 ChatBox
小结
第6章面向企业的DeepSeek API调用
6.1 API调用的优势
6.2 常用DeepSeek API调用方式
6.2.1 DeepSeek官方开放平台
6.2.2 DMXAPI
小结
第7章面向企业的DeepSeek云服务部署
7.1 本地部署与云服务部署的对比
7.1.1 本地部署的特点
7.1.2 云服务部署的特点
7.2 模型推理加速框架
7.2.1 推理加速框架的必要性
7.2.2 BladeLLM
7.2.3 SGLang
7.2.4 vLLM
7.3 常用DeepSeek云服务部署方式
7.3.1 阿里云
7.3.2 腾讯云
7.3.3 华为云
7.3.4 火山引擎
7.3.5 AutoDL
小结
第8章 DeepSeek模型训练
8.1 常用训练框架
8.1.1 Unsloth
8.1.2 TRL
8.2 DeepSeek模型的SFT训练
8.2.1 算力租用
8.2.2 模型下载和部署
8.2.3 数据预处理
8.2.4 模型训练
8.2.5 模型推理
8.3 DeepSeek模型的GRPO训练
8.3.1 加载模型
8.3.2 配置PEFT模型
8.3.3 数据集准备
8.3.4 模型训练
8.3.5 模型推理
小结
第9章 DeepSeek的RAG实战
9.1 用LangChain构建简单的RAG本地系统
9.1.1 RAG管道构建
9.1.2 向量数据库构建
9.1.3 Web页面启动
9.2 开源DeepSeek RAG应用案例
9.2.1 Local PDF Chat RAG
9.2.2 RAG Flow
小结 239
第10章 DeepSeek的Agent实战
10.1 基于LlamaIndex项目构建简单的智能体应用
10.1.1 软件安装和模型下载
10.1.2 构建本地知识库
10.1.3 实现基于本地知识库的智能体问答
10.2 基于Swarm框架构建智能体应用
10.2.1 Swarm框架介绍
10.2.2 DeepSeek模型接入
10.2.3 调用外部工具
10.3 开源Agent应用框架
10.3.1 Browser Use
10.3.2 Camel
小结
参考文献

展开