搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
基于DeepSeek大模型的深度应用实践
0.00     定价 ¥ 129.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302685999
  • 作      者:
    作者:韩晓晨|责编:王金柱
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2025-04-01
收藏
畅销推荐
内容介绍
本书结合大模型的理论基础,系统地阐述了DeepSeek大模型的技术架构、开发实践与行业应用。全书分为3部分11章,第1~4章深入介绍大模型的理论基础与核心技术,包括大模型的核心概念、Transformer与MoE机制,以及DeepSeek架构的关键设计思想、优化策略与开发基础等。第5~7章聚焦于实际应用开发,详细讲解如何在DeepSeek平台上构建智能开发工具,包括编程智能助手的技术实现、智能代码生成、调试、多任务跨领域应用以及Prompt设计等。第8~10章深入探讨了大模型在行业中的定制化应用,通过多个案例展示了大模型如何解决零售、制造等行业中的具体业务问题,帮助读者掌握从需求分析到模型部署的全流程。第11章详细介绍了DeepSeek-R1的关键技术。 本书理论兼备实践,涵盖从DeepSeek-V3到R1的完整技术路径,适合大模型和AI研发人员、高校师生以及企业工程师和行业从业者,也可作为培训机构和高校相关课程的教材或参考书。
展开
目录
第1部分 理论基础与技术实现
第1章 大模型技术导论
1.1 深度学习与大模型的演进
1.1.1 深度学习的历史背景
1.1.2 Transformer架构的崛起与影响
1.1.3 MoE模型简介
1.2 大模型的核心概念
1.2.1 参数规模与计算复杂度
1.2.2 数据驱动的模型优化
1.2.3 架构创新的推动作用
1.3 生态系统与开源框架
1.3.1 开源模型的价值
1.3.2 DeepSeek系列模型生态概述
1.3.3 应用场景与案例
1.4 面向应用的智能模型构建
1.4.1 从理论到实践的转换
1.4.2 应用开发中的常见挑战
1.4.3 DeepSeek在工业中的应用
1.5 本章小结
1.6 思考题
第2章 DeepSeek核心架构解析
2.1 Transformer与多头注意力机制
2.1.1 基础架构复盘
2.1.2 深度注意力优化
2.1.3 高效解码策略
2.2 MoE模型的深入剖析
2.2.1 动态路由机制详解
2.2.2 专家负载均衡策略
2.2.3 高效通信优化
2.3 FP8混合精度计算
2.3.1 精度与性能的平衡
2.3.2 FP8的实现与实践
2.3.3 面向经济成本的设计原则
2.4 深度优化技术
2.4.1 DualPipe双管道并行算法
2.4.2 上下文窗口扩展技术
2.4.3 数据与模型并行的协同优化
2.5 跨节点通信技术详解
2.5.1 跨节点通信机制:All-to-All
2.5.2 InfiniBand优化
2.5.3 NVLink带宽优化
2.6 本章小结
2.7 思考题
第3章 基于DeepSeek的大模型开发基础
3.1 开发环境与工具链
……
第2部分 开发实践与技术应用
第3部分 行业应用与定制化开发
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证