搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
大模型核心原理与企业落地实践
0.00     定价 ¥ 99.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302687948
  • 作      者:
    编者:林学森//吴锋//王劲涛//代声馨|责编:文怡
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2025-05-01
收藏
内容介绍
全书分两大篇。第1篇原理篇(第1、2章),尝试引导读者共同探索和揭秘研发领域大模型背后的核心原理,以使读者“知其然,知其所以然”,并为后续章节的学习打下坚实的基础。从概率、最优化等基础理论入手,进而深入浅出地阐述Transformer、神经元等大模型的核心组成元素,以及评估方法、数据工程建设等通用能力的建设。针对技术细节,采用通俗易懂的行文风格,并辅以大量的图表和数据,“零基础”的读者也可以高效地学习。第2篇应用实践篇(第3~8章),是产业界最新实践成果的总结。选取代码生成、代码转换、知识问答、推理加速、运维运营等研发大模型领域的高频业务作为剖析对象,详细展示作者在针对这些问题时的端到端思考,包括设计理念、关键技术瓶颈、解决方案及落地结果等。 无论你是初学者还是行业专家,都能在本书中找到宝贵的知识和实用的技巧,本书将帮助你在大模型技术的浪潮中乘风破浪。
展开
目录
第1篇 原理篇
第1章 人工智能概述
1.1 人工智能的定义
1.2 人工智能发展简史
1.2.1 史前文明,曙光初现(1956年之前)
1.2.2 初出茅庐,一战成名(1956—1974年)
1.2.3 寒风凛冽,首次入冬(1974—1980年)
1.2.4 卷土重来,威震八方(1980—1987年)
1.2.5 失望弥漫,再度入冬(1987—1993年)
1.2.6 重出江湖,渐入佳境(1993年至今)
1.3 自然语言处理和大语言模型
1.3.1 自然语言处理
1.3.2 大语言模型
第2章 大模型的数学基础
2.1 微分学
2.1.1 链式求导法则
2.1.2 对数函数求导
2.1.3 梯度和梯度下降算法
2.2 线性代数
2.2.1 向量
2.2.2 矩阵拼接
2.2.3 特征值和特征向量
2.2.4 几何变换
2.3 概率论
2.3.1 概率分布
2.3.2 先验概率和后验概率
2.3.3 最大似然估计
2.3.4 贝叶斯法则
2.4 统计学
2.4.1 数据的标准化和归一化
2.4.2 标准差
2.4.3 偏差和方差
2.4.4 协方差和协方差矩阵
2.5 深度神经网络基础
2.5.1 神经元
2.5.2 激活函数
2.5.3 前向传播和后向传播算法
2.5.4 损失函数
2.6 Transformer机制详解
2.6.1 Transformer简介
2.6.2 分词及向量化
2.6.3 位置编码
2.6.4 自注意力和多头注意力
2.6.5 残差连接和层归一化
2.6.6 Transformer小结
2.7 其他
2.7.1 训练、验证和测试数据集
2.7.2 过拟合和欠拟合
2.7.3 奥卡姆剃刀原则
2.7.4 信息熵
第2篇 应用实践篇
第3章 大语言模型与检索增强生成技术
3.1 检索增强生成背景
3.2 检索增强生成技术框架
3.2.1 信息检索
3.2.2 提示工程
第4章 基于大语言模型的智能问答助手
4.1 文档离线预处理与存储
4.1.1 格式化
4.1.2 切割
4.1.3 向量化与存储
4.2 联网在线预处理与存储
4.3 在线QA服务
4.3.1 用户问题向量化
4.3.2 Prompt组装
4.3.3 问答召回
4.4 长记忆与多轮对话
4.5 归因与可解释性
4.6 评测
4.7 用户反馈
4.8 待解决的系列问题
第5章 基于大语言模型的智能数据助手
5.1 数据标准化
5.2 工具
5.3 案例
第6章 基于大语言模型的鸿蒙代码转换探索
6.1 背景概述
6.2 问题剖析
6.3 探索破题
6.3.1 总体思路概述
6.3.2 基于“知识体系”的数据工程建设
6.3.3 针对被转换对象“庖丁解牛”
6.3.4 提取典型问题模式,利用关键技术“各个击破”
6.3.5 不断优化“反馈回路”,缓解工程复杂性
第7章 大语言模型的推理加速
7.1 引言
7.2 推理加速技术原理
7.2.1 推理计算与显存分析
7.2.2 模型压缩
7.2.3 计算加速
7.2.4 技术总览
7.3 推理加速框架
7.3.1 vLLM
7.3.2 TGI
7.4 推理加速工程实践
7.4.1 Llama3在vLLM框架上的推理
7.4.2 Llama3在TGI框架上的推理
7.4.3 推理测试
第8章 大语言模型的运维与持续优化
8.1 运维背景
8.2 链路追踪
8.3 数据管理与测试用例管理
8.3.1 Web数据集管理
8.3.2 SDK数据集管理
8.3.3 数据集版本管理
8.3.4 few-shot动态管理
8.4 一站式评测
8.4.1 评测
8.4.2 单元测试
8.4.3 回归测试
8.4.4 流量录制回放测试
8.4.5 Agent/Tool评测
8.4.6 RAG评测
8.5 Prompt管理
8.6 监控告警
8.6.1 过滤器
8.6.2 监控
8.7 部署
8.7.1 框架
8.7.2 k8s部署
参考文献
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证