搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
构建大模型数据科学应用(从机器学习升级到大模型数据科学与大数据技术)
0.00     定价 ¥ 49.80
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302685838
  • 作      者:
    作者:(美)克里斯汀·科勒//凯莱布·凯撒|责编:王军//韩宏志|译者:王奕逍
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2025.05
收藏
作者简介

Kristen Kehrer从2010年以来,一直为电子商务公司、医疗保健公司和公共事业部门构建和维护具有创新意义的、用于统计数据的ML模型方案。Kristen是Data Moves Me公司的创始人,2018年荣膺领英数据科学与分析领域顶尖影响力人物,拥有9.5万名数据科学领域的粉丝。Kristen获得了伍斯特理工学院的应用统计学专业硕士学位和数学专业学士学位。

Caleb Kaiser目前担任Comet的全栈工程师,也是Cortex Labs的创始成员。Caleb还曾在Scribe Media的作者平台团队工作,并获得了芝加哥艺术学院的艺术写作专业学士学位。


展开
内容介绍


在两位顶尖数据科学家的引导下,你将系统了解LLM前沿技术的更新进展,学习理论知识,以最负责任的方式将LLM技术融入商业场景;将构建一个LLM驱动的应用,直观感受框架的实际运作,掌握数据版本控制、实验跟踪、模型监控和伦理等知识点。

本书旨在为不同层级的数据领域从业者提供助力,使用前沿技术与方法论,全方位呈现LLM应用,介绍上佳技术实践。通过“数据优先”视角,识别整合LLM并驱动业务成功的机会。


展开
目录

第1章 现代机器学习简介   1

1.1  数据科学与商业智能渐行渐远   2

1.2  从CRISP-DM过渡到最新的多组件ML系统   3

1.3  LLM提升了ML的能力和复杂度   5

1.4  你能从本书中学到哪些知识   6

第2章 一种端到端的方法   9

2.1  YouTube搜索智能体的组件   11

2.2  生产中使用的ML系统的核心原则   13

2.2.1  可观察性   14

2.2.2  可再现性   15

2.2.3  互操作性   15

2.2.4  可扩展性   16

2.2.5  可改进性   17

2.2.6  关于工具的注意事项   18

第3章 以数据为中心   19

3.1  基础模型的出现   19

3.2  现成组件的角色   20

3.3  数据驱动的方法   21

3.4  有关数据伦理的注意事项   22

3.5  构建数据集   23

3.5.1  使用向量数据库   25

3.5.2  数据版本控制和管理   38

3.5.3  开始使用数据版本控制工具   41

3.6  适度了解数据工程知识   45

第4章 LLM   47

4.1  选择LLM   47

4.1.1  我需要执行哪种类型的推理   49

4.1.2  这项任务是通用的还是专用的   50

4.1.3  数据的隐私级别有多高   50

4.1.4  该模型需要多高的成本   51

4.2  LLM实验管理   52

4.3  LLM推理   56

4.3.1  提示工程的基本原理   56

4.3.2  上下文学习   58

4.3.3  中间计算   64

4.3.4  RAG   67

4.3.5  智能体技术   71

4.4  用Comet ML优化LLM推理   77

4.5  微调LLM   84

4.5.1  微调LLM的时机   84

4.5.2  量化、QLoRA和参数高效微调   85

4.6  本章小结   90

第5章 合成一个完整的应用   91

5.1  用Gradio得到应用的雏形   93

5.2  使用Plotnine创建图形   94

5.2.1  添加选择框   102

5.2.2  添加徽标   103

5.2.3  添加选项卡   103

5.2.4  添加标题和副标题   104

5.2.5  更改按钮的颜色   104

5.2.6  添加下载按钮   105

5.2.7  将组件合在一起   105

5.3  将模型部署为API   107

5.3.1  用FastAPI实现API   109

5.3.2  实现Uvicorn   111

5.4  监控LLM   111

5.4.1  用Docker部署服务   113

5.4.2  部署LLM   115

5.5  小结   119

第6章 完成ML生命周期   121

6.1  部署一个简单的随机森林模型   121

6.2  模型监控简介   125

6.3  用Evidently AI监控模型   131

6.4  构建模型监控系统   134

6.5  有关监控的总结   141

第7章 最佳实践   143

7.1  第一步:理解问题   143

7.2  第二步:选择和训练模型   144

7.3  第三步:部署和维护   145

7.4  第四步:协作与沟通   148

7.5  LLM的发展趋势   149

7.6  进一步的研究   150


展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证