搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
RAG实践权威指南(构建精准高效大模型之道)/智能系统与技术丛书
0.00     定价 ¥ 89.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787111781790
  • 作      者:
    作者:宁星星|责编:高婧雅
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2025-06-01
收藏
内容介绍
本书由华大生命科学研究院资深NLP专家撰写,旨在带你从零构建高效的企业级RAG系统。本书全面解析RAG原理与实战,涵盖架构与组件、高阶技术与实践、检索与问答模块优化策略、模型推理等核心技术,并深入讲解三大落地优化技术,以及高阶变体与能力增强措施。 本书共8章。第1章介绍RAG技术基础,帮助读者建立对RAG技术的全面认知。第2章介绍RAG系统的核心组件与实践,帮助读者掌握核心技术与基于Python库的实践。第3章介绍高阶RAG技术与实践的细节,帮助读者掌握进阶技术。第4章介绍检索与问答模块的优化,全方位讲解优化策略。第5章介绍模型推理技术,加速RAG技术的落地。第6章介绍RAG系统在实际应用中的鲁棒性、安全性和公平性优化技术,提升RAG系统的整体性能与可信度。第7章介绍RAG技术的高阶变体,以充分挖掘RAG技术的应用潜力。第8章介绍实时知识更新与跨模态能力增强,展望RAG技术未来应用的方向。
展开
目录
前言
第1章 RAG技术基础
1.1 为什么需要RAG技术
1.2 工作流程与核心技术解析
1.2.1 工作流程
1.2.2 核心技术
1.3 工作范式
1.4 价值与实际应用场景
1.5 计算资源与数据存储需求
1.5.1 计算资源的需求
1.5.2 数据存储的需求
1.6 面临的主要挑战
第2章 RAG系统的核心组件与实践
2.1 向量数据库
2.1.1 Elasticsearch
2.1.2 FAISS
2.1.3 Milvus
2.2 检索系统
2.2.1 基于知识图谱查询
2.2.2 基于关系型数据库查询
2.2.3 基于向量数据库查询
2.3 生成系统
2.3.1 Transformer
2.3.2 GPT
2.4 RAG系统基准测试工具
2.4.1 评测数据集
2.4.2 常用的评测基准与步骤
2.5 基于常用Python库的RAG实践
2.5.1 基于Hugging Face Transformers库
2.5.2 基于PyTorch和TensorFlow
2.5.3 基于LlamaIndex
2.5.4 基于LangChain
第3章 高阶RAG技术与实践
3.1 切片与向量化技术
3.1.1 切片
3.1.2 向量化
3.1.3 向量存储与检索
3.1.4 优化切片与向量化策略
3.1.5 实战:从文本到向量
3.2 检索技术
3.2.1 检索流程及优化策略
3.2.2 关键词检索
3.2.3 语义检索
3.2.4 密集段落检索
3.2.5 混合检索
3.2.6 重排序
3.3 高级检索策略
3.3.1 假设性问题和假设性回答策略
3.3.2 扩大检索语境
3.4 生成模型的选型与提示词工程
3.5 检索技术与生成技术的融合
3.5.1 RAG-Token模型
3.5.2 RAG-Sequence模型
第4章 检索与问答模块优化
4.1 数据预处理和管理优化
4.1.1 数据清洗
4.1.2 数据存储和访问优化
4.2 检索模块的优化
4.2.1 嵌入模型的训练优化
4.2.2 文档解析技术的优化
4.2.3 同义词扩展
4.2.4 查询重写
4.3 问答模块的优化
4.3.1 问答能力的优化
4.3.2 增强拒答能力
第5章 模型推理优化
5.1 推理加速技术
5.1.1 量化
5.1.2 剪枝
5.1.3 知识蒸馏
5.2 分布式推理
5.2.1 分布式推理技术
5.2.2 分布式推理算法
5.2.3 常见的分布式推理系统
5.2.4 分布式推理优化策略
5.3 边缘计算优化
第6章 鲁棒性、安全性和公平性优化
6.1 模型鲁棒性优化
6.1.1 对抗训练
6.1.2 模型正则化
6.1.3 随机自我集成
6.1.4 防御模块
6.2 模型安全性优化
6.2.1 数据匿名化和加密
6.2.2 访问控制
6.2.3 验证查询和输出内容
6.2.4 保护向量数据库
6.3 模型公平性优化
6.3.1 检测模型偏见的方法
6.3.2 减少模型偏见的策略
第7章 RAG技术的高阶变体
7.1 长上下文的困境突围LongRAG
7.1.1 原理解析
7.1.2 源码解析:LongRAG的深度剖析
7.2 知识图谱的优势融合GraphRAG
7.2.1 原理解析
7.2.2 源码解析:GraphRAG的深度剖析
7.3 垂直领域的定向增强GeneRAG
7.3.1 原理解析
7.3.2 源码解析:GeneRAG的深度剖析
第8章 实时知识更新与跨模态能力增强
8.1 实时知识更新
8.1.1 数据实时获取的方法
8.1.2 知识库动态更新
8.1.3 自动化数据管道
8.2 跨模态能力增强
8.2.1 多模态向量嵌入
8.2.2 多模态内容生成
附录 相似度计算
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证