搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
大规模语言模型开发基础与实践
0.00     定价 ¥ 89.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787301352595
  • 作      者:
    编者:王振丽|责编:王继伟//蒲玉茜
  • 出 版 社 :
    北京大学出版社
  • 出版日期:
    2024-08-01
收藏
畅销推荐
内容介绍
本书循序渐进、详细讲解了大模型开发技术的核心知识,并通过具体实例的实现过程演练了使用TensorFlow和PyTorch开发大模型程序的方法和流程。 全书分别讲解了大模型基础,数据集的加载、基本处理和制作,数据集的预处理,卷积神经网络模型,循环神经网络模型,特征提取,注意力机制,模型训练与调优,模型推理和评估,大模型优化算法和技术,AI智能问答系统和AI人脸识别系统。全书简洁而不失其技术深度,内容丰富全面。本书易于阅读,以极简的文字介绍了复杂的案例,是学习大模型开发的实用教程。 本书适用于已经了解Python基础开发的读者,以及想进一步学习大模型开发、模型优化、模型应用和模型架构的读者,还可以作为大专院校相关专业的师生用书和培训学校的专业性教材。
展开
目录
第1章 大模型基础
1.1 人工智能
1.1.1 人工智能的发展历程
1.1.2 人工智能的研究领域
1.1.3 人工智能对人们生活的影响
1.2 机器学习和深度学习
1.2.1 机器学习
1.2.2 深度学习
1.2.3 机器学习和深度学习的区别
1.3 大模型简介
1.3.1 大模型的作用
1.3.2 数据
1.3.3 数据和大模型的关系
1.4 大模型开发与应用的技术栈
第2章 数据集的加载、基本处理和制作
2.1 数据集的加载
2.1.1 PyTorch加载数据集
2.1.2 TensorFlow加载数据集
2.2 数据集的基本处理
2.2.1 转换为Tensor格式
2.2.2 标准化处理
2.2.3 调整大小和裁剪
2.2.4 随机翻转和旋转
2.3 数据集的制作
2.3.1 自定义数据集
2.3.2 制作简易图片数据集
2.3.3 制作有标签的数据集
第3章 数据集的预处理
3.1 数据清洗和处理
3.1.1 缺失值处理
3.1.2 异常值检测与处理
3.1.3 重复数据处理
3.2 数据转换与整合
3.2.1 特征选择与抽取
3.2.2 特征变换与降维
3.2.3 数据集成与关联
3.3 数据标准化与归一化
3.3.1 标准化及其重要性
3.3.2 特征缩放和归一化
3.3.3 数据转换和规范化
3.3.4 “最小-最大”缩放
3.4 数据增强技术
3.4.1 数据增强的意义
3.4.2 图像数据增强
3.4.3 自然语言数据增强
第4章 卷积神经网络模型
4.1 卷积神经网络简介
4.1.1 卷积神经网络的发展背景
4.1.2 卷积神经网络的结构
4.2 卷积神经网络模型开发实战
4.2.1 使用TensorFlow创建一个卷积神经网络模型并评估
4.2.2 使用PyTorch创建手写数字模型
第5章 循环神经网络模型
5.1 文本处理与循环神经网络简介
5.1.1 循环神经网络基础
5.1.2 文本分类
5.2 循环神经网络模型开发实战
5.2.1 使用PyTorch开发歌词生成器模型
5.2.2 使用TensorFlow制作情感分析模型
第6章 特征提取
6.1 特征提取简介
6.1.1 特征在大模型中的关键作用
6.1.2 特征提取与数据预处理的关系
6.2 特征的类型和重要性
6.2.1 数值特征和类别特征
6.2.2 高维数据的挑战
6.3 特征选择
6.3.1 特征选择的必要性
6.3.2 特征选择的方法
6.4 特征抽取
6.4.1 特征抽取的概念
6.4.2 主成分分析
6.4.3 独立成分分析
6.4.4 自动编码器
6.5 文本数据的特征提取
6.5.1 嵌入
6.5.2 词袋模型
6.5.3 TF-IDF特征
6.6 图像数据的特征提取
6.6.1 预训练的图像特征提取模型
6.6.2 基本图像特征:边缘检测、颜色直方图等
第7章 注意力机制
7.1 注意力机制基础
7.1.1 注意力机制简介
7.1.2 注意力机制的变体
7.1.3 注意力机制解决的问题
7.2 TensorFlow机器翻译系统
7.2.1 项目简介
7.2.2 下载并准备数据集
7.2.3 文本预处理
7.2.4 编码器模型
7.2.5 绘制可视化注意力图
7.2.6 解码器
7.2.7 训练
7.2.8 翻译
7.3 PyTorch机器翻译系统
7.3.1 准备数据集
7.3.2 数据预处理
7.3.3 实现Seq2Seq模型
7.3.4 训练模型
7.3.5 模型评估
7.3.6 训练和评估
7.3.7 注意力的可视化
第8章 模型训练与调优
8.1 模型训练优化
8.1.1 底层优化
8.1.2 样本权重和分类权重
8.2 损失函数和优化算法
8.2.1 损失函数和优化算法的概念
8.2.2 TensorFlow损失函数和优化算法
8.2.3 PyTorch损失函数和优化算法
8.3 批量训练和随机训练
8.3.1 批量训练和随机训练的概念
8.3.2 小批量随机梯度下降
8.3.3 批量归一化
8.3.4 丢弃
8.4 模型验证和调优
8.4.1 训练集、验证集和测试集
8.4.2 交叉验证优化
8.4.3 超参数调优
第9章 模型推理和评估
9.1 模型推理
9.1.1 模型推理的步骤
9.1.2 前向传播和输出计算的过程
9.1.3 模型推理的优化和加速
9.2 模型评估
9.2.1 模型评估的方法和指标
9.2.2 交叉验证和统计显著性测试的应用
第10章 大模型优化算法和技术
10.1 常见的大模型优化算法和技术
10.2 梯度下降法
10.2.1 梯度下降法简介
10.2.2 TensorFlow梯度下降法优化实践
10.2.3 PyTorch梯度下降法优化实践
10.3 模型并行和数据并行
10.3.1 模型并行和数据并行的基本概念
10.3.2 TensorFlow模型并行和数据并行实践
10.3.3 PyTorch模型并行和数据并行实践
10.4 学习率调度
10.4.1 学习率调度的方法
10.4.2 TensorFlow学习率调度优化实践
10.4.3 PyTorch学习率调度优化实践
10.5
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证