搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
昇腾AI处理器CANN架构与编程/华为智能计算技术丛书
0.00     定价 ¥ 89.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787302601043
  • 作      者:
    编者:苏统华//杜鹏//周斌|责编:钟志芳
  • 出 版 社 :
    清华大学出版社
  • 出版日期:
    2022-04-01
收藏
畅销推荐
内容介绍
本书专注昇腾AI处理器和昇腾AI异构计算架构CANN,全书共7章。第1章介绍昇腾AI处理器硬件架构。首先介绍昇腾AI处理器的达芬奇架构,为后续章节提供了计算单元、存储系统、控制单元、指令集等知识储备,然后介绍基于该架构分别面向训练和推理的昇腾AI处理器,最后介绍围绕昇腾AI处理器的Atlas系列硬件产品。第2章介绍昇腾AI异构计算架构CANN。涵盖CANN概述、昇腾计算图、训练和推理两种场景运行架构、开发环境安装及全流程开发和全流程开发工具链MindStudio等重要内容。第3章介绍CANN自定义算子开发,以示例的方式介绍TBE DSL、TBE TIK和AI CPU三种算子开发方式。第4章介绍昇腾计算语言。首先讲述AscendCL的编程模型,包括线程模型和内存模型,接着介绍AscendCL提供的五大开放能力,包括资源管理、模型加载与执行、算子能力开发和高级功能等。第5章介绍基于CANN的通用AI模型训练方法。以模型训练的全流程作为起始,对比了主流深度学习框架的异同,然后讲述基于CANN的模型训练方法和训练辅助工具的使用方法。第6章介绍基于CANN的模型部署方法。讲述模型部署全流程以及数字视觉预处理模块、模型转换工具、模型压缩工具的使用方法。第7章介绍两个典型行业应用实例。围绕个性化影视推荐系统和智能巡检机器人,提供全流程的完整开发实例。 本书是昇腾AI处理器架构、昇腾AI异构计算架构与编程的官方教材,可以作为高校人工智能、智能科学与技术、计算机科学与技术、软件工程、电子信息工程、自动化等专业的教材,也可以作为从事人工智能系统开发的科研和工程技术人员的参考用书。
展开
目录
引言
第1章 昇腾AI基础
1.1 人工智能与深度学习
1.1.1 人工智能简史
1.1.2 深度学习概述
1.2 达芬奇架构
1.2.1 计算单元
1.2.2 存储系统
1.2.3 控制单元
1.2.4 指令集设计
1.2.5 卷积加速计算实例
1.3 昇腾AI处理器
1.3.1 昇腾310处理器
1.3.2 昇腾910处理器
1.4 Atlas硬件计算平台
1.4.1 模组(Atlas 200)与开发者套件(Atlas 200DK)
1.4.2 Atlas 300板卡
1.4.3 Atlas 500智能小站
1.4.4 服务器(Atlas 800/Atlas 500 Pro)
1.4.5 Atlas 900 AI集群
1.5 本章小结
第2章 昇腾AI异构计算架构CANN
2.1 CANN概述
2.2 昇腾计算图
2.3 运行架构
2.3.1 训练场景运行架构
2.3.2 推理场景运行架构
2.4 开发环境安装
2.5 全流程开发
2.5.1 开发工具链
2.5.2 典型开发流程
2.6 全流程开发工具链MindStudio
2.6.1 MindStudio简介
2.6.2 模型开发
2.6.3 应用开发与调优
2.6.4 算子开发
2.7 本章小结
第3章 CANN自定义算子开发
3.1 TBE开发概述
3.1.1 算子基本概念
3.1.2 TBE基本概念
3.1.3 TBE开发方式与流程
3.2 TBE DSL算子开发
3.2.1 开发环境准备
3.2.2 DSL的API接口
3.2.3 DSL算子开发示例
3.2.4 算子原型定义与算子信息定义
3.2.5 算子适配插件开发与算子编译及部署
3.2.6 算子单元测试
3.2.7 算子系统测试
3.3 TBE TIK算子开发
3.3.1 TIK的适用场景
3.3.2 TIK算子开发示例
3.3.3 算子的性能优化
3.4 AI CPU算子开发
3.5 本章小结
第4章 昇腾计算语言
4.1 AscendCL编程模型
4.1.1 基本概念
4.1.2 逻辑架构
4.1.3 线程模型
4.1.4 内存模型
4.2 资源管理
4.2.1 初始化管理
4.2.2 Device管理
4.2.3 Context管理
4.2.4 Stream管理
4.2.5 内存管理
4.3 模型加载与执行
4.3.1 模型加载
4.3.2 模型执行
4.3.3 设置动态Batch/动态分辨率/动态AIPP/动态维度
4.3.4 准备模型执行的输入/输出数据结构
4.4 算子功能开发
4.4.1 算子功能开发典型流程
4.4.2 封装成AscendCL的算子
4.4.3 未被封装成AscendCL的算子
4.5 辅助功能
4.5.1 同步/异步
4.5.2 AI Core异常信息获取
4.5.3 日志管理
4.5.4 Profiling性能数据采集
4.6 高级功能
4.6.1 图开发
4.6.2 分布式开发
4.6.3 融合规则开发
4.7 本章小结
第5章 CANN模型训练
5.1 深度学习训练框架
5.1.1 MindSpore
5.1.2 TensorFlow
5.1.3 PyTorch
5.1.4 主流框架对比
5.2 深度学习训练流程
5.2.1 数据处理
5.2.2 模型搭建与训练配置
5.2.3 训练网络与保存模型
5.3 CANN训练实例之MindSpore
5.3.1 环境搭建
5.3.2 ResNet-50实现图像分类
5.3.3 高阶技巧
5.4 CANN训练框架之其他框架
5.4.1 CANN与TensorFlow的适配原理
5.4.2 使用TensorFlow训练ResNet-50
5.4.3 CANN与PyTorch的适配原理
5.4.4 使用PyTorch训练ResNet-50
5.5 网络模型迁移和在线推理
5.5.1 模型迁移和在线推理流程
5.5.2 性能分析工具——Profiling
5.5.3 算子自动调优工具——AutoTune
5.5.4 精度分析工具——DataDump
5.6 本章小结
第6章 CANN模型部署
6.1 模型部署概述
6.1.1 模型部署全流程
6.1.2 调用AscendCL实现推理执行
6.2 CANN的数字视觉预处理模块
6.2.1 DVPP工作原理
6.2.2 DVPP使用方法
6.3 CANN的模型转换工具
6.3.1 ATC工具工作原理
6.3.2 ATC工具使用方法
6.3.3 AIPP
6.3.4 使用MindStudio完成模型转换
6.4 CANN的昇腾模型压缩工具
6.4.1 模型量化原理
6.4.2 昇腾模型压缩工具简介
6.5 CANN的模型部署实例
6.5.1 TensorFlow模型推理——以ResNet-50为例
6.5.2 MindSpore模型推理——以FasterR-CNN为例
6.5.3 PyTorch模型推理——以Transformer为例
6.6 本章小结
第7章 行业应用实例
7.1 个性化影视推荐系统全流程开发实例
7.1.1 实例简介
7.1.2 系统总体设计
7.1.3 系统详细设计与实现
7.1.4 实例系统部署
7.2 基于文字感知的智能巡检机器人全流程开发实例
7.2.1 实例简介
7.2.2 系统总体设计
7.2.3 系统详细设计与实现
7.2.4 实例系统部署
7.3 本章小结
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证