搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
微处理器体系结构专利技术研究方法(第2辑x86多媒体指令集)
0.00     定价 ¥ 158.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787030771377
  • 作      者:
    编者:徐步陆|责编:赵艳春//霍明亮
  • 出 版 社 :
    科学出版社
  • 出版日期:
    2023-12-01
收藏
畅销推荐
内容介绍
本书研究x86多媒体指令集扩展专利技术实现的思路、方法。MMX与之后的SSE、AVX等一系列x86多媒体扩展指令集使得处理器支持的紧缩数据的数据元素类型从整数扩展到单精度、双精度浮点数,宽度从8位扩展到16位、32位、64位、512位。本书第1章分析MMX指令集专利技术。第2~7章研究SSE、SSE2、SSE3、SSSE3、SSE4等专利技术。第8~11章研究AVX、AVX2和AVX-512等专利技术。 上述指令集扩展不但高效地实现多媒体应用处理的初衷,今天更是成功地应用在信号处理、科学计算、人工智能等高算力领域。本书中相关的专利技术方案是研制x86处理器时难得的一手资料,具有工业实现和科学研究的双重价值。本书可为从事CPU处理器、异构处理器和人工智能模型领域研发的相关科研人员、工程师和广大师生提供参考。
展开
目录
前言
第1章 多媒体扩展指令集专利技术
1.1 紧缩数据打包和拆开指令
1.2 紧缩数据乘加(乘减)指令和运算
1.3 紧缩数据移位指令
1.4 紧缩数据加或减指令
1.5 紧缩数据移动指令
1.6 清空MMX寄存器状态指令
1.7 带饱和操作类指令
1.8 紧缩数据数量统计指令
1.9 MMX指令序列应用
1.9.1 复数滤波和复数乘累加
1.9.2 两紧缩数据对应元素求差的绝对值运算
第2章 流式传输SIMD扩展指令集专利技术
2.1 SIMD单精度浮点指令
2.1.1 高位或低位紧缩单精度浮点数移动指令
2.1.2 紧缩浮点混洗指令
2.1.3 SSE单精度浮点数交织拆开指令
2.1.4 不同寄存器结构的多种整数和浮点数互相转换
2.2 SSE 64位SIMD整型指令
2.2.1 紧缩绝对差值之和指令
2.2.2 插入和提取指令
2.2.3 紧缩整数最小值和最大值指令数据预处理电路优化
2.3 缓存能力控制和预取指令
2.3.1 字节掩码写四字指令定义和实现
2.3.2 使用推测实现字节掩码写操作
2.4 SSE指令序列应用:矩阵乘法加速
2.4.1 指令序列实现紧缩数据水平加法
2.4.2 动态数据重排法实现矩阵乘法
第3章 流式传输SIMD扩展2(SSE2)指令集专利技术
3.1 紧缩和标量双精度浮点指令
3.2 128位紧缩整型指令
第4章 流式传输SIMD扩展3(SSE3)指令集专利技术
4.1 128位非对齐整型数据加载指令
4.2 紧缩数据水平算术指令
4.2.1 紧缩数据水平加法指令和基于水平加法的矩阵乘法
4.2.2 紧缩数据水平算术指令和8点时间抽取操作指令序列
4.3 浮点加载、移动及复制指令
4.4 改进的线程同步指令
第5章 补充流式传输SIMD扩展3(SSSE3)指令集专利技术
5.1 紧缩数据符号乘法指令和求绝对值指令
5.2 带舍入和缩放组合高位乘法指令
5.3 紧缩字节整型带掩码的混洗指令
第6章 流式传输SIMD扩展4(SSE4)指令集专利技术
6.1 SSE4.1
6.1.1 紧缩浮点数点积
6.1.2 逻辑比较并设置零和进位
6.1.3 带舍入模式的紧缩和标量浮点值舍入
6.2 SSE4.2
6.2.1 字符串和文本比较
6.2.2 面向应用的加速器指令
第7章 其他流式传输SIMD指令或指令序列专利技术
7.1 数据交换取反指令增强复数乘法操作
7.2 紧缩整数转换为紧缩浮点数的指令序列优化
7.3 带存取模式的存储器存取指令
7.4 四像素平均值指令逻辑实现和电路改进
7.4.1 四像素平均指令FPA实现电路优化
7.4.2 四数据平均值指令WAVG4电路优化技术和图像缩小应用
7.5 移位和异或指令
第8章 高级矢量扩展指令集专利技术
8.1 掩码移动指令
8.2 高精度的浮点倒数计算指令实现方法
8.3 通道内混洗指令
8.4 尺寸不同的紧缩浮点和紧缩整型转换指令
第9章 高级矢量扩展2(AVX2)指令集专利技术
9.1 聚集和分散指令:跨距访存支持
9.1.1 聚集和分散指令集
9.1.2 聚集和分散扩展:支持原子操作的向量链接聚集和条件分散指令
9.2 置换、移位和循环的实现优化
第10章 高级矢量扩展512(AVX-512)指令集专利技术
10.1 写掩码广播指令
10.2 写掩码对齐向量指令
10.3 扩展与压缩指令
10.4 写掩码混合指令
10.5 掩码向量的置换指令
10.6 掩码操作类指令
10.6.1 紧缩数据掩码移位指令
10.6.2 紧缩数据掩码算术组合指令
10.6.3 紧缩数据掩码串联指令
10.6.4 紧缩数据写掩码比特压缩指令
10.6.5 掩码寄存器上的广播操作
10.7 无须标记位的操作数基础系统转换的向量乘法
10.8 写掩码混洗指令
10.9 紧缩数据写掩码循环指令
10.10 改进的插入、提取和置换指令
10.11 冲突检测和向量紧缩广播指令
10.12 双块绝对差求和指令
10.13 向量指令的读写掩码
10.14 打包存储和加载拆开
10.15 混洗和操作组合指令
10.16 乘乘加法
10.16.1 乘乘加法指令操作
10.16.2 乘乘加法指令应用优化
10.17 共轭复数计算指令
10.18 索引值
10.18.1 转换掩码寄存器至向量寄存器中的索引值
10.18.2 产生重排指令相关控制索引的改进
10.19 写掩码提取指令
10.20 指定数据精度的浮点舍入指令
10.21 十进制浮点数分解指令
10.22 二维聚集指令
10.23 使用掩码寄存器的条件跳转指令
10.24 掩码向量移动指令和掩码更新指令加速稀疏向量递归运算
10.25 用户级线程的即时上下文切换状态交换指令
10.26 向量计算和累加指令
10.27 向量紧缩绝对差指令
10.28 确定值是否在范围内的指令
10.29 单个向量紧缩水平加减指令
10.30 扩展的向量后缀比较指令
10.31 向量压缩和解压缩算法相关指令
10.31.1 向量紧缩一元解码指令
10.31.2 向量紧缩增量编码和解码指令
10.31.3 向量行程长度解码指令和逻辑
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证