译者序<br>序<br>前言<br>致谢<br>作者简介<br>第1章 为什么需要CUDA<br>1.1 本章目标<br>1.2 并行处理的历史<br>1.3 GPU计算的崛起<br>1.4 CUDA<br>1.5 CUDA的应用<br>1.6 本章小结<br>第2章 入门<br>2.1 本章目标<br>2.2 开发环境<br>2.3 本章小结<br>第3章 CUDA C简介<br>3.1 本章目标<br>3.2第一个程序<br>3.3 查询设备<br>3.4 设备属性的使用<br>3.5 本章小结<br>第4章 CUDA C并行编程<br>4.1 本章目标<br>4.2 CUDA并行编程<br>4.3 本章小结<br>第5章 线程协作<br>5.1 本章目标<br>5.2 并行线程块的分解<br>5.3 共享内存和同步<br>5.4 本章小结<br>第6章 常量内存与事件<br>6.1 本章目标<br>6.2 常量内存<br>6.3 使用事件来测量性能<br>6.4 本章小结<br>第7章 纹理内存<br>7.1 本章目标<br>7.2 纹理内存简介<br>7.3 热传导模拟<br>7.4 本章小结<br>第8章 图形互操作性<br>8.1 本章目标<br>8.2 图形互操作<br>8.3 基于图形互操作性的GPU波纹示例<br>8.4 基于图形互操作性的热传导<br>8.5 DirectX互操作性<br>8.6 本章小结<br>第9章 原子性<br>9.1 本章目标<br>9.2 计算功能集<br>9.3 原子操作简介<br>9.4 计算直方图<br>9.5 本章小结<br>第10章 流<br>10.1 本章目标<br>10.2 页锁定主机内存<br>10.3 CUDA流<br>10.4 使用单个CUDA流<br>10.5 使用多个CUDA流<br>10.6 GPU的工作调度机制<br>10.7 高效地使用多个CUDA流<br>10.8 本章小结<br>第11章 多GPU系统上的CUDAC<br>11.1 本章目标<br>11.2 零拷贝主机内存<br>11.3 使用多个GPU<br>11.4 可移动的固定内存<br>11.5 本章小结<br>第12章 后记<br>12.1 本章目标<br>12.2 CUDA工具<br>12.3 参考资料<br>12.4 代码资源<br>12.5 本章小结<br>附录 高级原子操作
展开