由于受诸多因素的影响,片上多核处理器(Chip Multiprocessor,CMP),又称多核微处理器,已成为构造现代高性能微处理器的唯一技术途径,是处理器发展的必然趋势。《片上多处理器体系结构改善吞吐率和延迟的技术》是讲授多核体系结构设计和优化的第一本著作。<br> 通过对LLCMP与传统单处理器的优缺点,《片上多处理器体系结构改善吞吐率和延迟的技术》仔细研究了如何针对两种常见但截然不同的工作负载来更好地设计CMP:高度并行且对吞吐率敏感的应用和并行度较低但对延迟敏感的应用。对吞吐率敏感的应用,如可迅速处理多个独立事务的服务器工作负载,需要综合考虑CMP中所有可能限制吞吐率的部件,如处理器核心、片上缓存和片外存储器接口。对延迟敏感的应用,如桌面应用,其关注的焦点是如何降低内核间的通信延迟,以及如何帮助程序员简化已有程序代码的多线程化。书中介绍了多种可用于CMP系统的并行编程的技巧,并重点讨论了斯坦福大学在该领域的相关研究工作。《片上多处理器体系结构改善吞吐率和延迟的技术》还关注了线程级猜测(Thread-level Speculation,TLS)和事务型内存(Transactional Memory)。TLS是一种将标准的串行程序自动切分成CMP上多个并行线程的方法。事务型内存模型使用硬件而非传统软件锁机制来保证一段指令的原子代码执行,可以显著减少并行编程的工作量,降低并行代码的出错概率。
展开