第1章 引言
本章描述书中所涉及的学科领域,解释所采用的方法,并概括全书的主要内容。
1.1 分布式系统
分布式系统(distributed system)是能彼此通信的多个独立计算装置所组成的集合。这一定义包罗了范围很广的现代计算机系统,从VLSI芯片,到紧耦合共享存储器的多处理器、本地工作站集群、因特网。本书主要讨论松耦合的分布式系统。一般而言,并行处理的目标是使用全体处理器来执行一个大的任务;而分布式系统中每个处理器通常是执行半独立的程序序列,由于资源共享、可用性和故障容错等各种原因,各处理器之间需要协调行动。
目前,分布式系统无处不在(商业、学术界、政府部门及家庭)。这些分布式系统通常提供共享资源(如彩色打印机或扫描仪等专用设备)和共享数据的手段,对于我们以信息为基础的经济是极其重要的。点对点计算是分布式系统的一个范例,它在提供计算资源和服务方面,正越来越流行。更有挑战性的分布式系统是通过并行解决子问题来提供更高的计算性能的,它们也提供更强的可用性以防某些部件发生故障。
虽然分布式计算机系统如此诱人,但构建一个能正确运行的系统是相当困难的。比如,一些实际的困难包括:系统中存在异构硬件和软件,未遵守相关的标准。更根本的困难是由以下三个因素引起的:异步、有限的局部知识和故障。异步意味着不能精确地知道事件发生的绝对时间,甚至相对时间。有限的局部知识是指每个计算实体只知道它自己所获得的信息,而这只是全局状况的一个局部视图。故障则指各计算实体可能独立发生故障,于是整个系统便会出现一部分计算实体在运行,而其他计算实体失效的情形。
分布式系统正在急剧增加,所以迫切需要我们理解和掌握克服上述困难的方法。正如我们接下来要讨论的,分布式计算这一专业领域就是为分布式系统的设计和分析提供理论支撑的。
展开