第1章引言与概述
1.1绪言
自从R.A.Fisher建立现代统计以来,试验设计在统计学课程、实践和研究中发挥着重要作用.它已成功应用于许多科学研究领域,包括农业、医学和行为研究以及化学、制造业和高科技行业.起源于试验设计和分析的概念,如随机化、效应混杂和别名,其应用范围已经超出了*初的动机.设计理论在数学方面的工作,如分区组设计和正交表,也刺激了某些数学分支的新研究,如代数、组合数学和编码理论.
试验问题根据其目标可以分为五大类(Wuand Hamada,2000):①处理比较,②变量筛选,③响应*面探索,④系统优化,⑤系统稳健性.除了单向或二向分类设计的处理比较外,其余问题涉及多个输入变量对试验结果(即响应)的影响研究.这些输入变量称为因子,这些试验称为因析试验.每个因子必须有两个或更多设置,以便探究改变因子设置对响应的影响.这些设置称为因子的水平.因子水平的任意组合称为一个处理组合.在工业试验中,一个处理组合也称为一次运行.因析设计关心的是一个因析试验中处理组合的选择和安排.因析设计因为它丰富的结构、理论和应用而成为*重要的一类设计.应用设计的文章通常有很大一部分内容用来介绍因析设计.事实上,任何涉及多个因子的研究都可以从因析设计的概念、理论和方法中受益.
一个全因析设计包含所有可能的处理组合.随着因子数量的增加,处理组合的数量会迅速增加.对于一个因子都是二水平的因析试验,随着因子数量从6增加到9,处理组合的数量从64增加到512.当每个因子有三个水平时,随着因子数量从3增加到6,试验的大小就从27增加到729.显然由于经济原因,大规模的全因析试验可能不可行.一个实用的解决方案是选择全因析设计的一部分进行试验.以经济有效的方式选择这样的部分是部分因析设计的主题.
我们通过一个简单的例子来说明部分因析设计.考虑表1.1中16x15的表,称为设计矩阵.矩阵中的行对应于处理组合(或运行),列用来分配因子.每个因子有两个水平,在表中用0和1表示.第1列至第4列由四个因子的所有16种可能的处理组合构成.从前四列中取出任意2到4列,做模2加法形成第5列至第15列.例如,第5列是用第1列和第2列的模2加法得到的,可以解释为第1
列和第2列所安排因子的交互作用.假设处理组合数固定在16,可以用前4列构成一个2x2x2x2全因析设计(缩写为24设计)来研究4个因子.当需要研%5个因子时,可以保留前4列,再从剩余的11列(即表中编号为5到15的列)中选择一列作为第5个因子所在列.给定一个设计目标,这将是一个简单的搜索,因为它只涉及11种不同的选择.由此产生的设计是25全设计的1/2部分.随着因子数的增加,搜索的规模变得更加难以计算.对于9个因子16个处理组合的设计,需要找到29设计的1/25部分,即29_5设计.除了前4列,必须从剩下的11列中再选择5列,共有462种选择.对于更大的问题,这个数字可以呈现天文数字般增长.如前所述,研究32(=25)个处理组合的13个二水平因子,搜索共有个选择,为了研究个处理组合的14个因子,不同选择数从百万增加到16.5亿.通过对称分析和其他技术,如上数字的搜索规模可以减少.但这种蛮力强制寻求经济和高效设计的方法显然是不可行的,进而需要一种理论.
1.2为什么写这本书?
在解决部分设计的“*优”选择问题之前,必须确定*优性准则的选择.**个主要准则是Box和Hunter(1961a,1961b)提出的*大分辨度准则:具有更大分辨度的部分因析设计更可取(技术术语的定义见后续章节).进一步研究发现,这个准则不能区分具有相同分辨度但却有不同性质的部分因析设计.时隔近20年,Fries和Hunter(1980)提出了一个更具辨别力的准则:*小低阶混杂(minimum aberration,MA)准则,用于选择*优部分因析设计.显然,这项开创性的工作源于Box,W.G.Hunter和J.S.Hunter(1978,第410页)给出的一个二水平部分因析设计表.尽管他们的书中并没有提到MA准则,但该表中的所有设计都有MA性质.美国国家标准局(NationalBureauofStandards,1957,1959)的**工作也包含一些关于MA准则的线索,但没有接近定义或抓住它的本质.
除了Franklin(1984,1985)的工作外,Fries和Hunter的论文及MA准则又被忽视了十年.在90年代初,本书的作者之一及其合作者认识到这一准则在选择*优部分因析设计方面的核心作用,以及发展理论和计算机算法来描述与搜索MA设计的需要.随着*初的论文发表,这种新的因析设计方法立即受到了设计界的关注.在过去的十五年里,MA设计的文献大量增加,并被推广到更复杂的情况,进一步衍生出了如估计能力等相关准则.这项研究对教科书和软件都产生了重大的影响.Wu和Hamada(2000)的应用设计类著作*先广泛使用MA准则选择*优部分因析设计及其设计表.Box,J.S.Hunter和W.G.Hunter(2005)的**著作第二版也提到了MA准则和设计.SAS/QC,JMP和Design-Ease等统计软件包现在拥有使用此准则来选择*优部分因析设计的选项.
本书旨在全面总结以MA方法为核心的现代因析设计.为了使读者具备必要的背景知识,我们还发展建立了一些基本概念和结果.此外,为了实际使用,本书提供了MA及相关设计的大量表格.基础工作、MA视角下的*新研究成果和设计表共同构成了本书的主体部分.关于MA准则之外的因析设计和相关主题的书籍,参考Raktoe,Hedayat和Federer(1981),Dey(1985),John和Williams(1995),Dey和Mukerjee(1999)以及Hedayat,Sloane和Stufken(1999).
1.3本书包含哪些内容?
本节给出本书的框架.在绪言章节之后,第2章详细阐述了因析设计的数学基础.*先依据Bose(1947)的**著作介绍因子效应,然后定义正规部分因析设计.依据效应分层原理,基于分辨度和混杂提出*优性准则.*后三节讨论部分因析设计与正交表、有限射影几何和代数编码的联系,以及后者的相关数学性质.本章内容为后续章节的现代理论提供了先决数学条件.此外,它们为试验设计其他方面,如不完全区组设计、拉丁方和响应*面设计,提供了有用的背景材料.事实上,这一章本身对那些对组合设计领域感兴趣的人来说也很有价值.
第3章至第5章组成下一个单元.第3章讨论二水平MA设计,介绍主要
工具和理论结果,并讨论纯净效应和MaxC2准则的相关概念,全面研究了的MA2n-k设计.对于更大的k(即高度部分化的试验),对问题的直接处理是无法实现的.因此,一个新颖的想法是通过一些组合恒等式将设计性质与其补设计的性质联系起来.当补设计中的因子数小于原始设计中的因子数时,这种方法特别有用.本章详细讨论这个强大工具的发展和应用.它将以越来越复杂的形式在随后的章节中重新出现.本章全面给出了有16,32,64和128个处理组合的设计表,并讨论它们的实际应用.这些表格不仅包括MA设计,还包括其他MA或MaxC2准则下的高效设计.设计表格可以被视为书中“更应用”的部分.同时也形成了一个数据库,供设计研究人员使用.
第4章将上述工作扩展到s7JC平因析设计,其中s是素数或素数幂.本章*先讨论三水平设计的情况,并指出从二水平到三水平或更高水平时,在数学处理和因子效应解释中的额外复杂性.除了这种复杂性,本章的内容和结构与第3章相似.通过使用代数编码理论作为工具,得到一个主要定理,这个定理将MA设计与其补设计联系起来.这个定理是近期设计理论中*深刻和*重要的定理之一.本章还给出27和81个处理组合的三水平设计表,并讨论它们的实际用途.与第3章一样,这些表格包括MA设计和其他高效设计.
随着MA准则的流行,人们试图在各种模型假设下,通过一种更直接与可估性联系起来的替代准则为其提供进一步的统计证明.这就引出了*大估计容量的思想,这是第5章的重点.本章对二水平和一般s水平因析设计都进行了研究.主要技术工具仍是补设计,现在称为补集.
第3章至第5章中考虑的设计是对称因析设计,即所有因子的水平数相同.然而,在有些实际情况下,一些因子的内在性质不允许这种对称性.例如,除了一个表示零件供应的定性因子,其有四个供应商,所有因子可能都有两个水平.第6章的重点是非对称(或混合水平:)设计,其因子有不同的水平数.*简单和*常见的例子是包含二水平和四水平因子的混合水平设计,这些设计是通过替换方法构造的.本章*先给出了含有一个或两个四水平因子和一定数量的二水平因子的MA设计,然后考虑了具有s水平和f水平因子的设计.射影几何理论用来描述此类设计,补集技术用于研究其MA性.本章还给出了MA设计表.
接下来的三章构成了本书的*后一个单元.它们处理包含两种不同类型因子的设计.第6章中因子之间的区别在于因子水平数的不同,相较而言,这里的区别是一种更微妙的本质不同.需要额外关注且必须开发新的工具来解决不对称的新特征.第7章涵盖了全因析设计和部分因析设计的分区组.除了处理因子的因子结构外,这类设计还含有一个分区组结构,将MA准则推广到全因析设计的分区组设计.然而,部分因析设计的分区组问题因为两种结构的存在而变得复杂:一种用来定义处理因子的部分,另一种用来定义分区组方案.本章用射影几何对必要的数学表示进行描述,并讨论由MA驱动的各种*优性准则;给出具有理想性质的有16,32,64和128个处理组合的二水平分区组设计表,以及有27和81个处理组合的三水平分区组设计表.
第8章是关于部分因析裂区设计,由于不同的误差结构,整区和子区因子不能对称处理.这需要用另一个后续准则来补充原来的MA准则.与前几章一样,射影几何和补集是主要技术工具.第8章同样以*优设计表结束.
稳健参数设计是一种减小变差的统计或工程方法,通过选择合适的可控因子的设置而使系统对难以控制的噪声变化不敏感.参数设计试验通常用于质量改进,第9章对其设计方面进行介绍,考虑两种试验策略:交叉表和单一表,并给出交叉表可估性的基本结果.这里缺乏对称性是由于控制因子和噪声因子在设计和建模策略的选择中扮演的角色不同.同时考虑到对试验优先次序的认知,引入一个新的效应排序原则解决这种不对称性.这相应地导致对MA准则较大的修改,进而讨论用修改后的准则选择*优设计.
由于本书的重点是试验设计,因此建模问题很少提及.有关建模、分析和应用的资料,可以参考应用设计方面的文献,如Montgomery(2000),Wu和Hamada(2000)以及Box,J.S.Hunter和W.G.Hunter(2005).
1.4超出本书的内容
在本节中,我们简要指出书中未涵盖的近期因析设计中一些有研究价值的主题.它们仍在快速发展阶段,因此尚未形成完整的体系.
本书考虑的所有部分因析设计都是正规的.2.4节给出精确定义,另见2.7节.为了了解正规部分因析设计的含义,我们参考表1.1中的设计矩阵.容易看出,该矩阵任意两个不同列的模2和都可以在剩余的列中找到.在这个意义上,从这个矩阵中选择列给出的任意部分因析设计都是正规的.另外,表1.2(Plackett and Burman,1946)中给出的12行矩阵产生的设计是非正规的.注意到其任意两列的模2和在剩余列中是找不到的.传统上,正规部分一直是因析设计研究的核心.它们有一个整齐的数学结构,简化了推导,并促进了对效应别名的理解.此外,它们也是实际中*常用的设计.
多年来,非正规设计主要从数学角度受到了研究者的关注.然而,*近人们意识到利用它们也可以用于实施有效的试验,而且具有灵活性、试验次数的经济性以及有估计交互作用的能力(Hamada and Wu,199
展开