2.2.6.1 回归分析概述
1.回归分析的定义
回归分析即是为拟合模型,通过优化目标函数(例如最小二乘法)来估计模型参数,并对适当的模型假设作检验,以及用拟合好的模型作统计预报的一种方法。
回归分析就是将所关心的特性(通常称为“响应变量”)的性能与潜在的原因(通常称为“解释变量”)联系起来。这样一种关系可通过科学、经济、工程等学科的模型做出规定,或经验地得到。目的是帮助理解响应变差的潜在原因,并解释每个因素对该变差所起的作用有’多大。通过统计将响应变量的变差与解释变量的变差联系起来,以及将预期和实际响应变量之间的偏差减至最小达到最佳拟合。
2.回归分析的用途
回归分析可用于以下几个方面:
①检验有关潜在解释变量对响应变量影响的假设,并针对解释变量的已知变化,使用这些信息描述所估计的响应变化;
②针对解释变量的具体值,预测响应变量值;
③针对给出的解释变量特定值,(在规定的置信水平)预测响应值的预期范围(置信区间);
④估计响应变量和解释变量相关联的方向和程度(尽管这样的关联并不意味着因果关系)。例如,可以使用这些信息确定当变更某个因素而其他因素不变时所产生的影响,如改变温度对过程产量的影响。
3.回归分析的益处
回归分析可使组织深入了解各种因素与所关心的响应之间的关系,这样的了解有助于指导组织在研究和最终改进过程时做出决策。
回归分析获得的结论来自于其对响应数据的形态进行简明地描述能力,对不同但相关的数据子集的比较能力以及对潜在的因果关系的分析能力。当这些关系能较好地建模时,回归分析还能估计解释变量所产生影响的相对大小以及这些变量的相对强度。这些信息在控制或改进过程的输出中具有潜在的价值。
回归分析也可以对在分析中未测量或遗漏的因素对响应影响的大小和来源做出估计。这种信息可用来改进测量系统或过程。
回归分析可针对一个或多个解释变量的给定值预测响应变量值;同样回归分析也可以就现有或预期的响应来预测解释变量改变时的影响。
4.回归分析的注意事项、
应当注意的是,当建立过程模型时,需要具备一定专业知识和统计技术技能。回归分析的模型必须在适用的范围内使用,不得任意扩展,否则会发生严重的与事实不相符的错误。例如人的年龄与身高在0~20岁时的回归模型,应用到60岁以上的群体中,则必然会得出与客观事实完全相违背的结果。
……
展开