前言<br><br><br><br><br><br><br><br><br><br><br><br><br>为什么使用统计学?<br><br><br><br><br><br><br>我是一名经常使用统计学的研究人员,也是谈话类广播节目的热心听众,我发现自己每天都会冲着收音机大喊大叫。尽管我明白这些喊叫毫无作用,但还是不能自已。电台谈话节目主持人、夸夸其谈的政治人物以及公众都知道,再没有什么比个人经验更有效果和说服力了。统计学家把这称为“奇闻轶事”的证据。我经常举一桩陈年旧事来做例子:本地国会议员办公室曾给我寄过一本小册子,上面对公共教育状况大加抨击,我致电这间办公室来表达不满。负责教育事务的工作人员接待了我。我告诉他,根据不同来源报告的统计数据来看,许多迹象表明我们的系统表现良好,高中毕业率上升,大学生人数增加,标准化测试成绩提高,所有族裔的学术能力评估测试成绩都有一定程度的改善,等等。这名工作人员告诉我,即便统计数据果真如此,她也仍然相信我们的公立高中大不如前,因为她与父亲上同一所高中,而父亲受到的教育更好。听罢,我气得挂断电话,又一次大喊大叫起来。<br>许多人对统计数据有着普遍的不信任感,觉得狡猾的统计学家总能“令统计数据说出他们想听的话”,或者“用统计学撒谎”。事实上,研究人员如果计算正确的话,就不能随心所欲。统计数据只会说它能说的,而且从不撒谎。但狡猾的研究人员能以不同方式解释统计数据的含义。不懂统计学的人要么对统计学家和研究人员给出的解释全盘接受,要么一概拒绝。我相信更好的选择是去了解统计学原理并用它解释自己的见闻。本书的目的就是让统计学变得更容易理解。<br><br><br><br><br>统计学的用途<br><br><br><br><br>“奇闻轶事”数据的一个潜在缺陷是其特殊性。议员办公室的那位工作人员告诉我,她与父亲上同一所高中,父亲接受的教育比她好,而我却毫不费力地受到了比父辈更好的教育。统计学使研究者可以从众人身上收集信息或数据,然后概括出他们的典型经验。究竟大多数人受到的教育比他们的父母更好还是更差呢?统计学使研究者收集大量数据并把数据概括成一些数字,例如平均数。当然,把众多数据概括成一个数,难免损失了大量信息,掩盖了不同人的不同经历,所以要切记,统计学在大多数情况下不能对任何个别经验提供有用信息。但研究者一般使用统计学得出关于某个总体的一般性结论。虽然个人经验经常令人感动或引人入胜,但理解典型的或平均的经验往往更加重要。正因如此,我们才需要统计学。<br>统计学也用来得出有关不同分组之间整体差异的结论。例如,我家有四个孩子,两男两女,女比男高。这一个人经验可能令我得出以下结论:女人通常比男人高。当然,我们知道,平均而言,男人比女人高。我们之所以知道这一点,是因为研究者已经随机抽取了大量男女样本,并比较了他们的平均身高。研究者经常对诸如此类的比较产生兴趣:癌症病人服用一种药物是否比服用另一种药物存活的时间更长?用一种方式教孩子阅读是否比用另一种方式更有效?对某部电影的感受是否男女有别?为了回答这些问题,我们需要从随机选取的样本中收集数据,并用统计学比较这些数据。从此类比较中得出的结论通常更为可信,而从非随机样本的简单观测中得出的结论则不然,例如我家男女的身高差异。<br>统计学也用来考察两个变量的取值是否相关并进行预测。例如,统计学能用来考察吸烟与罹患肺癌的可能性之间是否相关。长期以来,烟草公司声称吸烟与罹患癌症之间并无关系。固然有些吸烟的人患上了癌症,但也有许多吸烟的人并未患上癌症,而且吸烟的人往往干一些可能致癌的其他事情,比如食用不健康食品和缺乏锻炼。研究者借助统计学工具进行了大量的研究,最终更多有力的证据表明,吸烟与罹患癌症之间确有关系。由于统计学倾向于关注普遍模式而非个别情况,所以这种研究并不意味着所有吸烟的人都会罹患癌症。但研究表明,平均而言吸烟的人比不吸烟的人患上癌症的概率更大。<br>只要稍加思索,你就能想到大量有趣而重要的“关系”问题,是统计学能够帮助你解答的。自负与学术成就之间有无关系?刑事被告的相貌与定罪可能之间有无关系?能否根据各州在戒毒项目上的支出金额来预测该州的暴力犯罪率?如果我们已知父亲的身高,那么预测儿子的身高有多大把握?研究者利用统计学来确定总体之中的变量间关系,从而考察上述问题以及成千上万的其他问题。<br><br><br><br><br><br>如何使用本书?<br><br><br><br><br>本书无意让初学者在学习统计学时“毕其功于一役”。社会科学的统计学课程如果要使用更加详细的推荐教材,不妨将本书作为补充读物。或者,如果你已经学过一两门统计学课程的话,将本书作为参考书,用来复习巩固学过的统计学概念,也将大有裨益。千万不要忘记,本书比传统教材要精炼得多!书中讨论的概念相当复杂,而表达却力求简明扼要,两相或难免有所冲突。想要更加全面地理解这些概念的话,只需参阅更传统、更详细的教科书即可。<br>告诉大家我的提醒之后,接下来该说说本书的潜在好处以及怎么将这些好处充分发挥了。作为一名统计学的研究者和教师,我发现统计学教科书中总是包括大量的技术性内容,这令那些非专业统计学家的人士望而生畏。虽然我刚说过这些信息是重要的,但有时候简要直白地描述一个统计量的适用条件和解释方式则更为实用。对于统计学课程的初学者、那些对“数学倾向”不感兴趣的人以及多年前学过统计学现在需要复习一下的人而言,更是如此。本书的写作目的是精炼、直白地描述和解释一些统计量,使之容易阅读和理解。<br>为了帮助读者以一种“各取所需”的方式使用本书,我将每一章内容分成三部分。第一部分给出统计量的简单(1~2页)描述,包括统计量的用途及其提供的信息。第二部分包括稍微多点(3~8页)的关于统计量的讨论。在这一部分中,对如何使用统计量、如何利用公式计算统计量、统计量的优缺点以及使用统计量必须满足的条件都提供了更多的信息。最后,每章的结尾都举例说明统计量的应用及解释。<br>开卷之前如果注意到本书的以下三个特点将有助于阅读。首先,某些章不止讨论一个统计量。例如,第2章描述了度量集中趋势的三个统计量:均值、中位数和众数。其次,某些章的内容是统计概念而不是具体的统计技术。例如,第4章讨论正态分布。也有章节讨论统计显著性和统计交互作用。最后,书中各章不一定非得循序阅读。本书组织内容的原则是越基本的统计量和统计概念越安排在靠前的章节,越复杂的概念越出现在较后位置。但也并非只有读过前一章才能理解后一章,而是每章自成一体。这样一来,读者可以根据需要选读各章。例如,如果你在统计学课上已经理解了t检验,但对单因子方差分析不太明白,你就可以越过t检验一章(第9章),直接跳到方差分析一章(第10章)。<br><br><br><br><br>这一版的新特点<br><br><br><br><br>《白话统计学》(第三版)新增和修订了不少内容。最大的改动是增加了关于数据整理组织技术、因素分析和信度分析一章(第15章)。这些在社会科学的统计应用中十分普遍,对于那些使用调查方法的研究者更是如此。另外,第1章也新增了关于理解数据分布的一节,并增加了几幅图表以帮助理解如何使用和解释图表。本书在许多章之后都增加了“行文表述”一节,以说明在出版的论文、书籍或专著中如何表述统计量。这将有助于读者将自己的结果写入出版物或者阅读他人的著作。第三版设有配套网站<br>http://wwwpsypresscom/statisticsinplainenglish/,包括每章的课件汇总、多数章的互动习题集以及进一步学习统计学的有用网站链接。最重要的是,我订正了本书前一版本出现的全部错误。当然,我也可能在撰写这一版时发生了一些新错误,读者不可掉以轻心哟。<br>统计学是帮助人们认识有意义现象的强大工具。无论你是一名学生、一位研究者,或者只是一个有兴趣理解周围世界的公民,统计学都可以提供一种方法来帮助你弄清楚身边的环境。本书用大白话写就,更便于非统计专业人士利用统计学的功能。我希望读者发现它确实有用。<br><br><br><br><br>致谢<br><br><br><br><br>首先,泰勒弗朗西斯集团下属劳特利奇出版社(Routledge/Taylor & Francis Group)的Debra Riegert这些年来好主意不断并且经常请客吃饭,我早就应该感谢她了。接下来,我虽有些不情愿但仍诚挚地感谢本书第三版的评论者:亚拉巴马大学的Gregg Bell、新墨西哥大学的Catherine ARoster以及一位匿名评论人。我不善于听取批评意见,但为了读者的利益,最终还是认识到忠言逆耳并采纳了大多数建议。在准备本书的各个版本时,我主要依靠几位学生提供协助。对这一版协助最大的是Sarah Cafasso,Stacy Morris和Louis Hung。最后,感谢Jeannine使我有时间写作,感谢Ella和Nathaniel让我没把大好时光全耗在工作上。<br>
展开