统计研究人员已经建立了一些基本原则,如果你希望证明一件事情是另一件事情的原因,那你就得遵守这些原则。 使用统计数据的社会科学研究有着广泛的目标。其中一个目标是收集和分析有关世界的数据,用来支持或否定变量间关系的假设。第二个目标是检验假设,看变量间是否存在因果相关。与目标二相比,目标一是件容易的事。 世间万物之间存在各种各样的关系,统计学家也发明了各种方法来找到这些关系,但是相关性的存在并不意味着某个特定变量是另外一个变量的原因。比如,人群中身高和体重之间存在良好的正相关[Hack #11],但是如果我瘦几磅,我不会变矮。反过来说,如果我长高了几英寸,我的体重很可能会增加。 只知道两者相关,并不能真正告诉我一件事是否导致另一件事的发生。不过,相关性缺失似乎能说明因果方面的问题。如果两个变量间不存在相关性,似乎就能排除一个变量是另外一个变量原因的可能性。相关性存在使得因果关系有可能存在,但无法证明它的存在。 1.9.1 设计有效的实验 研究人员已经发展出一种框架,用来讨论各种研究设计,以及这些设计是否有可能证明一个变量对另一变量产生影响。不同的设计在于有无对照组以及被试如何分配。 基于设计能否提供因果关系的强证据、中等证据、弱证据或是无证据,共有四种基本的组设计类别。 非实验设计 这类设计通常只包含一组人,统计数据常被用来描述总体或是证明变量间关系。这种设计的一个例子是相关性研究,分析变量间简单的关联[Hack #11]。这种类型的设计并不提供因果关系证明。 预实验设计 这类设计通常对一组人运用两套或更多的测量手段,看结果是否有所改变。这个设计的一个例子就是对一组人进行预测试,对他们做点什么,然后对他们做一次实验后测试,看他们的分数是否发生了改变。这种类型的设计提供了很弱的因果关系证明,因为除了你对这些人施加的作用外,还有其他的外力可能会导致分数的改变。 类实验设计 这种设计包含不止一组人,至少会有一组作为对照组。对各组成员的分配不是随机的,而是通过研究者无法控制的一些东西决定的。这种设计的一个例子就是对比男性和女性对统计学的态度差异。最好的情况下,这种设计能提供因果关系中等强度的证明。如果没有随机分组,各群组很可能在一批未测量的变量上不等同,这种不等同可能是导致所发现差异的真正原因。 实验设计 这类设计有一个对照组,重要的是,被试是随机分配到各组的。随机分配被试使得研究人员可以假定所有的群组在未测量变量上是等同的,因此(在理论上),如果发现任何差异性,则把它们剔除作为备择解释。这种设计的一个例子就是药物研究,所有被试被随机分配到两组,一组服用药物,另一组作为对照组,服用安慰剂(糖丸)。 1.9.2 体重会影响身高吗 在本条Hack的稍前部分,我提到关于相关性的一个著名发现:在人群中,身高和体重似乎存在相关。比如,个子高的男性胖些,个子矮的男性瘦些。我觉得这个说法挺滑稽的,因为如果真是这样,那么只要给他们多吃点,他们就会长高一些。因为我知道身体发育的原理,所以体重会影响身高在理论上不太可能。但如果你要科学的证据,那该怎么证明呢? 我可以通过一个基本的实验设计,来检验“体重会影响身高”这一假设。实验设计必须有一个对照组,且被试的分配必须随机。在这种情况下发现的任何相关都可能是因果相关。在我的研究中,我会创建两个组。 第1组 30名大一新生,是从我工作的中西部大学(Midwestern University)这一总体中招募的。这组是实验组,我会增加他们的体重,然后测量他们的身高是否有所增加。 第2组 30名大一新生,也是从我工作的中西部大学这一总体中招募的。这组是控制组,我不会对他们的体重进行任何操控,然后测量他们的身高是否发生改变。 在这一设计中,科学家将体重称作独立变量(因为我们不关心是什么引发体重变化),将身高称作因变量(因为我们想知道它是否依赖于独立变量,或是由独立变量引发的)。 因为这一设计符合实验设计的标准,所以我们能将所发现的任何相关视为因果关系的证明。 1.9.3 抵御对效度的威胁 研究结论分为两类。它们关系到可否做出因果声明,以及该因果声明确立后,可否被推广到整个总体或是实验室之外。表1-9展示了解释研究结果时需要考虑的效度类型。研究人员就好比跨栏运动员,必须跨越这些栏杆。 表1-9:研究结果效度 效度考虑 效度问题 统计结论效度 变量间存在相关吗 内部效度 该相关是因果相关吗 构建效度 变量间的因果关系是否因此而受到影响 外部效度 这因果关系到处都存在吗 即便研究人员选择了真正的实验设计,他们依然要担心结果实际上或许不是由于一个变量对另外一个的影响造成的。对因果结论的效度造成威胁的因素有很多,但幸好,研究人员只需要想想,就辨识出很多这样的威胁并开发了解决方案。 研究人员对群组设计的理解、用来描述它们的术语、研究设计中对效度威胁的确认以及应对威胁的方法,几乎完全来自于Cook和Campbell两人影响深远的论著,见1.9.4节。 以下部分将讨论针对因果声明以及普遍性声明的威胁,并讲到若干消除威胁的方法。在已有研究文献中识别出的威胁有几十种,也试图给出应对方法,但其中大多数要么无法解决,要么可以用这里介绍的工具来解决。 历史 外界事件能够影响结果。一个解决办法是使用控制组(一个未接受药物或任何干预的对照组),并将被试随机分配。这个方案的另一部分是尽可能控制两组的环境(比如在实验室环境下)。 生物成熟 在一项研究过程中,被试自然地生长发育,所以改变有可能是这种自然发展导致的。对实验组和控制组随机分配被试能很好地解决这个问题。 选择 在分配被试时可能存在系统性偏差。解决的办法是随机分配被试。 测试 只进行一场预测试也许会影响研究变量的水平。创建一个对照组,对两组都进行预测试,这样两组中的任何改变都是等同的。还有,要对两组随机分配被试。(你开始看出某种模式了吗?) 测试设备 在测量中可能会有系统性偏差。解决办法是使用有效的、标准化的、客观的分数测试。 霍桑(Hawthorne)效应 被试知道自己在参加实验的意识也许会影响结果。为了应对这个问题,你可以限制被试对你期望的实验结果的认知,或者执行一场双盲研究(double-blind study),即被试和研究人员都不知道给予被试的是什么刺激。 研究设计的效度以及任何一种因果关系声明的效度,都类似于测量中的效度声明[Hack #28]。这样的讨论是开放和无止境的,效度结论依赖于对手边证据的合理检验,以及对什么结论看似合理的考虑。 1.9.4 参阅 Campbell, D.T. and Stanley, J.C. (1966). Experimental and quasi-experimental designs for research. Chicago: Rand McNally. Cook, T.D. and Campbell, D.T. (1979). Quasi-experimentation: Design and analysis issues for field settings. Boston: Houghton-Mifflin. Shadish, W.R., Cook, T.D., and Campbell, D.T. (2002). Experimental and quasi-experimental designs for generalized causal inference. Boston: Houghton-Mifflin.
有趣的统计——1.9 展示因果
书名: 有趣的统计
作者: [美] Bruce Frey
出版社: 人民邮电出版社
副标题: 75招学会数据分析
译者: 邹 澍
出版年: 2014-9
页数: 292
定价: 59.00元
装帧: 平装
ISBN: 9787115356215