实验心理学考点归纳及典型题(含历年真题)详解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第2章 心理实验的变量与设计

2.1 考点归纳

一、心理实验的含义与基本形式

1.心理实验的含义

心理实验,是指通过人为地、系统地操纵环境,导致某些行为发生变化,并对之进行观察、记录和解释的科学方法。在实验法中,研究者可以积极地利用仪器设备干预被试者的心理活动,人为地创设出一些条件,使得被试者做出某些行为,并且这些行为是可以重复出现的。实验法的基本含义是对变量的操控和对因果关系的揭示。

与其他研究方法相比,实验法的显著特征是:(1)要操纵或控制变量,人为地创设一定的情境;(2)基本目的在于揭示变量之间的因果关系;(3)有严格的研究设计,包括被试选择、研究的材料和工具、实验程序、设计分析方法等,以保证实验结果的科学性。

2.心理实验的基本形式

(1)根据实验研究目的的不同,实验可分为探索性实验和验证性实验;

(2)根据实验情境的不同,实验可分为实验室实验和现场实验;

(3)根据实验设计的不同,实验可分为前实验、真实验和准实验;

(4)根据实验中自变量的数量的多少可分为单因素实验和多因素实验等等。

二、心理实验中的变量及其控制

变量是指在数量上或质量上可变的事物的属性。实验中的变量可以分为自变量,因变量和无关变量。

1.自变量的种类与控制

(1)自变量

即刺激变量,它是由主试选择、控制的变量。它决定着行为或心理的变化。自变量可以分为以下四种:

刺激特点自变量

刺激的不同特性会引起被试不同的反应。例如,灯光与声音引起的反应时不同,强度不同的声音引起的反应时也不同,我们把这类自变量称为刺激特点自变量。

环境特点自变量

进行实验时环境的各种特点,如温度、是否有观众在场、是否有噪音、白天或夜晚筹,都可以作为自变量。

被试特点自变量

一个人的各种特点,如年龄、性别、职业、文化程度、内外倾个性特征、左手或右手为利手、自我评价高或低等等,也都可以作为自变量。

暂时造成的被试差别

当被试来到实验室时,他们在各方面都是大致相同的。但是当主试对被试进行分组时,一组被试与另一组被试的差别便产生了。被试的暂时差别通常都是由主试给予不同的指示语而造成的。

(2)对自变量的操纵

在一个具体的实验中,实验者是根据他的实验目的来选择自变量的。研究者不但要选择合适的自变量,还要对这些自变量进行操纵改变,即对自变量进行控制。对自变量控制的好坏,直接影响实验的成败。它主要经历以下两个步骤:

对自变量下操作定义

在研究中,对研究变量作出明确的定义有两种方式:一是抽象定义,指对研究变量或指标本质的概括,以揭示其内涵,并将其与其他变量或指标区别开来;二是操作性定义,指用可感知、度量的事物、事件、现象和方法对变量或指标作出具体的界定、说明。操作定义的最大特征就是它的可观测性,作出操作定义的过程就是将变量或指标的抽象陈述转化为具体的操作陈述的过程。

实验中规定操作性定义有很多好处,可以使研究者的思考具体而清晰;可以增进科学研究者之间沟通的正确性;可减少一门学科所用概念或变量的数目。操作定义就是由测定它的程序来下定义。操作定义明确了自变量的内涵,同时也往往指出了自变量操纵的方法。

在对自变量规定使用的操作定义时,要特别防止操作定义单一性偏差,影响研究的构想效度。

设计操作定义常见的方法:a.方法与程序描述法,即通过特定的方法或操作程序给变量或指标下定义的一种方法,如“疲劳”可定义为连续工作8小时后个体存在的状态;b.静态特征描述法,即通过描述客体或事物所具有的静态特征给变量下定义的一种方法,如“聪明”可定义为学识渊博、语言词汇量大、思维敏捷;c.动态特征描述法,即通过描述客体或事物所具有的动态特征给变量下定义的一种方法,如“好学”可定义为经常上自习、进图书馆、进书店、看报纸和电视等。

确定自变量的各个水平

所谓自变量的水平,即指自变量的一个取值(或操纵结果)。因素型实验的自变量一般不超过4个水平,并应尽量使自变量变化范围(全距)较大,各个水平在全距上分布平均。而函数型实验的自变量水平需要更多些,如果预期实验考察的是线性函数关系,可以取3~5个水平;如果是关于更复杂函数关系的,则至少需要5个水平。

自变量的变化范围不宜过小,一般应该通过文献工作确定合适的全距大小。至于自变量各个水平在全距范围上的分布,则可以根据实际情况而定。若预期自变量和因变量的关系是接近于线性函数,则各水平平均分布即可;而如果预期自变量和因变量符合对数函数关系,则各水平间的间距应按对数单位变化。

2.因变量的种类与控制

因变量即被试的反应变量,它是自变量造成的结果,是主试观察或测量的行为变量。

(1)因变量的种类

对于实验研究来说,因变量的种类是很多的,也是很复杂的。一般来说,对于因变量的测量有客观指标也有主观指标。客观指标主要有以下几种:

反应速度,如简单反应时或潜伏期、走完一个迷津所需要的时间、在一定时间内完成某项作业的数量等。

反应速度的差异。在现代认知心理学实验中,经常以反应速度的差异作为考察被试各种高级认知机能的指标。

反应的正确性,如选择反应的正确次数、走迷宫入盲巷的次数等。

反应标准。随着信号检测理论的广泛使用,诸如似然比β、报告标准c等就常被用来作为客观因变量指标。

反应的难度。有些作业可以定出一个难易等级,看被试或动物能达到什么水平,如斯金纳箱就有三个难度等级。

因变量的主观指标主要是指被试的口语记录。口语记录是指被试在实验时对自己心理活动进程所作叙述的记录,或在实验之后,被试对主试提出问题所作回答的记录。在心理学实验中,口语记录是很重要的参考资料,有助于我们分析被试的内部心理活动。

(2)因变量的控制

因变量的控制主要着眼于如何精确客观地记录下它的变化。一般而言,有几种主要方法可以用于因变量的控制:

反应控制

反应控制的目的,是让被试的反应确实发生在实验者感兴趣的因变量维度上。一般而言,在不加控制的情况下,被试对刺激的反应总是千差万别,而且很难保证所有的反应都恰如其分地表现了实验者感兴趣的因变量变化。

在人作为被试的实验中,对反应的控制往往是通过指导语实现的,指导语是心理学实验中主试给被试交代任务时说的话。在指导语不能充分控制反应时,就要很好地考虑刺激条件和实验装置,使刺激条件、实验装置与指导语配合起来,使被试只能作出主试所要求的反应。

选择恰当的因变量指标

和自变量一样,因变量的控制同样有赖于一个操作定义,这有助于明确某些原本含糊不清的行为变化。一个恰当的因变量指标必须满足以下标准:

a.有效性,即指标充分代表当时的现象或过程的程度,也称为效度(validity)。反应指标的效度直接关系到实验的效度。

b.客观性,即指标是客观存在的,是可以通过一定的方法观察到的。反应时、反应频率、完成量等都是客观存在的指标,是可以用客观的方法测量和记录下来的。这样的指标能经得起检验,并能够重复进行实验,验证结果。

c.数量化,即指标能数量化,也就便于记录,便于统计,并且量化的指标能进行比较。避免量程限制。

在以上几个选择指标的条件中,有效性是最重要的。为了使所用的指标具有较高的效度,应全面考虑,也才能选择出好指标。

避免量程限制

在影响指标有效性的各种因素里,天花板效应和地板效应是尤其典型的情况。这两种效应是指反应指标的量程不够大,而造成反应停留在指标量表的最顶端或最低端,从而使指标的有效性遭受损失。

3.额外变量及其控制

在一次实验中确定了自变量与因变量以后,就应该使实验的其他条件保持恒定,因为只有这样实验中的因果关系才能得到明确的说明。额外变量就是指与实验目的无关,但又对被试的反应有一定影响的变量,在实验中应该进行控制。通常包括两种额外变量:一是与实验目的无关的,相对恒定的客观条件对实验结果产生的影响。这种影响通常是在一个恒定的水平上下波动。我们将这种额外变量称为系统的额外变量。二是随机的、偶然出现的、不可预期的与实验目的无关的,但对实验结果又有一定影响的因素,这个因素称为随机的额外变量。系统的额外变量对实验结果会产生系统误差,这种误差对所有被试的影响是一致的。随机的额外变量则会产生随机误差。

(1)心理学实验中典型的额外变量

额外变量主要表现在:实验仪器的性能与技术参数的设置;来自实验环境方面的额外变量;来自主试方面的额外变量;来自被试方面的额外变量;来自实验设计和实验过程控制方面的额外变量;来自数据整理和统计分析方面的额外变量。其中最典型的两个额外变量是:

实验者效应。主试在实验中可能以某种方式(如表情、手势、语气等)有意无意地影响被试,使他们的反应附和主试的期望。这种现象称为实验者效应。

要求特征。在心理学实验中,被试并不是消极被动的,他们总是以某种动机、态度来对待实验的,因而实验结果在很大程度上也依赖于被试对实验的态度。那么很有可能,被试会自发地对主试的实验目的产生一个假设或猜想,然后再以一种自以为能满足这一假想的实验目的的方式进行反应,我们把这种称为要求特征。

(2)在心理学实验中,对额外变量的控制技术

对部分被试变量及暂时被试变量的控制方法。如指导语、主试对被试的态度等。

对环境变量及部分被试变量的控制方法主要有以下几种:

排除法。排除法是把额外变量从实验中排除出去。

恒定法。旨在使额外变量在实验过程中保持恒定不变。这主要体现在保持实验条件恒定的方面。

匹配法。匹配法是使实验组和控制组中的被试属性相等的一种方法。使用匹配法时,先要测量所有被试身上与实验任务呈高相关的属性,然后根据测得结果将被试分成属性相等的实验组和控制组。

随机化法和抵消平衡法。随机化法是把被试随机地分派到各处理组中去的技术。随机化分配被试,利用数学概率原理,从理论上使各个处理条件下的情况相似。达到平衡误差的目的。随机化法不会导致系统性偏差,能够控制难以观察的中介变量(如动机、情感、疲劳、注意等)。随机化法不仅能应用于被试,也能应用于刺激呈现和实验顺序的安排。随机化法也被用于平衡实验条件的序列效应。抵消平衡法采用某些综合平衡的方法,使额外变量的效果互相抵消,达到控制额外变量的目的。常见的抵消平衡法有ABBA法和拉丁方设计法。

统计控制法。在实验完成后通过一定的统计技术来事后避免实验中额外变量的干扰,因而也被称为统计控制法。统计控制法主要用于实验前控制难以完全控制额外变量影响的情况下。除了协方差分析以外,常用的统计控制法还包括:剔除极端数据,或分别加权等事后控制技术。

统计控制法是在实验前控制难以起到完全效果时的补充手段,而不可能取代实验前控制的重要地位。离开了严格完整的实验前控制工作,再高明的统计技术也无法于事后控制所有的额外变量。

无关变量的纳入。使无关变量成为实验设计中的一个自变量,可以弥补排除、恒定、平衡、抵消无关变量的缺点,这样使实验更接近真实情景。但是由于自变量的增加,也带来了统计上的困难。

三、实验设计

1.实验设计及评价标准

(1)实验设计

实验设计就是进行科学实验前做的具体计划。它主要是用来控制实验条件和安排实验程序。实验设计的目的在于尽可能减少额外的或未控制的变量,从而增加实验产生有效的一致结果的可能性。

心理实验的步骤

a.确定研究问题并提出假设;

b.拟定验证实验的方法并进行研究;

c.整理分析资料并解释实验结果。在这些环节中,验证假设应是整个研究的重点,而验证假设的主要工作,又在于实验设计,可见实验设计的重要性。

一个完整的实验设计提供的信息

a.该项研究的价值如何;

b.研究计划实施的可能性如何;

c.研究者的能力如何。实验设计的意义是由于实验设计本身的功能所决定的。

实验设计的功能

a.使实验变量(即反应变量)的变化最大,实验设计时,必须考虑到选取能够引起反应差异最大的自变量间距及检查点;

b.能控制好各种影响实验结果的无关变量;

c.使实验中误差变异最小。由于实验情境严格控制,因而能使随机误差达到最小。

实验设计是实验成功的关键。一个好的实验设计能够用最少的人力、物力获得最多和最有效的实验数据以达到实验的最佳状态。如果实验设计不当,对非实验条件控制不严,实验方法和程序安排不合理,即使实验的规模较大、实验次数较多,所得到的实验数据也仍有可能无法对最初提出的问题给出合理的回答,达不到原来的实验目的。

(2)实验设计的评价标准

对实验设计的评价包括几方面的内容:

能够恰当地解决所欲解决的问题。实验研究本是解决疑难问题、验证假设的科学方法,实验设计是关于研究者如何应用实验方法解决问题的具体说明,只有具体可行的设计完成之后,实验研究才有可能,这个具体说明的周详程度、科学性如何就决定研究者所欲研究的问题能否得以解决。

恰当地控制实验中的无关变量。一项实验研究中,虽然想了解的是自变量和因变量的关系,但是心理实验中的因变量可能受很多与自变量无关的变量的影响。因此,一个好的实验设计,必须能细密而周全的考虑控制各种无关变量,从而达到解决所欲解决问题的目的。

使实验结果有很高的可靠性(又称效度),就是说实验结果没有混入除自变量之外的其他变量的影响(即使混入,也能加以区分),这个结果不仅仅是特殊情境下的产物,它应具有一定的科学性和普遍性。这就要求设计实验时考虑所选取的被试样本,或实验情境应具有一定的代表性,并能够推论到其他被试或实验情境中去。

实验指标的精确性和可靠性,结果记录的准确性与可靠性直接关系到实验结果的推论性,如果记录的结果不够准确可靠,那么就很难保证实验的结果的可靠性,由此作出的结论也可能是错误的。因此在实验过程中,应采用精确的实验仪器,对实验过程进行研究和控制,尽可能保证实验结果的精确性和可靠性。

2.前实验设计与事后设计

(1)前实验设计是最为原始的设计,它对任何无关变量都没有控制,因而效度很低。基本类型有以下三种:

单组后测设计

这种实验设计,它对任何无关变量都没控制,对一组被试实施实验处理,然后再对其进行观测,以评价实验处理的效果。该设计由于未控制无关变量的干扰和影响,因而难以得出因实验处理而引起实验结果的结论。

单组前后测设计

在实验处理之前增加了一次前测,通过前测可以获得所抽取样本的最初水平或心理特征,再与单组后测结果进行比较,以分析实验处理的效应。该研究设计的结论也缺乏可靠性,因为其中可能存在练习效应以及历史、成熟因素的影响。

单组前后测设计的显著性检验的统计方法:相关样本的t检验,非参数的符号检验,非参数的符号秩次检验。

对照组比较设计

除了接受实验处理的实验组外,另外设置了一个不接受实验处理的控制组,因而可在一定程度上控制历史、成熟和统计回归等无关因素。但是,在该设计中,实验组与控制组被试的选取和分配不是随机的,而且没有前测,因此也不能肯定地将实验组和控制组后测的差异归因于实验处理。

对照组比较设计显著性检验可以选择四种统计分析方法。分别是独立样本t检验,非参数检验中的曼-惠特尼U检验,非参数检验中的中位数检验,卡方检验。

(2)事后设计是指所研究的对象是已发生过的事件。在研究过程中,研究者不需要设计实验处理或操纵自变量,只需通过观察存在的条件或事实,将这种已自然发生的处理或自变量与某种结果或因变量联系起来加以分析,以便从中发现某种可能的简单关系。事后设计的研究从已经发生的并在某方面有差异的组别开始,追溯研究产生这种差异的原因。

事后设计的类型

事后回溯设计主要包括两种类型,即相关研究设计和准则组设计。

a.相关研究设计

相关研究设计是在一个被试组内收集两个集合的数据,其中一个数据集合是观察到的结果,另一个则是被追溯的数据集合,研究的目的是确定这两个数据集合之间的关系(正相关、负相关和无关)。使用相关研究设计的目的在于借助所测量的变量之间的相关系数来确定变量之间存在的某种关系,并为提出变量间的因果关系奠定基础。应该注意的是,两变量之间的相关关系并不一定就存在着某种因果关系,即使两个变量间存在着较高程度的相关,也不能说明它们之间必然存在着因果关系。

相关研究设计的统计分析方法:皮尔逊积差相关的计算方法;点二列相关的计算方法;斯皮尔曼等级相关的计算方法。

b.准则组设计

准则组设计与相关研究设计相类似,是对已经发生的事件进行研究的一种非实验设计。它要求研究者通过对所研究现象的被试的比较,确定某些被试(准则组)具有一种状态的特征,而另一些被试(非准则组)不具有这种状态的特征,然后去追溯可能存在的原因。

准则组设计统计分析方法:准则组设计所采用的统计分析方法一般是t检验和z检验,也可以用非参数中的曼-惠特尼U检验以及中位数检验。

相关研究与准则组研究是事后回溯设汁的两种主要形式,这两种研究是相辅相成的。

事后设计的优点

a.可以对自然条件下出现的事情或各种学习现象进行时间上的追溯,了解产生这些现象的信息,即由于什么原因在什么样的条件下出现了这种结果;

b.特别适用于研究简单的因果关系的问题;

c.可以为研究假设提供充足的论据。这种假设可以通过以后更严格的实验方法来检验;

d.在某种环境或特殊条件下,事后设计比其他实验设计更为有用,这是因为其他实验设计所建立的研究需要人为的作用来引起;

e.由于条件限制,研究者在不可能采用严格的实验设计研究时,便可以考虑这种方法。

事后设计的缺点

a.在实验研究中缺乏控制,研究者不能操纵自变量或者随机分配被试;

b.研究中所追溯的原因有多个,在不同条件下,一个特定的结果可能由不同的原因所引起;

c.两个有关系的因素可能并不存在有因果关系,它们可能都是第三个因素的原因或者结果。

3.准实验设计

准实验设计是介于前实验设计和真实验设计之间的实验设计,它对无关变量的控制比前实验设计要严格一些,但不如真实验设计控制得充分和广泛。是指在实际的社会情境中,不能用真正的实验设计来控制无关变量,但可以对一些影响实验结果的无关变量进行分类,将其作为自变量因素纳入,使用真正实验设计的某些方法搜集、整理、统计分析资料,例如,什么时候测定结果,测哪些被试等等。这种实验设计由于缺少对部分实验的控制,因而,研究者必须事先对哪些无关变量影响实验结果有清楚的认知,这样才便于对实验结果进行解释。主要包括以下几种类型:

(1)时间序列设计

时间序列设计是指对一组非随机取样的被试实施实验处理,并在实验处理前后周期性地做一系列测量,然后分析前后测量是否具有连续性,从而推断实验处理的效果。其基本形式为:一系列前测→实验处理→一系列后测。

由于采用了一系列前测,时间序列设计对于成熟、历史和测验效应均有了一定程度的控制。当然时间序列设计对历史因素的控制不能像真实验设计那样完全,但研究者可以借助一系列测量来解释历史因素的干扰程度,另外时间序列设计还很好地控制了测验效应,由于一系列的前测,使被试对测验逐渐适应了,练习效应逐渐减弱或者隐含于前后测量结果总的变化趋向中,称为平衡因素。但是时间序列设计没有控制组,不能控制与实验处理同时发生的偶然事件的影响,不能排除那些与自变量同时出现的附加变量。同时,由于实验过程被试反复接受测量,也可能导致疲劳效应,影响结果的客观性。

时间序列设计多用于小样本实验,结果一般采用t检验进行考察。

(2)相等时间样本设计

相等时间样本设计是指对一组被试抽取两个相等的时间样本,前一个时间样本里出现实验变量,而在后一个时间样本中不出现实验变量,通过比较多次测量的差异,可检验实验处理的效果并分析实验安排的顺序效应。其基本形式如下:

处理→测量O1→无处理→测量O2→处理→测量O3→无处理→测量O4

相等时间样本设计可有效控制历史因素的影响,但外部效度不高。它一般适用于一次实验处理对被试序列、行为只有暂时影响的研究,如某些行为的矫正研究。

(3)不相等控制组前后测设计

在一些心理研究中,研究者往往不能随机分配被试,这时候就可以采用不相等控制组前后测设计,基本形式如下:

实验组:前测O1→实验处理→后测为O2

控制组:前测O3→后测O4

由于采用了控制组和前后测,不相等控制组前后测设计控制了历史、成熟、测验等因素,比前实验设计完善了一步。但是,它还不如真实验中的前后测设计。因为在不相等控制组前后测设计中被试不是通过随机抽取的,只是采用原有的静态组,实验组和控制组之间可能存在选择偏差。

其统计分析一般是采用独立样本的t检验和协方差分析,将两组前后测的分数变化进行比较,从而估计出实验处理的效果。

(4)不相等实验组控制组前后测时间系列设计

这种设计是将时间序列设计和不相等控制组设计结合起来,基本形式如下:

实验组:一系列前测→实验处理→一系列后测

控制组:一系列前测→一系列后测

这种设计既采用了序列前后测,又设置了非随机分配的控制组,能更好地控制成熟和历史的因素,而且测验的练习效应和敏感性也能得到有效的平衡和控制。但是序列测量可能会引起被试的疲劳和敏感。

这种设计的统计方法可以将两组被试各自一系列时间前测的平均数与一系列时间后测的平均数加以比较,从测量结果的变化说明处理的效果,也可以比较两组间的一系列时间的前测或者后测,这样就可以判断两组接受不同处理所产生的效果。

(5)分解样本前后测设计

这种设计的基本形式如下:

从形式上看,这种设计是将前实验设计的单组前后测设计进行两遍,比较适合于不能一次使所有被试都接受处理,但要求最终所有被试都接受处理的情况。

这种实验设计的内部效度很容易受到三个方面的干扰:

由于使用前测带来的测验效应,然而使用前测对于控制选择偏差又是必要的,因此,研究者应该尽量避免使用敏感性比较高的前测;

成熟因素的影响不容忽视。由于这种实验设计中的主要的控制比较是O3和O1,然而通常第二组在处理开始的时候,其成熟水平要比第一组结束时候的成熟水平低一些;

可能存在选择与成熟之间的交互作用,从而影响结果的解释和作出结论。

(6)修补设计

分解样本前后测设计是将一个前实验设计重复两次,而修补设计实际上是将两个不同的前实验设计结合在一起;其基本形式为:

A组:实验处理→后测O1

B组:前测O2→实验处理→后测O3

4.真实验设计

真实验设计就是通常所说的实验设计,其特征在于对影响内部效度的无关变量采取了严格的控制并有效地操纵研究变量。

(1)真实验设计的分类

根据被试接受实验处理的情况,真实验设计可分为被试间设计、被试内设计和配对组设计三大类。

被试间设计

被试间设计就是每个被试只接受一种自变量水平的实验处理,不同的被试接受不同的自变量水平的实验处理。在这种设计中由于被试是随机取样并随机安排接受不同的实验处理的,因而又称完全随机化设计;各实验处理组之间不相关,因而又称独立样本设计。分别用以下的模式表示:

后测设计:

实验组:随机取样(R1)→实验处理→后测O1

控制组:随机取样(R2)→后测O2

前测后测设计:

实验组:随机取样(R1)→前测O1→实验处理→后测O2

控制组:随机取样(R2)→前测O3→后测O4

所罗门四组设计:

实验组1:随机取样→前测O1→实验处理一后测O2

控制组1:随机取样→前测O3→后测O4

实验组2:随机取样→实验处理→后测O5

控制组2:随机取样→后测O6

被试间设计的优点是每一个人只接受一种处理方式,而一种处理方式不可能影响或污染另一种处理方式,因此避免了练习效应和疲劳效应等由实验顺序造成的误差。

但它也有两个基本的缺点:第一个缺点是所需要的被试数量巨大:由于每一个自变量的每一个水平都需要不同的被试,当实验因素增加时,实验所需要的被试数量就会迅速增加。第二个缺点更严重:由于接受不同处理的总是不同的个体,因此被试间设计从根本上是不能排除个体差异对实验结果的混淆的,而匹配和随机化技术也只是尽可能地缓解而不是根治这一问题。

被试内设计

被试内设计是指每个或每组被试接受所有自变量水平的实验处理的真实验设计。又称“重复测量设计”。如果用被试组代替单个被试,每组都要接受所有的实验处理,但组中的每个被试随机地接受一种实验处理,这样的组称为区组,这种设计称为“随机区组设计”。同一区组内的被试应尽量“同质”(即在各方面都相似或相同)。随机区组设计的实验处理之间相关,因此又称“相关样本设计”。

被试内设计的最大优点是:它更有力或更敏感,其由被试变异性而导致误差的可能性比被试间设计小。被试内设计往往需要平衡,因此如果在某些情况下平衡设计难以应用,那就意味着被试内设计也无法适用。

配对组设计

前测O→配对→随机分组-实验组→实验处理→后测O1控制组→后测O2

从中可见,配对组设计既具有被试间设计的某些特点,如每组被试接受一种实验处理,又有被试内设计的特点,即实验组与控制组同质。

混合设计

混合设计一般涉及两个以上自变量的处理,其中每个自变量的实验设计是不相同的。例如,其中一个用被试间设计,另一个用被试内设计。此种设计兼具了被试间和被试内设计的优缺点。

(2)完全随机单因素设计

完全随机化设计也称简单随机化设计,是指用随机化方法将被试随机分为几组,然后依实验的目的对各组被试实施不同的处理,实验中只包含一个自变量。

随机实验组控制组前测后测设计

随机实验组控制组前测后测设计是指研究者在实验前采用随机分配的方法将被试分为两组,并随机选择一组为实验组;另一组为控制组。实验组接受实验处理,而控制组则不给予实验处理,它的基本模式如下:

实验组:R  O1  X  O2

控制组:R  O3 O4

在该设计的基本模式中,R表示采用随机布置方法分配被试和实验处理,X表示由研究者操纵的实验处理,O1和O3表示在实验前对两组被试进行前测验,得到被试初始状态的成绩,O2和O4表示两组被试的后测成绩(一组接受实验处理,另一组不接受实验处理)。

设计的显著性检验:

对实验组控制组前测后测设计所得到的实验数据进行统计分析,可以采用两种方法:

a.对每个被试,用其后测的成绩减去前测的成绩(即O2一O1,O4一O3),分别求出两组前后测之差的平均数,然后对两组差前后测之差的平均数进行t检验;

b.用协方差分析法,将前测分数作为协变量,对实施实验处理前的组间差异进行控制和调整,以便使两组的后测成绩能够进行比较,而不受前测的影响。

随机实验组控制组后测设计

在随机实验组控制组前测后测设计中,由于采用了前测验,从而有可能影响实验的外部效度,为了克服这一不利因素的影响。也可以考虑去掉前测验。而形成另一种实验设计。即随机实验组控制组后测设计,它的基本模式如下:

实验组:R  X  O1

控制组:R O2

在该设计模式中,字母表示的意义与前一种设计模式相同,O1和O2为后测成绩。

实验组控制组后测设计几乎具有实验组控制组前测后测设计的所有优点。首先,由于采用实验组接受实验处理,控制组不接受实验处理,从而控制了历史和成熟因素对内部效度的影响。其次,由于实验是在同等条件下进行的,因此它控制了选择和被试的中途推出等影响内部效度的因素。最后,由于两组被试没有进行前测,从而控制了测验与实验处理交互作用对实验外部大小度影响。

实验设计的显著性检验:实验组控制组后测设计采用t检验对两组后测成绩进行比较研究,而非参数检验也常常采用中位数或者U检验。

随机多组后测设计

有时研究者要进行的实验处理X的个数有3个或3个以上。在此我们以3个实验处理作为特例来进行分析,这种实验设计的基本模式是:

实验组1:R  X1  O1

实验组2:R  X2  O2

实验组3:R  X3  O3

这种实验设计通过随机化的方式分配被试和实验处理到不同的组别中,然后对几个组的被试进行后测验,获得各组被试的后测成绩。

实验设计的显著性检验:随机多组后测设计采用单尾的方差分析方法,或非参数卡方检验。

(3)完全随机多因素设计

指在实验中包括两个或两个以上因素(自变量),并且每个因素都有两个或两个以上的水平,各因素的各个水平互相结合,构成多种组合处理的一种实验设计,又称完全随机析因设计。

在完全随机析因设计中,研究者可以考察各个自变量交互作用对因变量的主要影响效应(交互作用);并同时考察各自变量对同一因变量的主要影响效应(主效应);以及考察一个因素的各个水平在另一个因素的某个水平上的效应(简单效应)。在心理学的实验研究中,这种设计具有很大的实用价值。

(4)随机区组设计

随机化区组设计的目的在于使区组内的被试差异尽量缩小,而对区组之间的差异依据设计要求而定。每种处理出现在每个区组中,这时区组之间的差异并不影响在各处理平均数间的差异。这种差异可以从误差中剔除。

随机化区组设计的原则是同一区组内的被试尽量“同质”。每一区组内被试的人数分配有3种情况:

一名被试作为一个区组。这时,每名被试(区组)均接受全部处理,在接受处理的顺序上要采用随机化的方法。

每个区组内被试的人数是实验处理数目的整倍数。

区组内的基本单元不是一名被试或几名被试,而是以一个团体为单元。

随机区组设计又可分为随机化区组单因素设计和随机化区组多因素设计。

随机化区组单因素设计要求将被试划分为不同的区组,并且每一区组的被试随机接受所有不同的处理。然后观察实验处理后每个区组中的被试对不同处理的反应,并作为后测成绩。

随机化区组多因素设计中不仅仅限于一个因素。例如,随机化区组两因素设计将被试划分为不同的区组,每个区组都随机接受两因素各个水平组合的全部处理,然后观测每个区组对不同处理的反应,并将反应值作为后测成绩。

四、实验研究的效度

1.内部效度

(1)定义

实验的内部效度是指实验中的自变量与因变量之间因果关系的明确程度。如果在实验中,当自变量发生变化时因变量随之发生改变,而自变量恒定时因变量则不发生变化,也就是说确实是自变量而不是其他因素引起了因变量的变化,那么这个实验就具有较高的内部效度。由此可知,内部效度与无关变量的控制有关。

(2)内部效度的影响因素

被试因素

a.历史因素。由于实验都经历一个时间过程,在这一时间历程中,存在一些有利于强化反应的因素作用,使反应变量发生偏移,反应结果不真实。

b.霍桑效应、安慰剂效应、要求特征。即被试知道自己正在被观察测定,所表现出的期望效应和猜测实验目的对自己利弊而作出的不实反应,是影响内在效度的一个很值得注意的问题。

c.疲劳因素。是由重复安排实验所产生的影响实验结果的因素。

d.成熟。指随着时间的经过,被试者内部历程发生改变,而影响了实验结果的真实性。

e.被试亡失。指最能反映实验处理效应的被试,由于某些原因中途退出实验,造成实验结果的偏差。

f.选择。指没有用随机取样的方法选择实验对象或进行分组,使所选择的几组实验对象在实施实验处理之前就存在差异,不相等;在对结果的分析处理时,又未采用相应的方法加以鉴别分析,故其结果的差异难以说清是自变量的效果还是原有被试的差异造成的,而如果只依数据的表面差异情况作出结论,显然就会降低内在效度。

测验工具因素

a.测验经验的增长。测验经验是指对心理学研究中常用的测验量表的应答技巧,它会使测验成绩越来越好。如果其间有实验处理,前后两次测验结果的变化,就很难说是实验处理的效应,还是测验经验。

b.测量工具的稳定性。指呈现自变量和测定反应变量的仪器或其他工具,随使用时间、电压变化,或其他原因而变化,有变化的即为不稳定。同样,一个信度不高的心理测验量表也属于这一类,如果用这种信度不高的工具测量被试心身的变化,会带来很大误差,使内在效度降低。

实验者效应

由实验者的期望、态度、情绪等因素造成对实验结果的影响称之为实验者效应。

交互作用因素

a.主试-被试间的相互作用

在心理学实验研究中,除了主试给出指导语及被试按指导语要求完成任务的相互作用之外,他们之间还可能存在着某种干扰实验、使实验结果发生混淆的相互作用。有两种来源的偏差:要求特征和实验者效应。

保证实验内部效度的通用手段是双盲实验法。也就是说,主试和被试都不清楚实验的具体目的,因而可最大程度上避免主试的暗示和被试的顺从。

b.选择与成熟之交互作用。选择不同被试可能与成熟之间存在交互作用,也影响效度。

c.前测与实验处理的反作用效果。有些研究设计需要进行前测,前测与实验处理本身,都会对后测(实验效果的检测)产生影响。这些影响有正也有负,即心理唤醒水平、练习效果、迁移、前摄抑制等等,这也是影响内在效度的因素之一。

统计回归

回归假象的概念:第一次测量平均值偏高者,第二次测量平均值有趋低的倾向(向常态分布的平均数回归);第一次测量平均值偏低者,第二次测量平均值有趋高的倾向(也向常态分布的平均数回归)。

当实验分组涉及某些具有极端特性的个体作为被试(如高焦虑组和低焦虑组)时,统计回归将对实验的内部效度起到极大的影响,实验者将无法区分统计回归的效应和自变量本身的效应。为避免统计回归对实验效度的影响,通常建议实验者在匹配被试时必须考虑两组被试本身是否同质,如果不同质(就像白人儿童和非洲裔儿童),就必须以几组被试各自的相对水平进行匹配。此外,利用统计控制进行协方差分析,在某种程度上也能降低统计回归对实验效度的影响。

(3)零结果对内部效度问题的提示

如果在一项实验研究中,由于上述种种原因造成了严重的混淆,导致自变量的操纵和变化没有引起因变量相应的变化,那么实验就会出现零结果。因此,如果零结果不是真正意义上说明白变量和因变量毫无关系,那么就必然提示了实验的内部效度存在大问题。

一般来讲,零结果产生后,我们要在以下几方面寻找原因以改进实验的内部效度。

a.自变量的操纵是否有效。如果自变量的操纵本身较失败,那么就不足以引起因变量的变化;

b.因变量的测量是否充分。如果因变量的测量范围受到限制,出现天花板效应或地板效应,那么实验的内部效度也将大打折扣;

c.额外变量是否得到有效控制。如果实验对额外变量的控制不够充分,自变量与因变量之间因果关系的明确程度就大大降低,那么实验就很有可能出现零结果。

无论是何种情况下,当一项研究出现了零结果时,它可以告诉研究者很多信息。

a.它提醒研究者可能他的实验操纵存在问题,实验的内部效度已经受到了严重的威胁。需要研究者重新考虑该如何对待这种操纵的失误,并采取相应的措施来弥补,比如重新实验;

b.它告诉研究者可能他的实验假设存在偏颇。需要研究者重新谨慎地思考其假设背后的理论的正确性。虽然这种情况很难让每个研究者都接受,但却可以真实地反映研究者的科学态度。

2.外部效度

(1)定义

实验的外部效度是指实验结果能够普遍推论到样本的总体和其他同类现象中去的程度,即实验结果的普遍代表性和适用性,研究者也将之称为生态效度。普遍性的问题在所有类型的研究中都存在,也是研究者感兴趣的问题。它涉及实验结果的概括力和外推力,也就是实验结果接近现实的程度。

(2)外部效度的影响因素

实验的外部效度受到很多因素的制约。主要有以下几个方面的影响:

实验环境的人为性

实验是在严格的控制条件下进行的,实验环境的人为性可能使某些实验结果难以用来解释日常生活中的行为现象。在特定的实验情境中,被试通常知道自己是处于被观察的地位,因此其行为可能会受到影响,表现为与他们不知道自己正在被观察或不参加实验时有很大的不同。而且实验室中的仪器设备也会影响被试的典型行为。此外,被试参与实验时都存在一定的动机和对实验的预期,这些因素都会影响其行为表现。

被试样本缺乏代表性

如果研究者选择一些具有独特心理特质的被试进行实验时,因为这些独特的心理特质有利于对实验处理造成较佳的反应,就很难将得出的结果推广到其他特质的被试上去。

测量工具的局限性

实验者对自变量和因变量的操作性定义往往以所使用的测量工具的测量结果来加以考虑的。实验材料和测验类型的差异可能会使多个研究者对同一个问题的研究结论无法会聚,也就是说可能导致不同的结论。这直接影响到实验研究的外部效度,以及我们对某一研究对象的正确和深入的理解。

其他的因素

操作定义不明确;研究对被试的反作用;事前测量与实验处理的相互影响;多重处理的干扰;实验者效应;研究与实际情境相差较大;被试选择与实验处理的交互作用等。

3.构思效度

(1)定义

构思效度,又称结构效度,是指理论构思的合理性及其转换为抽象与操作定义的恰当性程度。

(2)提高构思效度方法

理论构思必须结构严谨、符合逻辑、层次分明,形成某种“构思网络”;

严谨地对各种变量做出明确、严格的说明;

给变量下明确的操作定义,并制定相应的客观测量指标;

消除或控制各种影响因素,如构思水平之间的混淆、主被试效应等。

(3)构思效度的特点

构思效度的大小首先取决于事先假定的心理特质理论。一旦人们对同一种心理特质有着不同的定义或假设,则会使得关于该特质测验的构思效度的研究结果无法比较。

当实际测量的资料无法证实我们的理论假设时,并不一定就表明该测验构思效度不高,因为还有可能出现理论假设不成立,或者该实验设计不能对该假设作适当的检验等情况。这就使得构思效度的获取更为困难。

构思效度是通过测量什么、不测量什么的证据累积起来给以确定的,因而不可能有单一的数量指标来描述构思效度。

4.统计结论效度

(1)定义

统计结论效度是关于研究的数据分析处理程序的效度检验,或者说,它是检验研究结果的数据分析程序与方法的有效性的指标。

(2)统计结论效度的基本问题是研究误差、变异来源与如何适当地运用统计显著性检验,它不涉及系统性偏差的来源问题,而是研究误差变异情况和如何适当运用统计显著性检验的问题。

(3)要提高统计结论的效度,首先必须保证数据的质量;其次要明确各种统计检验方法的基本假设和适用条件,选用适宜的统计程序;此外还应注意适当增大样本的容量。