第三讲 真实验设计

合集下载

真实验与准实验

真实验与准实验

准实验、真实验的判断方法
对无关变量进行控制,但不 完全,不随机分配被试就是准 实验; 对无关变量进行控制,随 机分配被试就是真实验。
实验设计类型时所用的符号:
• • • • • X :一种实验处理 C :控制的变量 O :一次测试或观察 R :被试已被随机选择分配和控制 ...... :上、下两组未做等组化处理
1.前实验
• 这种研究策略,通常是一种自然描述,用来识别自然存在 的临界变量及其关系。它不是严格意义上的实验,但它却 是真实实验设计的组成部分或重要元素,所以称为前试验 设计。 前试验设计对无关变量不能控制,但可以操纵变化自变量, 内外效度都不高。有三种表现形式: (1)单组后侧设计 基本模式: X O (2)单组前后侧设计 基本模式: O1 X O2 (3)固定组比较设计 基本模式: X O
什么是准实验研究
准实验研究是指在无须随机地 安排被试时,运用原始群体,在 较为自然的情况下进行实验处理 的研究方法。本来是心理学研究 中采用的一种研究方法,近年来 已被国外教育界引入到教育研究 中。准实验具有推广到教育实际 的可行性;教育实验大多属于准 实验……
什么是真实验研究
能随机选择和安排被试, 严格控制额外变量,有效地操 纵研究变量的实验。真实验有 很高的外部效度,很难在实际 的教育情境中普遍推广应 用……
3.真实验
• 真实验是能随机分派被试,完全控制无关干扰来源,能系 统地操作自变量的实验。从而具有较高的内外在效度。真 实验设计都有一个控制组,被试随机选择和随机分配到组。 主要有三种表现形式: (1)实验组、控制组前后测设计 基本模式:R O1 X O2 R O3 X O4 (2)实验组、控制组后测设计 基本模式: R X O1 R O2 (3)所罗门四组设计 基本模式:R O1 X O2 R O3 O4 R X O5 R O6

教育实验设计的效度与基本类型(前实验设计、准实验设计、真实验设计)教育研究与写作.pdf

教育实验设计的效度与基本类型(前实验设计、准实验设计、真实验设计)教育研究与写作.pdf

O1 X O2
XO ……
O
特 在单组后测设计 单组前测后测设计是 采用实验组和控制组 征 中,只有一个实 对单组后测设计的一 两组被试,但因这两
验组且不是随机 种改进,它增加了在 组被试在实验处理前 选择,无控制对 实验处理前的测验, 就已经形成,如原有 照组;实验中对 但还是只有一个实验 的教学班,不是随机 实验组只给予一 组且不是随机选择, 选择,也未加任何控 次实验处理;有 无控制对照组,仅一 制选择偏向,故它不 一个后测,将后 次实验处理;有前测 能使用随机化原则选 测结果作为实验 和后测,用前测的差 择被试。两个组都有 处理的效应。 大于零来作为实验处 后测。
这一研究对无关 理前后两次观测条件 了内部效度;若外来
变量没有控制, 下行为变化的直接依 变量影响了后测的成
因而其内部效度 据,能明显地验明实 绩,影响都是一样
极低,一般不宜 验处理的效果;(3) 的,可以控制历史因
使用。
只有一个实验组,自 素;统计分析上,比
身兼作控制组。故可 前两种统计分析把握
认为选择变量得到了 性更大一些)。
一定的控制,同一被 其缺点在于:(1)
试变量,在前测→处 由于被试不是随机分
理→后测过程中表现 组,又没有一个前测
的明显差异,可以在 数据,所以对选择这
一定程度上推断这种 一因素缺乏控制。
变化是由处理引起 (2)选择与成熟的
实验室内的实验往往内在效度高、外在效度低;学校、教室内的实 验往往外在效度高、内在效度低。
三、实验设计类型(*)
前实验设计
特点:前实验设计对无关变量是完全没有控制,但可以操纵变 化自变量。
外 高(三个越来越低) 效
内 低(三个越来越高) 效

(心理学研究方法)4真实验设计

(心理学研究方法)4真实验设计
例如,药理实验:当被试接受处理2时,在处理1摄 取的药物仍然留在被试体内。
控制顺序效应的办法——拉丁方设计
N!种顺序:当有3个条件的话就有6种可能的顺序, 包括ABC、 ACB、 BAC、 BCA、 CAB、 CBA
当有6种处理水平的话,就有720种可能的顺序。所以至 少要720个被试。
注意:当N为偶数,只 需一个拉丁方。 当有N为奇数个条件的 话,就必须构建2个拉 丁方。另一个是第一个 反方向。如N=5,那么 第一个拉丁方的第一行 是BAECD,那么第二个 拉丁方是DCEAB
问题2:假设对120个被试进行了前测,测量了每个被试的运动持续性程 度。如何用前测分数来确认上一个问题是否已经发生?
问题3:这是被试内、还是被试间设计?对于现在的干扰因素,你有什么 办法来控制额外变量的干扰?
问题4:使用被试内设计,该如何分配被试?
多因素实验设计
1、同时探讨字频和字号是否会影响读者的阅读速度 2、自变量:字频、字号、字体三个因素 12种处理水平:字频两个水平,字号三个水平,字体两 个水平 表示为:2字频(高频、低频)×3字号(大号、中号、 小号) ×2字体(正体、斜体)
真实验设计
内容
第一节、提高实验的内部效度的方法
✓ 控制组(对照组)的设置 ✓ 额外变量的控制方法
随机化 保持恒定或匹配
第二节、被试间设计
基本概念 优缺点
第三节、被试内设计
控制组的设置
实验研究必须包含控制组(对照组)。 概念
实验组:处理情境称为实验组。 控制组:无处理情境称为对照组(或控制组)。
实验组:20位 对照组:20位
考虑抑郁程度的高低是混淆变量,请分别采用 随机化、恒定、匹配法把40位被试分为实验组 和对照组?

实验设计的类型

实验设计的类型

实验设计的类型
从对实验控制条件的严密程度的不同:
①真实验设计
②准实验设计
③非实验设计
根据实验中要操纵变量的多少:
①单因素实验设计
②多因素实验设计
根据在各种自变量及各种处理水平中是否用相同被试:
①被试内设计
②被试间设计
缺点:需要的人数较多
③混合设计
实验设计模式
一、从被试接受实验处理的情况分
(一)被试内设计
1.实验前后设计
2.定时系列设计
3.抵消平衡设计
(二)被试间设计
1.随机组设计
2.配对组设计
(三)混合设计
二、从实验控制的严密程度分
(一)真实验设计
1.完全随机化设计(被试间设计)
(1)随机实验组控制组前测后测设计
(2)随机实验组控制组后测设计
(3)随机多组后测设计
2.多因素实验设计
完全随机析因设计
3.随机化区组设计(被试内设计)
(1)随机化区组单因素设计
(2)随机化区组多因素设计
(二)准实验设计
1.单组准实验设计
(1)时间序列设计
(2)相等时间样本设计
2.多组准实验设计
(1)不相等组实验组控制组前测后测设计
(2)不相等组实验组控制组前测后测时间序列设计(3)平衡设计
(三)非实验设计
1.单组后测设计
2.单组前测后测设计
3.固定组比较设计
4.事后回溯设计。

第3章实验设计

第3章实验设计

调查法的优点和局限: 优点: 1、根据研究需要确定需要调查的对象。 2、指导语、测验程序高度标准化,容易重复。 3、利于进行自变量和因变量间的关系分析。 局限: 1、描述性的,不能进行因果分析。 2、调查结果预测行为效度不高。(中国人旅店)
二、相关法
是一种探求两个或多个变量间的相互关系的研究方法。 和观察法一样,也是基于描述的科学研究方法,也无 法确定因果关系。 比观察法优越:能够描述事物间的共变关系,能从一 个变量的值推断出另一个变量的大小。
7、结论
以条文形式、用简短语句说明 实验证实了或否定了什么假设
列出曾在正文或引言中引用过 的文章和书籍 极少使用,实验中使用的特别 材料或不寻常的统计技术
同标准实验报告内容
8、参考 文献 9、附录
少,但也要按要求列出 (养成习惯) 实验全部原始数据
第二节:心理学研究的基本方法
实验法能明确变量间关系,保证科学性,但不是唯一 的科学方法。非实验方法所得到的结果,不见得比实验法 所得结果逊色。 非实验方法主要包括观察法和相关法,它们虽然在额 外变量的控制程度上不能与实验法相比,但也有各自的优 点。
2
实验变量
定义:是在数量上或质量上可以(变化、操纵或测量)的 (条件、现象、事物或事物特征)。
额外变量
自变量
因变量
自变量
定义:在实验中主试所操纵的、对被试的反应产生影响 的变量。是实验的核心。 自变量的来源,主要分为以下2类: 外部刺激
来自外部环 境的刺激,包括 物理刺激和社会 性刺激。外部刺 激一般比试所具备的某种品质、能力或特征而编制 的专业问题。 类型: (1)成就测验:评估掌握水平或能力的测验。如资格考 试 (2)能力倾向测验:测量某一特定工作上的潜在能力和 技能。GRE:词汇、数学 (3)人格测验:测量个体的动机状态,人际交往能力或 人格的一个具体方面。

心理学实验设计 ppt课件

心理学实验设计 ppt课件
(奥卡姆的威廉)著名格言:“不应不必要地增加 事物的复杂性。” (即某课题能简单设计既达成实验
目的,那就不要把设计复杂化了)
心理学实验设计
❖ 根据实验自变量的多少区分为:单因素实验设计、 多因素实验设计(课堂只讲两因素实验设计)。
单因素实验设计中根据自变量水平的多少区分为:双组 设计、多组设计。
❖根据各被试组的类型不同区分为:独立组设计、相关组 设计(包括配对设计、被试内设计);对应对随机化 设计与区组设计。
❖举例:
[被试分配、统计方法]
①高恐惧水平者比低恐惧者更趋于与他人沟通。
②对于缺失同样信息量的汉字,内嵌缺失的汉字比 外围缺失的汉字更易被识别出。
③针对社交障碍者,团体辅导比个别辅导更有效。
❖在此类“呈现两个不同量值或属性”的情景中, 两组均接受实验处理(均为实验组,只是不同的处理)。
心理学实验设计
心理学实验设计
❖ 考察“在相同时间内,完成不同难度的任务对该段时 距估计的影响”
2 实验设计
❖采用单因素被试间设计(1分)。自变量为作业的 任务难度,区分为低难度、中等难度及高难度三 个水平。每组被试只接受一种实验处理。(2分)
❖因变量为时距估计的长短与准确性,分别用被试 对时距的估计值、以及估计值与真实值之差的绝 对值作为其反应指标。(2分)
❖附“被试的分组情况”
心理学实验设计
❖ 考察“语调在6-10岁儿童对不同类型反语认知中的作用”
3 实验材料(略,按实验的真实需要来编制) 4 实验程序(略,按实验的真实需要来安排)
❖如有必要,请说明计分方法(如本题中“正确率”
的计算)
5 数据处理(略,只需按实验目的拟出适宜的统 计方法)
❖ 课外作业:查阅一篇实验报告论文,简要摘录 文中关于研究方法的内容 [ 被试构成、实验设计、 实验材料、实验程序、统计方法 ],并注明出处。 (限700字)

教育实验设计的效度与基本类型(前实验设计、准实验设计、真实验设计) 教育研究与写作

(1)历史或偶然事件:在实验进展过程中没有预料到的影响因变 量的事件的发生。如未定的考试产生的焦虑。
控制方法:可以通过恒定其他条件的方式加以控制。 (2)成熟程度:时间在被试身上起的作用。 控制方法:使被试选择与分组尽可能随机化,并设立对照组。 (3)测验:注意一次测验对随后另一次测验的影响。 控制方法:通过设立无前测的对照组加以控制。 (4)工具:测量手段不统一会产生错误的结果。如:主持实验者 主观情绪状态发生变化,或者研究者的个性、态度、价值观、信息的影 响,或评判标准不同(前后测难度不同、不同班用不同测验、评判者的 差异)。 控制方法:研究者要精心选择测验及技术,谨慎观察,加强基本训 练和严格测试手段,并选择好实验设计以控制这个因素。 (5)统计回归:挑选被试的误差,比如用极端分数进行回归,将 对今后的测验产生不利影响。 控制方法:在研究中最好不采用两极端的被试或在研究中将极端分 数者单独分组,注意结果的差异。 (6)在实验进展过程中被试的选择差异:被试未能随机分配或挑 选,而其中一个因素起了作用,从而产生了组的不对等性。或者是被试 者的态度动机不同。 (7)被试的缺失:非随机挑选的被试脱离实验以及时间的不等 值,都会产生不良影响 (8)取样:成熟程度交互作用,由于取样不一带来的成熟程度的 不一致。 2.外在效度:指特定研究的结果是否具有推广性(具有代表性、接 近真实教育教学环境、可以在不同条件下重复实验)。 研究具有外在效度,说明其结果可以推广到其他情境内;研究没有 外在效度,则其结果不具有概括性。 对外在效度的威胁主要来自四个方面:选择与实验处理的交互作用 效应、测验与处理的交互作用效应、实验安排的效应和多重处理的干 扰。 控制方法:使用设计组加以平衡、用随机、匹配,或者让被试兼做 自己的控制组以控制被试变量等。
实验室内的实验往往内在效度高、外在效度低;学校、教室内的实 验往往外在效度高、内在效度低。

第五章 真实验设计 34单多因素随机区组


拉丁方的标准块:当拉丁方阵的第一行或第 一列都是按字母表顺序排序的时候,叫标准 化方块。
A B B A 2×2 A B C B C A C A B 3×3 A B C D B C D C D A D B A A B C 4×4
P=4的时候标准块的个数是多少? (4*4 为4; 5*5为56; 6*6 为9408) 拉丁方阵标准块的随机化: 当P=2 时 2*2的拉丁方阵可能的个数是2个; 当P=3 时 3*3的拉丁方阵可能的个数是12个; 当P=4 时 4*4的拉丁方阵可能的个数是576个; …… 当P=7时 7*7的拉丁方阵可能的个数是16942080个; 算法:P!*(P-1)!* 标准方块数
二、多因素随机区组设计的数据分析
• 多因素随机区组设计的数据也可通过多因素方差分 析进行处理,即将区组作为一个因素。实验处理A 和实验处理B的主效应及其交互作用是研究者关注 的中心,区组因素则作为无关变量加以控制。 • 但是研究者可以尝试分析区组因素和实验处理之间 的交互作用,如果达到统计的显著性水平,就可以 进一步修改原有的理论假设,把区组因素作为一个 实验因素加以考虑,以提高实验研究的外部效度。
实验处理平均 O.1
例.天气状况对“赛车”测试速度的影 响
年老组



年轻组



举例
一个研究者在做4种文章的生字密度对 学生阅读理解影响的研究时,在这个研究 中,自变量——生字密度有a1, a2, a3, a4 四个水平。学生智力不是研究者感兴趣 的变量,但它们对实验可能有影响,于是 将它们纳入到“自变量”中。
随机化区组设计的原则
• 随机化区组设计的原则是同一区组内的被试尽量 “同质”。 • 每一区组内被试的人数分配有3种情况: 一名被试作为一个区组。这时,每名被试(区组)均 接受全部处理,在接受处理的顺序上要采用随机化 的方法。 每个区组内被试的人数是实验处理数目的整倍数。 区组内的基本单元不是一名被试或几名被试,而是 以一个团体为单元。

第五章 真实验设计 5重复测量实验设计


研究设计

影响被试者对知觉图形喜欢程度的因素有很多,在我们的研 究中,不关心这些因素的作用、影响,只关心熟悉程度对被 试者的喜欢程度产生的影响。我们准备采用单一因素研究模 式,可以考虑的备选模式有两种,一种是重复测量,一种是 非重复测量。哪种更好呢? 我们将熟悉程度定义为呈现图形的次数,分为4种水平,呈 现1次,2次,3次,4次;每次呈现时间为1分钟,以卡片的 形式呈现。实际操作中,第一次呈现时,要求被试者对该图 形给予一个评价,评价方法是采用模糊数学的方法,采用0100之间的数字来表示自己对图形的喜欢程度,0表示喜欢程 度最低,100表示喜欢程度最高。第二次呈现时,与第一次 要求相同。这时,得到的实验数据就是呈现2次的(前面第 一次实验时,已经接受1次刺激),采用累积的方法来定义 处理水平。
E1 E2 E3 E4 E5
a1 a2 a3 a4 —————————————— S11 S12 S13 S14 S21 S22 S23 S24 S31 S32 S33 S34 S41 S42 S43 S44 S51 S52 S53 S54 —————————————— Y1 Y2 Y3 Y4
被试间设计的优缺点
被试受到不同顺序的自变量水平的处理,所
以当平均全部被试的测试成绩时,任何顺序效果
应相等地分布在全部自变量水平上。
1. 完全抵消平衡 (一般适用于三个处理以下)
• 确定自变量水平的所有可能组合(每一种处理在每 一个位置上出现次数相等;任何一个处理先于其他 处理的次数相等) • 把不同的被试分派到每一组合中去(每种顺序都只 有一个相等的次数)
③ 2+1,
3+1, 1+1,
4+1, (n+1)=1, 5+1, ……

3 实验心理学 实验设计


A的效应不随B的变化而变化的图示
b1水平 70 60 50 40 30 20 10 0 a1 兴趣大 自变量A a2 兴趣小
动机强
因变量观测值
b2水平
动机弱
50 40 30 20 10 0
兴趣大
因变量观测值
a1
自变量A
a2
兴趣小
70 60 50 40 30 20 10 0 a1
兴趣大
因变量观测值

实验材料:车鸟问题图示
实验设计

两组被试,给一组被试呈现问题的同时呈 现图解,一组被试只看到问题,没有图解。
因变量指标的选择

(1)在限定时间内有多少被试解决了问题。
问题:如果两组中每个人都解决了问题,是不是 可以判定自变量(有无图示)不起作用呢? 不是。由于天花板效应的作用,从两组解决问题 百分比相等得出自变量不起作用的结论当然是不 正确的,因为问题太容易不能揭示任何可能的区 别。
Williamson等(2003)评估了不同公司网站对未来求职者 的吸引力。 研究人员邀请了252名商校学生浏览了一家在建的陈列馆网 站。研究人员制作了两个版本的网站,但每个学生只能看到 其中的一个。除了老一套的公司简介、部门介绍、组织模式 专栏外,网站还专辟了招聘一栏:



第一个版本,招聘专栏介绍了各个职位以及在公司内部的晋升空 间; 第二个版本设计了一个专门的链接,询问求职者的学历背景、技 能与工作经历,供求职者作自评用。
动机强
动机弱
b2 b1
a2 自变量A
兴趣小
A的效应随B的变化而变化的图示
b1水平 动机强 80
因变量观测值
60 40 20 0 a1 20 10 0 a1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三讲真实验设计一、实验设计概念的由来1:广义的,实验者预料或者设计出来的,包括对实验变量的操纵,对无关变量的控制,对因变量的测量和统计分析方法的研究计划。

2:狭义的,对各种变量和实验程序加以安排和规定的实验模式。

按照舒华(1994):实施实验处理的一个计划方案以及与计划方案有关的统计分析。

实验设计包括如下活动:1.建立与研究假说的统计假说;2.确定实验中使用的实验处理(自变量)和必须控制的多余条件(无关变量);3.确定实验中需要的实验单元(被试)的数量以及被试抽样的总体。

4.确定将实验条件分配给被试的方法;5.确定实验中每个被试要记载的测量(因变量)和使用的统计分析。

所谓真实验设计-----在随机化原则基础上分配被试,能够充分控制全部内在的无效变异源和外在无关因素的影响,以获得比较准确的实验结果的设计。

它是相对于准实验设计而言的。

所谓真实验设计是在各种设计方法中要求控制条件最严密、操纵自变量最有效和测定记录因变量最准确的一种。

为了达到这些目标,常常需要将这类研究置于实验室条件下进行,也称为实验室研究设计(张一中,1998)。

二、心理学实验设计中的随机化问题1随机化的概念和意义所谓随机化(RANDOMIZATION)就是研究者根据概率的原则进行选择或者分配变量的过程。

随机化是近代实验设计的基本要求之一,是控制实验中无关因素的有效手段。

2实验设计中需要随机化的因素首先是被试的取样(抽样统计分析)心理学的实验研究是通过被试样本实现的,根据样本的研究结果来推断总体的某些特点。

在实验研究中,要求被试样本完全是按照随机化的原则从总体中抽取得到的,因此,按照随机化的原则和方法获得的样本就称为随机样本。

在取样之前,我们要懂得研究总体和样本的概念。

所谓总体就是研究对象的全体,总体可以是无限的,也可以是有限的。

一般而言,在具体研究中,被试的取样总是以有限总体为研究对象的。

一般情况下,对总体全部进行研究是不可能的,也是不必要的。

这时就涉及到从总体中取样的问题,采用能够代表总体的样本作为研究的被试。

当总体同质性高时,抽样比较容易,总体同质性低时,抽样要求比较高。

抽样之所以重要就在于它要真正能够代表研究总体。

心理学研究中常用抽样的方法介绍随机抽样:按照随机性原则从总体中抽取样本个体的方法。

就是在取样的过程中,使总体中的每一个个体都有同样的机会被抽取到样本中去。

比较常见的有简单随机抽样和分层比例随机抽样。

(1)简单随机抽样适应于总体中个体数量不太多的情况,例如将一个班级作为总体,丛中随机抽取一定数量的学生,就可以采用该方法。

具体的做法是把总体中的每个对象编号,然后采用抽签或者查随机数字表的方法,取得足够数量的被试样本。

(2)分层比例随机抽样:如果研究总体中情况和条件比较复杂,就需要按照研究的需要以一定的标准对总体区分出不同的层。

例如,以一个城市的居民作为研究总体,就需要分为不同的年龄段、性别、文化程度、职业等各种层次,根据有关的资料掌握各种层次的居民在全市居民中所占的比例,然后按照这种比例计算出在每一层次中应抽取到样本中去的人数,并用简单随机抽样法在每一层次中抽取足够数量的被试,所有被抽取来的被试就构成了分层随机抽样的样本。

抽样对于调查结果的影响无论如何估计都不过分。

例如,1936年Franklin Delano Roosevelt 和共和党的候选人Kansa 州州长Alfred Landon 竞选下一任美国总统。

当时绝大多数观察家认为Roosevelt会获胜,《文学摘要》却预言,Landon会以57% 对43%的压倒多数获胜。

其根据是约有240万人参加的一次民意测验(poll)。

在此之前,自1916年以来历届选举中,《文学摘要》(the literary digest)都准确地预测了获胜的一方。

但结果是Roosevelt以62%对38%的绝对优势获胜。

接受民意测验的人数绰绰有余,但预测误差幅度之大令人吃惊。

与此同时,有一个较GEORGE GALLUP的人创立了一个调查机构,只调查大约50000人就正确预测了Roosevelt 会以56%对44%获胜。

那么,《文学摘要》预测的误差来自哪里呢?后来,研究者从样本抽取过程中发现了问题所在。

《文学摘要》的程序是将问卷邮给1000万人,他们的名字和地址摘自诸如电话薄或者俱乐部会员名册。

这样做的结果是筛选掉那些不属于俱乐部成员或者没有安装电话的穷人,而这些人正是支持民主党人Roosevelt的。

在《文学摘要》的抽样程序中严重地存在着排挤穷人的选择偏向。

而当时Roosevelt的主张有利于穷人,Landon的主张有利于富人。

这是原因之一。

这只是第一步的错误。

当选择程序有偏向时,抽取一个大的样本并没有帮助。

它只不过是在叫大的规模下重复基本错误。

在确定样本后,还要去调查他们的想法。

如果样本中的大多数人实际上不回答问卷或提问,那将产生严重的扭曲,称为不回答偏倚。

例如,那一年中,给芝加哥登记的选民每三个人邮寄一份问卷,约20%回答,其中超过半数支持Landon ,但是在选举中是选民对Roosevelt 和Landon的支持率为2:1。

结论:不回答者可能非常不同于回答者,样本中不回答的个体比例很高时,防止不回答偏倚。

结论:《文学摘要》的民意调查中,收到问卷的1000万人中只有240万人回答问卷。

而在240万人并不能代表被测验的1000万人。

有鉴于此,现代调查机构更喜欢采用亲自询问来代替邮寄问卷。

尽管如此,亲自询问依然存在不回答偏倚问题。

例如。

访问者来访时,不在家的人和接受访问的人可能在工作时间。

家庭关系,社会背景方面有较大的差异,从而看法也不一样。

民意测验杜威(deway)当选年1948年共和党人THOMAS DEW AY , ALBANY州州长与在位的HARRY TRUMAN (罗斯福死后,接任总统)。

三家主要的民意测验采访了竞选情况,代表HEARST报的CROSSLEY;联合了100家报纸的GALLUP,以及财富杂志《FORTUNE》的ROPER:统计资料使得ROPER相信杜威是胜利者,将领先5%。

结果如下表所示:预测实际结果候选人CROSSLEY GALLUP ROPERTRUMAN 45 44 38 50DEW AY 50 50 53 45THURMOND 2 2 5 3WALLACE 3 4 4 2为什么会出现这么大的偏差呢?他们采用的是定额抽样方法。

根据该程序,访问者访问的各种对象都规定了固定的名额,此外某些范畴也是固定的,例如,居住地区,性别,年龄,种族和经济状况。

在其他方面,访问人员可以自由挑选。

问题是:在规定的定额内,访问人员可以自由选择他喜欢的任何人,这就给人为选择留有过多的余地,而人为选择经常容易出现偏倚。

英国统计学家Fisher(1890-1962)最早提出实验设计的概念。

三、实验设计的基本原则1:随机化原则1)能够使可能存在的无关变量的效应受到控制,相互抵消;2)可获得由每个自变量及其每个因素水平所引起的因变量的平均值以及他们之间的差异的恰当估计量。

2:局部控制原则1)即,力求在同一实验中的环境条件,仪器设备,技术措施,被试等都应尽可能一致。

实验条件具有同质性。

3:重复原则即,每一因素水平或因素水平的组合,实验次数不得少于2次。

其作用有两个第一:可以得到更精确的实验误差估计量;第二:可以对样本平均数有一个更精确的估计。

四、良好的实验设计的特征1:对诸多无关因素或新异变量建立实验控制,以便使实验组与控制组之间的差异确实是由实验处理引起的。

2:实验结果的普遍性和概括力,或者说代表性和可推广性。

具体地说,可以分解为以下几点:1充分的实验控制,指对实验条件有足够的控制,以便实验者能够解释结果。

2不加人为修饰,如果实验结果推广到非实验设定的情景时也成立。

3比较的基础,需要通过某种方式进行比较来确定是否有实验效果。

控制组的引入;4通过数据获得足够的信息,数据必须足以检验实验假说。

5非污染的数据,数据应充分反映实验效应。

没有相关变量之间的干扰,实际上,这与充分的实验控制密切相关,可能存在其他对因变量有影响的变量,这些变量称为无关变量,这些影响不应被错误地理解为实验效应。

6代表性,研究者常常希望将实验的结果推广到其他场合。

7省力原则,如果所有其他特征相同,应该使用简单的而不是复杂的设计。

良好设计的标准可以概括为增加实验效度,实验效度可以分为内在效度和外在效度(Campell, Stanley, 1963)。

所谓效度指测量是否测到了它所需要的内容,或者说测量结果与所要达到的目标二者之间相符合的程度。

例如,智力测量测量的是儿童的智力而不是知识,高考测量的是高中生对中学知识的掌握程度以及大学学习能力的潜力。

在实际操作中,效度是采用相关系数来表示的,效度的分类标准有许多,比较常见的是三分法:内容效度,效标效度,结构效度;我们重点介绍效标效度,使用一种其他的测量作为参照标准,检查测量结果和预期结果的相关程度。

它又可以分为两种:同时效度和预测效度。

在实验设计的评价中,效度被分为内在效度和外在效度,内在效度指结果可以被精确解释的范围,外在效度指结果能够被推广的场合。

我们希望两种效度都高,但事实上两者是相互冲突的。

内在效度要求对无关变量的选择,测量方法等方面进行充分控制,以便研究者能够精确解释所发生的实验效应。

控制得越严密,内在效度越好。

但这样得到的结论很难推广,影响到外在效度。

五、实验设计的分类1:完全随机,随机区组和拉丁方实验设计这是三种最基本的实验设计形式,它们的主要区别在于控制无关变异的方法。

1)完全随机设计(completely randomized design)通过随机方法控制无关变异。

使用随机分配被试的方法,通过随机分配被试给各个实验处理,达到实现各个处理的被试之间在统计上无差异。

在方差分析中,所有不能由处理效应解释的差异全部被归结为误差变异,所以,F检验不够敏感。

F=MS(组间,处理引起)/MS(组内,误差引起)例如:阅读理解随着文章中生字密度的增加而下降。

自变量:生字密度;5:1;10:1;15:1;20:1四种生字密度。

因变量:阅读理解测验分数被试32名,随机分成四组,每一组接受一种处理(生字密度)的阅读材料。

G1(X1),G2(X2)G3(X3)G4(X4)。

影响阅读理解的因素有很多,例如,文章的长度,文章的类型,被试的年龄,受教育的程度,阅读能力,但这里都不与考虑。

特点是:第一,接受每个处理水平的被试数量可以不相等,不需要被试匹配,每个被试仅接受一个处理水平。

第二:被试的个体差异带来的无关变异难以消除。

2随机区组设计(randomized block design)上面完全随机设计中,我们看到被试的个体差异可能混淆实验处理的效应。

相关文档
最新文档