警惕心理学研究中的统计误用

警惕心理学研究中的统计误用
警惕心理学研究中的统计误用

警惕心理学研究中的统计误用

【内容提要】正确地使用统计方法对心理学研究至关重要。但心理学研究中存在着诸多统计误用现象。该文着重分析了心理学研究中常见的一些统计误用现象:小或有偏样本的使用、在概率的理解上存在偏差、显著性检验问题、夸大的统计图、相关分析的误用等等,并在此基础上提出了提高研究者自身的统计素养、强调理论在心理学研究中的重要性、运用多样化的研究方法等应对之策。

【摘要题】学术广角

1 从赌徒的谬误谈起

首先让我们来看一个有趣的例子:一名赌徒在打赌硬币是正面朝上或是背面朝上时的情景。如果硬币正面朝上或朝下确实是随机的话,那么该名打赌者在任何一次压注时赢的概率都是。假设这个人接连赌了5次,每次他都赌硬币正面朝上,而每次结果却都是背面朝上。现在他要赌第6次了,他该赌正面朝上还是背面朝上呢?或者说这时硬币正面朝上的概率大还是背面朝上的概率大呢?显然,投掷硬币时连续5次背面朝上是很不寻常的,这样的事件发生的概率非常低,赌徒注意到了这一点,所以,在下一次压注时,他加大了赌注,依然赌了正面向上,在硬币连续5次背面朝上后,他愈发相信硬币将正面向上了。结果很不幸,这位打赌者又一次输了。打赌者的错误就在于对概率规律的应用,一枚真的硬币应该有一半的时候正面朝上,这些规律只有在无数次大量的事件后才可能成立。对于很少的尝试次数而言,这些规律不适用。那名赌徒所忽略的是,每次硬币投掷都是一个独立事件,前面抛掷中发生的情况对接下来将要发生的事件没有任何影响。其实,赌徒对于第6次的尝试不会比前面的5次更有把握。正面朝上的概率依然没变。从某种程度上讲,赌徒的错误是很自然的事,他们确实是依据正确的概率规律所作的结论,经过大量的投掷,对一面真正的硬币而言,的确有50%的结果是正面向上,错就在把适用于大量事件发生时才有效的规律运用到了很少的事件上。在6次投掷中全部正面朝上或全部背面朝上并不是绝对不可能,因为概率还没有小到可以忽略不计。赌徒的谬误同样可能发生在心理学研究中。

科学心理学的目的在于理解人们的所思所想。为了达成此目的,心理学工作者收集信息和提供理论解释时使用的是大量的完备技术。正是对这些技术的恰当运用和对所得数据的合理分析构成了科学心理学的支柱。科学方法在心理学研究中的作用是显而易见的。因为科学心理学强调经验观察,而只有科学方法所确立的信念才是建立在经验观察之上,其他方法所确立的信念都不是建立在经验基础上的。经验观察的正确方法包括收集数据的科学程序和分析数据的科学程序,

因而对数据加以分析的程序——统计的使用和理解在心理学研究中就变得非常关键和重要的。正如Wells所言:统计思维的能力有朝一日将如同阅读与书写的能力一样,成为一名合格公民的必须。但是在心理学研究中存在着大量统计误用和乱用的现象,其原因是多方面的:有时仅仅是研究者出于某种目的和需要,有时是对统计学本身理解得不透彻、不深入,有时则是由于统计学本身的逻辑性造成的。统计在心理学研究中的重要性不能成为我们在任何时候任何场合可以误用或乱用统计学的理由。如果不对这些现象作深入的剖析,如果容忍这样的错误一犯再犯,那么统计学在心理学研究中的作用越大,造成的后果也就越严重。甚至可能为阻碍心理学的发展。因此要警惕心理学研究中的各种统计误用和乱用的现象。应该使自己在从事心理学研究时不会因为不小心而落入统计学的陷阱,也不人为地为别人设计统计学陷阱,同时在阅读他人的研究报告时也要注意不落入别人设下的统计学陷阱。本人把该文定名为警惕心理学研究中的统计学误用,其用意也正因为此。

2 心理学研究中常见的统计误用

统计的方法是如此地有用,以至于有时我们似乎可以借助统计的方法使任何的观点站住脚。许多人都用统计来支持他们各自的观点。难怪有人这样说,世界上有3种谎言——谎言、该诅咒的谎言和统计。统计会说谎吗?其实统计本身并不会说谎,但它们却可以被人利用而给人以误导。以下是本人认为容易发生在心理学研究中的一些统计误用和乱用现象。

小或有偏样本的使用

在心理学研究中,我们希望利用统计分析推论出普遍的结论,因此我们常常使用大样本的研究范式。在大样本研究范式里,有非常多的被试,因而任何一个不寻常的参与者都不会对结果形成多大影响,这样我们就可以得到一个相对普遍的结论。大样本研究设计已经成为心理学研究的一个标准。因此取样问题是心理学研究中一个非常重要的问题:我们在对数据作统计分析时就要想一想这些数据是怎么得来的,它的取样合理吗?所有的统计分析都是建立在数据的取得是合理、正确的前提下,如果取样不合理,无论多么高深和精美的统计方法都是无计于事的。合理的样本、准确的测量是使统计结论正确可靠的前提。但我们在进行研究时,有意无意地,在取样的合理性问题上总会打折扣。下面两种取样的问题在研究中就经常会发生:(1)样本过小;(2)有偏样本的使用。许多广告就会用小样本或有偏样本来误导消费者,比如说在电视上有一位明星说他喜欢喝某一品牌的饮料。广告商这样做的目的就是要给大家一个印象,因为这位明星喜欢这种品牌的饮料,所以所有的人(总体)也会喜欢它。而回归假象效应这一现象也说明了有偏样本的使用会导致我们得出错误的结论。所谓回归假象是指向平均数的回

归,当我们从总体中挑选出极端分数组进行重测时,第二次测得的分数更接近于整个总体的平均数。我们在研究中经常会使用匹配技术,这时就可能有回归假象效应存在。如果在第一次测验的基础上对两组进行匹配,倘若研究者从通常做得很差的组中挑出高分者,从通常做得很好的组中挑出低分者,即使没有给予两组不同的实验处理,研究者仍可以预期他们在第二次测验中得分会很不同,其原因仅仅是因为向平均数回归。这方面一个典型的例子就是20世纪60年代在美国的一个“领先计划”研究。因此,无论何时你自己在进行研究和阅读别人的研究报告时,你都要问两个有关抽样的问题:(1)样本有多大?(2)样本是如何被选中的?

在统计学的基础:概率的理解上存在偏差

应用于心理学研究中的定量研究方法大部分是基于概率理论之上的,概率是统计学的基础。我们借助于概率达到对未来的预测。如气象学家会说,明天有80%的几率会下雨,或有20%的可能会下雪。如我们前面提到的赌徒的例子。但倘若我们对概率的理解不透彻,就有可能犯错误,赌徒的谬论就是典型的例子。即使给予事件将要发生的先决条件,我们也很难有绝对的把握认为此事件必然发生,我们所能知道的仅仅是发生机会的比率或是一特定的概率。如根据我们的研究发现具有某一心理特点的人中有90%难以完成某一水准的学业,我们能否就可以据此来预测一个具有这样心理特点的人就不能完成学业呢?显然我们并不能得出这样的结论。基于概率和统计学基础上得出的结论是从总体中得出的,我们在总结自己的某一研究时,总会这样表述:从总体上说,什么是怎么怎么样的……总体上得出的结论在具体用到某一个人身上不能过分绝对化。

鉴于此,人们对大样本研究范式也提出了批评,认为个体的心理活动是非常独特的,这种独特性并非都能作出普遍的概括。经过充分混合个体分数的“统计磨合机”的加工,这些独特性就丧失殆尽了。单靠统计未必就能够抓住事物的本质特征。斯金纳就曾呼吁在操作性研究中使用小样本设计,因为他想强调削弱统计分析的重要性。他认为人们把统计的作用夸大了,统计分析通常被看成了目的而不是帮助实验者推出实验结论的工具。

显著性检验问题

众所周知,统计显著性检验在心理统计学教科书中是作为推断统计的重要组成部分而引进的,它和参数估计组成了推断统计的两大基石。心理学家有一个约定俗成的规定,即如果统计检验的计算表明虚无假设可能正确的概率小于,那么我们就可以拒绝它而接受另一个假设。因为拒绝虚无假设可能犯错误的机会如此微小,我们有理由认为这么做是安全的。简单地就,推断统计被用于确定两种条件的结果差别是由自变量还是随机因素造成的。如果不同实验条件下所得的结

果之间差异很大,而且这种差异由偶然因素导致的概率低于时,那么研究者可以排除偶然因素导致该结果的可能性,而认为结果是自变量造成的。心理学家一般都认为推断统计比描述统计更能反映事物的本质,因为它用了概率论的知识,从样本数据到总体性质作了科学的推断。但是简单的显著性检验在应用中却会产生这样或那样的问题。尽管结论在统计上被认为是可信的,但由偶然因素(统计信度仍保持5%的错误概率)、一些未被注意到的混淆因素、或者实验者误差所造成的可能性仍然存在。例如,大多数聪明或大多数低智商的被试碰巧被分在一种条件中。尽管这些可能性不太容易出现,但有时它们确实发生了。

不少人对显著性检验存在误解,误认为经过显著性检验后其科学性就得到了保证,自己的观点就万无一失了。但事实上并非如此。近年来,人们对心理学研究中的显著性检验有诸多争议,Cohen在其著名的《地球是圆的(p<.05)》一文中对此进行了列举。有鉴于此,美国心理学会统计推断特别工作小组发表了《心理学杂志中的统计方法——指导方针及其解释》一文,以期引起人们对于显著性检验的思考。流行于研究者间的一句格言是“重复一次抵得上一千次t检验”,这句格言的要旨是许多研究者都相信实验验证要好于应用于初次实验结果的推断统计,这是非常有道理的。

夸大的统计图

统计作为一种工具,往往为受到使用者本人主观意愿的制约。有人曾感叹统计学家会说话。确实,人们在统计指标的选择、统计图表的制作、统计方法的选用上都可能会带有自己的个人目的,具有一定的功利性。这一点可以从下面的例子中可见一斑。有一所高校近3年内因心理问题而被迫中断学业的人数从13增加到17、20人,学校的心理咨询中心为了呼吁人们对大学生心理健康问题的重视,因而想让人们知道该校学生的心理问题正变得越来越严重,单单因心理问题而中断学业的人数就在不断增加,所以他们以年份为横坐标,以心理问题而中断学业的人数为纵坐标绘制了一张统计图,通过把Y轴的标尺拉得很短,使学校心理问题而中断学业的人数的增加看上去很突出。而学校当局则往往不愿意这样来宣传自己的学校,于是根据同样的数据可以绘制了另外一张统计图,他们通过把Y轴的标尺拉得很长,给人以学校因心理问题而中断学业的人数相当稳定的感觉。两张图显示的结果都是正确的,但要说明的问题却大相径庭。无怪乎人们把统计与谎言并列。而这种被夸大的统计图在心理学研究中相当常见。因此,我们在读图时,必须仔细看清图中的标尺。此外更重要的是要确定差异在统计学上是否可靠,而是不挖空心思地使差异在图中显得足够“大”。

相关分析的误用

观看暴力性电视节目会导致儿童的攻击性行为吗?有人曾研究了三年级的

儿童,对他们对暴力电视的爱好及其同伴评价的攻击性进行测量,发现上述两个变量之间确实存在着中等程度的正相关(r=+),那么我们该如何解释这一相关系数呢?可以这么说:这表明了攻击性强的儿童倾向于观看更多的暴力性电视节目。但我们还能进一步说正是因为观看暴力性电视节目才导致了儿童的攻击性行为吗?这涉及到对相关分析这一统计方法的理解问题。事实上,仅仅根据一个相关系数,我们无法确定事物之间的因果关系,单一的相关证据并不能作出有效的因果陈述。在本例中,我们可以把因果陈述颠倒过来:即儿童的攻击性行为导致了他们对暴力电视的爱好,也有可能有第3个变量,比如说家庭环境,才导致了儿童的攻击性行为与对暴力电视的爱好。相关分析一般只用于分析两个变量间的关联程度,要说明蕴含在相关背后的、对这种相关加以解释的本质则要借助于理论。或进一步对一些变量进行控制后作深入的研究,也可以对相关研究进行改进,如作交叉-滞后-组相关程序的研究(一种追踪研究,可以得出因素间的交叉-滞后相关),经过多重检验来提高相关研究的解释力。

对相关系数的另一个误用与取样有关,如果你取到的样本数据之间没有足够大的差异,就有可能产生全距限制现象,这时即使变量之间存在着高相关,但凭取到的数据却只能得出变量间的低相关,即由于取样的不合理性,计算出的相关系数就不能反映出真正变量间的相关,这种现象在心理学研究中也很普遍,因为心理学工作者常常会使用同质的总体进行研究,比如只选用大学生群体,所以在解释相关系数时一定要慎重考虑是否有全距限制现象存在。

3 防止统计学误用的应对之策

既然统计学在心理学研究中如此重要,那么统计学一旦被误用,就有可能造成严重的后果,因此防止统计方法的误用也就显得尤为重要。防止统计方法的误用可以从以下几方面着手。

提高研究者自身的研究素养

要防止统计方法的误用首先要注意提高研究者自身的研究素养,真正理解统计学的逻辑性。每种统计方法都有其自身的特点,有其使用的前提条件和适用范围。研究者要了解每种统计方法的特点和使用的前提条件,并分析你的研究中是否具备这样的条件,你所获取的数据适合什么统计方法,在此基础上才能使用某一种合适的统计方法。此外,对得出的统计结果应给予合理的解释。

强调理论在心理学研究中的重要性

理论可以被粗略地被定义为解释多个事件的一组相关表述。运用理论可以对数据和心理现象的因果关系进行有效的解释。如前面谈到相关分析一般只用于分析两个变量间的关联程度。但我们可以借助于理论来说明蕴含在相关背后的、对这种相关加以解释的本质。在从儿童对暴力性电视节目的爱好和其同伴评价的

攻击性两者的高相关中,我们不能简单地推论出因果关系,但这也不能一概而论。如人们对吸烟与肺癌的发生率作相关研究时发现两者存在着高相关,据此,人们认为吸烟可以引起肺癌。正是因为有这样的相关证据,人们就在烟盒上印上了相应的警告语,而且也禁止在电视和其他媒体上作广告。在这里,相关可以被作为推论因果关系的证据,是因为其他的解释缺乏合理性。因为人们不可能在患肺癌后去吸更多的香烟以安抚肺脏,而吸烟会导致肺癌的生理机制也非常的显而易见。鉴于此,我们依然可以从相关分析中得出因果关系,这不能不说是理论的作用。

在心理学中,理论具有两大功能:第一,它为数据的系统化和有序化提供框架。第二,它使得科学家能够在实验研究之前对一些事件作出预测。统计学绝不是思维的替代品,统计分析是一个服务于理论和假设检验的理论上的中立程序。理论和假设总是先于统计。在心理学研究中存在着忽视理论、将统计手段置于理论之上的现象,这无异于本末倒置。统计方法自始至终应该是为理论服务的,而不是为了统计而统计。

4 运用定量研究和定性研究等多样化的研究方法

心理学研究方法论和方法的问题一直是心理学研究的重大问题。随着心理学的发展,近几年对该问题的争论有愈演愈烈之势。人们在反思定量研究的种种不足后又开始将目光投向定性研究。有人就反对用定量研究,认为:怎能将儿童的天真无邪、初恋的柔情蜜意、飞车疾驰的惊心动魄以及足球队失败后的撕心裂肺用客观枯燥的一串串数字来把握呢?

在心理学界,人们往往认为不能对资料作量化分析的即为定性研究,能够对资料作量化分析的即为定量研究。这一区分标准隐含着这样一个意思:二者的地位是不相等的,定量研究的科学性高于定性研究。事实上,单靠统计未必就能够抓住事物的本质特征。许多迷信定量研究的人,常常不关心如何收集具有高质量的数据资料,而是寄希望于先进的统计分析手段,热衷于各种“数字游戏”,希冀用高明的统计方法来掩盖粗劣的原始资料。这好比先进的机器设备加工劣质的原材料,如果输入的是垃圾,无论最先进的设备也只能生产与垃圾相关的产品。同时,过分强调定量研究,常常会使心理学研究走上非人化的道路,人的情绪情感、动机和主观感受常常被忽略,这会导致心理学的畸形发展。

我国著名心理学家陈立有感于心理学研究过分强调收集信息和提供理论解释时使用的大量完备技术而忽略心理学研究的人化,在《平话心理科学向何处去》一文中说:心理学研究要从严格精密限制条件的实验室里解放出来。凯林在《心理学大曝光:皇帝的新装》中也对心理学研究中的种种不足提出了批评,但他最终认为实证主义的科学方法是心理学科学方法的帝国主义。陈立先生则反对,他认为对心理学要进行战役性研究,在一个战役中,海陆空部队都要用,各种合法

武器都要用,具体问题要具体解决,这才是真正的科学方法。比如爱因斯坦发明相对论,但有人问他怎么得出这么一个大道理来,他对这个问题的回答竟然是“只有通过对经验的共鸣理解为基础的直觉,才能得到这些定律。”这么说来,如果我们要了解爱因斯坦的这种思想过程,就不得不用人文科学的释义学了。因为释义学和自然科学的实验法相比,完全是另外一种方法,也可以说是主观的研究方法。由于心理现象的复杂性,心理学研究方法应该是多样化的。

实证研究的方法、定量研究的方法使心理学从哲学的母体中脱胎出来,对心理科学的发展起到了十分重要的作用,在以后心理学研究中还将发挥其巨大的作用。但要达到对心理现象的完整认识必须采用多元化的研究手段。任何单一的方法都只能对部分现象加以解释,只有采用多样化的研究方法才能最终殊途同归,达到从整体上了解人类自身所思所想的目的。

【参考文献】

BH坎特威茨,HL罗迪格,DG埃尔姆斯.实验心理学——掌握心理学的研究.上海:华东师范大学出版社,,574

谢小庆.教育研究中定量研究的局限,心理发展与教育,1998,1:54

王京生,王争艳,陈会昌.对定性研究的重新评价,教育理论与实践,

20XX,(2):49

李伟明,曹怡.20XX年APA统计推断特别工作小组的建议对我国心理统

计教育的启示,心理科学,20XX,24(3):286-287

Jacon earth is round(p

<.05).The American Psychologist,1994,49(12):997-1003

Leland Wilkinson and Task Force on Statistical I nference:Statistical method in psychology journals:Guidel ines and psychologist,20XX,55(8):1-27

陈立.平话心理科学向何处去.心理科学,1997,20(5):385-389

保罗·凯林.心理学大曝光——皇帝的新装.北京:中国人民大学出版社,1992

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

实验心理学实验设计方案

实验心理学实验设计方 案 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

一、研究课题:考察“不同面部表情的识别速度与识别准确性存在差异”[预期可能结果:不同的面部表情,识别速度有差异;或者不同的面部表情,识别的准确率也有差异] 引言:速度—准确性权衡是关系到一切反应时实验信度的基本问题,下面我们将尝试通过一个简单的生活化的实验来展示任务速度和任务准确性之间普遍的权衡关系。在反应时实验中,当被试追求较快的速度时,必然要以牺牲准确性为代价。同样,当被试力求高的准确性时,也必然要以放慢速度为代价。在具体的实验中,被试究竟会如何权衡二者的关系,取决于很多因素。本实验主要探讨不同面部表情(痛苦、微笑、悲哀、快乐)识别速度与准确率是否存在显着差异。 假设:假设不同面部表情的识别速度与识别准确性存在差异 二、实验目的:通过实验证明不同面部表情(痛苦、微笑、悲哀、快乐)的识别速度与识别准确性存在差异,本实验旨在研究不同面部表情的识别速度与识别准确性存在差异,通过自编的e-prime实验程序对四十名被试进行施测。 三、实验材料:痛苦、微笑、悲哀、快乐的图片(均选自于标准的实验图片库)、电脑、e-prime程序 四、实验设计 采用单因素完全随机化设计 自变量为不同面部表情、区分为(痛苦、微笑、悲哀、快乐)四种。每个小组只接受一种实验处理,只对一种表情做出反应。 因变量为反应时、准确率,分别是识别的准确率、以及被试对不同面部表情识别的反应时。

五、实验程序: 被试构成: 采用简单随机抽样,在弘德楼随机选取了几个自习室,共选取了40个被试。男女各半,年龄为18-23岁,随机分为四个小组。 研究工具: 在计算机上自编好e-prime实验程序 研究过程 (1)正式实验前被试要先进行几次类似练习,以熟悉按键反应。 (2)被试坐在电脑前,接受相同的指导语。其指导语为:“在接下来的一段时间里你将继续进行此类题目的正式作答,请用心作答”。被试按键确认后即开始正式实验、期间不再中断休息。 (3)使用主试自编计算机视觉搜索程序,每帧呈现一副面部表情图片,每幅图片呈现的间隔时间一致,随机播放图片。每种表情的图片都有10张,每张呈现2次,共呈现20次,所有表情图片共呈现80次。痛苦按“1”键、微笑按“2”键、悲哀按“3”键、快乐按“4”键。其中第1小组只对痛苦做反应、2小组只对微笑做反应、3小组只对悲哀做反应、4小组只对快乐做反应。每出现一幅图要求被试按对应的反应键,计算机自动记录反应时间和正确率。 六、数据处理 采用进行统计分析。 以不同面部表情为自变量,反应时和准确率为因变量。 针对两个反应指标均可分别采用单因素完全随机化/独立样本的方差分析来进行差异检验。

统计学试卷及答案

统计学试卷及答案 一、判断题 1.统计学是一门方法论科学,其目的是探索数据的内在数量规律性,以达到 对客观事物的科学认识。() 2.统计研究的过程包括数据收集、数据整理、分析数据和解释数据四个阶段。 () 3.统计数据误差分为抽样误差和非抽样误差。() 4.按所采用的计量尺度不同,可以将统计数据分为时间序列数据和截面数据() 5.用来描述样本特征的概括性数字度量称为参数。() 6.如果数据呈左偏分布,则众数、中位数和均值的关系为:均值<中位数< 众数。() 7.通过散点图可以判断两个变量之间有无相关关系。() 8.所有可能样本均值的数学期望等于总体均值。() 9.影响时间序列的因素可分为:长期趋势、季节变动、循环波动和不规则变 动四种。() 10.狭义的统计指数是用来说明那些不能直接加总的复杂现象综合变动的一 种特殊相对数。() 二、单项选择题 1.为了估计全国高中生的平均身高,从20个城市选取了100所中学进行调查。在该项研究中样本是()。 A 100所中学 B 20个城市 C 全国的高中生 D 100所中学的高中生 2.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2005年城镇家庭的人均收入数据。这一数据属于()。 A 分类数据 B 顺序数据 C 截面数据 D 时间序列数据

3.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为() A 24 B 25 C 26 D 27 4.两组数据相比较()。 A 标准差大的离散程度也就大 B 标准差大的离散程度就小 C 离散系数大的离散程度也就大 D 离散系数大的离散程度就小 5.在下列指数中,属于质量指数的是()。 A 产量指数 B 单位产品成本指数 C 生产工时指数 D 销售量指数 6.定基增长速度与环比增长速度的关系为()。 A 定基增长速度等于相应的各个环比增长速度的算术和 B 定基增长速度等于相应的各个环比增长速度的连乘积 C 定基增长速度等于相应的各个环比增长速度加1后的连乘积再减1 D 定基增长速度等于相应的各个环比增长速度的连乘积加1(或100%) 7.某企业报告期产量比基期增长了10%,生产费用增长了8%,则其产品单位成本降低了()。 A 1.8% B 2.5% C 20% D 18% 8.用简单随机重复抽样方法抽取样本单位,如果要使抽样标准差降低50%,在其他条件不变的情况下,则样本容量需要扩大到原来的()。 A 2倍 B 3倍 C 4倍 D 5倍 9.如果变量x和变量y之间的相关系数为﹣1,这说明两个变量之间是()。 A 低度相关关系 B 完全相关关系 C 高度相关关系 D 完全不相关 10.合理施肥量与农作物亩产量之间的关系是()。 A 函数关系 B 相关关系 C 没有关系 D 正比例关系 11.在回归分析中,描述因变量y如何依赖自变量x和误差项 的方程称为()。 A 回归方程 B 回归模型 C 估计的回归方程 D 理论回归方程 12.平均指标是用来反映一组数据分布的()的指标。

心理统计学考研历年真题及答案

考研真题和强化习题详解 第一章绪论 一、单选题 1 .三位研究者评价人们对四种速食面品牌的喜好程度。研究者甲让评定者先挑出最喜欢的品牌,然后挑出剩下三种品牌中最喜欢的,最后再挑出剩下两种品牌中比较喜欢的。研究者乙让评定者将四种品牌分别给予l~5 的等级评定,( l 表示非常不喜欢,5 表示非常喜欢),研究者丙只是让评定者挑出自己最喜欢的品牌。研究者甲、乙、丙所使用的数据类型分别是:( ) A .类目型―顺序型―计数型 B .顺序型―等距型―类目型 C .顺序型―等距型―顺序型 D .顺序型―等比型―计数型 2 .调查了n =200 个不同年龄组的被试对手表显示的偏好程度,如下: 该题自变量与因变量的数据类型分别是:( ) A .类目型―顺序型 B .计数型―等比型 C .顺序型―等距型 D .顺序型―命名型 3 .157.5 这个数的上限是()。 A . 157 . 75 B . 157 . 65 C . 157 . 55 D . 158 . 5 4 .随机现象的数量化表示称为()。 A .自变量 B .随机变量 C .因变量 D .相关变量

5 .实验或研究对象的全体被称之为()。 A .总体 B .样本点 C .个体 D .元素 6 .下列数据中,哪个数据是顺序变量?( ) A .父亲的月工资为1300 元 B .小明的语文成绩为80 分 C .小强100 米跑得第2 名 D .小红某项技能测试得5 分 7、比较时只能进行加减运算而不能使用乘除运算的数据是【】。 A .称名数据 B .顺序数据 C .等距数据 D .比率数据 参考答案:1 . B 2 . D 3 . C 4 . B 5 . A 6 . C 7.C 二、概念题 1.描述统计(吉林大学2002 研) 答:描述统计指研究如何整理心理教育科学实验或调查的数据,描述一组数据的全貌,表达一件事物的性质的统计方法。比如整理实验或调查来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等,将大量数据简缩,找出其中所传递的信息。 2.推论统计(中国政法大学2005 研,浙大2000研) 答:推论统计又称推断统计,指研究如何通过局部数据所提供的信息,推论总体或全局的情形;如何对假设进行检验和估计;如何对影响事物变化的因素进行分析;如何对两件事物或多种事物之间的差异进行比较等的统计方法。常用的统计方法有:假设检验的各种方法、总体参数特征值的估计方法(又称总体参数的估计)和各种非参数的统计方法等等。 3 .假设检验(浙大2002 研) 答:假设检验指在统计学中,通过样本统计量得出的差异作出一般性结论,判

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

心理学实验设计方案

心理学实验设计方案 一,实验题目:人类在背诵英语单词时,英语单词的长度和被试背诵的时间是否影响背诵者的记忆效果 1假设 1.1选用短的英语单词背诵时,背诵者的记忆效果比选用长的英语单词好; 1.2背诵英语单词的时间长的比背诵时间短的记忆效果好 2变量及额外变量的操纵方法 2.1自变量:单词的长度,背诵时间 2.2因变量:背诵者的记忆效果(在分析中,选取单词默写正确个数为 2.3额外变量:被试的性别、智商水平,疲劳效应等 2.3.1额外变量的操控方法: 2.3.1.1选择性别数量上相等的被试(男10女10) 2.3.1.2选择在同一智商水平(按韦克斯勒智力量表)的被试 2.3.1.3让被试在实验中休息 3被试的选择及分组 选取男女被试各10名,每位被试接受四种水平(长单词—长时间、长单词—短时间、短单词—长时间、短单词—短时间)的实验处理 4实验实施过程及方法 4.1选择100个英语单词(其中,长短单词各50个)作为实验材料,20名被试把他们随机分配到四个处理水平上,每个处理水平上分配5名被试。 4.2让每组被试记忆单词,短单词选取CET四级词汇中含5-6个字母的单词,长单词选取CET四级词汇中含9-11个字母的单词;记忆的短时间为5分钟,长时间为10分钟。 4.3记忆时间到时,让被试默写自己记忆的单词;批改被试默写的单词 二、计算机键盘与水平面可有三种倾斜度:0度、10度和15度,试设计一项实验来证明,哪一种倾斜度最有利于输入字符。 单因素被试间设计

1. 提出假设:在计算机和水平面之间的三种倾斜度中,0度,10度和15度中,打一段相同的材料(使用相同的语言),在完成任务以后,比较一下哪种任务完成的时间是最少的,假设倾斜10度所需要的时间是最少的。 2. 被试 筛选被试:筛选被试:在对被试进行选择的过程中,需要进行严格的筛选。在进行最后的测试之前,要对每个被试进行测试。让所有被试在同一个房间里进行,给他们500字的中文文字,在最后的结果中筛选出在3-4分钟内完成的被试,这样能够排除掉打字技术对成绩的干扰。其中选出被试45名。每个被试分别接受三个水平的实验处理(0度,10度和15度)。 单因素被试间设计 3. 实验材料 3台配置一样的电脑,分别是:0度,10度和15度。 分别给被试呈现不熟悉的材料,避免对材料有熟悉度,每段文字500字。 4. 实验程序 (1) 把被试统一安排在指定教室进行,事先不需要太多的交流。 (2) 指导语:大家好,今天我们要进行一项文字输入的测试。在屏幕中央将会出现一篇文字,请您以最快的速度输入文字。在我说开始后,大家可以开始了。 (3)电脑自动记录被试完成的时间。 (4)进行数据分析。 三、研究者要探讨灯光强度与颜色对反应时的影响,试设计一个2×2实验研究范式。(要求说明实验中自变量、因变量与控制变量,是组间设计还是组内设计,被试如何分组,实验结果如何整理等) 参考答案: 实验设计:采用2×2多因素实验设计。 该实验研究的自变量有两个:灯光强度:分为强、弱两个水平,灯光的颜色:可分为红、绿两种不同颜色的灯光。这样,共有四种实验处理:红色的强光、红色的弱光、绿色的强光、绿色的弱光。 因变量:记录每个被试在不同实验条件下的反应时间。 控制变量:所有被试的练习次数、准备状态、额外动机、年龄以及其他个别差异应保持相等。

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

现代心理与教育统计学笔记图文稿

现代心理与教育统计学 笔记 集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

概念 (1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称 为随机变量。 (2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类 事物的总体,是研究对象的全体。 (3)样本:样本是从总体中抽取的一部分个体。 (4)个体:构成总体的每个基本单元。 (5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f 表示。 (6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用 比例或百分数来表示。 (7)概率:概率论术语,指随机事件发生的可能性大小度量指标。其描述性定 义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记 为P(A)。 (8)统计量:样本的特征值叫做统计量,又称作特征值。 (9)参数:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值:随机变量的取值,一个随机变量可以有多个观测值。

2何谓心理与教育统计学学习它有何意义 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整 理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传 递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就 是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并 将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、 推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。 它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关 系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学 正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学和统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学和统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组和组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和使用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,使用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

现代心理与教育统计学 笔记

概念 (1)随机变量:在统计学上把取值之前,不能准确预料取到什么值的变量,称 为随机变量。 (2)总体:总体(population)又称为母全体或全域,是具有某种特征的一类 事物的总体,是研究对象的全体。 (3)样本:样本是从总体中抽取的一部分个体。 (4)个体:构成总体的每个基本单元。 (5)次数:是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用 比例或百分数来表示。 (7)概率:概率论术语,指随机事件发生的可能性大小度量指标。其描述性定 义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A的概率,记为P(A)。 (8)统计量:样本的特征值叫做统计量,又称作特征值。 (9)参数:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整 理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、 推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。统计学正是提供了这样一种科学方法。统计方法是从事科学研究的一种必不可少的工具。 ②心理与教育统计学是心理与教育科研定量分析的重要工具。 凡是客观存在事物,都有数量的表现。凡是有数量表现的事物,都可以进行测量。心理与教育现象是一种客观存在的事物,它也有数量的表现。虽然心理与教育测量具有多变性而且旨起它发生变化的因素很多,难以准确测量。但是它毕竟还是可以测量的。因此,在进行心理与教育科学研究时,在一定条件下,是可以对心理与教育现象进行定量分析的。心理与教育统计就是对心理与教育问题进行定量分析的重要的科学工具。 ③广大心理与教育工作者学习心理与教育统计学的具体意义。 a.可经顺利阅读国内外先进的研究成果。 b.可以提高心理与教育工作的科学性和效率。 c.为学习心理与教育测量和评价打下基础。 3.先用统计方法有哪几个步骤? 答:一项实验研究结果要用何种统计方法去分析,需要对实验数据进行认真的分析。只有做到对数据分析正确,才能对统计方法做出正确地选用。选用统计方法

统计学简答题整理精编版

统计学简答题整理 GE GROUP system office room 【GEIHUA16H-GEIHUA GEIHUA8Q8-

统计学简答题整理第一章P11 1.获取直接统计数据的渠道主要有哪些及区别在于 普查、抽样调查 普查是为某一特定目的,专门组织的一次性全面调查。这是一种摸清国情、国力的重要调查方法。花费的时间、人力、财力和物力都较大,间隔的时间较长。而两次普查之间的年份以抽样调查方法获得连续的统计数据。 抽样调查是统计调查中应用最广、最为重要的调查方法,它是通过随机样本对总体数量规律性进行推断的调查研究方法。存在着由样本推断总体产生的抽样误差,但统计方法可以估计出误差的大小进一步控制误差;节省人力、财力、物力,又能保证实效性 2.简要说明抽样误差和非抽样误差。 非抽样误差是由于调查过程中各有关环节工作失误造成的。(它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差,还有一种人为干扰造成的误差即有意瞒报或低报数据等)。非抽样误差在普查、抽样调查中都有可能发生,但可以避免。

抽样误差是利用样本推断总体时产生的误差。(由于样本只是总体的一部分,用样本的信息去推断总体,或多或少总会存在误差,因而抽样误差对任何一个随机样本来讲都是不可避免的。但可计量、可控制)。抽样误差与样本量的平方根成反比关系。 第二章P51 1.统计的计量尺度 ①列名尺度(定类尺度):是按照某一品质标志将总体分组之后,对属性相同的单位进行计量的方法。各组之间的关系是并列的,没有大小、高低、先后之别。 ②顺序尺度(定序尺度):是按照某一品质标志将总体分组,对等级相同的单位进行计量的方法。各组之间的关系是有顺序的,可以进行排序。 ③间隔尺度(也称定距尺度):是按某一数量标志将总体分组,对相同数量或相同数量范围的单位或其标志值进行计量的方法。其特点是不仅可以进行排序,还可以计算不同数值之间的绝对差距。 ④比例尺度(也称定比尺度):是类似于间隔尺度,又高于间隔尺度的计量方法。其特点是不仅可计算数值的绝对差异,还可以计算数值的相对差异。 2.简述统计分组的概念和作用。 概念:统计分组是根据统计研究目的,选择一定的分组标志,将总体划分为若干组的统计方法。其目的是使组与组有明显差别,同一组中具有相对的同质性。(例:人口按性别、年龄、民族、职业分组;企业按规模分为大型、中型和小型。)

统计学习题集及答案

统计学原理 习题集学院: 班级: 学号: 姓名:

目录

第1章导论 一、判断题 1. 在对全国工业设备进行普查中,全国工业企业设备是统计总体,每台工业设备是总体单位。() 2. 总体单位是标志的承担者,标志是依附于总体单位的。() 3. 品质标志表明单位属性方面的特征,其标志值只能用文字来表现,所以品质标志不能转化为统计指标。() 4. 数量指标的表现形式是绝对数,质量指标的表现形式是相对数和平均数。 5. 统计的研究对象是客观现象总体的各个方面。() 6. 统计具有信息、咨询和监督的整体功能,在上述三个职能中,以提供咨询为主。() 7. 某生产小组有5名工人,日产零件为68件、69件、70件、71件、72件,因此说这是5个数量标志或5个变量。() 8. 统计指标有的用文字表示,叫质量指标;有的用数字表示,叫数量指标。() 二、单选题 1.要了解某企业职工的文化水平情况,则总体单位是() A、该企业的全部职工 B、该企业每一个职工的文化程度 C、该企业的每一个职工 D、该企业每一个职工的平均文化程度 2.下列总体中,属于无限总体的是() A、全国的人口总数 B、大海里的鱼 C、城市流动人口数 D、某市工业企业设备数 3.统计工作的全过程各阶段的顺序是() A、统计设计、统计分析、统计调查、统计整理 B、统计调查、统计设计、统计分析、统计整理 C、统计设计、统计分析、统计调查、统计整理 D、统计设计、统计调查、统计整理、统计分析 4.由工人组成的总体所计算的工资总额是() A、数量标志 B、数量指标 C、标志值 D、质量指标

5.几位工人的月工资分别是500元、520元、550元、600元,这几个数字是() A、指标 B、变量 C、变量值 D、标志 6.统计标志用以说明() A、总体属性和特征 B、总体某一综合数量特征的社会经济范畴 C、单位具有的属性和特征 D、总体单位在一定时间、地点条件下动作的结果 7.变异性是指() A、在不同单位可以有不同的标志值 B、总体单位有许多不同的标志 C、现象总体可能存在各式各样的指标 D、品质标志的具体数值 8.下列各项中,属于统计指标的是() A、小王英语考试成绩为85分 B、广州至北京的机票价格为1360元 C、光华公司1999年4~6月份的利润为200万元 D、钢材20吨 9.总体和单位不是固定不变的,而是有() A、在某些场合是要互相变换的 B、只存在总体变换为总体单位的情况 C、只存在总体单位变换为总体的情况 D、所有的标志都能变换为单位 10.离散变量可以() A、被无限分割,无法一一列举 B、按一定次序一一列举,通常取整数 C、用相对数表示 D、用平均数表示 11.下列变量中,属于连续变量的是() A、企业个数 B、企业的职工人数 C、用相对数表示的数据 D、企业拥有的设备台数 12.统计指标体系是指() A、各种相互联系的指标所构成的整体

统计学简答题答案修订

统计学简答答案 1.一组数据的分布特征可以从哪几个方面进行描述? 数据分布的特征可以从三个方面进行测度和描述: (1)分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度; (2)分布的离散程度,反映各数据远离其中心值的趋势; (3)分布的形状,反映数据分布的偏态和峰态。 2.影响样本量大小的因素有哪些?简述这些因素与样本量的关系。 (1)影响样本量大小的因素有:所要求的置信水平、总体方差和估计时所希望的估计误差。 (2)关系:其他条件不变的情况下: 1)样本量的大小与置信水平成正比。置信水平越大,所需样本量也就越大; 2)样本量与总体方差成正比。总体的差异越大,所要求的样本量也越大; 3)样本量与估计误差的平方成反比,即允许的估计误差的平方越大,所需的样本量就越小。 3.简述统计数据的类型和特点。 类型:(1)按计量尺度:分类数据、顺序数据和数值型数据; (2)按收集方法:观测数据和实验数据; (3)按被描述的现象与时间的关系:截面数据和时间序列数据。 特点:(1)按计量尺度分时:分类数据中各类别间是平等的并列关系,各类别间的顺序是可任意改变的;顺序数据的类别间是可以比较顺序的;数值型数据其结果表现为具体的数值。 (2)按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。 (3)按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 4.在假设检验中,当不拒绝原假设时,为什么不采取“接受原假设”的表示方式? (1)在假设检验时,当拒绝原假设时,表明样本提供的证据证明它是错误的;当没有拒绝原假设时,也没法证明它是正确的。 (2)采用“接受”原假设的说法,意味着样本提供的证据证明了原假设是正确的。但由于原假设的真实值是什么并不知道,没有足够的证据拒绝原假设并不等于能够证明原假设是真的,它仅仅意味着目前我们还没有足够的证据拒绝原假设,只表示手头上这个样本提供的证据还不足以拒绝原假设。5.什么是判定系数?它在回归分析中的主要作用是什么? (1)判定系数:回归平方和占总平方和的比例。记为R2,公式为:R2,=SSR/SST. (2)在回归分析中,R2,主要是用于测度回归直线对观测数据的拟合程度。取值范围是[0,1]。R2,越接近于1,回归直线的拟合程度就越好;R2,越接近于0,回归直线的拟合程度就越差。若所有观测点都落在直线上,R2,=1,拟合是完全的;如果R2,=0,回归直线对数据完全没有拟合。 6.解释95%的置信区间 如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平为95%的置信区间。 7.说明区间估计的基本原理 区间估计是在点估计的基础上给出总体参数估计的一个估计区间,该区间通常是由样本统计量加减估计误差得到的。与点估计不同,进行区间估计时,根据样本统计量的抽样分布,可以对统计量与总体参数的接近程度给出一个概率度量。 8.测度两个分类变量相关性的统计量有哪些?他们有什么不同? 测度两个分类变量相关性的统计量有以下几个: Φ相关系数、列联相关系数(c系数)、v相关系数 (1)Φ相关系数:描述2×2列联表数据相关程度最常用的一种相关系数且Φ系数没有上限。 (2)列联相关系数(c系数):主要用于大于2×2列联表的情况且c系数小于1.

张敏强版《教育和心理统计学》1到3章读书笔记汇编

《绪论》 1.什么是教育与心理统计学 教育与心理统计学是应用统计学的一个分支,是数理统计学与教育学、心理学的一门交叉学科,它把统计学的理论方法应用于教育实际工作和各种心理实验、心理测验等科学研究中,通过对所得数据的分析和处理,达到更为准确地掌握情况、探索规律、制订方案、目的,为教育与心理的科学研究提供了一种科学的方法。 2.教育与心理统计学的基本内容及本书体系。 1)描述统计学:这一部分主要是研究和简缩数据和描述这些数据。 例如:计算平均数、中位数、众数等,以这些参数来反映观测数据的集中趋势。 计算标准差、方差等,以这些参数来反映观测数据的离散趋势。 描述统计学主要是描述事务的典型性、波动范围以及相互关系,提示事物的内部规律。 2)推断统计学:这部分内容主要是研究如何利用数据去作出决策的方法。推断统计学则是一种依据部份数剧去推论全体的一种科学方法,它是进行教育与心理实验、对教育与心理研究或实验作出预测和规划的有力工具。推断统计学的主要内容有:统计检验、统计分析和非参数统计法。 3)多元统计分析:这部分内容主要是研究超过两个因素的教育与心理的研究和实验。 多元统计分析的主要任务就是寻找出主要的因素,相近或相关的因素合并或归类。 多元统计分析的主要内容有:主成分分析、因素分析、聚类分析、多元方差分析、多元回归分析等。 3.教育与心理统计学的昨天、今天和明天 1)与心理统计学的昨天:1904年美国人桑代克写的《心理与社会测量导论》 2)教育与心理统计学的今天:叶佩华主编的《教育统计学》,张厚粲主编的《心理与教育统计》等。 4.预备知识 1)概念与术语 <1>随机变量: 教育与心理实验或观测,在相同的条件下,其结果可能不止一个,同实验或观测所得到的数据,事先无法确定,这类现象称为随机现象。因为可以用数字来表现,则称这些数字为随机变量。 它的特点是:离散性、变异性和规律性。 依其性质可分为:称名变量、顺序变量、等距变量、比率变量四种 称名变量:用于说明一事物与其它事物在属性上的不同或类别上的差异,但不说明事物与事物之间差异的大小。 顺序变量:指可以按事物的某一属性,把它们按多少或大小顺序加以排列的变量。 等距变量:指变量之间具有相等的距离。它除了有量的大小外,还具有相等的单位。 比率变量:除了有量的大小、相等单位之外,还有绝对零点。 变量依其相互关系可分为自变量(一般将相互关系中作为原因的称为自变量)与因变量(作为结果的

实验心理学题库整理版

一、准实验设计 准实验设计:未对自变量实施充分的控制,但使用真实实验的某些方法整理、搜集、统计分析数据的研究方法。 单组时间序列设计 1.设计方案:对一组被试先进行周期性测量,之后引入实验处理X,然后再进行一系列周期性的测量。比较插入实验处理前后测量的变化趋势,从而推断实验处理是否产生效果。 2.优点:1.可以较好的控制“成熟”因素对实验处理效果的影响。在O1~O8的系列测量过程中,相邻两次测量的时间间隔基本相同,可以认为在每个时间间隔内“成熟”的发展基本相同。2. 可以有效的控制测验因素的干扰。由于每个被试的成绩都是经过反复测验而得到的一系列结果,这样就能够降低由于只做一次测验而出现的有偏样本成绩的概率,可以有效地减少测量偏差。3.缺点:1、由于无对照组,因而不能有效地识别和控制伴随实验处理发生的偶发事件的影响,不能排除那些与实验处理同时出现的附加变量的影响。2、多次实施前测往往会降低或增加被试对实验处理的敏感性,从而在被试身上产生作用而影响其实验处理后的测量成绩。 4.注意事项:1、研究中要保持实验情境的相对稳定,减少不必要的条件变化对实验结果的干扰。 2、通过单组时间序列设计实验不能得到最后的、确定性的结论,如果想得到肯定的因果关系结论,应选用有控制组参加的实验设计。 3、由于研究中对实验条件控制不是很严格,因此研究者应充分考虑那些突发的或随意事件,详细记录研究中伴随的各种事件,这有利于对结果作出更符合实际的科学评估和解释。 单组相等时间样本设计 1.设计方案:对一组被试连续抽取多个相等的时间样本,即选择完全相等的多个时间段,在其中的一个时间样本中实施实验处理,而在后续的另一个时间样本中并不实施实验处理,并通过对两种时间样本的观测分数之间的差异分析来比较实验处理的准实验设计。 2.数据分析:可对结果做三方面的检验:1.处理条件与无处理条件间的比较,以考察存在处理效应的可能性;2.分别在有处理条件下和无处理条件下考察时间因素的简单效应,这主要是分析研究中的时间效应或顺序效应; 3.分析实验处理与处理顺序的交互效应,以考察在时间序列中不同处理的不同效应。 3.优点:在控制影响内部效度的因素方面是完全有效的,如能较好控制“历史”作用的影响。 4.缺点:1.采用单组设计,实验处理后再重复进行做过的测验可能会增加或降低实验处理实验安排中,实验处理的间断出现会使被试产生新异感,并暴露实验目的,由2.的敏感性。. 此产生实验的霍桑效应。3.实验的重复进行也会产生一系列的顺序效应。 多组不相等组前后测设计 1.设计方案:先将实验组和控制组接受前测,然后给实验组处理,再对这两组被试进行后测。 2.优点:首先,增添了控制组,从而控制了历史、成熟、测验等因素的干扰。其次,前测可以了解实验处理实施前的初始状态,从而也就对选择有了初步的控制。 3.缺点:1.实验组与控制组是不对等的,因而选择与成熟、选择与实验处理的交互作用可能会降低效度。2.不能证明实验处理的长期效应。 多组不等组前后测时间序列设计 1.数据分析:方法1.求出实验组和对照组的前测成绩的平均数,以及实验组和对照组的后测成绩的平均数;然后求出实验组前测成绩和后测成绩平均数的差异,以及对照组前测成绩和后测成绩平均数的差异。采用独立样本的t检验对实验组差值和对照组的差值进行比较。方法 2.回归直线方程。 2.优点:1.既能对一组的一系列的观测成绩的变化趋势进行了解,也能对两组的前测和后测的系列观测成绩的趋势进行比较,以估计实验处理的效果。2.实际使用较多的一种比较完善的准实

北大心理统计知识点总结统计

第八章访查分析 一方差分析初步 思考以下实验设计的统计方法 程序: 方差分析 (ANOVA). ●ANOVA能够处理数据的类型:在上例中有两个自变量 (称为因素): 学习的时间和 性别. 两个都是组间 (独立样本) 变量. ANOVA 亦可用于分析包含组内 (重复测量) 因素的研究设计,同时包含组间和组内因素的混合设计(e.g. 假设上例中我们对复习时间超过半年的学员纵向研究。性别是组内变量,学习的时间是组间变量). 什么是因素?什么是水平? ●在方差分析中,因素就是自变量. 包含一个自变量的研究称为单因素设计(single- factor design). 具有多于一个自变量研究称为因素设计(factorial design). 请举一个单因素设计的例子 请前一个例子上再将这个改为多因素设计 ●构成因素的个别处理条件称为因素的水平. 性别这个因素的水平? ●上述研究称为因素设计, 两个组间因素,培训的经历这个因素有 3 个水平,专业这个 因素有2个水平 (称为 3 X 2 组间设计). ANOVA的逻辑 ●与假设检验的逻辑是同样的, 只是具体内容有变化 step 1: 陈述 H0 (和H1 ??) ,确定标准: α = ? step 2: ANOVA 检验总是单尾 step 3: 指出检验的df (有两个 df) step 4: 查表找出临界 F统计量 step 5: 对于样本,计算 F统计量 step 6: 比较 F统计量和临界 F统计量 step 7: 对于H0 作出结论

单因素, 独立测量研究设计的例子 ●检验三个不同的学习方法的效应。将学生随机分配到3个处理组 ●方法 A:让学生只读课本, 不去上课. ●方法 B:上课,记笔记,不读课本. ●方法 C:不读课本,不去上课, 只看别人的笔记 ●Step 1: 陈述假设和设定标准 (选择 a) H0: μ1 = μ2 = μ3 H1: 其中一个组与另一个(或更多)的组均值不同。备择假设可能的形式很多: μ1不等于μ2 = μ3 μ 1 = μ3 不等于μ2 μ 1 = μ2 不等于μ3 μ 1 不等于μ2 不等于μ3 因此,只需给出虚无假设就够了 ●step 2: ANOVA 检验总是单尾. 因为不存在负的方差. F分布表也只有单侧的Alpha. (F分布图) ●step 3: 找出检验的 df. 注意要考虑几个 df ●step 4: 从表找出临界 F统计量 与 t分布表类似, F分布表也是描述一族 F分布. 需要用到两个df,用一个找出正确的行另一个找出正确的列.上面一行对应于α= 0.05, 下面一行对应于α= 0.01. ●step 5: 计算样本的F统计量观测值 概念的水平的讨论: ANOVA 非常类似两个独立样本的 t检验 tobs = 得到的样本均值间差异 期望的机会差异 对于 ANOVA检验统计量 (称为 F比率) 类似 F = 样本均值间方差 (差异) 期望的机会(误差)方差(差异) 为什么用方差? ● ●因为有多于两个组. ●如何计算一个分数来描述差异间分布? 差异不能够分割, 但是方差能够分割。这就 是ANOVA -方差分析名字的由来. ●首先考虑方差的来源. ●什么造成样本的不同(处理间变异) ? ●处理/组效应 - 处理造成的差异 ●个体差异效应 - 个体差异变异 ●随机误差 ●每一个样本内部的变异 (处理内变异) ●个体差异效应 ●随机误差

相关文档
最新文档