对我国统计教育的思考与建议

对我国统计教育的思考与建议
对我国统计教育的思考与建议

对我国统计教育的思考与建议(有删改)

严雪林 JMP大中华总经理

摘要

本文简要介绍了全球统计应用的大致趋势,分析了传统统计教育与市场对统计分析人才实际需求之间的差异,介绍了业界对统计人才的大概要求方向,仔细说明了统计类专业能力教育的内容和框架,为我国统计教育尤其是应用统计教育和高等学位教育提供了一些有益的建议,并且在案例分享、人才培训和市场反馈等方面为我国教育界提供了有用的信息和意见来源。

2010年10月20日是第一个“世界统计日”。毫无疑问,统计的重要作用已经在全球范围得到承认。谷歌首席经济学家哈尔·瓦里安 (Hal Varian)此前曾说统计师将是未来十年的热门职业。而SAS公司CEO Jim Goodnight则认为“我觉得他有点儿后见之明,因为过去30年以来,统计工作一直是一门具有吸引力的职业”。

问题一理论、工具和实际如何结合?

统计是工具学科,对统计理论本身进行研究的人,应该远远少于将统计应用于数据分析和解决实际问题的人。唯有这样,统计的工具属性才得以体现。

而在更多场合里,并不需要参与者了解统计原理和数理方法。大量需要的反倒是对数据质量、数据的分布、以及一些常规统计量和统计图形、统计概念的理解。大量需要的还有:在实际问题与统计方法之间存在一些直觉的联系,使得参与者一看到具体问题,就能够想到如何了解这些问题,如何以数据、图形、表格来表达、界定这些问题;然后,进行数据分析工作,发现问题背后存在的规律、趋势和根源,进而为解决问题提供依据。

总的来说,我国的统计教育在表达手段方面,“阐述统计原理”占了大多数篇幅。我们希望看到一些适应市场需求的转变,即,促使教育者和教学手段尽快完成这样的转换:从主要展示原理转换到既适当展示统计原理、又重点阐述如何应用统计方法。

问题二市场需要什么样的统计分析人员?

懂得统计原理(知识)和懂得如何应用统计方法(技能)之间的距离,到底有多远?让我们听听来自成熟市场的声音。

美国统计协会(ASA)的官方杂志AMSTATNEWS 2010年7月刊上,登载了对两位业界高层的长篇访谈,两位专家的观点非常令人耳目一新,摘录并翻译部分如下:

受访者:

Mary Batcher, 安永(Ernst & Young’s)数量经济及统计部门执行总监

Laura Schweitzer, 普华永道经济及统计应用总监

访谈内容:

招聘统计顾问的时候,你们最看重候选人的哪些特征?

内容摘要:

1. 统计背景

Mary和Laura都认为统计教育背景是此类工作的基本要求。

2. 统计沟通(communicating statistics)

两位总监都认为在咨询领域,沟通技巧是“一票否决”类特征。

Mary: 我最不希望我的顾问在客户面前讲太多大多数客户不太理解的统计术语,更不需要那些只会向别人解释自己是如何如何用统计方法分析问题的人。我希望我的顾问能够用客户听得懂的语言和客户有效沟通。

Laura: 有时候我会问应聘者什么是标准差,有些应聘者无法回答清楚这个问题。也许不能解释标准差听起来很不可思议,但仅此一点并不能让我否决此人。如果他/她能够把统计分析(比如回归)的结果清楚地用一两句话就可以传达给我们的客户,并且给出下一步解决问题的大概建议,我会觉得他/她在这方面完全符合要求。

3. 从分析员到经理

两位总监都认为一些工作环境里需要的软技能是很重要的,这往往也是统计毕业生们比较可能欠缺的:团队精神,迅速切入业务环境(business environment),时间管理,学习能力等。和这些内容相比,统计分析其实是最低级的分析员就可以完成的工作。高级一些的顾问或者经理,往往需要和客户有效沟通,迅速了解客户的问题所在,帮助客户厘清问题的类型和大概范围,然后开始寻找数据,并且让低级分析员去完成分析工作。

访谈总结:“那些统计学学位也许可以帮助人们略微专业一点地说明一些东西,但是,我们真正需要的不是学位,而是解决实际问题的人。”

借助美国同行的观点,我想补充两句,那就是,无论行业,以客户为中心永远都是最受欢迎的。统计知识在实际应用中,承担了重要的基础角色。在这个(知识)基础之上,市场需要我们的毕业生具备一定的技能,以帮助他们迅速完成从受训者到问题解决者的转变。和这种转变相对应,我呼吁我们的统计教育界为学生提供全新的教学手段和内容,帮助他们在校园里就有机会全身体验实际工作环境(而不是“毕业实习”),解决大量来自实际世界的业务问题,培养以统计理论和数据分析工具为基础来分析问题和解决问题的能力。

问题三我国统计教育界如何培养能力

知识的获得通过课堂学习就可以轻松实现。而技能,需要在大量实践中习得。

既然技能是实践能力,那么,在教学环节里,将统计知识转化为数据分析技术,知识传授配合对来自实际世界数据和问题的分析,应该是技能培养的基本框架。将这个框架细化,我们建议在教学内容和教学手段上进行如下革新:

1.采用业界主流的数据分析工具,降低“统计沟通”门槛。

统计软件最近十几年有复杂化的趋势。为了应付越来越繁重的数据管理和大型模型分析要求,统计软件的复杂程度与日俱增。如何降低统计分析的“沟通门槛”,不仅仅是学生学习的需要,更是让统计在各行各业大放异彩的必备条件。

对于教育者和学生来说,还有另一个要求,就是软件能够帮助双方降低学习统计工具所需

要的时间,大量的学习时间应该被投入在解决问题上而不是理解统计原理上。繁重的编程需要(如R等)以及难以沟通的“高端模型”只会令统计教学复杂化技术化。

适逢JMP 9即将发布。JMP的统计算法即是SAS算法,而在图形和易用性方面,JMP在全球统计软件里遥遥领先。SAS公司共同创始人John Sall先生当年用SAS程序重新编译为JMP软件的初衷,即是将统计工具的准入门槛降低,令统计软件成为大众的分析语言,而不只是统计学家的科研工具。JMP 9除了闻名统计应用界的交互式数据分析(Interactive Data Analyses),分析自动化(Analytic Automation),和探索性数据发现(Exploratory Data Analyses)之外,还增加了地图功能。对零售、政府、银行、物流等对地域分布高度敏感的行业来说,统计分析与地图的结合,是IT创新带来的意外便利。降低统计沟通门槛,在JMP的帮助下可以变得很容易。

2.在学校内模拟实际工作环境,让学生在模拟的实际世界里分析和解决问题

我从北卡州立大学高级分析学院了解到,他们创新了实践教学环节。和我国典型的“毕业实习”不同,他们的实践演练贯穿整个学习周期的几乎每一门课程。他们不停的让学生组成不同的团队,大家轮流担任团队领袖,承担来自实际世界的问题解析和数据分析,并且向提供这些数据和问题的赞助公司提交分析报告和解决方案。

校内模拟不仅仅意味着被分析的数据和问题来源于实际,更要求学生在商业环境下工作,以团队的形式解决问题:指定或者选举团队领导人,定期开会商讨如何解决问题,分配任务,计划进程,定期反馈和汇报……直到项目结束提交分析结果和解决方案并且得到问题提供者的认可为止。这一整套的流程和方法,其实就是JMP几十年来为客户提供分析能力并解决实际问题的基本工作方法。我们非常乐意把这些来源于实际的、被高度归纳的经验和技能与我国教育界分享。

3.辅助以专门的技能培训

除了在分析实践中学习团队合作,沟通,表达等基本技能,专门的培训和实践环节也许是值得尝试的。看看秀水街的小贩吧。他们的察言观色和讨价还价能力丝毫不差于来自500强公司的、经过大量专业销售技能培训的专业销售人员。实践出真知!问题是,学生学习的动力恐怕要小于小贩赚钱的动力。学习的回报过于长远且不可见,而眼前这一单可以赚不少钱!除此之外,学校的实践模拟,并不能完全等同于真实的工作环境。对学生的技能培养,我认为专门的培训是必要的且容易实施。我建议就如下技能对我国统计专业学生进行专门培训:

?沟通技能

?演讲技能

?写作技能

?计划和组织技能

4.建立对教职人员本身的培训体系,并且和业界进行技能方面的合作培养

新的教学内容和手段对相当一部分习惯于阐述原理的教职员队伍是一个不小的挑战。教职人员知识和技能的与时俱进,应该先于教学手段和内容的变化。师者,传道、授业、解惑也。教师首先要从全新的统计软件、教学案例、模拟实践环节的管理、技能培训、行业知识等各方面建立起自己的学习框架,方可在下一阶段对现有教学系统进行改善和优化。

目前JMP正在参与国内一些大学的统计教育改善工作,为他们提供一些辅助性手段、经验、知识和技能的分享。我相信,这些持久的努力将缓慢而有力的推动我国统计教育的改变。

我们的努力

全球统计应用领域的倡导者之一、JMP软件创始人、SAS公司联合创始人John Sall先生曾经当面要求我为中国的统计教育事业提供尽可能的支持与协助。John曾经多次访问我国,和我

国教育界和统计界高层有相当多的接触和沟通。让统计更轻松地为人类所应用,我想是他创造JMP的使命之一。

目前,如前面所提及的,我们正在我国统计教育界几位专家的支持和帮助下,致力于改善统计应用和教学的几项基础工作:

1.案例分享

有相当代表性和一定行业、职能、应用范围跨度的案例,可能是对统计应用最好的诠释。和传统的、以展现统计原理为出发点的案例不同,我们提供的案例全部来自全球各领域行业领袖的实际统计应用和改善案例。案例不仅仅包含数据、数据分析和解决问题的建议,还包括了问题是怎样被发现和提出的,如何界定“问题”,如何根据对问题的初步界定来收集数据,如何确保数据的质量和代表性等。简言之,我始终认为,一个完整的统计应用案例应该更多的阐述:

?有没有问题?

?问题是什么?

?如何发现新问题?

?问题是如何产生的?

?未来,这一问题可能会如何变化?

?如何解决问题?

?解决的成效如何?

?有没有更好的解决办法?

?如何前瞻性的让类似问题不再发生?

因此,数据收集、清洗、分析、建模,只是执行环节的内容,而远远不是核心内容。目前案例分享工作正在有条不紊的开展中,很快就会有一本完整的案例集问世。希望这些微薄的努力能够为统计工作者和教育者提供更多的来自应用第一线的参考。

2.统计应用人才技能框架

我们力图将实际应用环节的关键内容导入。这些内容除了用更好的案例和更优秀的软件工具之外,还包含了“软”实力,也就是分工、协作、统计沟通、展现、持续改善等领域所需要的各种软技能(和统计知识这一“硬”指标相对应)。

这些软实力,需要用专业的技能框架来体现和指标化。

除了技能框架,一些行业和职能类知识也是高级学位教育所必须的。比如对生物统计硕士或者博士学位来说,来自CRO(Contracted Research Organization)的实际工作流程是要了解的;对于运营优化类硕士来说,市场管理的战略和执行手段也是应该掌握的内容;。这些内容,我们称之为行业知识或者职能知识。

我们认为和上述内容相关的专业培训是教育者和被教育者都急迫需要尽快掌握或者了解的内容。我们正在准备上述框架和培训建议,为我国高级统计学为教育提供可选的升级途径。

3.市场反馈

“与时俱进”是个非常不错的提法。数据量在逐年几何级数递增,商业、工业和其他人类活动亦因此而日益复杂和多元化。好在有数据,有统计方法,让我们得以部分揭示其内在规律。但是高速的变化需要工具的提供者和使用者不断的刷新自己的知识结构和技能累计,以迎合不断变化的环境之需。

我们计划持续不断的总结来自我们的客户、合作伙伴和其他利益相关方的变化状况,并且

把这些变化里可能对统计教育有关联的部分向教育界同仁做定期的报告和建议。这些变化可能包括但不限于:

?对统计人才的需求

?统计方法的应用水平

?数据收集和管理状况

?管理层决策对数据分析的依赖程度

?行业性统计应用趋势

?数据分析工具的演进

?……

最后,再次借用SAS全球CEO Jim Goodnight的一句话:“我胆敢断言,统计工作将是这一个世纪的热门职业。” 21世纪将会是中国的世纪。中国人在全球统计学界正在扮演不可或缺的重要角色。我衷心祝愿我国统计教育界为国家和人民培养出更多更优秀的统计分析人员,为弘扬统计的魅力而更上层楼。

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

教育统计与评价作业与答案

作业 1.第1 题对提出问题事先安排好答案,让对方从中选择的问卷类型是 A.限制式 B.开放式 C.半限制式 D.半开放式 您的答案:A 题目分数:2.0 此题得分:2.0 2.第2 题 在已知各个平均数的基础上再计算加权平均数的方法,称为 A.等级平均数 B.组距数列平均数 C .总平均数

D. 评分平均数C .总平均数

您的答案:C 题目分数:2.0 此题得分:2.0 3.第3 题 反映试题鉴别能力的指标是 A.区分度 B.信度 C.效度 D.难度 您的答案:A 题目分数:2.0 此题得分:2.0 4.第4 题 在不易简明扼要地表达答案的意思时,最好选用哪一种类型问卷 A.限制式 B. 开放式

C.半限制式 D.半开放式 您的答案:B 题目分数:2.0 此题得分:2.0 5.第5 题 难度系数为0.42 时,则试题的难易情况为: A.难 B.适中 C.易 D.无法区分 您的答案:B 题目分数:2.0 此题得分:2.0 6.第6 题欲分析某校教师和学生对某一改革方案持赞成或反对的态度是否一致的问题,应使用何种

检验方法? A.t 检验 B.u 检验 C.x 2检验 您的答案:B 题目分数:2.0 此题得分:2.0 7.第7 题 欲分析某校100 名教师对两个教学改革方案持赞成或反对的态度是否一致的问题,应使用何种检验方法? A.t 检验 B.u 检验 C.x 2 检验 您的答案:B 题目分数:2.0 此题得分:2.0

8.第19 题对数据资料计算综合指标,然后根据综合指标值对教育客观事物给予评价。这种方法称为 A.描述性统计 B.推断性统计 C.定量统计 D.相关统计 您的答案:A 题目分数:2.0 此题得分:2.0 9.第20 题 对两个不同对象的总体的差异评价称为 A.诊断评价 B.横向评价 C.安置评价 D.纵向评价 题目分数:2.0 您的答案:B

《教育统计与测量评价》复习题及参考答案

本课程复习题所提供的答案仅供学员在复习过程中参考之用,有问题请到课程论坛提问。 本复习题页码标注所用教材为: 福师1203考试批次《教育统计与测量评价》复习题及参考答案一 … 一、单项选择题(每题1分,共10分) 1、体育运动会中各个项目的名次为“第1名,第2名,第3名……”,这一变量属于()。 A、称名变量 B、顺序变量 C、等距变量 D、比率变量 2、某次考试之后对数据进行统计分析,求得第46百分位数是64分,这意味着考分高于64分的考生人数比例 为()。 A、36% B、46% C、54% D、64% 3、下列分类是属于按照解释结果的参照点划分的() A、形成性与总结性测量与评价 B、智力与成就测量与评价 C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价 4、标准分数Z与百分等级之间关系()。 A、可以互相推出 B、没有关系 、 C、百分等级PR大于Z分数 D、在一定条件下Z分数和PR值一一对应 5、在正态分布中,已知概率P(0<Z≤=,试问:概率P(Z>)的值为()。 A、B、C、D、 6.下列分类属于按照教学时机划分的是() A、形成性与总结性测量与评价 B、智力与成就测量与评价 C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价 7.适合于某些用于选拔和分类的职业测验的效度种类是()。 A.时间效度 B. 内容效度 C. 效标关联效度 D. 结构效度 8. 统计学中反映一组数据集中趋势的量是下面哪个选项()。 A、平均差 B、差异系数 C、标准差 D、中数 。 9.某次考试之后对数据进行统计分析,求得第90百分位数是78分,这意味着考分高于78分的考生人数比例 为()。 A、90% B、10% C、78% D、22% 10. 考试中对学生进行排名,常见的名次属于什么变量() A、称名 B、顺序 C、等距 D、比率 答案提示:

现代心理与教育统计学的复习资料

第一章心理与教育统计学基础知识 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 比率数据 2、变量、随机变量、观测值 变量是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、总体、个体和样本 需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数

5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章统计图表 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表

将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图(frequency polygon )是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 %100 N f

秋《教育统计与评价》在线作业分

秋《教育统计与评价》在线作业(分)

————————————————————————————————作者:————————————————————————————————日期:

1.第1题 反映某一事物或现象规模总量的指标是?A.绝对数?B.相对数 C.平均数? D.标准差 您的答案:A 题目分数:2.0 此题得分:2.0 2.第2题 检验事物之间的差异或联系是否出于偶然性的方法是A.描述性统计 B.推断性统计 C.定量统计 D.相关统计 您的答案:B 题目分数:2.0 此题得分:2.0 3.第3题 某一学生在期末考试中,语文成绩66,政治成绩74,语文的全班平均分和标准差分别为65和13;政治的全班平均分和标准差分别为75和10。请问该生的语文与政治成绩哪一个好??A.语文?B.政治 C.一样好? D.无法比较 您的答案:A 题目分数:2.0 此题得分:2.0 4.第7题 由于各种偶然因素的影响产生的,没有固定倾向的误差称为?A.系统误差 B.抽样误差? C.随机误差? D.条件误差 您的答案:C 题目分数:2.0 此题得分:2.0 5.第8题 对数据资料计算综合指标,然后根据综合指标值对教育客观事物给予评价。这种方法称为 A.描述性统计?B.推断性统计 C.定量统计?D.相关统计 您的答案:A

题目分数:2.0 此题得分:2.0 6.第9题 欲分析某高校男女毕业生对16种职业的选择顺序是否存在显著关系,可采用的方法是?A.积差相关法?B.等级相关法?C.点二列相关法?D.χ2检验 您的答案:B 题目分数:2.0 此题得分:2.0 7.第10题 分析测试内容与预测内容之间的一致性程度,这种测试效度的方法叫?A.效标关联度?B.内容效度?C.结构效度?D.预测效度 您的答案:B 题目分数:2.0 此题得分:2.0 8.第11题 反映某考试的可靠性的指标是 A.效度 B.信度?C.难度 D.区分度 您的答案:B 题目分数:2.0 此题得分:2.0 9.第19题 欲检验某班进行拓展训练前后学生成绩差异情况,应使用何种检验方法? A.t检验? B.u检验 C.χ2检验 您的答案:A 题目分数:2.0 此题得分:2.0 10.第20题 通过计算使用同一试卷进行前后两次考试结果的相关

《教育统计与评价》

《教育统计与评价》测试一 一、填空题 1.描述性评价的主要特点是:()。 2.标准分数的作用是把各类原始分数统一在()的标准上衡量的。3.显著性水平指的是()时犯错误的可能性。 二、选择题(单选) 1.对两个独立总体的比较即是何种比较?()A.横向B.纵向C.纵横向 2.一般来说,复习次数与遗忘程度是何种相关情形?()A.正相关B.负相关C.零相关 3.欲比较学生德、智、体、美四个方面是否均衡发展时,应使用何种综合指标?()A.平均数B.标准差C.绝对数 4.欲研究辅导是否有效的问题,分别对学生辅导前后进行同一难度不同题目的测验,这时对测验分数的检验方法是哪种?()A.t检验B.u检验C.2x检验 5.欲研究考试结果能否反映学生的真实水平时,应作何种分析?()A.效度B.信度C.区分度 6.若统计检验结果在0.05的水平上显著,则在0.01水平上是否也是显著? A.是 B.否 C.不一定 三、应用题 1.某高三教师自编一套英语测试题,用来预测学生的高考英语成绩,问:据下列测验结果能否说明自编测验对高考有预测效果? 2.据某题数据资料计算难度并给予评价。 1.全面说明等级平均数的作用。 2.应用哪些统计方法可以全面评价教学实验后学生的学业成绩?

《教育统计与评价》测验二 一、填空题 1.定量评价的主要特点是()。 2.标准差是反映现象内部()的一个综合指标。 3.显著性水平愈小,叫推断结果()愈小。 二、选择题(单选) 1.设计调查问卷时,应尽可能采用何种问卷形式?()A.限制式 B.开放式 C.半限制式 2.欲全面评价个人或集体时,宣使用何种平均数?()A.总平均数 B.等级平均数 C.评分平均数()3.欲评价某事物的水平时,应使用何种综合指标?()A.平均数 B.标准差 C.绝对数()4.欲研究某校干部和教师对该校某一改革方案的看法是否一致的问题,属何种检验情形()A.两个独立总体比例 B.两个相关总体比例 C.两个独立总体平均数 5.欲研究性格与性别的关系问题,应使用何种检验方法?()A.t检验 B.u检验 C.2x检验 6.欲研究某班统计学考试成绩是否存在显著的性别差异,应使用何种表? A.t分布表 B.正态分布表 C.积差相关系数检验表 三、应用题 1.试比例下列两学生某科两次考试总绩哪个优?其中学生第二次考试是否退步? 甲组:672,672,666,660,654,648,648 乙组:690,684,672,660,648,636,630 四、简答题 1.如何理解一个人的测量结果只是他的真实水平的估计值? 2.应用哪些统计方法可以全面评价教学实验后学生的学习兴趣情况? 测验一答案或提示 一、填空题

现代心理与教育统计学答案

第一章 1名词概念 (1)随机变量 答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。(2)总体 答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。 (3)样本 答:样本是从总体中抽取的一部分个体。 (4)个体 答:构成总体的每个基本单元。 (5)次数 是指某一事件在某一类别中出现的数目,又称作频数,用f表示。 (6)频率 答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。 (7)概率 答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。其描述性定义。随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。 (8)统计量 答:样本的特征值叫做统计量,又称作特征值。 (9)参数 答:又称总体参数,是描述一个总体情况的统计指标。 (10)观测值 答:随机变量的取值,一个随机变量可以有多个观测值。 2何谓心理与教育统计学?学习它有何意义? 答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 (2)学习心理与教育统计学有重要的意义。 ①统计学为科学研究提供了一种科学方法。 科学是一种知识体系。它的研究对象存在于现实世界各个领域的客观事实之中。它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

教育统计与测量评价复习题及参考答案

教育统计与测量评价复习题及参考答案 内部编号:(YUUT-TBBY-MMUT-URRUY-UOOY-DBUYI-0128)

本课程复习题所提供的答案仅供学员在复习过程中参考之用,有问题请到课程论坛提问。 福师1203考试批次《教育统计与测量评价》复习题及参考答 案一 一、单项选择题(每题1分,共10分) 1、体育运动会中各个项目的名次为“第1名,第2名,第3名……”,这一变量属 于()。 A、称名变量 B、顺序变量 C、等距变量 D、比率变量 2、某次考试之后对数据进行统计分析,求得第46百分位数是64分,这意味着 考分高于64分的考生人数比例为()。 A、36% B、46% C、54% D、64% 3、下列分类是属于按照解释结果的参照点划分的() A、形成性与总结性测量与评价 B、智力与成就测量与评价 C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价 4、标准分数Z与百分等级之间关系()。 A、可以互相推出 B、没有关系 C、百分等级PR大于Z分数 D、在一定条件下Z分数和PR值一一对应 5、在正态分布中,已知概率P(0<Z≤1.96)=0.4750,试问:概率P(Z>1.96) 的值为()。 A、0.9750 B、0.9500 C、0.0500 D、0.0250 6.下列分类属于按照教学时机划分的是() A、形成性与总结性测量与评价 B、智力与成就测量与评价 C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价

7.适合于某些用于选拔和分类的职业测验的效度种类是()。 A.时间效度 B. 内容效度 C. 效标关联效度 D. 结构效度 8. 统计学中反映一组数据集中趋势的量是下面哪个选项()。 A、平均差 B、差异系数 C、标准差 D、中数 9.某次考试之后对数据进行统计分析,求得第90百分位数是78分,这意味着考 分高于78分的考生人数比例为()。 A、90% B、10% C、78% D、22% 10. 考试中对学生进行排名,常见的名次属于什么变量() A、称名 B、顺序 C、等距 D、比率 答案提示: 1.B 2.C 3. C 4.D 5.B 6.A 7.B 8.D 9. B 10.B 二、绘制统计图(共10分) 请按以下的分布统计资料,绘制相对次数分布直方图与多边图(可画在同一个坐标框图上) 答案提示:考核知识点:次数直方图与多边图的绘制,见第一章第三节的次数分布直方图的内容,P10-12。 三、概念解释(每小题3分,共9分)

现代心理与教育统计学课后题完整版14145

第一章绪论 1.名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标 观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2.何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3.选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4.什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量 5.怎样理解总体、样本与个体 总体N:据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6.统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值 二者关系:参数是一个常数,统计量随样本而变化 参数常用希腊字母表示,统计量用英文字母表示 当试验次数=总体大小时,二者为同一指标 当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7.试举例说明各种数据类型之间的区别 8.下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 千克厘米秒分是测量数据 17人25本是计数数据 9.说明下面符号代表的意义 μ反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 ρ表示某一事物两个特性总体之间关系的统计指标,相关系数 r 样本相关系数 σ反映总体分散情况的统计指标标准差 s样本标准差 β表示两个特性中体之间数量关系的回归系数

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

2013教育统计与评价(94分)

欲检验某班进行拓展训练前后学生成绩差异情况,应使用何种检验方法? A.t检验 B.u检验 C.χ2检验 您的答案:A 题目分数:2.0 此题得分:2.0 2.第3题 下列成绩中,那一项表明学生的成绩最好? A.Z=6.7 B.Z=-2 C.Z=-9.5 D.Z=5 您的答案:A 题目分数:2.0 此题得分:2.0 3.第5题 欲分析某校教师和学生对某一改革方案持赞成或反对的态度是否一致的问题,应使用何种检验方法? A.t检验 B.u检验 C.χ2检验 您的答案:B 题目分数:2.0 此题得分:2.0 4.第12题 欲分析学生生源地类型与外语兴趣的关系,宜采用的方法是 A.积差相关法 B.等级相关法 C.点二列相关法 D.χ2检验 您的答案:D 题目分数:2.0 此题得分:2.0 5.第17题 对信度的估计方法采用 A.T检验

C.相关法 D.χ2检验 您的答案:C 题目分数:2.0 此题得分:2.0 6.第20题 教育统计学的研究对象为 A.教育现象的本质与规律 B.教育现象 C.教育现象的数量方面 D.教育评价的质量方面 您的答案:C 题目分数:2.0 此题得分:2.0 7.第21题 对两事物均为测量数据的相关分析法为: A.积差相关法 B.等级相关法 C.点二列相关法 D.χ2检验 您的答案:A 题目分数:2.0 此题得分:2.0 8.第22题 对提出问题事先安排好答案,让对方从中选择的问卷类型是 A.限制式 B.开放式 C.半限制式 D.半开放式 您的答案:A 题目分数:2.0 此题得分:2.0 9.第23题 反映某考试的可靠性的指标是 A.效度 B.信度

教育统计与测量自考复习资料

1、统计:就是“统而计之”对所考察事物的量的取值在其出 现的全部范围内作总体的把握,全局性的认识。教育统计:对教育领域各种现象量的取值从总 体上的把握与认识,它是为教育工作的良好进行,科学管理、革新发展服务的。教育统计学:社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物 2、测量:按一定规则给对象在某种性质的量尺上指定值。教育测量:就是给所考察研究的教育现象,按一定的规则在某种性质量尺上指定值 3、心理量表:心理测验工具与常模的结合 4、数据:用数量或数字形式表示的资料事实称为数据。计数数据:是以计算个数或次数获得的,多表现为整数。测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后 所获数据。人工编码数据以人们按一定规则给不同类别的事物 指派适当的数字号码后所形成 的数据 5、称名变量:只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。顺序变量:是指可以就事物的某一属性的多少或大 小按次序将各事物加以排列的 变量,具有等级性和次序性的特点。等距变量:除能表明量的相对大小外,还具有相等的单位。比率变量:除了具有量的大小、相等单位外,还有绝对零点。比率变量数据可以进行加、减、乘、除运算 6、次数分布:一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的 情况。简单次数分布表:通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次 数分布结构。相对次数:各组的次数f与总次数N之间的比值7、次数分布曲线:从理论上讲,如若总次数无限增大,则随着组距的缩小,这些折线所接近的极限便将成为极光滑而富有规则 性的曲线,称为次数分布曲线8、散点图:用平面直角坐标系上点的散布图形来表示两种事 物之间的相关性及联系模式。散点图适合于描述二元变量的观 测数据。线形图:以起伏的折线来表示某种事物的发展变化及 演变趋势的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随 另一事物发展变化的趋势模式, 还可适用于比较不同的人物团 体在同一心理或教育现象上的 变化特征及相互联系 9、观测数据不仅具有离散性的 特点,而且还具有向某点集中的 趋势,反映次数颁分布集中趋势 的量数叫集中量数。中位数:位 于数据分布正中间位置上的那 个数。如果一组数据从小到大排 列,则中位数通常是将这批数据 个数一分为二,居于中间的那个 数。众数:一个次数分布中出现 次数最多的那个数,众数不唯一 可有一个或多个。用符号M o表 示。离中趋势:数据具有偏离中 心位置的趋势,它反映了一组数 据本身的离散程度和变异性程 度。差异量数:反映一组数据离 散程度的量 10、一批数据的算术平均数指的 是这批数据总和数除以数据总 次数后所得的商数。平均差:各 数据与其平均数的离差绝对值 的平均值。方差:数据的离差平 方数的算术平均数。标准差:方 差的算术平方根 11、差异系数:差异量数和集中 量数两相对比后所形成的相对 差异量数。地位量数:凡反映次 数分布中各数据所处地位的量 就叫地位量数 12、相关:行为变量或现象之间 存在着种种不同模式、不同程度 的联系。这种联系叫做相关。直 线性相关:两个变量的成对观测 数据在平面直角坐标系上描点 构成的散点图会环绕在某一条 直线附近分布 13、原始分数:在测量工具上直 接得到的测值(数字),叫原始 分数。相对评分分数:通过被试 间相互比较而确定意义的分数 叫相对评分分数。绝对评分分 数:通过拿被试测值跟应有标准 作比较来确定其意义的分数叫 绝对评分分数 14、常模:测验常模简称常模即 指一定人群在测验所测特性上 的普遍水平或水平分布状况。组 内常模:解释被试原始分数的参 照体系,即被试所属那类群体的 人,在所测特性上测验取值的分 布状况。标准分数常模:用被试 所得测验分数转换成的标准分 数来揭示其在常模团体中的相 对地位的组内常模 15、线性变换:对所有要作变换 的值,都乘以同一确定值然后再 都加上另一确定值。测绘项目的 难度:被试完成项目作答任务时 所遇到的困难程度。项目的难度 指数:定量刻画一个测验项目的 被试作答困难程度的量数就叫 项目的难度指数。得分率(通过 率):最通用的项目难度指数的 求法,就是计算被试在项目上的 得分率或者说通过率。项目区分 度:就是项目区别被试水平高低 的能力的量度。测验信度:测验 在测量它所测特质时得到的分 数(测值)的一致性。它是对测 验控制误差能力的量度,是反映 测验性能的一个重要质量指标 16、观察分数:如果从测验实施 过程中实际得到的被试分数叫 观察分数。真分数:被试在所测 特质上客观具有的水平值。测量 误差:观察分数与真分数的差就 是测量误差。信度系数:利用同 一测验向同一批被试重测两次 所得的两批独立测值,求出其间 的相关系数,就可利用这种重测 相关系数作为测验信度的估计 值。这样的相关系数就叫信度系 数。稳定性系数:由于重侧法十 分强调特质的稳定性,所以用这 种方法求取的信度系数就叫做 稳定性系数。等值性系数:用平 行形式相关求得的信度系数,因 为特别强调两测验形式的等值 关系所以又叫等值性系数 17、测量标准误:实际测验中所 得测值偏离真分数的程度叫做 测量标准误可记为SEM。测验效 度:测验实际上测到它打算要测 的东西的程度。内容效度:测验 项目构成应测行为领域代表性 样本的程度。效标关联效度:测 验预测个体在类似或某种特定 情境下行为表现的有效性。结构 效度:测验测得心理学理论所定 义的某一心理结构或特质的程 度。效度系数:测验分数与效标 测量值间的相关系数叫效度系 数 18、安置性测验:学期开始或单 元教学开始时确定学生实有水 平以便针对性地做好教学安排 而经常使用的测验。形成性测 验:在教学进行过程中实施的用 于检查学生掌握知识和进步情 况的测验,这可为师生双方提供 有关学习成败的连续反馈信息。 诊断性测验:为探测与确定学习 困难原因而施测的一类测验。终 结性测验:在课程结束或教学大 周期结束时,用于确定教学目标 达到程度和学生对预期学习结 果掌握程度的一类测验,称为终 结性测验 19、常模参照测验:实是参照着 常模使用相对位置来描述测验 成绩水平的一种测验。标准参照 测验:跟一组规定明确的知识能 力标准或教学目标内容对比时, 对学习者的测验成绩作出解释 的一类测验。职业能力倾向测 验:测量人的某种潜能,从而预 测人在一定职业领域中成功可 能性的心理测验 20、能力倾向:一个人获得新的 知识、能力和技能的内在潜力 21、确定性现象:在相同的条件 下其结果也一定相同的现象。不 确定性现象:在相同的条件下其 结果却不一定相同的现象,又称 随机现象 22、随机变量:我们称记录各种 随机试验结果的变量为随机变 量。概率:通俗地说,某事件发 生的概率就是该事件发生的可 能性大小记作为P(A) 23、正态分布是连续性随机变量 中常见的一种概率分布形态也 称常态分布。总体:我们把客观 世界中具有某种共同特征的元 素的全体称为总体。样本:从总 体中抽取的部分个体组成的群 体称为样本。统计量:在总体数 据基础上求取的各种特征量数 我们称其为参数,应用样本数据 计算的各种特征量数我们称其 为统计量。抽样分布:从一个总 体中随机抽取若干个等容量的 样本,计算每个样本的某个特征 量数,由这些特征量数形成的分 布,称为这个特征量数的抽样分 布 24、小概率事件:在教育统计中 常常把概率取值小于0.05或小 于0.01的随机事件称为小概率 事件。小概率事件原理:认为小 概率事件在一次抽样中不可能 发生的原理 25、统计假设检验的显著性水 平:在统计假设检验中,公认的 小概率事件的概率值被称为统 计假设检验的显著性水平。记为 α。虚无假设又称为原假设、零 假设,以符号H0表示。虚无假设 在假设检验中将被视作为已知 条件而应用,因此虚无假设应是 一个相对比较明确的陈述命题, 一定要含有“等于什么”的成分。 备择假设又称解消假设,研究假 设等,以符号H1表示。备择假设 作为虚无假设的对立假设而存 在,因此它也是一个陈述命题, 备择假设是对虚无假设的否定 26方差分析:统计学中一种独特 的假设检验方法,它的最基本功 能就是一次性检验多个总体平 均数的差异显著性

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

教育统计与测量自考复习资料

教育统计与测量复习资料 1、统计:就是“统而计之”对所考察事物的量的取值在其出现的全部范围内作总体的把握,全局性的认识。教育统计:对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好进行,科学管理、革新发展服务的。教育统计学:社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物 2、测量:按一定规则给对象在某种性质的量尺上指定值。教育测量:就是给所考察研究的教育现象,按一定的规则在某种性质量尺上指定值 3、心理量表:心理测验工具与常模的结合 4、数据:用数量或数字形式表示的资料事实称为数据。计数数据:是以计算个数或次数获得的,多表现为整数。测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后所获数据。人工编码数据以人们按一定规则给不同类别的事物指派适当的数字号码后所形成的数据 5、称名变量:只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。顺序变量:是指可以就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。等距变量:除能表明量的相对大小外,还具有相等的单位。比率变量:除了具有量的大小、相等单位外,还有绝对零点。比率变量数据可以进行加、减、乘、除运算 6、次数分布:一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。简单次数分布表:通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。相对次数:各组的次数f与总次数N之间的比值 7、次数分布曲线:从理论上讲,如若总次数无限增大,则随着组距的缩小,这些折线所接近的极限便将成为极光滑而富有规则性的曲线,称为次数分布曲线 8、散点图:用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。散点图适合于描述二元变量的观测数据。线形图:以起伏的折线来表示某种事物的发展变化及演变趋势的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于描述一种事物随另一事物发展变化的趋势模式,还可适用于比较不同的人物团体在同一心理或教育现象上的变化特征及相互联系 9、观测数据不仅具有离散性的特点,而且还具有向某点集中的趋势,反映次数颁分布集中趋势的量数叫集中量数。中位数:位于数据分布正中间位置上的那个数。如果一组数据从小到大排列,则中位数通常是将这批数据个数一分为二,居于中间 表示。离中趋势:数据的那个数。众数:一个次数分布中出现次数最多的那个数,众数不唯一可有一个或多个。用符号M o 具有偏离中心位置的趋势,它反映了一组数据本身的离散程度和变异性程度。差异量数:反映一组数据离散程度的量 10、一批数据的算术平均数指的是这批数据总和数除以数据总次数后所得的商数。平均差:各数据与其平均数的离差绝对值的平均值。方差:数据的离差平方数的算术平均数。标准差:方差的算术平方根 11、差异系数:差异量数和集中量数两相对比后所形成的相对差异量数。地位量数:凡反映次数分布中各数据所处地位的量就叫地位量数 12、相关:行为变量或现象之间存在着种种不同模式、不同程度的联系。这种联系叫做相关。直线性相关:两个变量的成对观测数据在平面直角坐标系上描点构成的散点图会环绕在某一条直线附近分布 13、原始分数:在测量工具上直接得到的测值(数字),叫原始分数。相对评分分数:通过被试间相互比较而确定意义的分数叫相对评分分数。绝对评分分数:通过拿被试测值跟应有标准作比较来确定其意义的分数叫绝对评分分数 14、常模:测验常模简称常模即指一定人群在测验所测特性上的普遍水平或水平分布状况。组内常模:解释被试原始分数的参照体系,即被试所属那类群体的人,在所测特性上测验取值的分布状况。标准分数常模:用被试所得测验分数转换成的标准分数来揭示其在常模团体中的相对地位的组内常模 15、线性变换:对所有要作变换的值,都乘以同一确定值然后再都加上另一确定值。测绘项目的难度:被试完成项目作答任务时所遇到的困难程度。项目的难度指数:定量刻画一个测验项目的被试作答困难程度的量数就叫项目的难度指数。得分率(通过率):最通用的项目难度指数的求法,就是计算被试在项目上的得分率或者说通过率。项目区分度:就是项目区别被试水平高低的能力的量度。测验信度:测验在测量它所测特质时得到的分数(测值)的一致性。它是对测验控制误差能力的量度,是反映测验性能的一个重要质量指标 16、观察分数:如果从测验实施过程中实际得到的被试分数叫观察分数。真分数:被试在所测特质上客观具有的水平值。测量误差:观察分数与真分数的差就是测量误差。信度系数:利用同一测验向同一批被试重测两次所得的两批独立测值,

相关文档
最新文档