2017自考教育统计与测量自考最新复习资料
2017年教育统计与测量
、教育统计学的内容主要包括:描述统计与推断统计
2、测量结果能在其上取定数值的量尺,从量化水平高低的角度可分为:名义量尺、顺序量尺、等距量尺与比率量尺。
3、在名义量尺上所指定的数字,只具有类别标志的意义,而无性质优劣,分量多寡的意义。
4、顺序量尺上的数字量化水平则较高,有优劣、大小、先后之别,如学业成绩评定优劣。
5、等距量尺上的数字量化水平又更高,这种数字是单位相等但零点可任意指定的线性连续体系上的值,如温度,可比可加。
6、比率量尺是一种有绝对零点的,等单位的线性连续体系。如身高、体重等。能加、减、乘、除
3、测量工作按一定的规则进行,体现为三种东西即:测量工具、施测和评分的程序与要求、结果解释参照系或参照物
4、心理测量跟物理测量的两点突出差异:一间接性;二要抽样进行
5、数据的种类①从数据来源分成计数数据、测量评估数据和人工编码数据②根据数据所反映的变量
的性质分分为称名变量数据、顺序变量数据、等距变量和比率变量数据。
6、顺序变量、等距变量与比率变量的区别;顺序变量数据之间虽有次序与等级关系,但不具有相等单位,也不具有绝对的数量大小和零点,因此只能进行顺序递推运算,不能做加减乘除运算。等距变量不能用乘、除法运算来反映两个数据之间的倍比关系,能做加减运算。比率变量数据可以进行加、减、乘、除运算
7、数据三个特点
①数据的离散性
②数据的变异性
③数据的规律性
8、统计一批数据的次数分布两种方法:一、按不同的测量值逐点统计次数;二、为了简缩数据以区间跨度来统计次数。如分数段统计
9、编制简单次数分布步骤
①求全距②定组数③定组距
④写组限⑤求组中值
⑥归类划记⑦登记次数
10、相对次数分布表主要能反映各组数据的百分比结构
11、累积次数分布表还分成“以下”累积次数分布表与“以上”累积次数分布表两种。
“以下”累积其目的在于反映位于某个分数“以下”的累积次数共有多少
12、次数分布图两种表达方式:次数直方图和次数多边图13、次数分布曲线按形状有各种不
同类型
①单峰对称分布曲线。正态分布曲
线也是这一类型曲线中的一种
②非对称曲线即偏态分布。正偏
态:次数分布有朝数量大的一边偏
尾,曲线高峰偏向数量小的方向,
在一些考试中,若题目偏难,多数
考分偏低时,可形成正偏态分布。
而负偏态的次数分布偏向正好与
正偏态相反
14、几种常用统计分析图:散点图、
线形图、条形图和圆形图。
15、圆形图有其独特的功能,特别
适用于描述具有百分比结构的分
类数据
16、集中量数有三个作用
①向人们提供整个分布中多数数
据的集结点位置
②集中反映一批数据在整体上的
数量大小
③一批数据的典型代表值
17、集中量数有多个种类,最常用
的是算术平均数、中位数和众数三
种。其中算术平均数是使用最普通
的一个集中量数。
18、中数在下列情况中有较好的应
用价值①数据分布中有个别异常
值或极端值出现时,用平均数作分
布的代表值倒不如用中数作分布
的代表值来得客观合理②在次数
分布的某端或两端的数据只有次
数而没有确切数量时③在一些态
度测验、价值观测验或一般的民意
问卷测试中,通常向被调查对象提
出一些事项,要求被调查对象对这
些事项排序。那么,在这种资料的
信息数据整理分析中可应用中数
来概括各个事项的总体排序结果
19、常用的差异量数是平均差、标
准差和方差等指标
20、差异系数又称为变异系数和变
差系数,用符号CV表示。差异系
数是一种反映相对离散程度的系
数,即相对差异量数。它消去了单
位,因而适合于不同性质数据的研
究与比较。
21、数据在次数分布中所处的地位
可用百分等级来表示。百分等级也
称百分位。用记号PR表示。
百分等级反映的是某个观测分数
以下数据个数占总个数的比例的
百分数,在0到100之间取值。如
百分等级PR=75,与其对应的这个
百分位数,读作第75百分位数,
记作P75
20、相关:统计学上用相关系数来
定量描述两个变量之间的直线性
相关的强度与方向。
如相互关联着的两变量,一个增大
另一个也随之增大,一个减小另一
个也随之减小,变化方向一致是正
相关。
如相互关联着的两变量,一个增大
另一个反而减小,变化方向相反是
负相关。
相关系数用r表示, r在-1和+1
之间取值。
相关系数r的绝对值大小,表示两
个变量之间的相关强度;
相关系数r的正负号,表示相关的
方向,分别为正相关和负相关;
相关系数r=0,称零线性相关,简
称零相关;
相关系数|r|=1时,表示两个变量
是完全相关。
当0.7≤|r|<1,称为高相关;
当0.4≤|r|<0.7时,称为中等相
关;当0.2≤|r|<0.4时,称为低
相关;当|r|<0。2时,称极低相
关或接近零相关
21、积差相关是应用最普遍、最基
本的一种相关分析方法,尤其适合
于对两个连续变量之间的相关情
况进行定量分析
22、等级相关适用的几种情况
①两列观测数据都是顺序变量数
据,或一列是顺序变量数据,另一
列是连续变量的数据。如对学生的
绘画、体育测试成绩排名就属顺序
变量数据
②两个连续变量的观测数据,其中
有一列或两列数据的获得主要依
靠非测量方法进行粗略评估得到。
如语文基础知识水平可测验加以
测量但学生的课文朗读水平却只
能根据若干准则由老师给予大体
的评估。
点双列相关适用于双变量数据中,
有一列数据是连续变量数据,如体
重、身高以及许多测验与考试的分
数;另一列数据是二分类的称名变
量数据,如性别
23、原始分数的意义必须要跟一定
的参照物(系统)作比较,才能真
正明确起来。
原始分数意义的参照物大体有两
类,一是其他被试的测值,即其他
被试在所测特性上的普遍水平或
水平分布状态;二是社会在所测特
性上的客观要求,即被试在所测特
性上发展应该达到程度的标准
24、常模总是指某一具体测验(不
能简单地看成是其名称所指特性)
上的常模。常模总是特定的、具体
的,是就一定人群在具体测验上的
表现来说的。常模又可分为发展常
模与组内常模两大类。发展常模又
有年龄常模与年级常模之别,组内
常模又有百分等级常模与标准分
数常模之别
25、历史上第一个提出常模这一科
学概念的是法国心理学家比纳。他
最早建立了智力测验的年龄常模。
发展常模就是某类个体正常发展
进程各特定阶段的一般水平
26、智商(IQ)=智力年龄/生理年
龄×100
27、组内常模又可分为百分等级常
模与标准分数常模两个类别。一个
分数的百分等级,就是该分数在所
属分数组中,取值比它小的分数个
数占该分数组总个数的百分数。百
分等级值只有可比性而无可加性,
不能累加求和与进一步求平均;这
是百分等级常模的一个局限所在
28、一个测验分数的标准分数,就
是以它所属分数组的标准差为单
位的,对它所属分数组的平均数的
距离
29、难度指数(p)取值越大并不
意味着项目越难,而是越易;指数
p的数字值与其代表的含义,方向
恰好相反
30、三种偏态分布:
如果一个测验对某一被试团体来
说,难度相对显得大,那么,被试
团体中大多数人就会得低分,被试
总分分布就会形成正偏态分布;
如果一个测验对某一被试团体来
说,难度相对显得小,被试团体中
就会有很多人得高分,总分分布就
会形成负偏态分布;
假定被试团体在某一特定方面,其
水平分布事实上是呈正态分布的,
若测验项目的难度确能做到对这
个被试团体来说是恰当的,那么对
这个团体施测这一测验,所得被试
测验总分分布自然也会呈正态分
布
31、“高、低分组求得分率差”的
办法就是将全体被试按总分多寡
加以排队,然后取得分最多的27%
的被试作为“高分组”,得分最少
的27%的被试作为“低分组”,最
后求这两个组上项目得分率(通过
率)的差来作为区分度指数的取值
31、人们就使用两个平行形式测验
来测查同一批被试,这样也可获得
同一批被试的两批独立测值,从而
通过求相关系数,估出测验的信度
32、效度验证工作大体分为三类即
内容效度、效标关联效度和结构效
度。效标关联效度又包含“并存”
效度和“预测”效度这两个小类别
33、测验即使相当有效,效度系数
r XY的取值也很少能超过0.70,一
般取值能达到0.40就相当不错了
34、根据课堂教学运用测验的一般
顺序来分可把学业成就测验分成
安置性测验、形成性测验、诊断性
测验和终结性测验。
根据解释测验分数的方法不同可
把学业成就测验分成常模参照测
验和标准参照测验两类。
根据成就测验的实施方式与测验
载体,我们把成就测验分成口头测
验、纸笔测验和操作测验
35、纸笔测验优点
①提高测验的效率,即同时可以进
行大团体的测验
②便于完整记录学生在题目作答
上的反应
③便于施测和评分过程的规范化
和标准化从而提高学业成就测验
的信度与效度④便于对测验中答
题信息的分析研究
36、课堂成就测验特点①简易性②灵活性③随意性④测量性能较差37、对教育目标分类的认识:布卢姆认为作为完整的教育目标应当包括三个主要的领域:认知领域、情感领域和动作技能领域。布卢姆把认知领域中的行为目标分为六个不同的层次,它们依次是知识(识记)、领会、应用、分析、综合和评价
①知识:回忆或辨认某些特定的事实
②领会:初步理解材料的意义
③应用:能够运用已学过的材料
④分析:把事物整体分解为部分,以便了解整体与部分以及部分与部分之间的关系
⑤综合:把各个部分有机地组织成一个整体的能力
⑥评价:根据一定的标准对事物的价值作出合乎逻辑的判断,如对小说、诗歌、电影、哲学流派、环保方案、测验设计等作出价值判断的行为与能力
38、我国教育工作者提出目标层次分为识记、理解(领会)、简单应用和综合应用这四个层次
39、学业测验中考试题目类型分为客观题、主观题
40、客观题:有一些考试题目,如果评分规则一旦明确下来,只要依照这些规则,无论谁去评分,都会得出相同的分数,典型的客观题类型常见的有填空题、简答题、是非题、匹配题、单项选择题或多项选择题等。
简答题和填空题适合于测量相对简单的学习成就。
是非题这种题型的缺陷也是明显的,一是容易猜测,(猜对的可能性有50%),二是适合于用是非题来测量的学习成就其范围有限。多项选择题更适合于测量具有较复杂结构的学习成就
41、主观题型如论述题、证明题、计算题、作图题、作文题等
42、心理测验主要用途
①人才选拔
②人员安置与人事管理
③临床心理学研究
④学校心理服务
⑤建立和检验假设
43、智力测验在国内常见
①比纳智力测验
②斯坦福—比纳智力测验
③韦克斯勒智力测验
④瑞文标准推理测验
⑤中小学生团体智力筛选测验
44、吉尔福特认为,发散思维所表现出来的一个人的外在的行为,即代表这个人的创造力
45、发散性思维在行为上表现三种基本特征:流畅性、变通性、独特性46、人格测验的方法与类型主要有
自陈量表法、投射测验法、情境测
验法、评定量表法
47、客观世界中发生的各种现象分
为两类:确定性现象不确定性现象
48、按照概率的定义,概率的取值
范围在区间[0,1]上,如某个事件
概率为1,表示该事件肯定发生,
这样的事件称为必然事件,在实际
研究中更多事件的概率介于0与1
之间,人们把发生概率很小的事
件,如概率小于0.05,或0.01,
称为小概率事件
49、一个离散性随机变量的概率分
布是指这个随机变量所有取值点
的概率的分布情况。
一个连续性随机变量的概率分布
是指这个随机变量所有取值区间
上概率取值的分布情况
50、从形态看,正态分布是一条单
峰、对称呈钟形的曲线,其对称轴
为过x=u的纵线。曲线在X=u点取
得最大值。从x=u点开始,曲线向
正负两个方向递减延伸,不断向X
轴逼近,但永不与X轴相交。一个
随机变量服从正态分布的最大特
点是其取值在平均数附近的概率
很大,而取值离平均数越远,其概
率越小。在这许许多多的正态分布
中有平均数为0、标准差为1的正
态分布可以作为正态分布的一个
典型代表,其他各种正态分布都可
以通过一定的数学方法与它相互
转化
51、在标准正态分布中,夹中间面
积90%的两个Z值分别为±1.96;
夹中间面积99%的两个Z值分别为
±2.58
52、统计学中,推断统计的直接操
作对象是总体的一个样本,但其推
断的却是总体的各种特征。影响样
本对总体代表性的因素主要有三
①总体本身的离散性②所抽取样
本容量的大小③对总体代表性强
弱的因素是抽样方法
53、随机抽样方法①简单随机抽样
②分层抽样③分阶段抽样④等距
抽样
54、随机抽样方法原则①机会均等
②相互独立。简单随机抽样最常见
的形式就是抽签。较严谨的简单随
机抽样是借助随机数码表而作的
随机抽样
55、分层抽样的实质就是将总体各
部分按其容量在总体规模中的比
分派到样本结构中去,然后进行抽
样。所以分层抽样是分两步进行①
按比例求出各部分入样元素数②
各部分按要求的人样数用简单随
机抽样的方法产生入样元素,最终
合成总样本。分阶段抽样实际上进
行两次抽样,第一次是以“部分”
为元素进行抽样,然后再在人样的
这些“部分”中抽取入样元素。等
距抽样的第一步也是首先对总体
所有元素编号,所编号码应该是连
续有序的。第二步计算每相邻两入
样元素的间隔距离。第三步是在第
一间隔中随机确定第一个入样元
素的号码,比如说取定为00003。
第四步则开始抽取入样元素
56、要认识抽样分布必须学会识别
三种分布:总体分布、子样分布和
抽样分布
57、α值常取0.05和0.01两个水
平,偶而也有取0.001的。在假设
检验中,α的取值越小,称此假设
检验的显著性水平越高
58、统计假设检验中使用的假设有
两种,一种称为虚无假设,一种称
为备择假设。统计假设检验中冒犯
I型错误的概率大小就等于显著性
水平α值的大小,β同时也是犯Ⅱ
型错误的概率值符号。
Ⅱ型错误称为β错误,影响Ⅱ型错
误概率大小的因素有三个。
第一因素是客观的真值与假设的
伪值两者之间的差异。
第二因素是α值的大小。α值越
大,犯Ⅱ型错误的概率就越小,α
值越小,β就越大。
第三因素是样本容量。样本容量越
大,犯Ⅱ型错误的概率就越小;样
本容量越小,犯Ⅱ型错误的概率就
越大
59、如果检验的目的是为了判断某
个总体参数是否等于某个定值,或
者是为了推断某两个总体参数是
否相等,则应该使用双侧检验。
如果检验的目的是为了推断某个
总体参数是否大于或是否小于某
个定值,或者是为了推断某两个总
体参数之间有无大于或小于的关
系
60、X1平均数-X2平均数的抽样分
布形态以及它的各种参数估计公
式主要受到四个因素的影响。
第一是受到两个总体是否相关的
影响,
第二是受到两个总体分布是否正
态的影响,
第三是受到两个总体方差是否已
知以及是否相等的影响,
第四是受到所抽样本容量的影响
61、把人按四种气质类型统计人
数;学习成绩按优、良、中、差分
类统计;对某项改革措施按所持赞
成、反对以及无所谓态度统计;把
一个教师群体同时按职称类别和
态度等交叉分类。对于这一类数据
的差异显著性检验,最适合的检验
方法是x2检验
62、计算x2时
①若实际观测次数f0和理论期待
次数f e完全相同,则x2为0,表明
观测的次数分布与设想的总体的
理论次数分布没有差异
②当实际观测次数f0和理论期待
次数f e相差越大时,则x2值也越
大,这表明观测的次数分布与设想
的总体的理论次数分布之间的差
异也越大
63、χ2(读作卡方)是检验实际
观测次数与理论期待次数之间差
异程度的指标,其最一般表达式
为:
f0表示实际观测次数;fe表示理论
期待次数。χ2检验最重要的最关
键的一步是如何从虚无假设出发,
确定各类事物的理论期待次数
64、总体分布的拟合良度检验包括
非连续变量观测次数分布的拟合
良度检验、连续变量观测数据次数
分布的拟合良度检验
65、在计算理论次数时,根据χ2
统计量的特性,对此要求把理论次
数小于5的组同相邻的组进行合
并,直至所有组的理论次数均不小
于5方可
66、列联系数C与χ2值,在对r
×K 列联表检验中(这里 r与K
中至少有一个大于2),当所得的
χ2值大于由预定显著性水平及特
定自由度决定的χ2临界值时,我
们有理由拒绝虚无假设并推断说,
两种特征或属性之间具有相互依
存的连带关系;但这种相关关系的
程度怎样呢?在统计学中,人们用
列联系数C来表示这种相关的程
度。列联系数在0与1之间取值
67、在实际工作中我们有时需要同
时对多于两个的总体平均数有无
显著性差异作出检验,三个或三个
以上用方差分析
68、方差齐性检验方法:多总体方
差是否齐性常采用Hartley最大F
值法
69、方差分析作出各总体平均数有
显著差异之后,还必须作进一步的
分析,目的以探清到底有多少对平
均数之间有显著差异,到底哪些平
均数之间有显著差异。方差进一步
分析方法有N-K法。
考察事物的量的取值在其出现的
全部范围内作总体的把握,全局性的认识。
2、教育统计:对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好进行,科学管理、革新发展服务的。
3、教育统计学:社会科学中的一门应用统计,是数理统计跟教育学、心理学交叉结合产物
4、测量:按一定规则给对象在某种性质的量尺上指定值。
教育测量:就是给所考察研究的教育现象,按一定的规则在某种性质量尺上指定值
5、心理量表:心理测验工具与常模的结合
6、数据:用数量或数字形式表示的资料事实称为数据。
7、计数数据:是以计算个数或次数获得的,多表现为整数。
8、测量评估数据:借助测量工具或评估方法对事物的某种属性指
派给数字后所获数据。
9、人工编码数据以人们按一定规则给不同类别的事物指派适当的
数字号码后所形成的数据
10、称名变量:只说明某一事物与其他事物在名称、类别或属性上的不同,并不说明事物与事物之间差异的大小、顺序的先后及质的优劣。
11、顺序变量:是指可以就事物的某一属性的多少或大小按次序将
各事物加以排列的变量,具有等级性和次序性的特点。
12、等距变量:除能表明量的相对大小外,还具有相等的单位。13、比率变量:除了具有量的大小、相等单位外,还有绝对零点。比率变量数据可以进行加、减、乘、除运算
14、次数分布:一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间
内所出现的次数多少的情况。15、简单次数分布表:通常简称为次数分布表,其实质是反映一批数据在各等距区组内的次数分布结构。
16、相对次数:各组的次数f与总次数N之间的比值
17、次数分布曲线:从理论上讲,如若总次数无限增大,则随着组距的缩小,这些折线所接近的极限便将成为极光滑而富有规则性的曲线,称为次数分布曲线
18、散点图:用平面直角坐标系上点的散布图形来表示两种事物之
间的相关性及联系模式。散点图适合于描述二元变量的观测数据。19、线形图:以起伏的折线来表示某种事物的发展变化及演变趋势
的统计图,适用于描述某种事物在时间序列上的变化趋势,也适用于
描述一种事物随另一事物发展变
化的趋势模式,还可适用于比较不
同的人物团体在同一心理或教育
现象上的变化特征及相互联系
20、集中量数:观测数据不仅具有
离散性的特点,而且还具有向某点
集中的趋势,反映次数颁分布集中
趋势的量数叫集中量数。
21、中位数:位于数据分布正中间
位置上的那个数。如果一组数据从
小到大排列,则中位数通常是将这
批数据个数一分为二,居于中间的
那个数。
22、众数:一个次数分布中出现次
数最多的那个数,众数不唯一可有
一个或多个。用符号M o表示。
23、离中趋势:数据具有偏离中心
位置的趋势,它反映了一组数据本
身的离散程度和变异性程度。
24、差异量数:反映一组数据离散
程度的量
25、算术平均数指的是这批数据总
和数除以数据总次数后所得的商
数。
26、平均差:各数据与其平均数的
离差绝对值的平均值。
27、方差:数据的离差平方数的算
术平均数。
28、标准差:方差的算术平方根
29、差异系数:差异量数和集中量
数两相对比后所形成的相对差异
量数。
30、地位量数:凡反映次数分布中
各数据所处地位的量就叫地位量
数
31、相关:行为变量或现象之间存
在着种种不同模式、不同程度的联
系。这种联系叫做相关。
32、直线性相关:两个变量的成对
观测数据在平面直角坐标系上描
点构成的散点图会环绕在某一条
直线附近分布
33、原始分数:在测量工具上直接
得到的测值(数字),叫原始分数。
34、相对评分分数:通过被试间相
互比较而确定意义的分数叫相对
评分分数。
35、绝对评分分数:通过拿被试测
值跟应有标准作比较来确定其意
义的分数叫绝对评分分数
36、常模:测验常模简称常模即指
一定人群在测验所测特性上的普
遍水平或水平分布状况。
37、组内常模:解释被试原始分数
的参照体系,即被试所属那类群体
的人,在所测特性上测验取值的分
布状况。
38、标准分数常模:用被试所得测
验分数转换成的标准分数来揭示
其在常模团体中的相对地位的组
内常模
39、线性变换:对所有要作变换的
值,都乘以同一确定值然后再都加
上另一确定值。
40、测绘项目的难度:被试完成项
目作答任务时所遇到的困难程度。
41、项目的难度指数:定量刻画一
个测验项目的被试作答困难程度
的量数就叫项目的难度指数。
42、得分率(通过率):最通用的
项目难度指数的求法,就是计算被
试在项目上的得分率或者说通过
率。
43、项目区分度:就是项目区别被
试水平高低的能力的量度。
44、测验信度:测验在测量它所测
特质时得到的分数(测值)的一致
性。它是对测验控制误差能力的量
度,是反映测验性能的一个重要质
量指标
45、观察分数:如果从测验实施过
程中实际得到的被试分数叫观察
分数。
46、真分数:被试在所测特质上客
观具有的水平值。
47、测量误差:观察分数与真分数
的差就是测量误差。
48、信度系数:利用同一测验向同
一批被试重测两次所得的两批独
立测值,求出其间的相关系数,就
可利用这种重测相关系数作为测
验信度的估计值。这样的相关系数
就叫信度系数。
49、稳定性系数:由于重侧法十分
强调特质的稳定性,所以用这种方
法求取的信度系数就叫做稳定性
系数。
50、等值性系数:用平行形式相关
求得的信度系数,因为特别强调两
测验形式的等值关系所以又叫等
值性系数
51、测量标准误:实际测验中所得
测值偏离真分数的程度叫做测量
标准误可记为SEM。
52、测验效度:测验实际上测到它
打算要测的东西的程度。
53、内容效度:测验项目构成应测
行为领域代表性样本的程度。
54、效标关联效度:测验预测个体
在类似或某种特定情境下行为表
现的有效性。
55、结构效度:测验测得心理学理
论所定义的某一心理结构或特质
的程度。
56、效度系数:测验分数与效标测
量值间的相关系数叫效度系数
57、安置性测验:学期开始或单元
教学开始时确定学生实有水平以
便针对性地做好教学安排而经常
使用的测验。
58、形成性测验:在教学进行过程
中实施的用于检查学生掌握知识
和进步情况的测验,这可为师生双
方提供有关学习成败的连续反馈
信息。
59、诊断性测验:为探测与确定学
习困难原因而施测的一类测验。
60、终结性测验:在课程结束或教
学大周期结束时,用于确定教学目
标达到程度和学生对预期学习结
果掌握程度的一类测验,称为终结
性测验
61、常模参照测验:实是参照着常
模使用相对位置来描述测验成绩
水平的一种测验。
62、标准参照测验:跟一组规定明
确的知识能力标准或教学目标内
容对比时,对学习者的测验成绩作
出解释的一类测验。
63、职业能力倾向测验:测量人的
某种潜能,从而预测人在一定职业
领域中成功可能性的心理测验
64、能力倾向:一个人获得新的知
识、能力和技能的内在潜力
65、确定性现象:在相同的条件下
其结果也一定相同的现象。
不确定性现象:在相同的条件下其
结果却不一定相同的现象,又称随
机现象
66、随机变量:我们称记录各种随
机试验结果的变量为随机变量。
概率:通俗地说,某事件发生的概
率就是该事件发生的可能性大小
记作为P(A)
67、正态分布是连续性随机变量中
常见的一种概率分布形态也称常
态分布。
68、总体:我们把客观世界中具有
某种共同特征的元素的全体称为
总体。
69、样本:从总体中抽取的部分个
体组成的群体称为样本。
70、统计量:在总体数据基础上求
取的各种特征量数我们称其为参
数,应用样本数据计算的各种特征
量数我们称其为统计量。
71、抽样分布:从一个总体中随机
抽取若干个等容量的样本,计算每
个样本的某个特征量数,由这些特
征量数形成的分布,称为这个特征
量数的抽样分布
72、小概率事件:在教育统计中常
常把概率取值小于0.05或小于
0.01的随机事件称为小概率事件。
73、小概率事件原理:认为小概率
事件在一次抽样中不可能发生的
原理
74、统计假设检验的显著性水平:
在统计假设检验中,公认的小概率
事件的概率值被称为统计假设检
验的显著性水平。记为α。
75、虚无假设又称为原假设、零假
设,以符号H0表示。虚无假设在假
设检验中将被视作为已知条件而
应用,因此虚无假设应是一个相对
比较明确的陈述命题,一定要含有
“等于什么”的成分。
76、备择假设又称解消假设,研究
假设等,以符号H1表示。备择假设
作为虚无假设的对立假设而存在,
因此它也是一个陈述命题,备择假
设是对虚无假设的否定
77、方差分析:统计学中一种独特
的假设检验方法,它的最基本功能
就是一次性检验多个总体平均数
的差异显著性
算术平均数的运算性质
①数据组全部观测值与其平
均数的离差之和必定为0
②每一观测值都加上一个相
同常数C后,则计算变换后数据的平均数等于原有数据的平均数加
上这个常数C
③每一观测值都乘以一个相
同常数C后,所得新数据的平均数,其值等于原数据的平均数同样乘以这个常数C
④对每个观测值作线性变换,即乘上相同的常数C,再加上另一常数d,则计算变换数据的平均数,其值等于原数据的平均数作相同
线性变换后的结果
2、标准差的性质与应用
①全组数据每一观测值都加
上一个相同的常数C后计算得到
的标准差不变
②若每一观测值都乘以一个
相同的非零常数C,则所得到的标准差等于原标准差乘以这个常数
的绝对值
③每个观测值都乘以同一个
非零常数C,再加上另一个常数d,所得数据的标准差等于原标准差
乘以这个常数C
3、建立常模步骤
①科学抽样,从清楚而明确地定义的“特定人群”总体中,抽取到容量足够大、并确具代表性的被试样组
②要用拟建立常模的测验,采用规范化施测手续与方法对标准
化样组(常模组)中的所有被试,施测该测验,以便恰当而准确地收集到所有这些被试在该测验上的
实际测值。
③对收集到的全部资料进行
统计分析处理,真正把握被试样组在该测验上的普遍水平或水平分
布状况。
4、年级常模的缺点:
年级常模虽直观好懂,但也有一定缺点。
一是许多学校科目并不连年
授课所以无法求年级常模;即使多学年授课的科目,如数学,随年级的递升内容重点也不断转移,
二是所得年级等值常易引起
误解。
5、百分等级常模的应用优点?
它应用得相当广泛。
这主要是因为百分等级的意
义直观、好解释而且若几个不同测验对同一常模组实施,建立起了这不同测验的百分等级常模,那么,原来无法相互比较的不同测验上
的原始分数,就可以通过百分等级而相互直接比较。6、百分等级本身不是等单位的
量度?
心理和教育测验分数的分布
状态,一般不会形成平行分布状
态,而会形成“两头小中间大”的
形状,或者就呈正态分布。这样,
第一百分等级(PR=1)跟第二百分
等级(PR=2)所对应的原测验分数
的差,和第五十百分等级(PR=50)
跟第五十一百分等级(PR=51)对
应的原测验分数的差,是不会相等
的。尾端一个百分等级的差,要比
中部一个百分等级的差大得多
7、标准分数是等单位的量度,
不存在尾端单位大而中部单位小
的问题
①标准分数是一个比值,分子
是原始测验分数的离均差,它是会
随测验分数联欢会取值不同而变
化的;但分母却是一个固定值,是
所属分数组的标准差,不会随测验
分数是在尾端或是中部取值而变
化。
②就位置不同测验分数的离
均差来求比值时,被比的基数都是
相同的,所以标准分数的单位就是
相等的了。
8、建立标准分数常模步骤?
我们要为性能优良的测验建立标
准分数常模步骤:
①从明确界定好的该测验应
该测查的被试总体中,抽取一个容
量足够大的代表性样组,即建立起
常模组(常模团体)。
②对该代表性样组按应有规
范施测该测验,获得代表性样组中
每一被试的测验分数,即得到常模
团体的测验分数组。
③求取常模团体测验分数组
的平均数与标准差,按公式求取从
-3.000到3.000这一区间上若干
个点的标准分数(Z值)跟测验原
始分数的对照表,就得到了标准分
数常模表。
9、为什么不同测验分数转化为Z
分数就能比较
①标准分数Z值是以被试所
属组分数的标准差为单位来表示
的被试个体分数对平均数的距离。
②标准分数的分布状态,就是
原始分数整个分布状态的“平移放
缩”后的产物;两个分布状态是完
全的相似形,只是标准分数分布
中,平均数取0而标准差为1。
③若两个测验上原始分数分
布状态相同,比如都呈正态分布,
那么两个测验上的标准分数,就可
直接比较了
10、求整份测验难度
①当所有项目的满分值都相
等时,才能用求算术平均数办法;
如果各项目的满分值并不相等,就
要用求加权平均数的办法。
②在后一种情况下,各项目难
度指数都要用本项目的满分值来
加权
③当有了全部被试的测验总
分后,就可直接利用它们来求取被
试总分的平均数,然后再求它对全
卷满分的比
11、标准化常模参照测验难度
①一般的标准化常模参照测
验目的是要尽可能把握信住被试
的个别差异,因此希望测验后所有
被试的分数“尽可能拉开距离”,
好、中、差被试都能得到相应的彼
此有足够差异的分数。
②测验项目的恰当难度应该
是p值尽量接近0.50③只有当项
目难度指数值愈接近0.50时,项
目才愈具有区分被试的能力。
12、标准参照测验难度?
教育领域中有不少测验是标
准(目标)参照测验:
①其目的是要考察被试的水
平是否达到应有要求。这种测验其
项目的难度,就不应该由被试的实
际通过率来决定,而应由项目的考
核要求是否体现了应有标准或教
学目标来决定。
②即使一个测验项目的通过
率为1.00,但考核要求确实体现
了应有标准或教学目标,项目的难
度仍然是恰当的、合理的。相反,
如果一个测验项目的通过率很低,
甚至为0.00,但考核要求并无不
当,体现的是应有标准和教学目
标,那么,项目难度也是合理的、
必要的,应予坚持。
13、项目区分度指数取值范围多
高为好?
①区分度指数值若在0.20以
下说明项目区别被试优劣的能力
很差,应从测验中淘汰这类项目
②区分度指数取值在0.20至
0.29之间说明这类项目区别被试
优劣的能力还相当弱应通过修改
来提高其区分能力
③区分度指数取值在0.30至
0.39间就说明这类项目的区别被
试优劣的能力合格;若区分度指数
取值大于0.40,试题区别被试优劣
的能力就很强,是性能优良的试
题。
14、各种信度系数适用情况
①重测相关求信度系数,就特
别着重考察跨时距上所得分数的
一致性。经常测试如智力、能力倾
向和人格特点。因此稳定性系数多
用在预测性测验上。
②用平行形式相关法求信度
系数,特别强调测验内容结构要平
行等值性,多用于学业成就测验
中。
③内部一致性系数强调测验
中各个项目都要测查同一个特质。
要求其所含项目具有高度的同质
性。
15、常模参照测验与标准参照测
验的差异
①常模参照测验的成绩通常
是一种相对评分,说明被试在某一
被试团体中的相对地位;而标准参
照测验的成绩通常是一种绝对评
分,说明被试达成某一教学目标,
或掌握某一范围内的知识技能的
实有程度。
②常模参照测验在设计意图
上比较强调对个体能力的区分鉴
别,而标准参照测验在设计意图上
考虑的是测验内容抽样是否良好
地代表一组既定的能力标准或既
定的教学目标。
③常模参照测验通常涉及更
广泛的、难以明确限定的学习内容
与能力目标,对每一项而标准参照
测验相对来讲,测验内容集中在限
定的学习任务上,对每一项学习任
务或目标通常用较多数量的题目
来测量。
16、实验技能考核三原则
①实践性为主的原则。应以动
手操作为主,不能停留在笔试形式
下考查实验操作知识的方式上。
②全面性原则。要尽力考核到
实验计划与设计、实验的实施与操
作、实验的分析与解释、实验报告
撰写等环节;因此可结合笔试、口
试和演示进行。
③客观化原则。要建立在行为
观察的基础上,客观地评价学生的
实验技能
17、标准化成就测验特点
①由有关教育测量专家和学
科专家编制。
②实现了测验全过程的标准
化。
③测验题目经过专家审查,常
常还抽取代表性被试样本进行预
测。
④备有测验指导手册。
⑤通常备有等价的或平行的
几份测验。
⑥测验的质量经过检验,信度
高、效度好。
⑦标准化成就测验还具有相
对稳定性的特点。
18、编制命题双向细目表通常以教学大纲或考试大纲为根据,采取步骤?
①确定考试内容要目,并把它们排列在表中最左边一栏上。这有两种方法;一按照教材章节名称依次罗列;二是根据教学内容知识块分别罗列。
②界定该科目应考查的掌握目标层次,并把这些目标层次从低级到高级依次安排在表中顶端第一行有关格子上。
③确定各项考试内容要目下的分数比重。
④把每一项考试内容的分数比重(如第一章绪论分数比重10分)逐一分配到若干必要的考查目标即掌握层次上去,形成网格的分数分配方案,即是命题双向细目表。
19、主观题突出的特点和长处?
①不允许简单猜测,适于考察分析综合能力、组织表达能力以及计算与推论等较为复杂的心智技能。
②提倡自由反应,有利于考察应用能力乃至创造能力。
③可以获得较为丰富的作答反应过程资料,便于分析被试的技能、策略和知识缺陷等。
④内容和形式更为接近教学与实践中的问题情境,被试不陌生、好接受,教师命拟比较方便。
主观题不足:
①作答反应费事,有大量的书写任务,造成被试“忙于写而无暇想”,“手指累而头脑松”。
②单位时间中施测的问题量减少,限制了测验内容的覆盖面,不利测验效率的提高。
③允许被试以文字技巧和作答风格来搪塞胡弄主试,靠“模棱两面可的词句”与“面面俱到的分析”来赚得高分。
④评分易受阅卷者主观因素的影响。
20、心理测验分类方法
①测验编制程序是否系统、科学和完备可分为标准化心理测验和非标准化心理测验。
②根据测验实施时每次可测试一个人还是可同时测试一批人可分为个别心理测验和团体心理测验。
③根据测验有无严格与苛刻的时间限制可分为限时测验和非限时测验。
④根据测验材料(刺激)是语言文字形式还是非语言文字可分成文字式心理测验和非文字式心理测验。
⑤根据测验引起的被试反应的特点可分为最高成就测验和典型作为测验。
(6)根据测验内容的性质,
可分为智力测验、能力倾向测验、
创造力测验以及人格测验等。
2、三种情况下的平均数抽样分
布?
1、原总体正态、总体方差已
知情况下的平均数抽样分布所得
样本平均数的分布,也就是我们所
说的平均数的抽样分布服从正态
分布。这个呈正态的平均数抽样分
布的平均数等于原总体平均数,这
个分布的标准差等于原总体标准
差的分之一。N即样本容量。
2、原总体正态,总体方差未
知情况下的平均数抽样分布一个
总体服从正态分布,但是并不知总
体的方差大小,从这个总体中所抽
取的容量为n的样本,其样本平均
数服从一个自由度为n-1的t分
布,这个t分布的平均数就是原总
体平均数,这个t分布的标准差,
也就是平均数的抽样标准误等于
样本标准差分之一,也即
SE x=S/ .t分布与正态分布一样,
也是一个单峰对称呈钟形的分布,
其对称轴通过分布的平均数,t分
布曲线在正负两个方向上也以横
轴为它的渐近线。与正态分布相
比,t分布曲线中间低而尖峭,两
头高而平缓。T分布的最大特点是
它实质上是一族分布,每一个t分
布的形态受一个称为自由度的东
西的制约。
3、原总体非正态,但样本较
大情况下的平均数抽样分布不管
原总体方差已知还是未知,平均数
的抽样分布都是渐近服从正态分
布,其总体平均数还是原总体平均
数,其标准差,也就是平均数的抽
样标准误差,在总体方差已知时为
σ/ ,在总体方差未知时为S/ 。
3、统计假设检验步骤
①根据题目的设问提出检验假设。
②选定显著性水平α。
③根据检验目的和已知条件找到
相应的抽样分布。
④写出检验统计量计算公式并按
已知数据条件计算检验统计量值。
⑤根据显著性水平α在抽样分布
中确定临界值和危机域。
(6)将求得的检验统计量值与临
界值作比较,根据其是否进入危机
域而作出是否拒绝虚无假设的统
计结论。
5、χ2分布特点?
①χ2≥0,即χ2值从0到正无
穷大。
②当自由度df≥3时,χ2分
布是单峰正偏态分布,各曲线的尾
巴都向右边(正方向)无限延伸,
但终不与横轴相交。
③当自由度df>30时,χ2分
布曲线基本上是对称的分布,而且
随着自由度df的增大,越来越接
近正态分布形式。
④χ2分布具有可加性,比如,
自由度df=4的χ2分布加上自由度
df=6的χ2分布,其结果是自由度
df=10的χ2分布。
⑤当自由度df=1时的χ2分
布,它与标准正态分布Z值的平方
正好相等;即df=1时,χ2=Z2
6、χ2检验的主要作用?
是基于实际观测次数和理论
期待次数之间差异程度的χ2统计
量实得值的概率考察,检验如下两
类问题:
第一,检验某抽样观测数据的
分布是否与某一理论分布相一致,
即总体分布的拟合良度检验。
第二,检验双向分类列联表数
据下,两个分类特征(即两个因素
变量)之间是彼此相关还是相互独
立的问题,这类问题称为独立性检
验。
利用χ2检验进行分布的拟合
良度检验和双向分类数据下的两
变量的独立性检验,其一般步骤
是:
①根据所存在问题的实际特
点,提出虚无假设(H0)。这里的
虚无假设总是“没有显著性差异”
的假定,或“两个变量相互独立(即
相关为零)”的假定。
②χ2检验最重要的、最关键
的一步是如何从虚无假设出发,确
定各类事物的理论期待次数。
③根据χ2统计量公式计算实
得的χ2值。
④选取适当的显著性水平α
值,并确定自由度df,然后在χ2
值表中找到临界值χ2。
⑤做出接受虚无假设或拒绝
虚无假设的统计决策。
其原则是:
①当所确定的实得χ2值大于
临界值χα2时,我们可拒绝虚无假
设(H0),并接受研究假设(H a)。
②当所确定的实得χ2值小于
临界值χα2时,我们便没有充分理
由拒绝虚无假设(H0)故暂认为虚
无假设是成立的,把虚无假设先接
受下来
7、总体分布的拟合良度检验主
要原理是借助χ2统计量的值来考
察实际观测次数f0与某一假定分
布的理论次数fe之间的差异是否
显著,从而解决前面所提及的第一
类统计检验问题,即解决“从实际
抽样调查所得的观测数据,来推断
其所来自的总体的次数分布是否
服从理论上所假定的某一概率分
布”的问题
8、方差分析的条件①总离均差
平方和的可分解性②总体正态性
③样本随机性④总体方差齐性
标准差、标准分、均差、离差
系数、P——Z转换
2、难度、区分度、相关系数
3、百分等级——百分位数、T分