0272《心理统计学》2016年6-7月期末考试指导
心理统计学提纲

心理统计学复习提纲一、解释概念抽样与样本随机化原则统计量与参数相关与相关系数集中量数差异量数随机事件的概率描述统计推断统计置信区间假设与假设检验第Ⅰ型错误第Ⅱ型错误等级相关点二列相关二列相关总体与个体参数的点估计统计分组统计图统计表二、简答题1.描述一个班的考试成绩,其主要统计指标是什么?试说明其理由。
2、心理统计学的主要内容是什么?3、心理统计学研究问题的基本步骤是什么?4、什么是集中量数,试述其种类与用途。
5、什么是差异量数,试述其种类与用途。
6、积差相关、等级相关、点二列相关、二列相关系数各自使用条件的条件是什么?试写出它们的计算公式。
7、统计假设检验的基本原理是什么?8、统计假设检验中可能存在的错误有哪些?如何使犯错误的风险减小?9、概率运算的基本法则是什么?写出它们的使用条件和公式。
10、什么是抽样误差,什么是均数的标准误,简述均数标准误与总体标准差之间的关系。
11、一个规范的统计表主要由哪几个部分组成?试对各部分的意义作说明。
12、一个规范的统计图主要由哪几个部分组成?试对各部分的意义作说明。
13、试述算术平均数的作用与优缺点。
14、试述方差与标准差的作用与优缺点。
15、卡方检验的主要用途是什么?16、方差分析的基本原理及其前提条件是什么?17、优良的点估计的标准是什么?18、回归分析的主要内容是什么?三、计算题1、某市为研究会考与高考成绩之间的关系,从全市随机抽取被试10人,得到英语的成绩如下: (1)求各次考试成绩的平均数; (2)求各次考试成绩的标准差: (3)求两次考试成绩之间的相关系数; (4)试对两次考试成绩之间的差异作显著性检验。
,33.19,86.17,66,67====Y X Y X σσN Y Y Y Y L N X X X X L YY XX2222222)()(,31901067048080)()(∑-∑=-∑==-=∑-∑=-∑==373810660472982=-28311066067047951))((=⨯-=∑∑-∑=--∑=NYX XY Y Y X X L XY 8198.0373831902831=⨯==YY XX XY XY L L L r 本题为相关小样本资料,用t 检验。
《心理统计学》年月期末测验指导

差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
1、全距、百分位差和四分差
全距又称两极差,用符号R表示,用最大值减去最小值就是全距。例如,4,4,5,3,5,5,2。这列数据的全距为3
百分位差是用百分位数之间的差值来表示离中趋势的一种差异量数。
四分差,又称为四分位差,通常用符号Q来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。
(4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。
(二)统计图表
1、次数分布表:各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。
2、编制次数分布表的步骤
(1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。用符号R表示
(3)方差、标准差的意义:是表示一组数据离散程度的最好指标。其值越大,表示数据的离散程度越大,该组数据越分散;其值越小,表示次数分布的数据比较集中,数据的离散程度越小。
3、分组资料标准差的计算方法
对于次数分布表中的数据标准差计算公式为:
4、差异系数:又称变异系数、相对标准差等,是一种相对差异量,用CV表示,为标准差对平均数的百分比,计算公式:CV=S/M×100%。
例如,已知在甲分布中P90-P10=38,在乙分布中P90-P10=24,两个分布的分散程度,则甲>乙。
2、标准差、方差
(1)方差:也称变异数,均方。作为样本统计量,用符号s2表示,作为总体参数,用σ2表示。它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。
心理与教育统计学课后题答案心理统计学试题及答案

心理与教育统计学课后题答案心理统计学试题及答案张厚粲现代心理与教育统计学第一章答案张厚粲现代心理与教育统计学第一章答案第一章1 名词概念(1)随机变量)答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。
(2)总体)答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。
(3)样本)答:样本是从总体中抽取的一部分个体。
(4)个体)答:构成总体的每个基本单元。
(5)次数)是指某一事件在某一类别中出现的数目,又称作频数,用 f 表示。
(6)频率)答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。
(7)概率)答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。
其描述性定义。
随机事件 A 在所有试验中发生的可能性大小的量值,称为事件 A 的概率,记为P(A)。
(8)统计量)答:样本的特征值叫做统计量,又称作特征值。
(9)参数)答:又称总体参数,是描述一个总体情况的统计指标。
(10)观测值)答:随机变量的取值,一个随机变量可以有多个观测值。
2 何谓心理与教育统计学?学习它有何意义?何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。
具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。
(2)学习心理与教育统计学有重要的意义。
①统计学为科学研究提供了一种科学方法。
科学是一种知识体系。
它的研究对象存在于现实世界各个领域的客观事实之中。
它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。
心理学统计期末复习整理

期末复习题(12.18)一、简答题1、线性相关与回归的区别和联系主要区别有三点:1.线性相关分析涉及到变量之间的呈线性关系的密切程度,线性回归分析是在变量存在线性相关关系的基础上建立变量之间的线性模型;2.线性回归分析可以通过回归方程进行控制和预测,而线性相关分析则无法完成;3.线性相关分析中的变量地位平等,都是随机变量,线性回归分析中的变量有自变量和因变量之分,而自变量一般属确定性变量,因变量是随机变量.4.相关系数的计算只适用于两个变量都服从正态分布的情形,而在回归分析中,因变量是随机变量,自变量既可以是随机变量(Ⅱ型回归模型,两个变量都可以服从正态分布),也可以是给定的量(Ⅰ型回归模型,这时,与每个X取值相对应的变量Y必须服从正态分布)。
5.线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的依存关系,是单向的。
主要联系:1.如果对同一资料进行相关与回归分析,则可得到的相关系数r与回归方程中的b正负号是相同的。
2.在相关分析中,求出r后也要进行假设检验,同样,在回归分析中,对b也要进行假设检验。
实际上,通过数学推导,对同一样本可以得出r与b互化的公式,同一样本的这两种假设检验也是等价的。
因此由于r的假设检验可以直接查表,较为简单,所以可以用其代替对b的假设检验。
3.相关和回归可以相互解释。
p365的最后一段和p366的第一段2、试述分层取样的原则和方法定义:又称比率、分类或分组取样,是按照总体已有的某些特征(如性别、年龄和民族等),将总体分成几个不同的部分(每个部分叫一个层或一个子总体),然后在每一个层或子总体中进行简单随机取样。
原理:是随机取样和系统取样在使用时一种可能的修正状态。
它可以提高样本的代表性,同时减少可能的抽样误差。
分层的标准:①以研究所要分析的主要变量或相关的变量作为分层的标准(也称分层变量);②以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量;③以那些已有明显层次区分的变量作为分层变量。
华中师范大学《心理统计学》期末考试必备通关指导2

共 3 道大题,满分 100 分一、单选题(共 15 道小题,共 30 分)1. 假设检验中两类错误的关系是( )。
(2 分)A. α+β=1B. α=βC. α+β=1/2D. α+β不一定等于1【答案】D【解析】α+β不一定等于1,因为两者是在两个前提下的概率。
α是拒绝H0时犯错误的概率,β时接受H0时犯错误的概率。
2. 下列统计量中对数据变化灵敏性最差的是( )。
(2 分)A. 方差B. 平均差C. 算术平均数D. 众数【答案】D【解析】众数指出现次数最多的数,对数据变化灵敏性差。
3. 在假设检验中,α取值越大,称此假设检验的显著性水平( )。
(2 分)A. 越明显B. 越不明显C. 越高D. 越低【答案】D【解析】在假设检验中,α取值越大,称此假设检验的显著性水平越低4. 某次英语考试的标准差为5.1分,考虑到这次考试的题目太难,评分时给每位应试者都加了10分,加分后成绩的标准差是( )。
(2 分)A. 4.9B. 15.1C. 5.1D. 10【答案】C【解析】标准差计算公式的运用5. 当一个实验( )时,我们才能得到交互作用。
(2 分)A. 自变量多于1个B. 因变量多于1个C. 自变量多余2个水平D. 因变量多于2个水平【答案】A【解析】当一个实验自变量多于1个时,我们才能得到交互作用。
6. 在统计假设检验中,同时减少α和β错误的最好办法是( )。
(2 分)A. 控制α水平,使其尽量小B. 控制β值,使其尽量小C. 适当加大样本容量D. 完全随机取样【答案】C【解析】在统计假设检验中,同时减少α和β错误的最好办法是适当加大样本容量7. 已知某次高考的数学成绩服从正态分布,从这个总体中随机抽取n=36的样本,并计算得其平均分为79,标准差为9,那么下列成绩不在这次考试中全体考生成绩均值μ的0.95的置信区间之内的有( )。
(2 分)A. 81B. 79C. 83D. 77【答案】C【解析】总体平均数估计公式运用8. 已知一组数据服从正态分布,平均数为80,标准差为10。
心理统计期末考试试题

心理统计期末考试试题一、选择题(每题2分,共20分)1. 心理统计学中,描述数据集中趋势的常用指标是:A. 标准差B. 方差C. 均值D. 众数2. 以下哪项不是描述数据离散程度的指标?A. 极差B. 四分位数间距C. 均值D. 标准差3. 相关系数的取值范围是:A. -1到0B. 0到1C. -1到1D. 1到无穷大4. 假设检验中,如果P值小于显著性水平α,则:A. 拒绝零假设B. 接受零假设C. 无法做出决策D. 需要更多数据5. 以下哪个不是常见的抽样分布?A. t分布B. F分布C. 正态分布D. 二项分布6. 心理测量学中,信度和效度的关系是:A. 信度高则效度一定高B. 效度高则信度一定高C. 信度和效度是相互独立的D. 信度是效度的必要条件7. 以下哪个不是心理统计学中常用的数据类型?A. 定性数据B. 定量数据C. 顺序数据D. 等级数据8. 进行回归分析时,如果自变量和因变量之间没有线性关系,则:A. 可以进行多元回归分析B. 可以进行非参数回归分析C. 无法进行回归分析D. 需要重新选择自变量9. 以下哪个不是心理统计学中常用的数据收集方法?A. 实验法B. 观察法C. 调查法D. 随机抽样法10. 心理测量中,项目分析通常不包括以下哪项?A. 难度分析B. 区分度分析C. 信度分析D. 效度分析二、简答题(每题10分,共30分)1. 描述方差和标准差的区别,并解释它们在心理统计学中的应用。
2. 解释什么是效应量,并讨论它在心理研究中的重要性。
3. 简述多元回归分析的基本步骤,并说明在心理研究中如何应用。
三、计算题(每题25分,共50分)1. 给定一组数据:3, 5, 7, 9, 11, 13。
请计算这组数据的均值、方差、标准差,并解释这些统计量的意义。
2. 假设你正在进行一项关于工作压力和工作满意度的研究。
你收集了以下数据:工作压力(自变量X)和工作满意度(因变量Y)的测量值。
《心理统计学》总复习要点[]
![《心理统计学》总复习要点[]](https://img.taocdn.com/s3/m/9b7d2a3652d380eb62946d3e.png)
《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。
连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。
不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。
是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。
2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。
二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。
(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。
这种测量水平的数据特征是有相等单位和绝对零点。
用这种量尺测量得到的数据变量为比率(或等比)变量。
(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。
等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。
但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。
用这种量尺测量得到的数据变量为等距变量。
(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。
用这种量尺对研究对象进行测量,只能给对象排个顺序。
顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。
如有必要的话,只能进行不等式运算。
用这种量尺测量得到的数据变量为顺序变量。
(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。
即无大小之分,也无等级之分。
心理统计学

心理统计学一一名词解释[1]1随机现象:在肯定条件下,可能消失也可能不消失,或者可能这样消失也可能那样消失的一类现象。
2统计学:讨论随机现象的数量规律性的应用数学分支。
3大数定理:虽然每次观看结果可能都不同(偶然性),但是大量重复观看的结果可以形成稳定的数量特征(必定性)。
4统计学科学:以统计学方法为主要定量分析手段的科学。
心理学就是一门统计性科学。
5数理统计学:以概率论为基础,阐明统计学的数学原理,推导和证明有关的数学公式的数学分支。
6应用统计学:数理统计学理论在各个学科领域中的应用产生的统计学分支。
7心理统计学:心理学领域的应用统计学分支。
8描述统计学:阐述搜集、提炼和描述资料的方法,是推断统计学的基础。
9推断统计学:运用概率论讨论如何依据样变的信息推断出样原来自的总体的相应信息,包括参数估量和假设检验两种形式。
10随机变量:表示随机现象的各种可能结果的变量。
11个体:所讨论的随机现象的载体,具有某种共同特性,是组成总体的基本单位。
12总体:具有某(些)共同特性的个体的总和。
13样本:从总体中抽取的作为观测对象的一部分个体。
14样本容量:样本包含的个体数no n>=30 的样本称为大样本,n<30的样本称为小样本。
15参数:依据总体中全部个体的观看值计算出来的数量指标,即总体上的数字特征。
16统计量:依据样本中全部个体的观看值计算出来的数量指标,即样本上的数字特征。
[2]1间断变量:其可能取值在数轴上不连续的变量。
2连续变量:其可能取值在数轴上连续地布满某一区间的变量。
3称名量表:各个数字表示的是观看值的不同质别,起到的是名称的作用,数据之间不行以进行任何数学运算。
4挨次量表:各个数字表示的是个体某方面特征所对应的名次或等级;数据之间可以进行比较运算。
5等距量表:表示测量上具有相等单位的观看值,而且有一个相对零点;数据之间可以进行加减运算。
6比率量表:表示测量上具有相等单位的观看值,而且有一个肯定零点;等距量表的数据之间可以进行乘除法运算。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0272《心理统计学》2016年6-7月期末考试指导一、考试说明本课程闭卷考试,满分100分,考试时间90分钟。
可能的考试题型包括:1、单项选择题2、判断题3、简答题4、计算题5、综合应用题二、重点复习内容(一)绪论1、心理学统计学的内容:描述统计、推论统计、实验设计。
其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关2、数据的种类按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。
(1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。
这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。
(2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。
等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。
(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。
可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。
例如,测量温度的℃。
(4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。
这类变量可以进行加减乘除的运算。
(二)统计图表1、次数分布表:各种次数分布的列表形式和图示形式。
次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。
2、编制次数分布表的步骤(1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。
用符号R表示(2)定组数(3)求组距:指每一组的间距,用符号i表示。
(4)定组限:指各组数据在数值上的起点值和终点值。
(5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。
(6)归类划记:将原始观测值按照一定的顺序逐一归组。
(7)记录各组次数(f)。
(8)核对,抄录新表。
3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。
4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。
5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。
由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。
(三)集中量数集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。
1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。
平均数是一种受极端数据值影响的统计量。
2、加权平均数加权算术平均数是指一组数据中每个数据与其权重乘积的总和除以权重总和所得的商。
在心理与教育研究中,经常会遇到由各个平均数计算总平均数这类实际的统计计算问题。
在这个问题中,可以把各小组的平均分数,视为该小组每个个体的分数,而把每个小组的人数,视为权数。
3、次数分布表中算术平均数的计算对于已经列成次数分布表的数据,其算术平均数的计算公式为:NfX X C∑= 式中,C X 为各组的组中值,f 为各组的次数,N 为总次数,即∑=f N 。
4、中数与众数中数:又称中点数,中位数,中值。
符号为Md 或Mdn 。
中数是按一定顺序排列在一起的一组数据中居于中间位置的数。
当数据的个数为偶数时,则取据中间两个数据的平均数为中位数。
对于数据较多的资料,其算术平均数与中位数的值不会相差太大。
众数:又称为密集数、范数等,常用符号M 0表示,众数是指在次数分布中出现次数最多的那个数的数值。
5、平均数、中数与众数三者之间的关系在正态分布中三者相等,在正偏态分布中,平均数大于中数,中数大于众数。
在负偏态分布中,平均数小于中数,中数小于众数。
M<Md<Mo 。
对于数据较多的资料,其算术平均数与中位数的值不会相差太大。
(四)差异量数差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
1、全距、百分位差和四分差全距又称两极差,用符号R 表示,用最大值减去最小值就是全距。
例如,4,4,5,3,5,5,2。
这列数据的全距为3百分位差是用百分位数之间的差值来表示离中趋势的一种差异量数。
四分差,又称为四分位差,通常用符号Q 来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。
例如,已知在甲分布中P90-P10=38,在乙分布中P90-P10=24,两个分布的分散程度,则甲>乙。
2、标准差、方差(1)方差:也称变异数,均方。
作为样本统计量,用符号s 2表示,作为总体参数,用σ2表示。
它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。
标准差的计算公式为NX X S ∑-=)(标准差是一组同质数据间变异度大小的量度指标,但是如果两组数据平均数相差较大时,不能采用标准差进行比较。
标准差、方差是描述数据的离散趋势最好的统计值。
(2)方差性质:可加性、可分解性标准差特性:每一个观察值都加一个相同常数C 之后,计算得到的标准差等于原标准差。
每一个观察值都乘一个相同常数C ,则所得到的标准差等于原标准差乘以常数C 。
以上两点结合,每一个观察值都乘以一个常数C (C 不等于0),再加上一个常数d ,所得标准差等于原标准差乘以常数C 。
(3)方差、标准差的意义:是表示一组数据离散程度的最好指标。
其值越大,表示数据的离散程度越大,该组数据越分散;其值越小,表示次数分布的数据比较集中,数据的离散程度越小。
3、分组资料标准差的计算方法对于次数分布表中的数据标准差计算公式为:22)(NfX N fX S C C ∑-∑=4、差异系数:又称变异系数、相对标准差等,是一种相对差异量,用CV 表示,为标准差对平均数的百分比,计算公式:CV=S/M ×100%。
差异系数的心理与教育研究中常用于:(1)同一团体不同观测值离散程度的比较,如身高和体重离散程度的比较;(2)对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。
5、标准分数:(1)又称基分数或Z 分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
标准分数的计算公式:___X X xz s s-== (2)标准分数在实际中的应用:①用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低; ②计算不同值的观测值的总和或平均值,以表示在团体中的相对位置; ③表示标准测验分数。
(五)相关系数 1、相关系数用于描述双变量数据相互之间的关系,是两列变量间相关程度的数字表示形式,或者说是用来表示相关强度的指标。
样本相关系数用r 表示,总体一般用ρ表示。
相关系数的取值介于-1.00至+1.00之间,常用小数形式表示。
相关系数的正负号,表示相关方向,取值的大小表示相关的程度。
如果两个相关系数取值相同,正负号不同,则相关程度相同。
当XY 相关程度很小时,从X 推测Y 的可靠性就很小。
2、散点图(1)散点图是用相同大小圆点的多少或疏密表示统计资料数量大小及变化趋势的图。
通常以圆点分布的形态表示两种现象间相关程度。
(2)在实际中的用途: 在相关研究中,通常用散点图表示两个变量之间的关系。
通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系做出直观而有效的预测和解释。
因此,散点图是确定变量之间是否存在相关关系及关系紧密程度的简单又直观的方法。
3、积差相关 适用的条件:(1)两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量。
(2)两列变量之间的关系应是直线性的,非直线性的双列变量,不能计算线性相关。
(3)两变量测量到的数据必须是成对的数据,对于不成对的数据无法计算相关,即使计算,得到的相关也没有意义。
计算公式:yx S NS xyr ∑=式中 X X x -=,Y Y y -=,N 为成对数据的数目,x S 为X 变量的标准差,S y 为Y 变量的标准差。
利用原始数据计算,公式可以转化为:∑∑∑∑∑∑∑-⋅--=NY YNX XN YX XY r 2222)()(其计算步骤为:(1)计算X 变量的∑X 、∑2X 和2)(∑X ;(2)计算Y 变量的∑Y 、∑2Y 和2)(∑Y ;(3)计算XY ,∑XY;(4)将有关数据代入公式,求得r 。
例如,计算12名学生两项心理测验的得分的相关系数,可以利用积差相关。
4、等级相关(1)斯皮尔曼等级相关:适用于两变量的资料为等级测量数据,且具有线性关系;连续变量的测量数据,按其大小排成等级,也可以用等级相关法计算;不要求总体呈正态分布。
例如,想了解某一测验结果(测验结果服从正态分布)与文化程度是否有关联,可以采用等级相关。
5、相关系数的选择:主要取决于要处理数据的性质类别以及某一相关系数需要满足的假设条件。
6、点二列相关两列变量一列是正态连续性变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。
7、肯德尔和谐系数一般常用来表示评分者信度。
(六)概率分布 1、概率的基本性质概率的公理系统:任何一个随机事件A 的概率都是非负的;在一定条件下,必然发生的必然事件的概率为1;在一定条件下必然不发生的事件,既不可能事件的概率为0。
任何一个随机事件的概率介于0和1之间。
在统计推断中小概率事件一般被称为不可能发生的事件。
事件的概率仅由事件本身决定,与我们用什么方法去求它无关。
2、正态分布(1)正态分布又叫常态分布,是连续随机变量概率分布的一种。
自然界,人类社会,心理与教育中大量现象均按正态的形式分布。
正态分布曲线函数又称密度函数,一般方程为:22221σμπσ)(--=x e y其中,π是圆周率3.14159...e 是自然对数的底2.71828...;X 为随机变量取值∞+∞-〈〈X ;μ为理论平均数,2σ为理论方差;y 为概率密度,即正态分布的纵坐标。
(2)正态分布的特点①正态分布的形式是对称的,它的对称轴是经过平均数点的垂线;②正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负一个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交;③正态曲线下的面积为1,过平均数点的垂线将其面积划分为相等的两部分;④正态分布是一族分布,它随随机变量的平均数,标准差的大小与单位不同而有不同的形态;⑤正态分布中各差异量数值相互间有固定的比例;⑥正态分布曲线下,标准差与概率(面积)有一定的数量关系。
决定正态分布曲线的最高点在横轴上确切位置的是平均数(即μ)。
(3)在实际中的应用①化等级评定为测量数据; ②确定测验题目的难易度③在能力分组或等级评定时确定人数 ④测验分布的正态化例如,某班级一次考试成绩服从正态分布,全班平均成绩为70分,标准差为10分,一个学生成绩为80分,他在全班的名次为前20%又如,某班成绩服从正态分布,平均数为80,标准差为4分,那么得76分至80分之间的学生比率为0.343、样本分布:是样本统计量的分布,是统计推论的重要依据。