心理统计学重要知识点

合集下载

心理统计学提纲

心理统计学提纲

心理统计学复习提纲一、解释概念抽样与样本随机化原则统计量与参数相关与相关系数集中量数差异量数随机事件的概率描述统计推断统计置信区间假设与假设检验第Ⅰ型错误第Ⅱ型错误等级相关点二列相关二列相关总体与个体参数的点估计统计分组统计图统计表二、简答题1.描述一个班的考试成绩,其主要统计指标是什么?试说明其理由。

2、心理统计学的主要内容是什么?3、心理统计学研究问题的基本步骤是什么?4、什么是集中量数,试述其种类与用途。

5、什么是差异量数,试述其种类与用途。

6、积差相关、等级相关、点二列相关、二列相关系数各自使用条件的条件是什么?试写出它们的计算公式。

7、统计假设检验的基本原理是什么?8、统计假设检验中可能存在的错误有哪些?如何使犯错误的风险减小?9、概率运算的基本法则是什么?写出它们的使用条件和公式。

10、什么是抽样误差,什么是均数的标准误,简述均数标准误与总体标准差之间的关系。

11、一个规范的统计表主要由哪几个部分组成?试对各部分的意义作说明。

12、一个规范的统计图主要由哪几个部分组成?试对各部分的意义作说明。

13、试述算术平均数的作用与优缺点。

14、试述方差与标准差的作用与优缺点。

15、卡方检验的主要用途是什么?16、方差分析的基本原理及其前提条件是什么?17、优良的点估计的标准是什么?18、回归分析的主要内容是什么?三、计算题1、某市为研究会考与高考成绩之间的关系,从全市随机抽取被试10人,得到英语的成绩如下: (1)求各次考试成绩的平均数; (2)求各次考试成绩的标准差: (3)求两次考试成绩之间的相关系数; (4)试对两次考试成绩之间的差异作显著性检验。

,33.19,86.17,66,67====Y X Y X σσN Y Y Y Y L N X X X X L YY XX2222222)()(,31901067048080)()(∑-∑=-∑==-=∑-∑=-∑==373810660472982=-28311066067047951))((=⨯-=∑∑-∑=--∑=NYX XY Y Y X X L XY 8198.0373831902831=⨯==YY XX XY XY L L L r 本题为相关小样本资料,用t 检验。

心理统计相关知识总结(9)

心理统计相关知识总结(9)

推论统计推论统计(inferential statistics):从总体中随机抽取样本,根据样本数据分析结果推论总体数量性质和特征的统计分析方法。

其理论基础主要是概率论。

主要内容包括:总体参数估计、假设检验、方差分析、回归分析和非参数检验方法等。

参数统计(parametric statistics):如果总体分布形态已知,根据样本信息对总体参数进行估计或假设检验的统计分析方法。

非参数统计(nonparametric statistics):如果总体分布形态未知或知之甚少,根据样本信息对总体性质和特征进行统计推断的统计分析方法。

主要特点有:(1)在利用样本资料对总体进行推断时,不必依赖于总体分布规律,故亦称“自由分布统计”;(2)通常不需对总体参数(如均值、标准差)进行估计或检验;(3)适用于不同测量水平的数据,可用于计数数据或测量数据。

统计规律性(statistical regularity):由大量同类随机现象所呈现出来的整体规律性。

概率论和数理统计就是研究此类规律性的数学分支学科。

在自然界,在生产、生活中,随机现象十分普遍。

同类随机现象大量重复出现时,其总体会呈现一定的统计规律性,这种规律性会随观测次数增多而愈加明显。

如掷硬币,每一次投掷很难判断是哪一面朝上,但是如果多次重复掷这枚硬币,就会越来越清楚地发现两面朝上的次数大体相同。

自由度(degree of freedom):在以样本的统计量估计总体参数时,样本中独立或能自由取值的变量个数。

用df表示。

通常df=n-h,其中n为样本含量,k为被限制的条件数或变量个数。

通常用于抽样分布。

如估计总体平均数时,由于样本中n个数据相互独立,从中抽取任何一个都不影响其他数据,所以其自由度为n;在估计总体方差时,使用样本离差平方和,样本均值就相当于一个限制条件,估计总体方差的自由度为n-1。

稳健统计1(robust statistics):研究当总体假设稍有变化、所采集数据存有一定程度错误或偏差时,统计方法的适应性问题的理论和方法。

心理统计相关知识总结(6)

心理统计相关知识总结(6)

全距(range):亦称“极差”。

差异量数的一种。

用R表示。

一组数据中极大值与极小值之间的差距。

即极大值减极小值所得数据结果。

主要适用于等距数据、比率数据等有单位的数据,不适用于名称数据和顺序数据。

四分位差(quartile deviation):亦称“内距”、“四分间距”。

差异量数的一种。

一组数据中上四分位数与下四分位数之差。

用Q表示。

四分位数指将若干按递增顺序排列的数据等分为四部分时,位于划分临界点上的数据。

四分位差主要用于测度顺序、等距和比率数据的离散程度,但一般不适合于类别数据。

离差(deviation):亦称“差量”。

差异量数的一种。

一组数据中具体数值与平均数之间的差。

实际使用中一般通过离差平方和来表示数据分布的集中程度。

离差平方和(sum of squares of deviation):差异量数的一种。

一组数据中每个数据离差平方的总和。

一般用来表示数据分布的集中程度。

方差(variance):差异量数的一种。

随机变量§与其数学期望Es的偏差平方的加权平均E(§-Es)²。

用Ds或vars表示。

在概率论和数理统计中,表示随机变量和其数学期望(即均值)之间的偏离程度,即数据和中心偏离的程度。

用来衡量一批数据的波动大小(即这批数据偏离平均数的大小)。

在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定。

样本方差(sample variance):与“总体方差”相对。

样本数据的方差。

用S²表示。

当总体方差未知,需要对其进行估计时,通常使用样本方差的修正公式估计总体方差,以保证估计的无偏性。

总体方差(population variance):与“样本方差”相对。

总体数据的方差。

用a²表示。

当总体方差未知时,一般通过样本方差进行估计。

参见“样本方差”。

标准差(standard deviation):亦称“均方差”。

差异量数的一种。

方差的平方根。

心理统计学复习提纲

心理统计学复习提纲

心理统计学复习提纲一、描述性统计1、统计表1)制表的原则:重点突出、简单明了、主次分明、层次清楚2)制表的基本要求:标题:概括说明表的内容,必要时包括时间地点或表号标目:含横标目和纵标目,反映主要研究事物的标目安排在表的左侧横标目:位于表的左侧,指被研究的事物的特征纵标目:位于标目线的上端,通常是统计指标,要注明单位线条:不宜过多,不应有竖线及斜线, 三/四横线数字:用阿拉伯数字表示,同一指标的小数位数一致,表内不应有空格备注:不列入表内,可用“﹡”标出在表下部说明3)统计表的分类简单表:按研究事物一个特征或标志分组复合表:按两个或两个以上特征或标志分组4)统计表的结构(学会判断表的正误)2、统计图1)统计图的基本结构图形:按资料的性质和分析目的选用合适的图形标题:在图下方,说明图的内容,必要时包括时间、地点和图的编号标目:纵横轴应在标目注明单位,纵横轴之比以5:7为宜图例:在图内右上角或图下方标题之上2)统计图的几个种类(掌握其特点以及何时用)线形图:在直角坐标系中用线段的升降表示某事物在时间上的变化趋势,用于比较连续性资料,或某现象随另一现象变迁的情况。

分单式和复式线图。

饼图:用于构成比的资料,比较各构成部分的比重。

散点图:用于双变量资料,用点的密集程度和趋势表示两种现象之间的相互关系。

对于横轴上的每个值纵轴可以有多个点与其相对应。

点与点之间不能用直线连接。

箱形图:注意五个指标:最小值、P25、中位数、P75、最大值茎叶图:茎叶图是由数字做成的图案,左边是频数,右边才是由数字组成的茎叶。

要留意茎的宽度!–条形图(直条图):用等宽直条的长短表示指标值大小,比较相互独立资料(间断性资料)的相同指标。

有单式直条图、复式直条图、分段直条图三种。

横轴为互相独立的指标,纵轴为欲比较的指标直方图:频数直方图相当于连续变量的条形图,是用于表示在某个范围内连续取值的变量在各组中的频数分布。

是在频数分布表的基础上画出来的,横轴表示变量的数值大小,纵轴表示变量在每组中的取值次数。

心理统计学常用公式总结

心理统计学常用公式总结

心理统计学常用公式总结心理统计学是心理学中的一个重要分支,它通过应用统计方法和概率理论来研究心理现象,分析和解释心理数据。

在心理统计学中,有许多常用的公式和方程式,用于计算和分析心理测量数据。

下面是一些常用的心理统计学公式总结。

1. 平均数(Mean)平均数是一组数值的总和除以数量的结果。

它是一组数据的集中趋势的一种度量。

平均数计算公式如下:平均数=总和/数量2. 中位数(Median)中位数是一组有序数据的中间值,将数据分为两个等长的部分。

对于一个有奇数个数据的数据集,中位数就是中间的值;对于有偶数个数据的数据集,中位数是中间两个值的平均数。

3. 众数(Mode)众数是一组数据中出现频率最高的值。

一个数据集可以有一个以上的众数,也可以没有众数。

4. 方差(Variance)方差是一组数据离其平均数的距离的平方的平均值。

方差用于衡量数据的离散程度。

方差计算公式如下:方差=Σ(数据-平均数)²/数量5. 标准差(Standard Deviation)标准差是方差的平方根,它是一组数据离其平均数的距离的平均值。

标准差也用于衡量数据的离散程度。

标准差计算公式如下:标准差=√方差6. 相关系数(Correlation Coefficient)相关系数衡量两个变量之间的关系强度和方向。

它是一个介于-1和1之间的值,越接近-1或1表示关系越强,越接近0表示关系越弱。

相关系数计算公式如下:相关系数=协方差/(标准差1*标准差2)7. 正态分布(Normal Distribution)正态分布是在统计学中经常出现的一种分布模式。

它呈钟形曲线,对称分布在平均数周围。

正态分布可以由均值和标准差来完全描述。

8. 标准分数(Standard Scores)标准分数是将原始分数转化为以标准差为单位的分数。

它表示一个分数距离平均数的几个标准差。

标准分数=(原始分数-平均数)/标准差9. 置信区间(Confidence Interval)置信区间是对总体参数的估计范围,常用来估计平均值或比例的范围。

心理统计相关知识总结(10)

心理统计相关知识总结(10)

是所抽取的样品单位对全部研究对象具有充分的代表性。

抽样目的是通过对抽取样品的分析和研究结果估计和推断全部对象的特征和规律,是科学实验、质量检验、社会调查普遍采用的一种经济有效的工作和研究方法。

主要分为随机抽样和非随机抽样。

非随机抽样(nonrandom sampling):与“随机抽样”相对。

不必遵循随机化原则(即总体中每个个体被抽取概率相同),主要按照研究性质和特征、研究者的实践经验或其他条件抽取样本的方法。

主要适用的情况有:(1)严格按照随机化原则进行抽样,几乎无法进行;(2)研究目标只是对问题进行初步探索或只是对问题提出一些初始假设;(3)研究对象性质、范围和大小难以确定或根本无法确定;(4)研究总体各单元间差异程度不明显。

其研究人员必须具有丰富调查实践和抽样经验等。

方便抽样(convenient sampling):非随机抽样的一种。

研究者从最方便可得的被试中抽取样本的方法。

如大学里研究者常常以大学生为被试,工厂的研究者常以工人为被试。

特点是方便、省时。

方便抽样的样本要随机地分派到各处理组中,各处理组在被试差异上大体相当,以使研究保持一定的外部效度。

计划抽样(planed sampling):非随机抽样的一种。

取样时,根据特定的研究目的或主观判断,从总体中选择在某方面具有代表性的个体。

随机抽样(random sampling):与“非随机抽样”相对。

按照随机化原则抽样的方法。

基本原则是随机性,即研究对象中每个单元被抽取的可能性相同,抽取时不带任何主观性。

分为简单随机抽样、分层抽样、系统抽样、整群抽样等。

简单随机抽样(simple random sampling):亦称“单纯随机抽样”“纯随机抽样”。

随机从总体N个单位中抽取n个单位作为样本的抽样方法。

其中随机指总体中每个单位被抽中概率都相等。

理论上认为,这种方法抽取的样本具有最好的代表性。

系统抽样(systematic sampling):亦称“机械抽样”“等距抽样”“SYS抽样”“间隔抽样”。

心理统计学公式汇总

心理统计学公式汇总在心理统计学中,各种公式如同工具,帮助我们理解和分析数据。

接下来,咱们就一起看看一些常见且重要的心理统计学公式。

一、集中趋势的测量1、算术平均数算术平均数是最常用的集中趋势测量指标。

其公式为:\(\bar{X} =\frac{\sum_{i=1}^{n} X_{i}}{n} \)其中,\(\bar{X} \)表示平均数,\( X_{i} \)表示第\( i \)个观测值,\( n \)是观测值的数量。

2、中位数对于一组有序数据,中位数是中间的那个数。

如果数据个数为奇数,中位数就是中间的那个数;如果数据个数为偶数,中位数是中间两个数的平均值。

奇数个数时:中位数=第\(\frac{n + 1}{2} \)个数偶数个数时:中位数=第\(\frac{n}{2} \)个数和第\(\frac{n}{2} + 1 \)个数的平均值3、众数众数是一组数据中出现次数最多的数值。

二、离散程度的测量1、全距全距(也称为极差)是数据中的最大值与最小值之差。

公式为:全距=最大值最小值2、方差方差反映了数据的离散程度。

样本方差的公式为:\( S^{2} =\frac{\sum_{i=1}^{n} (X_{i} \bar{X})^{2}}{n 1} \)3、标准差标准差是方差的平方根。

样本标准差的公式为:\( S =\sqrt{\frac{\sum_{i=1}^{n} (X_{i} \bar{X})^{2}}{n 1}}\)三、相关关系的测量1、皮尔逊相关系数用于测量两个连续变量之间的线性相关程度。

公式为:\( r =\frac{\sum_{i=1}^{n} (X_{i} \bar{X})(Y_{i} \bar{Y})}{\sqrt{\sum_{i=1}^{n} (X_{i} \bar{X})^{2} \sum_{i=1}^{n} (Y_{i} \bar{Y})^{2}}}\)2、斯皮尔曼等级相关系数适用于测量两个变量的等级数据之间的相关性。

心理统计学公式汇总

心理统计学公式汇总在心理统计学的领域中,各种公式犹如工具,帮助我们理解、分析和解释数据。

下面就为大家汇总一些常见且重要的心理统计学公式。

一、集中趋势的测量1、算术平均数算术平均数是最常用的集中趋势测量指标,其公式为:\\bar{X} =\frac{\sum_{i=1}^{n} X_{i}}{n}\其中,\(\bar{X}\)表示算术平均数,\(X_{i}\)表示第\(i\)个观测值,\(n\)表示观测值的数量。

2、中位数当数据呈现偏态分布时,中位数比平均数更能代表数据的集中趋势。

对于未排序的数据,首先将其从小到大排序。

如果数据个数\(n\)为奇数,中位数就是位于中间位置的那个数;如果\(n\)为偶数,中位数则是中间两个数的平均值。

3、众数众数是数据中出现次数最多的数值。

二、离散程度的测量1、极差极差是一组数据中最大值与最小值之差,公式为:\(R =X_{max} X_{min}\)。

2、方差方差反映了数据相对于平均数的离散程度,其公式为:\S^2 =\frac{\sum_{i=1}^{n} (X_{i} \bar{X})^2}{n 1}\3、标准差标准差是方差的平方根,公式为:\(S =\sqrt{\frac{\sum_{i=1}^{n} (X_{i} \bar{X})^2}{n 1}}\)。

三、正态分布相关公式1、正态分布的概率密度函数\f(x) =\frac{1}{\sigma \sqrt{2\pi}} e^{\frac{(x \mu)^2}{2\sigma^2}}\其中,\(\mu\)是均值,\(\sigma\)是标准差。

2、标准正态分布若\(X\)服从正态分布\(N(\mu, \sigma^2)\),则\(Z =\frac{X \mu}{\sigma}\)服从标准正态分布\(N(0, 1)\)。

四、相关分析1、皮尔逊积差相关系数用于测量两个连续变量之间的线性关系,公式为:\r =\frac{\sum_{i=1}^{n} (X_{i} \bar{X})(Y_{i} \bar{Y})}{\sqrt{\sum_{i=1}^{n} (X_{i} \bar{X})^2 \sum_{i=1}^{n} (Y_{i} \bar{Y})^2}}\2、斯皮尔曼等级相关系数适用于测量两个顺序变量之间的相关性,公式为:\r_s = 1 \frac{6 \sum_{i=1}^{n} d_{i}^2}{n(n^2 1)}\其中,\(d_{i}\)是两个变量的等级差。

心理统计相关知识总结(5)

百分等级(percentile rank):亦称“百分位”。

表示一组数据中,某个具体观测分数以下数据个数占数据总个数比例的百分数。

反映数据在次数分布中所处地位。

用PR表示。

在0~100之间取值。

是应用最广的表示测验分数的方法。

一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比,如85的百分等级表示在常模样本中有85%的人比这个分数要低。

百分等级指出个体在常模团体中所处位置,等级越低,个体所处位置就越低。

集中趋势(central tendency):与“离中趋势”相对。

数据分布特征之一。

数据分布中大量数据向某方向集中的程度。

具体指一组数据向某中心值靠拢的程度,反映一组数据中心点位置所在。

主要通过集中量数来衡量。

集中趋势愈强,说明集中量数的代表性愈大;反之,则愈小。

集中量数(measure of central tendency):描述数据集中趋势的统计量。

常用的主要有:算术平均数、中数、众数、加权平均数、几何平均数和调和平均数等。

算术平均数(mean):集中量数的一种。

所有数据的和与数据个数的商。

用M表示。

常用作现象一般水平的标志,是一组数据集中趋势主要测度方式,是统计分析和进一步推断的基础。

主要适用于数值型数据,但不适用于品质型数据。

设一组数据为X,X2,…,X,算术平均数计算公式为:M=(X,+X2+…+X,)/n。

样本平均数(mean of sample):与“总体平均数”相对。

由样本数据求得的算术平均数。

总体平均数(mean of population):与“样本平均数”相对。

由研究对象所有数据求得的算术平均数。

统计实践中,总体平均数很难或无法得知,此时主要通过样本平均数进行估计。

加权平均数(weighted mean):集中量数的一种。

把一组数据按照重要程度不同赋予相应权重,然后求得的平均数。

用M.表示。

数据权重反映该数据在总体中的相对重要性,权重确定与一定理论或经验价值有关。

心理统计相关知识总结(1)

心理统计统计分析(statistical analysis):运用统计方法及与分析对象有关的知识和信息,对有关研究对象的数据资料进行定量、定性分析的研究活动。

在统计设计、统计调查、统计整理基础上,揭示研究对象的规律、性质和特征,从而形成对研究对象更为深刻的认识。

通常包括统计分析方案的设计、数据资料的搜集整理、分析结果呈现和解释等阶段。

系统、完善、准确的数据资料是统计分析的必要前提。

总体(population):亦称“母体”、“全域”。

与“样本”相对。

具有某种特征和性质的一类事物的全部。

在具体实践中指所研究的某一类对象的全体。

总体中的每一基本单元称为“个体”,在心理研究中,有时指一个具体的人,也可以指实验中的一种反应、一种实验结果或一个具体数据。

在一个统计问题中,一般只涉及每个个体的某个或几个数量指标,因此,常把总体中每个个体的数量指标(一维或多维)的全体作为总体。

如,学生的身高,每个学生的具体身高数是个体,所有学生的身高数就是总体。

无限总体(infinite population):与“有限总体”相对。

容量无限的总体。

总体中所包含组成单元(即个体)的个数叫容量。

宇宙中星体数目、空气中尘埃数是难以计量的,即是无限的。

在具体研究实践中,假若总体中个体数目充分大时也可把其当作无限总体。

有限总体(finite population):与“无限总体”相对。

容量有限的总体。

如生理性别只包含男女两种类别,其数目是有限的。

样本(sample)):亦称“子样”。

与“总体”相对。

按照一定规则从总体中抽取出来,作为研究对象的部分个体。

当样本与总体同构或能够充分代表总体,就可根据样本统计分析结果,对总体特征(参数)进行一定程度的推测。

样本中所含个体的数目称为“样本容量”或“样本大小”,通常用n表示。

在心理研究中,样本可以是所选取的一组被试的一次测量结果,或一个被试的多次测量结果。

小样本(small sample):与“大样本”相对。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《心理统计学》重要知识点第二章 统计图表简单次数分布表的编制:Excel 数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel 数据透视表直方图(histogram ):直观描述连续变量分组次数分布情况,可用Excel 图表向导的柱形图来绘制 散点图(Scatter plot ):主要用于直观描述两个连续性变量的关系状况和变化趋向。

条形图(Bar chart ):用于直观描述称名数据、类别数据、等级数据的次数分布情况。

简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。

复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。

圆形图(circle graph )、饼图(pie graph ):用于直观描述类别数据或等级数据的分布情况。

线形图(line graph ):用于直观描述不同时期的发展成就的变化趋势;第三章 集中量数● 集中趋势和离中趋势是数据分布的两个基本特征。

● 集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。

● 集中量数:描述数据分布集中趋势的统计量数。

● 离中趋势:是指数据分布中数据分散的程度。

● 差异量数:描述数据分布离中趋势(离散程度)的统计量数 ● 常用的集中量数有:算术平均数、众数(M O )、中位数(M d ) 1.算术平均数(简称平均数,M 、X 、Y ):nx X i∑= Excel 统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(=-∑x x i(2)如果变量X 的平均数为X ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 的平均数X b a Y +=2.中位数(median ,M d ):在一组有序排列的数据中,处于中间位置的数值。

中位数上下的数据出现次数各占50%。

3.众数(mode ,M O ):一组数据中出现次数最多的数据。

4.算术平均数、中数、众数之间的关系。

5.加权平均数:iii n n n w w w x w w w w x w x w x M ∑∑=++++++=2122116.调和平均数(harmonic mean ,M H ):一组数值倒数的平均数的倒数。

∑=+⋅⋅⋅++=inH xnn x x x M 1)111(121 Excel 统计函数HARMEAN (1)用于描述同一个体(或一组个体)不同时间段的平均学习速度、平均工作效率。

(2)用于描述不同能力水平个体的平均学习速度、平均工作效率。

7.几何平均数(geometric mean ,Mg )是指n 个观察值连乘积的n 次方根.(1)一组数据中少部分偏大(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映数据的集中趋势。

n n g x x x M ⨯⨯= 21 Excel 统计函数GEOMEAN(2)用于计算平均学习进步速度、平均发展速度(平均发展倍数),即环比的几何平均数。

1111342312---=⨯⨯⨯=n n n n n g x x x x x x x x x x M (n x x x 、、、 21为各个时间段的成果数据) 平均增长率:1-g M第四章 差异量数● 差异量数:描述一组数据离散程度(离中趋势)的统计量数。

差异量数较大,说明数据分布得比较分散,数据之间的差异较大;差异量数较小,说明数据分布的比较集中,数据间的差异较小。

● 差异量数还能反映平均数对一组数据的代表性。

差异量数越小,平均数的代表性越好;差异量数越大,平均数的代表性越差。

● 常用的差异量数是标准差、方差、差异系数标准差s :n X X s i 2)(∑-=Excel 统计函数STDEVP (给定样本总体的标准偏差)标准差s n-1:1)(21--=∑-n X X s i n Excel 统计函数STDEV (给定样本的标准偏差)方差2s :nX X si 22)(∑-=Excel 统计函数VARP (给定样本总体的方差)方差21-n s:1)(221--=∑-n X X s i n Excel 统计函数VAR (给定样本的方差) 差异系数(又称变异系数、离散系数、相对标准差):XSCV =(1)用于比较不同观测工具测量结果(数据单位不同)的离散程度,例如,身高离散程度大,还是体重离散程度大?(2)用于比较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。

例如:7岁组儿童和13组岁儿童的体重离散程度,哪个较大?● 标准差的重要特性:如果变量X 的标准差为X S ,将变量X 按照公式bx a y +=转换为Y 变量后,那么,变量Y 的标准差X Y bS S =● 相对位置量数:反映个体(数据)在团体中相对位置的统计量数。

主要有标准分数及其线性转换分数(Z 分数、T 分数)、百分等级(PR)、正态化标准分数等。

1.标准分数的计算与应用:S X X Z i -=或:σμ-=i X Z , 5010+=Z T ,500100+=Z CEEBZ 分数的特点:Z 分数的平均数为0,即0=Z μ,标准差为1,即1Z =σ T 分数的平均数50T =μ,标准差为10T =σCEEB 分数的平均数=___________?,标准差=__________? (1)可用于比较个体各方面水平高低(横向比较,个体内差异评价)。

(2)对被试多方面的测量结果进行综合,如对高考各科成绩的综合,各分测验分数的综合。

(3)可用于对个体或样组某方面水平进行前后比较(纵向比较),判断其水平是提高了,退步了,还是没有变化。

2.原始分数X 的百分等级的含义与计算根据简单次数分布表计算:1005.0⨯+=NF f PR bX 根据分组次数分布表计算:100⨯+•-=NF f i L X PR b bX第五章 相关关系● 相关关系的描述方法(1)相关散点图:适用于直观描述两个连续性数值变量(等距数据、比率数据)之间的关系。

可用Excel 图表向导中的“XY 散点图”绘制。

(2)双向次数分布表(交叉表、列联表):适用于描述两个等级变量(或称名变量、类别变量)之间的关系。

可用Excel 数据透视表编制列联表)。

(3)相关系数(相关关系的特征值)。

● 相关系数:描述两个变量相关关系的统计量数,在-1.00~1.00之间取值,绝对值越大,越接近1,说明两个变量之间的关系程度越密切;绝对值越小,越接近0,说明两个变量的关系程度越低。

● 常用的相关系数: 1.积差相关:yx i i s ns y y x x r ∑--=))((Excel 统计函数CORREL适用条件:(1)X 、Y 两个变量都是连续性变量(等距数据或比率数据);(2)X 、Y 两个变量总体上为正态分布或接近正态分布。

2.斯皮尔曼等级相关:是一对(两列)名次变量的积差相关。

对数据变量的分布形态没有要求。

(1)等级积差相关法(名次积差相关法)。

YX R R Y Y X X R S NS R R R R r ))((--∑=Excel 统计函数CORREL公式中的R X 和R Y 是分别代表两变量中每个数据在变量中的名次。

(2)等级差数法(名次差数法)。

如果每个等级(即名次)变量中没有相同的等级名次,可用下面公式计算:等级差数法简化公式:)1(6122-∑-=N N D r R如果等级(即名次)变量中有相同的等级名次,需用下面校正公式计算: 等级差数法校正公式:))((222222y x D y x r RC ∑∑•∑-∑+∑=,2x ∑、2y ∑计算方法参见教材125页3.肯德尔W 系数(肯德尔和谐系数):描述多个名次变量一致性程度的统计量数。

适用于描述和分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名次)的一致性程度,在心理测量与教育评价中称为评分信度。

例如,5位阅卷老师对10篇论文评分排名的一致性。

如果评价者给出的不是个体的水平名次,而是分数(或等第、符号),可先将其转换成名次,然后再计算W 系数。

)(121)(3222N N K N R R W i i --=∑∑ 校正公式:∑∑∑---=T N N K NR R W i i )(121)(3222∑∑-=12)1(2n n T 公式中:n 为每个名次变量中相同名次的数目。

4.点二列相关(point-biserial correlation ):用于描述一列续性变量和一列真正二分变量(或非正态二分变量)之间的相关。

真正二变量:指按某种性质或标准将个体划分为两种结果的变量,如对、错,男、女等。

pq s X X r tqp pb •-=Excel 统计函数CORREL5.二列相关(biserialcorrelation):用于描述由一个正态连续变量人为划分成的二分变量与另外一个正态连续变量之间的相关。

或者说,用于描述一正态二分变量与一正态连续变量之间的相关。

人为二分变量?是指由连续变量转换而来的二分变量,例如,将测验或考试分数区分为及格和不及格,80分以上和80分以下;按中考(或高考)成绩,将考生区分为录取、未录取。

正态二分变量?如果二分变量是根据正态连续变量转换而来,那么,可称之为正态二分变量。

ypqs X X r tqp b •-=y 为将正态分布面积画分为p 、q 两部分的纵线的高度。

y 的计算方法:利用Excel 统计函数计算标准正态分布区间点函数NORMSINV(p 值)→区间点Z 值 正态分布函数NORMDIST(区间点Z 值,0,1,0)→Z 值的概率密度y 6.Φ相关(Φ系数):))()()((||d b c a d c b a bc ad r ++++-=Φ用于描述两个真正二分变量的相关程度,也用于描述一个人为二分变量和真正二分变量的相关。

注意:Φ相关计算公式是由皮尔逊积差相关计算公式转换来的。

因此,如果两列二分变量转换为0、1(或1、2)的数值变量时,可以用Excel 统计函数CORREL 计算Φ系数。

第六章 概率分布1.正态分布的特征(见教材)2.Excel 软件中正态分布函数和正态分布区间点函数的应用◆标准正态分布函数NORMSDIST 的应用:(1)P(Z <1.96)=? =NORMSDIST(1.96)=0.9750 (2)P(Z >1.96)=? =1-NORMSDIST(1.96)=0.0250(3)P(-1.5<X <2.5)=? =NORMSDIST(2.5)-NORMSDIST(-1.5)=0.9270 ◆正态分布函数NORMDIST 的应用例如:已知某次测验的分数呈正态分布,平均分为75分,标准差为10分,试计算: (1)低于80分的考生占多大比例,P(X <80分)=? (2)80分以上的考生占多大比例,P(X ≥80分)=?(3)80分以上,低于90分的考生占多大比例,P(80≤X <90)=? P(X <80分):“=NORMDIST(79.5,75,10,1)”=0.6736 P(X≥80分):“=1-NORMDIST(79.5,75,10,1)”=0.3264P(80≤X<90):“=NORMDIST(89.5,75,10,1)-NORMDIST(79.5,75,10,1)”=0.2528 ◆标准正态分布区间点函数NORMSINV 的应用根据给定的向上累积概率P(Z<a),标准正态分布的临界值a=? a=NORMSINV(p 值) 例如:P(Z<a)=0.90 =NORMSINV(0.90)= 1.28,a= 1.28,P(Z >1.28)=0.10 ◆正态分布区间点函数NORMINV 的应用根据正态变量X 的平均数、标准差和向上累积概率P(X<a),计算临界值a=?例:已知某次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。

相关文档
最新文档