0272《心理统计学》2016年6-7月期末考试指导要点
心理统计学提纲

心理统计学复习提纲一、解释概念抽样与样本随机化原则统计量与参数相关与相关系数集中量数差异量数随机事件的概率描述统计推断统计置信区间假设与假设检验第Ⅰ型错误第Ⅱ型错误等级相关点二列相关二列相关总体与个体参数的点估计统计分组统计图统计表二、简答题1.描述一个班的考试成绩,其主要统计指标是什么?试说明其理由。
2、心理统计学的主要内容是什么?3、心理统计学研究问题的基本步骤是什么?4、什么是集中量数,试述其种类与用途。
5、什么是差异量数,试述其种类与用途。
6、积差相关、等级相关、点二列相关、二列相关系数各自使用条件的条件是什么?试写出它们的计算公式。
7、统计假设检验的基本原理是什么?8、统计假设检验中可能存在的错误有哪些?如何使犯错误的风险减小?9、概率运算的基本法则是什么?写出它们的使用条件和公式。
10、什么是抽样误差,什么是均数的标准误,简述均数标准误与总体标准差之间的关系。
11、一个规范的统计表主要由哪几个部分组成?试对各部分的意义作说明。
12、一个规范的统计图主要由哪几个部分组成?试对各部分的意义作说明。
13、试述算术平均数的作用与优缺点。
14、试述方差与标准差的作用与优缺点。
15、卡方检验的主要用途是什么?16、方差分析的基本原理及其前提条件是什么?17、优良的点估计的标准是什么?18、回归分析的主要内容是什么?三、计算题1、某市为研究会考与高考成绩之间的关系,从全市随机抽取被试10人,得到英语的成绩如下: (1)求各次考试成绩的平均数; (2)求各次考试成绩的标准差: (3)求两次考试成绩之间的相关系数; (4)试对两次考试成绩之间的差异作显著性检验。
,33.19,86.17,66,67====Y X Y X σσN Y Y Y Y L N X X X X L YY XX2222222)()(,31901067048080)()(∑-∑=-∑==-=∑-∑=-∑==373810660472982=-28311066067047951))((=⨯-=∑∑-∑=--∑=NYX XY Y Y X X L XY 8198.0373831902831=⨯==YY XX XY XY L L L r 本题为相关小样本资料,用t 检验。
实验心理学心理统计期末复习知识点

实验心理学心理统计期末复习知识点文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-一、选择题1.实验的研究方法:观察法、相关法、实验法 P222.自变量:在实验中实验者所操纵的,对被试的反应产生影响的变量3.因变量:因自变量的变化而产生的现象变化或结果,是实验者要观察和记录的变量。
4.额外变量:除了自变量外其他可能会影响实验结果的其他变量随机的额外变量:偶然起作用的额外变量。
(如受到意外干扰、仪器性能不稳定等)系统的额外变量:经常地、稳定地起作用的变量。
5.操作性定义:根据可观察、可测量或可操作的特征来界定研究变量的定义。
用于详细说明研究者要观察、测量和操作研究变量的程序和活动。
这指出研究者要测量一个变量必须做些什么,来界定或给予一个研究变量的含义。
例如:智力:在某个智力量表上测得的分数。
身高:为受测者采立姿,由地面到头顶点的垂直距离。
攻击性、抑郁、焦虑、饥饿6.实验者效应:主试(实验者)在实验中可能以某种方式(表情、手势、语气)有意无意地影响被试,使他们的反应附和主试的期望。
控制办法:指导语标准化、采用双盲实验设计7.被试期望效应:由于受试者预期某些测试结果,于是无意识地以某种形式操纵了实验步骤,或向实验人员报告他们希望得到的结果。
受试者期望效应能严重歪曲实验结果,因此需利用双盲(double-blind)方式进行实验来消除这效应。
8.数据的统计方法:1)集中趋势:指一个可以代表分布中所有分数的数值。
包括平均数、中数和众数研究问题:参加研究的女性的平均年龄是多少?参加研究的男性的平均年龄是多少?2)差异量数:标准差(SD)是常用的描述分数离散程度的指标。
研究问题:男性每周学习小时数的标准差是多少?3)相关量数:两个变量之间的关系程度,用相关系数表示。
数据类型不同,计算相关的公式不同。
斯皮尔曼等级相关研究问题:学生的出生顺序与第一年的绩点有什么关系?皮尔逊积差相关研究问题:学习小时数与第一年的绩点有什么关系?4)卡方:用来确定观察次数与期望次数之间是否存在差异的非参数统计。
《心理统计学》考点详解-第二、四、五章

冷二之前对心理统计学考点进行了分析,将整个统计归纳为43个知识点(戳蓝字直达→),介于心理统计学分值较大(占13分)且不易记忆,我们来逐章节进行梳理。
心理统计学共分5个章节:①(←戳蓝字进入复习)②了解了这些之后就进入第二章——对数据的分布以及总体参数进行一系列的估计【8个知识点】;③对于数据的操作要严谨,只有估计当然是不行的,所以接下来我们需要对数据进行一些假设并通过各种方法进行检验【16个知识点】;④第四章的各种研究设计的方差分析不是考察重点,我们就不过多浪费时间和精力了【1个知识点】;⑤第五章一元线性回归我们需要对几个名词解释考点进行记忆【4个知识点】。
由于第四章只有1个知识点,且在17年考察过,今年不可能重复考察,同时,第五章只有4个知识点,这篇文章中我们就将第二章、第四章和第五章的知识点一起进行梳理吧!第二章数据的分布及总体参数的估计第一节数据分布的特点【简答题-14、18年真题】正态分布的特点(14年)正态分布及曲线(18年)【选择题】正态分布总体的随机样本的关系:算术平均数±1S=68.26%算术平均数±1.645S=90%算术平均数±1.96S=95%算术平均数±2.58S=99%✔【名词解释】标准正态分布均值=0,方差=1的正态分布【选择题】标准分数的公式、二项分布的平均数、标准差(记住公式,以防计算类选择题)【选择题举例】一个班成绩平均分( ̄X)为90分,标准差(S)为3。
已知一个学生的成绩为97.5分,则该生成绩在班里的半分位是多少?解:带入标准分数公式可得:标准分数=(97.5-90)/3=2.5 2.5接近2.58,即该生的分数接近99.5%(即99%+1%÷2)第二节总体参数的估计✔【名词解释-16年真题】抽样分布样本统计量的概率分布✔【名词解释】样本平均数从正态分布的总体中可无限抽取大小为n的样本,所计算的这无限多个平均数的分布,称为样本平均数的分布。
心理学统计期末复习整理

期末复习题(12.18)一、简答题1、线性相关与回归的区别和联系主要区别有三点:1.线性相关分析涉及到变量之间的呈线性关系的密切程度,线性回归分析是在变量存在线性相关关系的基础上建立变量之间的线性模型;2.线性回归分析可以通过回归方程进行控制和预测,而线性相关分析则无法完成;3.线性相关分析中的变量地位平等,都是随机变量,线性回归分析中的变量有自变量和因变量之分,而自变量一般属确定性变量,因变量是随机变量.4.相关系数的计算只适用于两个变量都服从正态分布的情形,而在回归分析中,因变量是随机变量,自变量既可以是随机变量(Ⅱ型回归模型,两个变量都可以服从正态分布),也可以是给定的量(Ⅰ型回归模型,这时,与每个X取值相对应的变量Y必须服从正态分布)。
5.线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的依存关系,是单向的。
主要联系:1.如果对同一资料进行相关与回归分析,则可得到的相关系数r与回归方程中的b正负号是相同的。
2.在相关分析中,求出r后也要进行假设检验,同样,在回归分析中,对b也要进行假设检验。
实际上,通过数学推导,对同一样本可以得出r与b互化的公式,同一样本的这两种假设检验也是等价的。
因此由于r的假设检验可以直接查表,较为简单,所以可以用其代替对b的假设检验。
3.相关和回归可以相互解释。
p365的最后一段和p366的第一段2、试述分层取样的原则和方法定义:又称比率、分类或分组取样,是按照总体已有的某些特征(如性别、年龄和民族等),将总体分成几个不同的部分(每个部分叫一个层或一个子总体),然后在每一个层或子总体中进行简单随机取样。
原理:是随机取样和系统取样在使用时一种可能的修正状态。
它可以提高样本的代表性,同时减少可能的抽样误差。
分层的标准:①以研究所要分析的主要变量或相关的变量作为分层的标准(也称分层变量);②以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量;③以那些已有明显层次区分的变量作为分层变量。
华中师范大学《心理统计学》期末考试必备通关指导2

共 3 道大题,满分 100 分一、单选题(共 15 道小题,共 30 分)1. 假设检验中两类错误的关系是( )。
(2 分)A. α+β=1B. α=βC. α+β=1/2D. α+β不一定等于1【答案】D【解析】α+β不一定等于1,因为两者是在两个前提下的概率。
α是拒绝H0时犯错误的概率,β时接受H0时犯错误的概率。
2. 下列统计量中对数据变化灵敏性最差的是( )。
(2 分)A. 方差B. 平均差C. 算术平均数D. 众数【答案】D【解析】众数指出现次数最多的数,对数据变化灵敏性差。
3. 在假设检验中,α取值越大,称此假设检验的显著性水平( )。
(2 分)A. 越明显B. 越不明显C. 越高D. 越低【答案】D【解析】在假设检验中,α取值越大,称此假设检验的显著性水平越低4. 某次英语考试的标准差为5.1分,考虑到这次考试的题目太难,评分时给每位应试者都加了10分,加分后成绩的标准差是( )。
(2 分)A. 4.9B. 15.1C. 5.1D. 10【答案】C【解析】标准差计算公式的运用5. 当一个实验( )时,我们才能得到交互作用。
(2 分)A. 自变量多于1个B. 因变量多于1个C. 自变量多余2个水平D. 因变量多于2个水平【答案】A【解析】当一个实验自变量多于1个时,我们才能得到交互作用。
6. 在统计假设检验中,同时减少α和β错误的最好办法是( )。
(2 分)A. 控制α水平,使其尽量小B. 控制β值,使其尽量小C. 适当加大样本容量D. 完全随机取样【答案】C【解析】在统计假设检验中,同时减少α和β错误的最好办法是适当加大样本容量7. 已知某次高考的数学成绩服从正态分布,从这个总体中随机抽取n=36的样本,并计算得其平均分为79,标准差为9,那么下列成绩不在这次考试中全体考生成绩均值μ的0.95的置信区间之内的有( )。
(2 分)A. 81B. 79C. 83D. 77【答案】C【解析】总体平均数估计公式运用8. 已知一组数据服从正态分布,平均数为80,标准差为10。
心理统计期末考试试题

心理统计期末考试试题一、选择题(每题2分,共20分)1. 心理统计学中,描述数据集中趋势的常用指标是:A. 标准差B. 方差C. 均值D. 众数2. 以下哪项不是描述数据离散程度的指标?A. 极差B. 四分位数间距C. 均值D. 标准差3. 相关系数的取值范围是:A. -1到0B. 0到1C. -1到1D. 1到无穷大4. 假设检验中,如果P值小于显著性水平α,则:A. 拒绝零假设B. 接受零假设C. 无法做出决策D. 需要更多数据5. 以下哪个不是常见的抽样分布?A. t分布B. F分布C. 正态分布D. 二项分布6. 心理测量学中,信度和效度的关系是:A. 信度高则效度一定高B. 效度高则信度一定高C. 信度和效度是相互独立的D. 信度是效度的必要条件7. 以下哪个不是心理统计学中常用的数据类型?A. 定性数据B. 定量数据C. 顺序数据D. 等级数据8. 进行回归分析时,如果自变量和因变量之间没有线性关系,则:A. 可以进行多元回归分析B. 可以进行非参数回归分析C. 无法进行回归分析D. 需要重新选择自变量9. 以下哪个不是心理统计学中常用的数据收集方法?A. 实验法B. 观察法C. 调查法D. 随机抽样法10. 心理测量中,项目分析通常不包括以下哪项?A. 难度分析B. 区分度分析C. 信度分析D. 效度分析二、简答题(每题10分,共30分)1. 描述方差和标准差的区别,并解释它们在心理统计学中的应用。
2. 解释什么是效应量,并讨论它在心理研究中的重要性。
3. 简述多元回归分析的基本步骤,并说明在心理研究中如何应用。
三、计算题(每题25分,共50分)1. 给定一组数据:3, 5, 7, 9, 11, 13。
请计算这组数据的均值、方差、标准差,并解释这些统计量的意义。
2. 假设你正在进行一项关于工作压力和工作满意度的研究。
你收集了以下数据:工作压力(自变量X)和工作满意度(因变量Y)的测量值。
《心理统计学》总复习要点[]
![《心理统计学》总复习要点[]](https://img.taocdn.com/s3/m/9b7d2a3652d380eb62946d3e.png)
《心理统计学》总复习要点第一章、第二章基本概念及次数分布表第一节基本概念一、基本概念1.连续变量与离散变量(不连续变量)变量分为连续变量与离散变量(不连续变量)。
连续变量则可以在量表上的任何两点加以细分,可以取得无限多个大小不同的数值。
不连续变量又称离散变量或间断变量,则在量表上的任何两点中只能取得有限个数值。
是一种只能取特殊值而不能取任何值的变量,它代表一个点,而不是一段距离。
2.总体、样本、个体总体是指具有某一种特征的一类事物的全体,构成总体的每一个基本元素称为个体,在总体中按一定规则抽取的一部分个体,称为总体的一个样本。
二、测量水平心理测量的工具一般可以分为四种水平,它们是由测量工具——量尺的水平决定的,量尺也称为尺度。
(一)量尺(Ratio Measurement)用这样的量尺测量出的数据,可以进行加、减、乘和除运算。
这种测量水平的数据特征是有相等单位和绝对零点。
用这种量尺测量得到的数据变量为比率(或等比)变量。
(二)等距量尺(Interval Measurement)只有相等单位,没有绝对零点,这种测量工具称为等距量尺。
等距量尺测出的数据可以进行加和减的运算,而不能进行乘和除的运算。
但是,等距数据的差值可以进行乘、除运算,因为等距数据的差值有一个绝对零点,两个数值相等,差值即为零。
用这种量尺测量得到的数据变量为等距变量。
(三)顺序量尺(Ordinal Measurement)顺序量尺又叫等级量尺,它的特点是:既无绝对零点,又无相等单位。
用这种量尺对研究对象进行测量,只能给对象排个顺序。
顺序量尺的测量结果原则上不能进行加、减、乘、除四则运算。
如有必要的话,只能进行不等式运算。
用这种量尺测量得到的数据变量为顺序变量。
(四)分类量尺(Nominal Measurement)分类测量不包含任何类间数量关系的假定,仅仅是把测量对象分为相同或相异,但在性质上没有哪一类较大,哪一类较小之分。
即无大小之分,也无等级之分。
《现代教育与心理统计学》期末考试复习要点

2013级《现代教育与心理统计学》期末考试复习要点一、题型(一)单项选择题(每题2分,共30分)(二)填空题(每空1分,共10分)(三)名词解释(每题3分,共12分)(四)简答题(每题6分,共24分)(五)计算题(第1题6分,第2题8分,第3题10分,共24分)第一章绪论第二节:心理与教育统计的内容(描述统计、推论统计、实验设计的定义及地位)第四节:心理与教育统计基础概念(数据类型、随机变量的概念及特点、样本、参数与统计量)第二章统计图表第二节:次数分布表(组距、组中值的计算,分组次数分布表编制的步骤)第三节:次数分布图(直方图、条形图、圆形图、散点图适合的数据资料)第三章集中量数第一节:算数平均数(平均数的计算、性质、优缺点及计算和应用的原则)第二节:中数与众数(二者的计算、优缺点及应用)第三节:其他集中量数(总平均数的计算)--平均数、众数、中数的关系第四章差异量数第二节:平均差、方差与标准差(计算公式、使用条件、方差和标准差的意义)第三节:标准差的应用(差异系数、标准分数的计算公式及具体应用)第四节:差异量数的选用(各种差异量数优缺点比较、如何选用差异量数)第五章差异量数第一节:相关关系与散点图(相关系数的定义、取值范围、类型、散点图)第二节:积差相关(适用资料、计算公式)第三节:斯皮尔曼等级和肯德尔等级相关(适用资料、计算公式)第四节:点二列相关和二列相关(适用资料)第六章:概率分布第一节:概率的基本概念(概率的取值范围、加法和乘法定理、分布类型)第二节:正态分布(正态分布的特征、正态分布理论在测验中的应用)第四节:抽样分布(样本平均数的分布、t分布的特点、F 分布的特点)第七章参数估计第一节:点估计、区间估计与标准误(良好估计量的标准、置信区间与显著性水平的概念、区间估计与标准误的计算)第二节:总体平均数的估计(估计总体平均数的步骤及计算)第八章假设检验第一节假设检验的原理(虚无假设和备择假设、假设检验中的两类错误、单侧检验和双侧检验、假设检验的步骤)第二节平均数的显著性检验第三节平均数差异的显著性检验第十四章抽样原理及方法第一节抽样的基本原则(随机化原则)第二节几种重要的随机抽样法第二节。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
0272《心理统计学》2016年6-7月期末考试指导一、考试说明本课程闭卷考试,满分100分,考试时间90分钟。
可能的考试题型包括:1、单项选择题2、判断题3、简答题4、计算题5、综合应用题二、重点复习内容(一)绪论1、心理学统计学的内容:描述统计、推论统计、实验设计。
其中,描述统计的指标包括数据的集中趋势,数据的离散趋势和数据间的相关2、数据的种类按照测量的水平,可以划分为称名变量、等级变量、等距变量和比率变量。
(1)称名变量,是指根据事物的某一特征,用来划分、区别事物的不同种类所形成的变量。
这类数码并无数量和序列的含义,不能进行数量化分析,不能做加减乘除的运算。
(2)等级变量,在对事物进行分类过程中,依据事物某种属性程度的大小排列顺序形成的变量。
等级变量既无相等单位,也无绝对零,不同组的等级变量间不能进行加减乘除的运算。
(3)等距变量,是指在观测标识事物某一特定属性时,具有相对参照点、有相等单位的变量。
可以进行加减运算,但是由于等距变量的参照点是相对的,即无绝对零点,因此不能进行乘除的运算。
例如,测量温度的℃。
(4)比率变量,是指既有相等单位又有绝对零参照点的变量,如身高、体重、反应时、各种感觉阈值的物理量等。
这类变量可以进行加减乘除的运算。
(二)统计图表1、次数分布表:各种次数分布的列表形式和图示形式。
次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。
2、编制次数分布表的步骤(1)求全距:从最大值的数据中减去最小值的数据,所得差数就是全距。
用符号R表示(2)定组数(3)求组距:指每一组的间距,用符号i表示。
(4)定组限:指各组数据在数值上的起点值和终点值。
(5)求组中值:各组实际上限数值与实际下限数值的中点数值,即上、下限数值的平均值。
(6)归类划记:将原始观测值按照一定的顺序逐一归组。
(7)记录各组次数(f)。
(8)核对,抄录新表。
3、连续变量的单位是无限的,例如整数180的实上限和下限分别为179.5和180.5,而测量数据8.35的下实限是8.345。
4、累加次数分布表:如果想知道某个数值以下或以上的数据的数目,就要用累加次数。
5、次数分布图:编制次数分布表与绘制次数分布图,对于了解一组数据的分布情况,平均水平,差异情况等非常有用。
由于数据的性质不同,有时实验结果的次数分布图上会出现双峰。
(三)集中量数集中量数主要用来描述一组数据的集中趋势,常用的代表性的集中量数有算术平均数、中数、众数。
1、算术平均数:又称平均数,是集中量数中性能最好的一个统计量,一般用M表示。
平均数是一种受极端数据值影响的统计量。
2、加权平均数加权算术平均数是指一组数据中每个数据与其权重乘积的总和除以权重总和所得的商。
在心理与教育研究中,经常会遇到由各个平均数计算总平均数这类实际的统计计算问题。
在这个问题中,可以把各小组的平均分数,视为该小组每个个体的分数,而把每个小组的人数,视为权数。
3、次数分布表中算术平均数的计算对于已经列成次数分布表的数据,其算术平均数的计算公式为:NfX X C∑= 式中,C X 为各组的组中值,f 为各组的次数,N 为总次数,即∑=f N 。
4、中数与众数中数:又称中点数,中位数,中值。
符号为Md 或Mdn 。
中数是按一定顺序排列在一起的一组数据中居于中间位置的数。
当数据的个数为偶数时,则取据中间两个数据的平均数为中位数。
对于数据较多的资料,其算术平均数与中位数的值不会相差太大。
众数:又称为密集数、范数等,常用符号M 0表示,众数是指在次数分布中出现次数最多的那个数的数值。
5、平均数、中数与众数三者之间的关系在正态分布中三者相等,在正偏态分布中,平均数大于中数,中数大于众数。
在负偏态分布中,平均数小于中数,中数小于众数。
M<Md<Mo 。
对于数据较多的资料,其算术平均数与中位数的值不会相差太大。
(四)差异量数差异量数是对一组数据的变异性,即离中趋势特点进行度量和描述的统计量,也称为离散量数。
1、全距、百分位差和四分差全距又称两极差,用符号R 表示,用最大值减去最小值就是全距。
例如,4,4,5,3,5,5,2。
这列数据的全距为3百分位差是用百分位数之间的差值来表示离中趋势的一种差异量数。
四分差,又称为四分位差,通常用符号Q 来表示,指在一个次数分配中,中间50%的次数的全距之半,也就是上四分点与下四分点之差的一半。
例如,已知在甲分布中P90-P10=38,在乙分布中P90-P10=24,两个分布的分散程度,则甲>乙。
2、标准差、方差(1)方差:也称变异数,均方。
作为样本统计量,用符号s 2表示,作为总体参数,用σ2表示。
它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。
标准差的计算公式为NX X S ∑-=)(标准差是一组同质数据间变异度大小的量度指标,但是如果两组数据平均数相差较大时,不能采用标准差进行比较。
标准差、方差是描述数据的离散趋势最好的统计值。
(2)方差性质:可加性、可分解性标准差特性:每一个观察值都加一个相同常数C 之后,计算得到的标准差等于原标准差。
每一个观察值都乘一个相同常数C ,则所得到的标准差等于原标准差乘以常数C 。
以上两点结合,每一个观察值都乘以一个常数C (C 不等于0),再加上一个常数d ,所得标准差等于原标准差乘以常数C 。
(3)方差、标准差的意义:是表示一组数据离散程度的最好指标。
其值越大,表示数据的离散程度越大,该组数据越分散;其值越小,表示次数分布的数据比较集中,数据的离散程度越小。
3、分组资料标准差的计算方法对于次数分布表中的数据标准差计算公式为:22)(NfX N fX S C C ∑-∑=4、差异系数:又称变异系数、相对标准差等,是一种相对差异量,用CV 表示,为标准差对平均数的百分比,计算公式:CV=S/M ×100%。
差异系数的心理与教育研究中常用于:(1)同一团体不同观测值离散程度的比较,如身高和体重离散程度的比较;(2)对于水平相差较大,但进行的是同一种观测的各种团体,进行观测值离散程度的比较。
5、标准分数:(1)又称基分数或Z 分数,是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
标准分数的计算公式:___X X xz s s-== (2)标准分数在实际中的应用:①用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低; ②计算不同值的观测值的总和或平均值,以表示在团体中的相对位置; ③表示标准测验分数。
(五)相关系数 1、相关系数用于描述双变量数据相互之间的关系,是两列变量间相关程度的数字表示形式,或者说是用来表示相关强度的指标。
样本相关系数用r 表示,总体一般用ρ表示。
相关系数的取值介于-1.00至+1.00之间,常用小数形式表示。
相关系数的正负号,表示相关方向,取值的大小表示相关的程度。
如果两个相关系数取值相同,正负号不同,则相关程度相同。
当XY 相关程度很小时,从X 推测Y 的可靠性就很小。
2、散点图(1)散点图是用相同大小圆点的多少或疏密表示统计资料数量大小及变化趋势的图。
通常以圆点分布的形态表示两种现象间相关程度。
(2)在实际中的用途: 在相关研究中,通常用散点图表示两个变量之间的关系。
通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度,能够对原始数据间的关系做出直观而有效的预测和解释。
因此,散点图是确定变量之间是否存在相关关系及关系紧密程度的简单又直观的方法。
3、积差相关 适用的条件:(1)两列数据都是测量的数据,而且两列变量各自总体的分布都是正态的,即正态双变量。
(2)两列变量之间的关系应是直线性的,非直线性的双列变量,不能计算线性相关。
(3)两变量测量到的数据必须是成对的数据,对于不成对的数据无法计算相关,即使计算,得到的相关也没有意义。
计算公式:yx S NS xyr ∑=式中 X X x -=,Y Y y -=,N 为成对数据的数目,x S 为X 变量的标准差,S y 为Y 变量的标准差。
利用原始数据计算,公式可以转化为:∑∑∑∑∑∑∑-⋅--=NY YNX XN YX XY r 2222)()(其计算步骤为:(1)计算X 变量的∑X 、∑2X 和2)(∑X ;(2)计算Y 变量的∑Y 、∑2Y 和2)(∑Y ;(3)计算XY ,∑XY;(4)将有关数据代入公式,求得r 。
例如,计算12名学生两项心理测验的得分的相关系数,可以利用积差相关。
4、等级相关(1)斯皮尔曼等级相关:适用于两变量的资料为等级测量数据,且具有线性关系;连续变量的测量数据,按其大小排成等级,也可以用等级相关法计算;不要求总体呈正态分布。
例如,想了解某一测验结果(测验结果服从正态分布)与文化程度是否有关联,可以采用等级相关。
5、相关系数的选择:主要取决于要处理数据的性质类别以及某一相关系数需要满足的假设条件。
6、点二列相关两列变量一列是正态连续性变量,另一列是二分变量,描述这两个变量之间的相关,称为点二列相关。
7、肯德尔和谐系数一般常用来表示评分者信度。
(六)概率分布 1、概率的基本性质概率的公理系统:任何一个随机事件A 的概率都是非负的;在一定条件下,必然发生的必然事件的概率为1;在一定条件下必然不发生的事件,既不可能事件的概率为0。
任何一个随机事件的概率介于0和1之间。
在统计推断中小概率事件一般被称为不可能发生的事件。
事件的概率仅由事件本身决定,与我们用什么方法去求它无关。
2、正态分布(1)正态分布又叫常态分布,是连续随机变量概率分布的一种。
自然界,人类社会,心理与教育中大量现象均按正态的形式分布。
正态分布曲线函数又称密度函数,一般方程为:22221σμπσ)(--=x e y其中,π是圆周率3.14159...e 是自然对数的底2.71828...;X 为随机变量取值∞+∞-〈〈X ;μ为理论平均数,2σ为理论方差;y 为概率密度,即正态分布的纵坐标。
(2)正态分布的特点①正态分布的形式是对称的,它的对称轴是经过平均数点的垂线;②正态分布的中央点(即平均数点)最高,然后逐渐向两侧下降,曲线的形式是先向内弯,然后向外弯,拐点位于正负一个标准差处,曲线两端向靠近基线处无限延伸,但终不能与基线相交;③正态曲线下的面积为1,过平均数点的垂线将其面积划分为相等的两部分;④正态分布是一族分布,它随随机变量的平均数,标准差的大小与单位不同而有不同的形态;⑤正态分布中各差异量数值相互间有固定的比例;⑥正态分布曲线下,标准差与概率(面积)有一定的数量关系。
决定正态分布曲线的最高点在横轴上确切位置的是平均数(即μ)。
(3)在实际中的应用①化等级评定为测量数据; ②确定测验题目的难易度③在能力分组或等级评定时确定人数 ④测验分布的正态化例如,某班级一次考试成绩服从正态分布,全班平均成绩为70分,标准差为10分,一个学生成绩为80分,他在全班的名次为前20%又如,某班成绩服从正态分布,平均数为80,标准差为4分,那么得76分至80分之间的学生比率为0.343、样本分布:是样本统计量的分布,是统计推论的重要依据。