SPSS 0903 第3次课
SPSS第三章

3.6 数据分组
► 3.6.1
数据分组的目的
对定距型数据进行整理和粗略把握其分布的工具; 对定距型数据进行整理和粗略把握其分布的工具; 数据分组就是按照统计研究的需要, 数据分组就是按照统计研究的需要,将数据按照某种标准重新 划分为不同组别, 划分为不同组别, 在分组的基础上进行频数分析,可以把握数据的分布, 在分组的基础上进行频数分析,可以把握数据的分布,另外还 能实现数据的离散化处理; 能实现数据的离散化处理;
►菜单 菜单Transform
3.3 数据选取
► 数据选取就是根据分析需要,从大量数据中按 数据选取就是根据分析需要,
照一定规则抽取部分数据参与分析的过程。 照一定规则抽取部分数据参与分析的过程。 3.2.1 数据选取的目的: 数据选取的目的: 提高数据分析效率; 提高数据分析效率; 少量抽取的样本可以大大提高分析效率; 少量抽取的样本可以大大提高分析效率; 要注意偏差; 要注意偏差; 检验模型的需要,一部分样本用于建模, 检验模型的需要,一部分样本用于建模,其 他用于检验模型。 他用于检验模型。
► ►
举例 计算是针对每个个案进行的, 计算是针对每个个案进行的,每个个案都 有计算结果。 有计算结果。
3.2.3 SPSS的条件表达式 SPSS的条件表达式
► 对不同组的个案进行不同的计算,例如,按照职 对不同组的个案进行不同的计算,例如,
称加工资,或者按照收入征缴个人税等等; 称加工资,或者按照收入征缴个人税等等; ► SPSS中的条件表达式就是用来完成这个功能; SPSS中的条件表达式就是用来完成这个功能 中的条件表达式就是用来完成这个功能; ► 简单的条件表达式是用<、>、=、~=、>=、 简单的条件表达式是用< ~=、>=、 <=符号连接的两个量 常量或者变量,例如: <=符号连接的两个量,常量或者变量,例如: 符号连接的两个量, n1>35; n1>35; ► 复合条件表达式又称逻辑表达式,是由逻辑运算 复合条件表达式又称逻辑表达式, 圆括号和简单条件表达式构成; 符、圆括号和简单条件表达式构成; ► 如果给出条件表达式,那么就只对满足条件的个 如果给出条件表达式, 案进行计算,举例。 案进行计算,举例。
《统计分析与SPSS的应用总结归纳(第五版)》课后测试答案(第3章)

精心整理《统计分析与SPSS的应用(第五版)》(薛薇)课后练习答案第3章SPSS数据的预处理1、利用第2章第7题数据,采用SPSS第一份数据文件存储常住地是“至5000之间的调查数据;据。
第一份文件:选取数据数据——存款<5000&常住地=沿海或中心繁华城市。
2、、收入水平(升序)、存款金额排序存款金额作为排序依据分别设置3、按得优课程数的降序排序。
计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。
4、利用第2章第9题的完整数据,计算每个学生课程的平均分以及标准差。
同时,计算男生和女生各科成绩的平均分。
方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。
分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。
先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。
方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。
数据——分类汇总——数据集并命名)——确定5、利用第2章第7限和组距进行组距分组。
设定6、在第“今年的收入比去年增加”且“预计未来SPSS的计数转换————将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。
7、对第2章第4题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。
数据——加权个案——点击加权个案——将人数作为频率变量——确定。
8、利用SPSS的变量计算功能,随机生成服从标准正态分布的100个样本数据。
⑴在空表中先列100个序号,激活表。
⑵转换✍随机数生成器✍设置起点✍勾选“随机”⑶转换✍计算变量✍目标变量:随机数✍数字表达式:RV.NORMAL(0,1) ✍确定结果:9、简述SPSS排序功能与拆分功能的不同点。
SPSS3

三 数据文件的建立与数据的录入学习要求:1、认识数据的类型1.1 常量与变量1.2 定义一个变量2、学会数据的输入2.1 数据的输入方法2.2 输入带有值标签的数据3.1 数据的类型3.1.1 常量与变量1. SPSS 的常量SPSS 中的常量就是一个数值、一个括在单(双)引号中的字符串或是按日期格式表示的日期和时间。
常用的SPSS 中的常量有三种,即数值型、字符型和日期型。
(1)数值型常量数值型常量就是程序在SPSS 语句中的数字。
一般使用两种书写方式。
一种是普通书写方式,如:23、34.8 等。
另一种是科学计数法,多用于表示特别大或特别小的数字。
如:1.23E18表示1.23×1018,2.35E-14 表示2.35×10-14等。
(2)字符串常量字符串常量是用单引号或双引号括起来的一串字符。
如果字符串中已经带有“’”,则该字符串常量必须使用双引号括起来。
例如“BOY'S BOOK”。
2.SPSS 的变量SPSS 中的变量有十个属性。
如图3-1 所示。
它们是:变量名(Name)、变量类型(Type)、变量长度(Width)、小数点的位数(Decimals)、变量名标签(Label)、变量值标签(Values)、缺失值(Missing)、列的显示宽度(Columns)、对齐方式(Align)、测量层次(Measure)。
要定义一个变量时,至少要定义变量名和变量类型。
其它属性可以定义也可以采用系统默认值。
在数据窗口中单击Variable View,进入变量窗口,即可对变量的类型、长度、小数点位数等进行定义。
图3-1 变量设置窗口(1)变量的命名在系统默认的情况下,SPSS 中的变量名由不多于8 个字符组成。
变量名的首字符必须是字母或汉字,后面的则可以是字符或数字。
但不能包含下列符号:“?”、“!”和“*”。
不能以下划线“-”和园点“.”作变量名的最后一个字符。
变量名不能与SPSS 的保留字相同。
SPSS第3次实验报告

过程:
H0:用该方法测量所得的结果与标准浓度值相同 H1:用该方法测量所得的结果与标准浓度值不同 使用 SPSS 得出下表
表中显示 N=11,均值为,标准差为;在检验值为,置信水平为的数值下的 t 统计量为,不在
(,)之内;P 值=<
所以拒绝 H0,暂时接受 H1
表3 单个样本统计量
N
均值
标准
差
均值的标 准误
分析:干预前后的数据可以当成是来自两个不同总体的配对样本,推断两个总体的 均值是否存在显着差异。
过程:
H0:干预前后该地区贫血儿童血红蛋白(%)平均水平有变化
H1:干预前后该地区贫血儿童血红蛋白(%)平均水平没有变化
结果:表所示为配对样本 T 检验分析的结果,干预前的均值为,标准差为,干预后 的均值为,标准差为,说明干预后该地区贫血儿童血红蛋白(%)平均水平有增长,且 波动幅度不大。
2. 步骤: 1) 提出零假设 2) 选择检验统计量 A. 当量总体方差未知且相等,即σ1=σ2 时,采用合并的方差作为 两个总体的方差估计,数学定义为:(t 统计量服从个自由度的 t 分布)
B. 当量总体方差未知且不相等,即σ1≠σ2 时,分别采用各自的 方差,此时两样本均值差的抽样分布的方差σ212 为:(t 统计量服从修正 自由度的 t 分布)
浓 11
度
.32186
t
浓 度
表4 单个样本检验 检验值 =
df
Sig.(
均值
双侧)
差值
.9836
10
.012
4
差分的 95% 置信区 间
下限
上限
.2665
(二) 独立样本 T 检验 1. 原理:
利用两个总体的独立样本,推断两个总体的均值是否存在显着差异。这个检验的前 提要求是:(1)独立。两组数据相互独立,互不相关;(2)正态,剂量组样本来自的总 体符合正态分布;(3)方差齐性。即两组方差相等。
SPSS 0903 第三次课 课前练习及复习

外部文件的获取练习1.读取全部数据的操作。
2.读取含变量名的部分数据的操作(A1:D30)。
3.读取不含变量名的部分数据的操作(A11:D30)。
冻结行或列练习在CCSS数据库中,冻结第一列Time 变量。
函数练习:绝对值、最大值和最小值函数的用法1.在09 social work 数据库中,计算卷面分数和最后总分的差值,将其存储为变量“差值”,利用绝对值函数将其转换为正差值,将其存储为变量“正差值”。
2.利用最大值函数,求出每一位同学中从第一题到第五题的最大值。
对变量的分组练习CCSS项目中的受访者年龄为18-64岁,将其分为18-34,35-54,55-64三组,年龄变量S3被重新赋值后将会保存为新变量TS3,其取值1、2、3分别代表上述3种情况。
指定数值的查找与计算练习1.生成新变量S3Old,用于标识出S3≥55的个案。
并计算出符合条件的个案的数量和百分比。
2.根据09 social work 数据库,生成新变量highscore,用于标识出最后总分≥70的个案。
并计算出符合条件的学生人数和百分比。
3.根据09 social work 数据库,生成新变量Fhighscore,用于标识出女生中最后总分≥70的个案。
排序个案练习1.将CCSS数据首先按照月份升序排列,月份相同再按照ID进行升序排列。
2.将CCSS数据首先按照月份升序排列,月份相同再按照ID进行降序排列。
提示:注意两变量选入的顺序。
注意两变量的升序和降序。
拆分文件练习在CCSS数据库中按月份拆分,并比较各组的S3年龄。
(对比选择右上部三个按钮时输出结果的不同)。
注意:分割文件的设定一旦完成,就将在之后的分析中一直有效,而且会被存储在数据集中,直到再次进行设定为止。
分类汇总练习在CCSS数据库中,按time月份和s0城市对CCSS案例数据中的变量index1进行均数汇总,并将结果输出到新数据文件Sum_index1中。
SPSS第9章课件

SPSS第9章
• 单独一所学校时的情况 • yi=α+β1standlrti+εi • 其中下标i代表第i个学生。在单独考虑这一
• 下面我们来观察更多的数据,图3.3是前10所学校各自的 回归线,从中我们可以看到除了截距以外,各回归线的斜 率间也不尽相同。也就是说,成绩在学校间的聚集性除了 表现为成绩的平均水平不同外,还表现在不同学校中成绩 的离散度上!斜率高的学校其16岁成绩离散度较高,斜率 低的则成绩比较集中。同上,模型将被继续扩展如下:
可见和普通的线型模型相比,混合线性模型主要 是对原先的随机误差进行了更加精细的分解。但 正因如此,该模型就可以正确估计并分析数据在 高水平单位内聚集的问题,同时可以为研究者提 供更加丰富的信息。
SPSS第9章
1.2 混合效应模型的用途
• 1.对固定效应参数进行更准确的估计
– 由于在模型的设置上就考虑到了数据的聚集性 问题,并采用了相应的迭代方法加以拟合,混 合效应模型可以获得回归系数的有效估计,并 且可以提供正确的标准误,从而假设检验的结 果也更加准确。
• 即我们可以准确的推断是哪些因素对应变 量的均数有影响,却无法分析是哪些因素 对应变量的变异程度有影响。这一问题现 在越来越受到重视,已成为统计理论的一 个重要发展方向。
SPSS第9章
混合效应模型
• 混合效应模型是八十年代初针对资料的层次结构而 发展起来的一类模型,它充分考虑到了数据聚集性 的问题,可以在数据存在聚集性的时候对影响因素 进行正确的估计和假设检验。
SPSS信度分析优质PPT课件

▪ 研究者透过信度与效度的检验,可以了解测量工具问卷本身是否 优良适当,以作为改善修正的根据,并可避免做出错误的判断。
▪ 另外,效度与信度的关系:信度为效度的必要而非充分条件。既 有效度一定又信度,但有信度不一定有效度。
检视信度的方法
信度
▪ 测验信度越高,表示测验结果越可信,但也无法期望两 次测验结果完全一致,信度除受测验质量影响外,亦受 很多其它受测者因素的影响,故没有一份测验是完全可 靠的。信度只是一种程度上大小的差别而已。一致性高 的问卷便是只同一群人接受性质相同题型相同目的相同 的各种问卷测量后,在各衡量结果间显示出强烈的正相 关。稳定性高的测量工具则是指一群人在不同时空下接 受同样的衡量工具时,结果的差异很小。
各题目平均数与变异数均同质时的最大概 率信度
术语
▪ 表3 Reliability Analysis模块的Statistics部分选项的参数及对应中文术语
关键字 F test Friedman Chi
Cochran Chi
Hotelling’s T Tukey’s Intraclass
功能
Hoyt信度系数 Friedman等级变异数分析及Kendall和 谐系数
将左边方格内的变项全选入右边items的方格内,在 左下角的Model框中选取Alpha后按statitis 键。
步骤二 按【Analyze】→【Scale】→【Reliability Analysis】
步骤三 出现下列对话框候选取下可以看到,第二个表,最后一列。其中对应于 num1的0.847表示,如果去掉问题一,那么其他思想的信 度为0.847.以此类推。
▪ 检视信度的方法有很多种,其中,最常用的是第四种 Cronbach α 系数,简介以下四种:
SPSS第3章

• ◇ Crosstabs过程
– 完成分类资料/等级资抖的统计描述和各种各样“常规”的统计检验, 常用的χ2检验也在其中完成
• ◇ Ratio过程
– 是SPSS 11.0版新增的方法,用于对两个连续性变量计算相对比指标, 它可以计算出一系列非常专业的相对比指标,其中的大多数还为我们 所不太熟悉。
Frequencies过程
• 2. Multiple Variables单选钮组:如果选择了两个以上变量 做频数表
– Compare variables可以将它们的结果在同一频数表过程输出结果 中显示,便于互相比较; – Organize output by variables则将结果在不同的频数表过程输出结 果中显示。
• 3. Suppress tables more than: 当频数表的分组大于下面设 定数值时禁止它在结果中输出,遮掩可以避免产生巨型表 格。
【Plots子对话框】
• 1. Boxplots单选框组:确定箱式图的绘制方式,可以是按 组别分组绘制(Factor levels together),也可以不分组一起 绘制(Dependents together),或者不绘制(None)。 • 2.Descriptive复选框组:可以选择绘制茎叶图(Stemand—leaf)和直方图(Histogram)。 • 3.Normality Plots with Test:绘制正态分布图,并进行 变量是否符合正态分布的检验。 • 4. Spread vs Level with Levene Test单选框组:该部分属 于高级分析功能,当选入分组变量时可用,其目的是判断 各组间的离散程度是否相同,并为此寻求一个比较合适的 变量变换方法,具体会输出分布——水平图,给出回归直 线斜率,并进行稳健的Levene方差齐性检验。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
小概率事件
衡量一个事件发生与否可能性的标准是概率大小,通常概率大 的事件容易发生,概率小的事件不容易发生。习惯上将发生 概率很小,如P<=0.05的事件称为小概率事件,表示在一 次实验或观察中该事件几乎不可能发生,因此,如果只进行 一次试验,可以视为不会发生。 这种认识是进行推断的出发点。关于这一点我们要有以下两个 方面的认识:一是这里的“几乎不可能发生”是针对“一次 试验”来说的,因为试验次数多了,该事件当然是很可能发 生的;二是当我们运用“小概率事件几乎不可能发生的原理” 进行推断时,我们也有5%的犯错误的可能。
方差和标准差
离均差 对于每个数据而言,其离散程度的大小就是和均数的 差值,简称离均差。 总体方差 用离均差平方和除以观察例数n。请大家尝试或依回 忆写出它的公式。 总体方差公式 样本方差公式 o^[(x-u)^/n 但是,方差在使用上存在不便,就是量纲不合常理,是原始指 标量纲的平方。(思考:量纲是指……;如何解决?)。
• 例2
上例中(n+1)恰好为4的倍数,所以确定四分数 较简单,如果(n+1)不为4的整数倍数,按上述分式计算 出来的四分位数位置就带有小数,这时,有关的四分位数就 应该是与该小数相邻的两个整数位置上的标志值的平均数, 权数的大小取决于两个整数位置距离的远近,距离越近,权 数越大,距离越远,权数越小,权数之和等于1。
中心极限定理
均值的抽样分布具有如下特征: (1)如果样本足够大(通常是指n不可少于30,最好是n大于等于100, 当然愈大愈好),则抽样分布接近正态分布。其特点是单峰和对称的。 (2)抽样分布的均值就是总体之均值,即如果将各个样本的均值加起来取 其平均,就会等于总体之均值。 (3)由于均值的抽样分布是正态分布,而其面积就是均值的次数,故任何 两值之间的样本均值次数所占的比例是可以知道的:在社会学中,下满 几项数值较为常用,有95%的样本均值在M±1.96(SE)这两个数值 的范围内,有99%的样本均值在M±2.58(SE)这两个数值的范围内。 上述抽样分布特征,在统计推论时有很大的意义。如果我们假设总体的均 值是M,然后用随机方法抽取一个样本来研究,则我们可以推测:这个 样本的均值在“M±1.96(SE)”两值之间的机会很大(即95%), 但在两值之外的机会就很小(只有5%),换言之,假如所计算出的样 本均值是在上述两值之外,那么我们便要怀疑原假设(即总体均值为M 的假设)的正确性了。
7.1.1 集中趋势的描述指标
在统计学中用于描述集中趋势,或者数据分布的中心 位置的统计量就被称为位置统计量(Location Statistic)。 1. 算术均数 (Arithmetic Mean) 2. 中位数 (Median) 3. 其他集中趋势描述指标 (1)截尾均数 (2)几何均数 (3)众数 (Mode) (4)调和均数
其它集中趋势描述指标 众数:众数指的是样本数据中出现频次最大的那个数,众数容 易理解,也不受极端值影响,但不易确定,且没有太明确的 统计特性,一般很少使用该指标。
7.1.2 离散趋势的描述指标
描述离散趋势的统计量称为尺度统计量(Scale Statistic), 常用的尺度统计量有全距、方差、标准差、四分位间距等。 全距(Range)又称为极差,它是一组数据中最大值与最小值 之差,是最简单的变异指标,但是过于简单,一般只用于预 备性检查。
标准误与标准差
标准差(SD),分析定距变量的离散情况,最常用的方法是 标准差(简写S),即将各数值(x)与其均值(x(-))之 差的平方和除以全部个案数目,然后取其平方根。公式中 x与x(-)的相差,就是表示均值作为代表值时会引起的偏 差或错误。如果各个实际数值与均值之相差的总和很大, 就表示变项数值的离散度很大,即均值的代表性很小。各 个x与的x(-)的差异,在未相加以前先变为平方值,可以 避免相加时的正反值相抵消。
是根据几率原则而成立的理论性分布,显示由同一总体中反 复不断抽取不同样本时,各个可能出现的样本统计值的分 布情况。 请大家举例说明。
抽样分布图示
原总体
样本1 样本2
样本n
n 统计量
x1
x2
新总体
x2
样本抽样分布 5
x
X
X
原总体分布 10
参数估计与假设检验
统计推论一般可以分为两类:参数估计与假 设检验。 参数估计,就是根据一个随机样本的统计值 来估计总体参数值,参数估计这类统计推论 方法是先看样本情况再看总体情况。 假设检验,是首先假设总体的情况是怎样的, 然后以一个随机样本的统计值来检验这个假 设是否正确。
–小概率事件在一次试验中 几乎不会发生 – 如果某事件在一次试验中
四分位间距即排除了两侧极端值的影响,又能够反映较多数据 的离散程度,是当方差、标准差不适用时较好的离散程度描 述指标。 四分位数求法见讲义p2。
• 四分位数求法 • 第一步 确定四分位数的位置 • 四分位数是将数列等分成四个部分的数,一个数列有三个四
•
分位数,设下四分位数、中位数和上四分位数分别为Q1、 Q2、Q3,则:Q1、Q2、Q3的位置可由下述公式确定: Q1的位置 (n+1)/4 ; Q2的位置 (n+1) /2; Q3的位置 3(n+1)/4(其中n表示资料的项数)
• 例如:某车间某月份的工人生产某产品的数量分别为13、13.5、13.8 • • • • • • • • •
、13.9、14、14.6、14.8、15、15.2、15.4公斤,则三个四分位数 的位置分别为: Q1的位置 (n+1)/4 =(10+1)/4=2.75 Q2的位置(n+1) /2=(10+1)/2=5.5 Q3的位置3(n+1)/4=3(10+1)/4=8.25 即变量数列中的第2.75项、第5.5项、第8.25项工人的某种产品产量分 别为下四分位数、中位数和上四分位数。 即: Q1=0.25×第二项+0.75×第三项 =0.25×13.5+0.75×13.8=13.73(公斤) Q2=0.5×第五项+0.5×第六项=0.5×14+0.5×14.6=14.3(公斤) Q3=0.75×第八项+0.25×第九项=0.75×15+0.25×15.2=15.05( 公斤) 在实际资料中,由于标志值序列中的相邻标志值往往是相同的,因而不 一定要通过计算才能得到有关的四分位数。
自由度
本堂课作业一: 自由度 对自由度的简要介绍:假定只有n=1个观 测值,我们仍然可以计算均值,但却无 法考虑分布的形状。例如,我们从足球 运动员中随机抽取了一名队员,他的身 高为179cm,那么我们可以用它来估计 队员的身高。但不可能知道队员身高分 布的情况,究竟是174cm-184cm,还 是176cm-182cm。只有超过1,我们 才能得到关于方差的信息。也就是说, 对于方差,我们实际上只有n-1个信息, 这就是计算方差时所用的那个除数。 习惯上称信息的个数为自由度。因此,我 们可以将上面的讨论归纳为:一个自由 度被均值所使用,余下的n-1个自由度 留给了方差。
总体参数与样本统计量
在一个总体中,均值和方差虽 然一般都是未知的,但它 们却是固定的常数,这些 常数叫做总体参数。 相反,样本均值是一个随机变 量,它随样本而变化,是 通过样本中的观测值计算 出来的,这些随机变量的 专门名称叫做样本统计量。
归纳法与演绎法
演绎法:由一般(总体)去推 证特殊(样本)。 归纳法:由特殊(样本)去推 证一般(总体)。
标准误与标准差
标准误(SE),抽样分布的标准差称为标准误。标准误是样 本均数的标准差,是描述均数抽样分布的离散程度及衡量 均数抽样误差大小的尺度,反映的是样本均数之间的变异。 标准误不是标准差,是多个样本平均数的标准差。标准误 用来衡量抽样误差。标准误越小,表明样本统计量与总体 参数的值越接近,样本对总体越有代表性,用样本统计量 推断总体参数的可靠度越大。因此,标准误是统计推断可 靠性的指标。
• 第二步 根据第一步所确定的四分位数的位置,确定其相应 的四分位数。 • 例1 例如:某车间某月份的工人生产某产品的数量分别
• • • •
为13、13.5、13.8、13.9、14、14.6、14.8、15、15.2 、15.4、15.7公斤,则三个四分位数的位置分别为: Q1的位置 (n+1)/4 =(11+1)/4=3 Q2的位置 (n+1) /2=(11+1)/2=6 Q3的位置 3(n+1)/4=3(11+1)/4=9 即变量数列中的第三个、第六个、第九个工人的某种产品产 量分别为下四分位数、中位数和上四分位数。即: Q1 = 13.8公斤、Q2 = 14.6公斤、Q3 = 15.2公斤。
Ⅰ(α =0)
II(α>0)
Ⅲ(α< 0)
• 峰度(Kurtosis) • 是用来描述变量取值分布
Ⅱ(β >0)
• •
形态陡缓程度的统计量, 是指分布图形的尖峭程度 。 画图练习:画出正态图、 比正态图陡峭的图和比正 态分布平坦的图。 峰度大样本小
Ⅰ(β =0)
Ⅲ (β <0)
统计基础知识复习
抽样分布
算术均数
总体均数用(
μ集中趋势描述指标,但是它不适用于对严重偏 态分布的变量进行描述。 思考:什么是严重偏态分布的变量?举例说明。
只有分布资料单峰和基本对称时使用均数作为集中趋势描述的 统计量才是合理的。
中位数
中位数是全体数据按大小顺序排列,在整个数列中处于中间位 置的那个值。 思考:09 social work 数据库中的“最后总分”变量,它的 中位置是多少?(72) 中位值将全部数值分成两部分,把它大和比它小的数值个数正 好相等,具体而言: (1)当n为奇数时,M=( ); 当n为偶数时,M=( )。 (2)由于中位数是位置平均数,因此不受极端值的影响,在 具有个别极大值或极小值的分布数列中,中位数比算术平均 数更具有代表性。 (3)由于中位数只考虑居中位置,对信息的利用不充分。因 此对于对称分布的资料,分析者会优先考虑使用均数,只有 当均数不能使用时采用中位数加以描述。