计量资料描述
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
计量资料的统计描述
描述性统计分析是进行统计分析的第一步,做好这一步是正确进行统计推断的先决条件。
计量资料常用的统计描述指标和方法主要有:
1、集中趋势指标(Central Tendency):包括均数、几何均数、中位数等。其中均数适用于正态分布和对称分布资料;几何均数适用于对数正态分布和呈等比的数据资料;中位数适合于所有分布类型的资料,但在实际中,中位数主要应用于偏态分布资料、分布不明资料和开口资料。
2、离散趋势指标(Dispersion):包括全距、四分位数间距、方差、标准差、变异系数、标准误等。方差、标准差用于正态分布资料,四分位数间距用于偏态分布资料,变异系数用于度量单位不同和均数相差悬殊的资料,标准误用于反映样本均数的离散程度,说明均数抽样误差大小。
SPSS的许多模块均可完成描述性统计分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:
Frequencies过程:产生频数表;按要求给出某百分位数。对计量资料、计数资料和等级资料的描述都适用
Descriptives过程:进行一般性的统计描述,用于服从正态分布的资
料,计算产生均数、标准差等;
Explore过程:用于对数据概况不清时的探索性分析;
Crosstabs过程:完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。
本次实习练习前3个过程:Frequencies过程,Descriptives过程,Explore过程。Crosstabs过程在X2检验实习讲述。
Frequencies过程
案例:
某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5。
4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71
5.69 4.12 4.56 4.37 5.39
6.30 5.21
7.22 5.54
3.93 5.21
4.12
5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89
6.25 5.32
4.50 4.63 3.61 4.44 4.43 4.25 4.03
5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16
5.10 5.86 4.79 5.34 4.24 4.32 4.77
6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60
4.09
5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18
6.14 3.24 4.90 3.05
一、建立数据文件
1、定义变量:在数据窗口,点击,定义一个变量,变量名(Name)“x”,类型(Type)“数值()8,小数位数(Decimals)2,变量标签(Label):“血清总胆固醇”。
(2)输入数据:
二、求最大值、最小值、全距(R),确定组距和组段
由于SPSS给出精细的频数分布表(列出每个观察值的频数),不能指定组距和组段,需要人工制定,故求出组距,确定组距和组段,对数据重新编码后在做频数分析
Analyze==>Descriptive Statistics==>Descriptives
在Variable(s)框选入血清总胆固醇(x),
Range旁边的复选框,
结果输出
资料的最大值是7.22,最小值是2.70,全距是4.52。则频数表的组距I=R/10=0.452,取0.5。第1组段的下限取2.7,最后一个组段是7.2~7.7,共分10个组段。
三、对原始数据进行分组
根据上述划分的组段,用Recode命令对数据进行分组。
操作方法:
Analyze==>Transform==>Recode==> Into Different Variables
在Numeric Variable -> Output 选入X ,在Output Vable 窗口的Nane对话框中填入X1(新变量名),在Label框中添入“血清总胆固醇分组”(对x1进行标签)。
在Old Value 框中,选择Range , 分别输入每个组段血清总胆固醇值的范围;在New Valuable 中,在Value 框中输入每个组段血清总胆固醇新的值(分别用1~10代表)。
运行后产生新的变量x1, 其值1—10,最好对x1的值定义标签,以便在统计分析的结果中明确1-10所对应的数值范围。
四、对原始数据(变量X)进行Frequencies过程分析
Analyze==>Descriptive Statistics==>Frequencies
Variables框:选入X
单击Statistics钮:
选中Mean、Std.deviation、Median复选框
单击Percentiles:输入2.5:单击Add:输入97.5:单击Add:
单击Continue钮
单击Charts钮:
选中Histograms (绘制直方图,若选择了 With normal curve 则输出带有正态曲线的直方图)
单击Continue钮
单击OK
得出结果后手工计算出CV。
结果如下: