计量资料描述

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

计量资料的统计描述

描述性统计分析是进行统计分析的第一步,做好这一步是正确进行统计推断的先决条件。

计量资料常用的统计描述指标和方法主要有:

1、集中趋势指标(Central Tendency):包括均数、几何均数、中位数等。其中均数适用于正态分布和对称分布资料;几何均数适用于对数正态分布和呈等比的数据资料;中位数适合于所有分布类型的资料,但在实际中,中位数主要应用于偏态分布资料、分布不明资料和开口资料。

2、离散趋势指标(Dispersion):包括全距、四分位数间距、方差、标准差、变异系数、标准误等。方差、标准差用于正态分布资料,四分位数间距用于偏态分布资料,变异系数用于度量单位不同和均数相差悬殊的资料,标准误用于反映样本均数的离散程度,说明均数抽样误差大小。

SPSS的许多模块均可完成描述性统计分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:

Frequencies过程:产生频数表;按要求给出某百分位数。对计量资料、计数资料和等级资料的描述都适用

Descriptives过程:进行一般性的统计描述,用于服从正态分布的资

料,计算产生均数、标准差等;

Explore过程:用于对数据概况不清时的探索性分析;

Crosstabs过程:完成计数资料和等级资料的统计描述和一般的统计检验,我们常用的X2检验也在其中完成。

本次实习练习前3个过程:Frequencies过程,Descriptives过程,Explore过程。Crosstabs过程在X2检验实习讲述。

Frequencies过程

案例:

某地101例健康男子血清总胆固醇值测定结果如下,请绘制频数表、直方图,计算均数、标准差、变异系数CV、中位数M、p2.5和p97.5。

4.77 3.37 6.14 3.95 3.56 4.23 4.31 4.71

5.69 4.12 4.56 4.37 5.39

6.30 5.21

7.22 5.54

3.93 5.21

4.12

5.18 5.77 4.79 5.12 5.20 5.10 4.70 4.74 3.50 4.69 4.38 4.89

6.25 5.32

4.50 4.63 3.61 4.44 4.43 4.25 4.03

5.85 4.09 3.35 4.08 4.79 5.30 4.97 3.18 3.97 5.16

5.10 5.86 4.79 5.34 4.24 4.32 4.77

6.36 6.38 4.88 5.55 3.04 4.55 3.35 4.87 4.17 5.85 5.16 5.09 4.52 4.38 4.31 4.58 5.72 6.55 4.76 4.61 4.17 4.03 4.47 3.40 3.91 2.70 4.60

4.09

5.96 5.48 4.40 4.55 5.38 3.89 4.60 4.47 3.64 4.34 5.18

6.14 3.24 4.90 3.05

一、建立数据文件

1、定义变量:在数据窗口,点击,定义一个变量,变量名(Name)“x”,类型(Type)“数值()8,小数位数(Decimals)2,变量标签(Label):“血清总胆固醇”。

(2)输入数据:

二、求最大值、最小值、全距(R),确定组距和组段

由于SPSS给出精细的频数分布表(列出每个观察值的频数),不能指定组距和组段,需要人工制定,故求出组距,确定组距和组段,对数据重新编码后在做频数分析

Analyze==>Descriptive Statistics==>Descriptives

在Variable(s)框选入血清总胆固醇(x),

Range旁边的复选框,

结果输出

资料的最大值是7.22,最小值是2.70,全距是4.52。则频数表的组距I=R/10=0.452,取0.5。第1组段的下限取2.7,最后一个组段是7.2~7.7,共分10个组段。

三、对原始数据进行分组

根据上述划分的组段,用Recode命令对数据进行分组。

操作方法:

Analyze==>Transform==>Recode==> Into Different Variables

在Numeric Variable -> Output 选入X ,在Output Vable 窗口的Nane对话框中填入X1(新变量名),在Label框中添入“血清总胆固醇分组”(对x1进行标签)。

在Old Value 框中,选择Range , 分别输入每个组段血清总胆固醇值的范围;在New Valuable 中,在Value 框中输入每个组段血清总胆固醇新的值(分别用1~10代表)。

运行后产生新的变量x1, 其值1—10,最好对x1的值定义标签,以便在统计分析的结果中明确1-10所对应的数值范围。

四、对原始数据(变量X)进行Frequencies过程分析

Analyze==>Descriptive Statistics==>Frequencies

Variables框:选入X

单击Statistics钮:

选中Mean、Std.deviation、Median复选框

单击Percentiles:输入2.5:单击Add:输入97.5:单击Add:

单击Continue钮

单击Charts钮:

选中Histograms (绘制直方图,若选择了 With normal curve 则输出带有正态曲线的直方图)

单击Continue钮

单击OK

得出结果后手工计算出CV。

结果如下:

相关文档
最新文档