计量资料统计描述
SPSS软件操作-计量资料统计描述

Valid Missing
5 25 50 75 95
119 0
4.6521 4.8000 .79786
.637 -.713 .222 -.377 .440 3.1000 4.1000 4.8000 5.3000 5.7000
• 用加权法计算表⒉1(频数表)数据的均数
VAR00001 Valid N (listwise)
Total N
36
Geometric Mean
53.8174
a. Limited to first 100 cases.
• 计算中位数、P25、P75
St at ist ics
组中值 N
Median Percentiles
Valid Missing
25 75
10 0 11.0000 5.5000 16.5000
Valid
108.00 112.00 114.00 116.00 118.00 120.00 122.00 124.00 126.00 128.00 130.00 132.00 Total
计量资料的统计描述

分 层 抽 样
整 群 抽 样
样
7
概率抽样、非概率抽样
• 概率抽样:每个对象被抽中的概率是已知/可计算的,其样本统计量是参数估计 和计算误差的基础;
• 等概率抽样:随机抽样 • 不等概率抽样:多单位被抽取的概率不同,可能会得到更有效的估计量 • 非概率抽样:抽样概率未知/无法计算,按主观、有目的、为方便进行抽样; • 不能计算抽样误差,或一般按简单随机抽样计算误差。配额抽样、滚雪球/识别
计量资料的统计描述
1
统计学中的几个基本概念
1、同质与变异 2、总体与样本 3、普查与抽样 4、参数与误差 5、频率与概率(小概率事件)
2
1. 同 质 与 变 异
• 同质(homogeneity)
指事物某方面的性质、影响条件或背景相同或相 近
• 变异(variation)
同质个体间的差异。来源于一些未加控制或无法控制的甚至不明原因的因素。 是统计学存在的基础。
M
X
8+X
2
8+1 2
2 (X 4+X5)2 (14+15)2 14.5(天)
42
百分位数
• 将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为PX。 中位数是百分位的特殊形式P50 。同样还有四分位数、十分位数等。
TG
31
第二节 计量资料的常用统计指标
一、集中趋势的描述-平均值
平均值是一组数据典型或有代表性的值。由于这样典型 的值趋向于落在根据数据大小排列的数据的波峰位置, 因此可以用于度量集中位置。
常用几种平均值:
1.算术均数 2.几何均数 3.中位数
32
1.算术均数(均数)
• 意义:一组性质相同的观察值在数量上的平均水平。 • 表示: (总体) X(样本) • 计算:直接法、频数表法 • 特征: ∑(X- X)=0 • 注意:应用于正态分布或近似正态分布,才能求均数,
计量资料的统计描述

1︰ 2 1︰4 1︰8 1︰16 1︰32 1︰64 1︰128
2 11 18 36 22 8 3
2 4 8 16 32 64 128
0.3010 0.6021 0.9031 1.2041 1.5051 1.8062 2.1072
0.6020 6.6231 16.2558 43.3476 33.1122 14.4496 6.3216
含义 离散趋势是指计量资料所有观察值偏离中
心位置的程度,反映一组同质变量值相互之间参
差不齐的程度,即离散度或变异度。
常用指标 全距、方差、标准差、变异系数。
1、全距(range, R)
又称极差,是一组变量值中最大值与最小值的差。
优点 缺点
计算简单 仅考虑了资料的最大值和最小值,不能反映
组内其它数据的变异程度。
是其它许多统计方法的理论基础
标准正态分布
(standard normal distribution)
正态分布是一个分布簇,对应于不同参数其位置和形状均 不相同,为应用方便,可进行变量转换:
u
X
式中的u值称为标准正态变量,其频数曲线图即为标准正
态分布( u分布),一般的正态分布N(μ,σ2)即转化为标准正态 分布N(0,1)。其面积分布可直接查表。
是一个度量相对离散程度的指标。
例1: 身高 体重
CV = 4.95/166.06× 100% = 2.98% CV = 4.96/53.72 × 100% = 9.23%
例2:新生儿 CV = 3/50 × 100%= 6%
几种重要的连续性随机变量分布:
正态分布 标准正态分布X75%统
第一单元 计量资料的统计描述

第一单元计量资料的统计描述【习题】分析计算题1.1 某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素锌(Zn)的含量(μg/g),资料如下:40 87 105 113 121 127 133 142 152 168 21554 88 105 113 121 127 134 143 153 173 22061 92 106 113 122 127 135 143 153 17674 94 107 114 124 128 136 143 155 17777 94 107 116 124 128 137 145 156 18080 95 109 117 124 128 138 147 156 18281 96 109 119 125 130 138 147 163 18382 97 111 119 125 130 138 149 163 18683 102 112 120 126 131 140 151 166 18885 105 112 120 126 132 141 151 168 195(1) 编制频数表并绘制直方图,简述频数分布类型和频数分布特征。
(2) 计算适当的集中趋势指标和离散程度指标。
1.2 某医院神经科用火焰原子吸收光谱法测定了102名男性脑卒中患者头发中微量元素铜(Cu)的含量(μg/g),资料如表1,求男性脑卒中患者头发中微量元素铜的平均含量。
表1 102名男性脑卒中患者头发中微量元素铜(Cu)的含量/(μg·g-1)频数表头发中铜的对数值频数f0.350 0~ 10.450 0~ 20.550 0~ 40.650 0~ 30.750 0~180.850 0~360.950 0~221.050 0~ 61.150 0~ 31.250 0~ 31.350 0~1.450 0 4合计1021.3 某年某地一次伤寒暴发潜伏期的分布情况如表2,计算该年伤寒暴发的平均潜伏期。
计量资料的统计学方法

计量资料的统计学方法
首先,计量资料的统计学方法包括描述统计和推断统计。
描述
统计用于总结和展示数据的特征,包括均值、中位数、标准差、频
数分布等。
这些统计量可以帮助我们了解数据的集中趋势、离散程
度和分布形态。
推断统计则用于从样本数据中推断总体的特征,包
括参数估计和假设检验。
参数估计可以帮助我们对总体参数(如均值、比例)进行估计,而假设检验则可以帮助我们对总体参数的假
设进行检验。
其次,计量资料的统计学方法还包括回归分析和方差分析。
回
归分析用于研究自变量和因变量之间的关系,可以帮助我们预测因
变量的取值。
常见的回归分析包括简单线性回归和多元线性回归。
方差分析则用于比较多个总体均值是否相等,可以帮助我们判断不
同组别之间的差异是否显著。
此外,计量资料的统计学方法还包括相关分析和时间序列分析。
相关分析用于研究两个变量之间的相关关系,可以帮助我们了解它
们之间的相关性强弱和方向。
时间序列分析则用于研究时间序列数
据的特征和规律,包括趋势、季节性和周期性等,可以帮助我们进
行未来的预测和规划。
综上所述,计量资料的统计学方法涵盖了描述统计、推断统计、回归分析、方差分析、相关分析和时间序列分析等多个方面,可以
帮助我们全面深入地理解和解释数据的特征和规律。
在实际应用中,研究者可以根据具体问题的特点和要求选择合适的统计方法进行分
析和解释。
计量资料的统计描述讲义

• 平均数反映同类现象的一般水平,是总体内 各单位参差不齐的标志值的代表值,也是对 变量分布集中趋势的测定。
常用的平均数有均数、几何均数、中 位数、众数等。
(一)均数(mean,average)
算术平均数(arithmetic mean),或称为 算术均数,简称为均数,是最重要的平 均数。
由频数表可看出频数分布的两个重要特
征:集中趋势(central tendency)和离 散程度(dispersion)。例如本例,身高有
高有矮,但中等身高居多,此为集中趋 势;由中等身高到较矮或较高的频数分 布逐渐减少,反映了离散程度。
对于数值变量资料,可从集中趋势 和离散程度两个侧面去分析其规律 性。
以例2.1说明其编制方法。
1.求全距(range)
2.定组段和组距: 3.列出频数表
二 频数表的特征
•三、频数表的用途
例2.1 某地1998年抽样调查了100名18岁男大 学生的身高(cm)资料如下,试编制频数表 。
某地1998年100名18岁男大学生的身高(cm)
173.6 165.8 168.7 173.6 173.7 177.8 180.3 173.1 173.0 172.6 173.6 175.3 178.4 181.5 170.5 176.4 170.8 171.8 180.7 170.7 173.8 164.4 170.0 175.0 177.7 171.4 162.9 179.0 174.9 178.3 174.5 174.3 170.4 173.2 174.5 173.7 173.4 173.9 172.9 177.9 168.3 175.0 172.1 166.9 172.7 172.2 168.0 172.7 172.3 175.2 171.9 168.6 167.6 169.1 166.8 172.0 168.4 166.2 172.8 166.1 173.5 168.6 172.4 175.7 178.8 169.1 175.5 170.8 171.7 164.6 171.2 177.1 170.7 173.6 167.2 170.7 174.7 171.8 167.3 174.8 168.5 178.7 177.3 165.9 174.0 170.2 169.5 172.1 178.2 170.9 171.3 176.1 169.7 177.9 171.1 179.3 183.5 168.5 175.5 175.9
医学统计学计量资料的统计描述
百分位数(percentile)
• 百分位数(percentile)
X%
PX
(100-X)%
• 中位数是第50百分位数,用P50表示。 • 第25,第75,第95百分位数记为P25, P75, P95是统计学上常用
• 在医学研究中有一类比较特殊的资料,如抗体滴 度、血清凝集效价和某些物质浓度,其数据特点 是观察值间呈倍数关系变化。
• 应用几何均数时要注意观察值中不能有0或负数, 否侧在做对数变换之前需要加一常数。
• 同一组观察值的几何均数一般小于它的算术均数。
中位数(median)
• 将一组观察值按从小到大顺序排列,为此 居中的数值即为中位数,用M来表示
• 意义:平均偏差越大,变异越大 • 特点:很直观,但用了绝对值,在应用中受到限
制
方差(variance)
• 定义:离均差平方和的均数
• 计算公式:总体方差用2表示,
样本方差用S2表示,公式
s甲2
(168 162)2 (142 162)2 (188 162)2 4 1
(150 162)2
318.667
14506
例 计算120名7岁男孩 身高的均数
算术均数的应用
• 算术均数适用于对称分布的资料 • 算术均数用到了每个原始观察值,所以敏
感度好 • 在偏态较大的情况下,算出的均值易受频
数分布两端极大或极小值的影响,不能较 好地反映分布的集中位置和平均水平
几何均数(Geometric mean)
• 可用于描述一组资料数据经对数转换后呈 现为对数分布或正态分布的变量值的平均 水平;
第二讲计量资料的统计描述
几何均数( mean) 几何均数(geometric mean)
G = n X1X2 LXn 1 ∑lg X lgG = (lg X1 + lg X2 +L+ lg Xn ) = n n lg X 1 ∑ 几何均数: 几何均数:变量 G = lg n 对数值的算术均 对数值的算术均 lg 表 以 为 的 数 数的反对数。 示 10 底 对 ; 的反对数。
2×57.5 + 5×60.5 +L+1×84.5 9311 X= = = 71.62(次 分) 2 + 5 +L+1 130
2、应用
适用于对称分布, 均数适用于对称分布,特别 是正态分布资料。 是正态分布资料。
几何均数( mean) 二、 几何均数(geometric mean) 可用于反映一组经对数 可用于反映一组经对数 转换后呈对称分布或正态分 转换后呈对称分布或正态分 布的变量值在数量上的平均 水平。 水平。
130名健康成年男子脉搏 名健康成年男子脉搏( 表2-1 130名健康成年男子脉搏(次/分)的频数分布表
脉搏组段 (1) 56~ 59~ 62~ 65~ 68 68~ 71~ 74~ 77~ 80~ 83~85 合 计 频数, f (3) 频率(%) (4)= (3)/N 累积频数 (5)=(3)↓ 累积频率 (6)=(5)/N
是否为对称分布?
50 45 40 35 30 25 20 15 10 5 0 2.45 3.05 3.65 4.25 4.85 5.45 6.10
频 数
变量
(2)偏态分布 : )
1)正偏态分布(右偏态分布):右侧的组段数多于 )正偏态分布(右偏态分布):右侧的组段数多于 ): 左侧的组段数,频数向右侧拖尾。 左侧的组段数,频数向右侧拖尾。
计量资料的统计描述
i=R/10=150.1/10=15.01≈15(umol/L)
• 第一组段应包括全部观察值中的最小值 • 最末组段应包括全部观察值中的最大值,并且同时 写出其下限与上限。 • 各组段的起点和终点分别称为下限和上限,某组段 的组中值为该组段的(下限+下一组段下限)/2。
1、频数表(frequency table)的编制
362.60 364.20 368.70 372.50 405.90 329.80 327.60 316.60 388.20 376.20 371.00 348.50 387.50 405.60 337.50 289.20 352.70 359.70 367.10 352.60 399.80 362.70 357.80 395.80 348.90 355.80 388.40 387.50 346.80 342.30 349.60 308.90 329.40 338.50 285.90 338.10 378.20 335.60 316.30 312.00 329.40 358.90 348.70 344.60 413.60 406.60 366.70 392.40 309.60 298.40 352.70 300.20 316.90 346.10 341.10 338.70 313.60 289.40 401.60 321.10 308.60 348.70 357.60 387.60 362.50 328.80 298.30 366.80 333.60 332.70 278.60 371.00 402.60 338.70 366.20 334.60 320.40 347.00 392.70 338.70 332.70 357.10 419.50 392.10 357.50 334.00 324.00 318.30 355.90 379.40 328.60 387.40 308.90 313.50 428.70 401.00 341.60 329.40 378.50 414.90 352.00 336.80 288.80 282.60 323.20 362.70 329.60 291.30 298.40 367.00 339.80 369.10 313.60 349.80 338.50 349.40 354.90 358.80 369.80 322.60 368.10 354.60 329.70 408.70 345.60 409.40 311.40 366.80 289.40 341.90 398.70 319.70 304.60 324.60 382.10 332.40 331.40 361.80 389.80 401.60 387.40 376.30 387.20 366.20 344.60 338.70 322.60 357.50 392.00 319.70
计量资料的统计描述
• 变量、变量值
三种基本类型:
计量资料, 计数资料, 等级资 料
*按变量值性质——定量资料和定性资料。
编辑ppt
18
计量资料的统计描述
编辑ppt
19
主要内容
• 频数表与频数图 • 计量资料的常用统计指标
(集中趋势 离散趋势) 正态分布 • 正常值范围估计
编辑ppt
20
第一节 频数表与频数图
原始计量资料
16
小结
1. 统计工作的基本步骤是什么? 2. 统计资料分为几类? 特点?
判断:大学教授的年收入,欧洲的国 家数,血红蛋白含量,患者的资料情况。 3. 什么是总体? 什么是样本? 4. 基本的概率抽样方法是什么? 5. 什么是抽样误差? 如何减小? 能否 避免?
编辑ppt
17
前讲回顾
统计资料的类型
特点:具有累加性、方向性、可避免性
(2).随机误差:由于一些非人为的偶然因素使得结 果或大或小,是不确定、不可预知的。
特点:无方向性、不能避免。
编辑ppt
13
A、 随机测量误差
在消除了系统误差的前提下,由于 非人为的偶然因素,对于同一样本多次测定 结果不完全一样,结果有时偏大有时偏小, 没有倾向性,这种误差叫随机测量误差。
计量资料的统计描述
编辑ppt
1
统计学中的几个基本概念
1、同质与变异 2、总体与样本 3、普查与抽样 4、参数与误差 5、频率与概率(小概率事件)
编辑ppt
2
1. 同 质 与 变 异
• 同质(homogeneity)
指事物某方面的性质、影响条件或背景相同或相 近
• 变异(variation)
同质个体间的差异。来源于一些未加控制 或无法控制的甚至不明原因的因素பைடு நூலகம்是统 计学存在的基础。