定量资料的统计描述概述

合集下载

(精选)定量资料统计描述

(精选)定量资料统计描述
当数据分布对称时,理论上中位数等于算术均数,当数 据经对数转换后分布对称时,理论上中位数等于几何均数。
因此,中位数可用于任何分布的定量资料。 但对于能用算术均数或几何均数描述集中趋势的资料, 应尽量使用算术均数或几何均数。
24
百分位数常用于确定医范围指特定健康人群的解剖、生理、 生化等指标的波动范围。
56.5 58.5
3. 频数分布表的用途 1) 揭示资料的分布类型 2) 反映频数分布的两个重要特征
集中趋势(Central tendency) 离散趋势(Tendency of dispersion)
9
3) 利于发现某些特大或特小的可疑值 4) 便于进一步进行统计分析
10
4. 频数分布图 以观测变量为横轴,频数(或频率)为纵轴
累计频数等于该组段及前面各组段的频数 之和;累计频率等于累计频数除以总例数。 累计频率描述了累计频数在总例数中所占比 重。
6
2. 频数分布的类型
① 对称分布:集中位置在正中,左右两侧大体对称。
② 偏态分布:集中位置偏向一侧,频数分布不对称。
正偏态分布
负偏态分布
频数分布类型不同,统计描述的方法不同。
适用于原始数据分布不对称,但经对数转换后对 称分布的资料;或各观察值之间呈倍数变化(等比关 系)的资料。
Gn X1X2Xn
Glg1(
lgX )
n
18
当资料中有相同观察值时,也可用加权 法计算几何均数
Glg1(
f lgX )
n
19
几何均数的应用 ① 常用于对数正态分布资料或等比资料:
如抗体平均滴度和平均效价、卫生事业 平均发展速度、人口几何增长的资料等。 ② 观察值不能有 0,不等同时有正有负。

研究生统计学讲义第2讲第3章定量资料的统计描述

研究生统计学讲义第2讲第3章定量资料的统计描述
左边μ=100,σ=10,X<90 右边μ=0,σ=1,u<-1.0,注 意刻度不同
现在我们把 X 转换为标准正态变量,因为μ=100, σ=10,所以
u X 90 100 1.0
10
因此90分能够用平均值下的1个标准差表示,见图 右图
P (X < 90)=P ( u <-1.0 )
附表3从u=0.00到u=4.99以增量0.01编成标准正态分布 的CDF表,沿着表的左边按所给u的一个小数找到u ,再从表的顶端找到u的第二位小数,在表内主要部
x2=78.6g/L时,u2 = (78.6-73.8)/3.9=1.23
2.查标准正态曲线下面积表(附表3):u= -0.46时 ,在表的左侧找到-0.4,在表的上方找到0.06,二者相 交处为0.3228,标准正态曲线下,横轴上u值小于- 0.46的面积为Ф(-0.46)= P(U<-0.46)=32.28%,即标 准正态变量u值小于-0.46的概率为32.28%;同样查 得u=1.23时,标准正态曲线下,横轴上u值小于1.23的 面积为Ф(1.23) =P(U<1.23)= 0.8907,即u值小于1.23的 概率为89.07% 。
图3.16左边μ=100,σ=10,X≥125 右边μ=0,σ=1, u≥2.5,注意刻度不同
只有0.62%的得分将是125或更高.
补例2 假设女高血压患者舒张压大约集中在100mmHg
,标准差是16mmHg ,血压是正态分布.求:
1.P (X<90) 2.P (X>124) 3.P (96<X<104) 4.求
2.中位数M (Median)
中位数M是排序观察值的中间值.当一组数据按照 从小到大的顺序排列起来时,值的深度d=(n+1)/2, 是它相对于极端值(末端)所在的位置.它不是由全 部观察值综合计算出来的,而是由居中位置的观察值 所决定,因此它不受个别特小或特大的观察值的影响 ,应用范围较广。

定量资料数据的统计描述

定量资料数据的统计描述

f lg X lg f
1
X1,X2…Xn 为各组段的滴度或滴度倒数。 f1,f2…fn分别为各组段的频数。
例2-6 52例慢性迁延性肝炎患者的HBsAg滴度 数据见表2-4,求其平均滴度。
2 1.20412 7 1.50515 ... 7 2.7027 G lg 1 52 lg 1 108.06977/ 52 lg 2.7017 119.74705
①两端的组段应分别包含最小值或 步骤: 最大值; (1) 求全距:(极差) R=29.64-7.42=22.22 ②尽量取较整齐的数值作为组段的 端点,便于对数据进行表述; (2) 定组段数与组距 : 8~15个组段,组距i=全距/组段数 ③组距以相等为宜。 (3) 划组段:以一个稍小于或等于最小值的整数作为第一个
理的各种因素在个体之间都不会完全相同,即个体间存在差
异,因此导致某地18-35岁健康男性居民血清铁含量不会完全 相同,而是呈现或大或小的离散趋势。
一、描述集中趋势的统计指标
平均数:描述一组同质计量资料的集中趋势;反映一组观察值 的平均水平。 常用的平均数有算术均数,几何均数和中位数。 (一)算术均数(mean):简称均数,总体均数用希腊字母µ 表
四、频数分布的类型
对称分布型:指集中位置在正中,左右 两侧频数分布大体对称。
偏态分布型:指集中位置偏向一侧,频数 分布不对称。 正偏态分布:集中位置偏向数值小的一侧。
偏态分布型
频数分布
负偏态分布:集中位置偏向数值大的一侧。
频数表的用途
1. 揭示频数分布的分布特征和分布类型。文献中常 将频数表作为陈述资料的形式。
图中横轴为血清铁含量,纵轴为频率密度,直条面 积等于相应组段的频率。

定量资料的统计描述

定量资料的统计描述

•定量资料的统计分析定量资料的统计描述主要内容•频数分布表•集中趋势指标•离散趋势指标•频数/频率分布表(frequency distribution table•频数:将定量资料的变量值进行分组,则某组段所包含的变量值的个数称为频数,以f表示。

频率是频数在总例数中所占的百分比。

•频数表(频率表):表示各组段及它们对应的频数(频率)的表格称为频数表或频数分布表。

频数分布表格•编制频数表的步骤1.求全距(R)。

R=最大值-最小值=84.3-64.3=20(g/L)2.确定组数和组距。

频数表一般设8-15组。

各组段的起点和终点分别称为下限和上限。

组距为相邻两组段的下限差。

组距i=R/组数≈R/10.本例w=20/10=2(g/L)3.确定组段值。

原始数据表第一组段应包含最小值,最末组段应包含最大值并写出其下限和上限值。

4.列出频数表。

采用划记法或计算机汇总。

•编制频数表的意义:•⑴由频数表可以看出频数分布的两个重要特征:集中趋势和离散趋势。

•⑵可以根据频数分布的不同类型,选择适当的统计方法,进行计算与分析。

频数分布的两个特征:①集中趋势(central tendency):变量值集中位置。

②离散(/中)趋势(tendency of dispersion):变量值围绕集中位置的分布情况。

离“中心”位置越远,频数越小;且围绕“中心”左右对称。

频数分布的类型:对称分布例题直方图偏态分布(集中位置偏向小的一侧叫正偏态,偏向大的一侧叫负偏态)。

偏态分布图示频数表的用途:1. 揭示资料的分布特征和分布类型2. 发现特大值和特小值3. 由组中值近似代表原始数据,便于手工计算集中趋势指标与离散趋势指标。

•集中趋势指标•平均数(average)•描述一组性质相同的观察值的集中趋势、中心位置或平均水平的指标•平均数是一组数据典型或有代表性的值。

•常用平均数的种类有:•算术均数•几何均数•中位数• 众数*• 调和均数*• 一、算术均数(arithmetic mean )1.适用资料:算术均数简称为均数(mean ),适用于正态分布或近似正态分布资料。

定量资料的统计描述

定量资料的统计描述

例:求下表中血清铁含量的5%、 95%位数
从表2-2可判断出5%位于“10~”这个 组段:
px = L +
i n( x%
fx
f
)
L
= 10 + 21(20×5% 4 =)10.67
6
该组血清铁资料的5%位数为10.67 (μmol/L)。
从表2-2可判断出95%位于“24~”这 个组段:
px = L +
n为奇数时: M = X n + 1
2
n为偶数时:M =
1 2
X
+
n 2
X n+ 1 2
式中X*表示将n例数据按升序排列 后的第i个数据。
上式中n为一组观察值的总个数,
n +1
n
n +1
2
2
2
均为下标,表示有序数列中观察值 的位次。
例:某药厂观察9只小鼠口服高山红 景天醇提物(RSAE)后在乏氧条件 下的生存时间(分钟)如下:
一般设10~15个组段,每个组段的 起点称“下限”,终点称“上限”;第 一组段含最小值,最末组段含最 大值。
(4) 列表
频数分布的类型:
对称分布—集中位置在正中、左右 两侧频数分布大体对称
偏态分布
正偏峰分布-集中位 置偏向数值小的一侧
负偏峰分布-集中位 置偏向数值大的一侧
定量变量的特征数
= 119.75
52例慢性肝炎患者的HBsAg滴度 的平均水平为1:119.75。
3. 中位数(median, M)
将一组观察值从小到大按顺序排 列,位次居中的观察值就称中位数。 用M表示。
中位数适用于任何一种分布的定量 资料,一般多用于描述偏态分布或 数据一端无界资料的集中趋势。

定量资料的统计描述

定量资料的统计描述
定量资料的统计描述
LOREM IPSUM DOLOR
主要内容
频数分布 集中趋势 离散趋势
被平均
中国人公共假期每年已有115天; 中国全国家庭平均住房面积116.4㎡; 北京平均月薪9227元; 中国男性平均身高174.2厘米; 中国人平均生育1.18个孩子; 中国家庭资产平均为121.69万元,城市家庭平均为
( kg )原始 数据如下, 试编制频数
表。
25.2 34.9 34.3 38.1 41.3 27.8 33.8 37.7 28.4 33.5 47.3 34.8 30.5 36.2 51.0 38.0 43.8 40.9 37.5 36.6 33.4 47.4 36.4 41.4 36.5 42.5 33.7 29.3 39.6 37.5 39.6 33.2 32.1 29.9 43.7 33.8 35.1 37.8 32.4 38.5 28.2 36.5 23.4 35.8 34.1 27.6 42.6 23.1 37.1 44.0 35.6 44.5 46.5 35.0 31.8 36.4 36.2 47.9 38.7 20.5 37.1 29.2 38.2 41.1 36.2 43.5 32.8 36.3 31.8 30.6 38.5 39.6 28.7 33.7 35.1 42.9 20.1 35.4 26.5 42.0 39.6 38.7 35.4 51.2 31.4 34.1 25.3 29.6 38.2 43.7 33.8 24.5 29.2 45.9 32.5 23.5 36.8 27.2 34.0 34.7 44.4 41.2 35.3 42.6 34.1 30.0 31.4 40.8 27.3 48.6 35.8 29.7 45.6 41.8 33.0 28.3 33.3 35.1 40.6 38.2 37.6 25.5 37.3 37.5 41.5 38.4 44.2 43.2 31.5 40.2 34.5 37.4

定量资料的统计描述

定量资料的统计描述


x i
i 1
N

2
N
S
x X
n i 1 i
2
n 1
xi xi i 1 i 1 n 1
n 2 n
2
n
步骤如下:
R=160.8-129.4=31.4。
组段数=10;组距=R/10=3.14≈30(cm);按要
求确定每一组段上下限。
分组统计每一组段的频数,编制频数表。
计量资料频数分布表
118 例 13 岁女孩身高(cm)资料频数表。 身高组段 (1) 129~ 132~ 135~ 138~ 141~ 144~ 147~ 150~ 153~ 156~ 159~162 合计 频数 (2) 2 2 8 20 26 25 20 9 3 2 1 118 组中值 (3) 130.5 133.5 136.5 139.5 142.5 145.5 148.5 151.5 154.5 157.5 160.5 —
3、方差(variance) 离均差平方和的算术平均数,即为方差。总体方差用 符号σ2(σ读seigama)表示,样本方差用S2表示。计算公 式分别为:
2
x
i 1
N
i

2
N
S2
x X
n i 1 i
2
n 1
4、标准差(standard deviation) 方差的平方根即为标准差。总体标准差用σ表示, 样本标准差用S表示。计算公式分别为:
集中趋势:指频数表中频数分布表现为频数向某一位置集中的趋势 分布特征 离散趋势:指频数虽然向某一位置集中,但频数分布表现为各组段都 有频数分布,而不是所有频数分布在集中位置的趋势。

定量资料的统计描述

定量资料的统计描述

编制频数分布表的步骤
第一组段包括最小值,最后 一组段包括最大值,除最后 一组段可同时标出上下限, 其他组段只标出下限。
一般 8- 15 之间 求出极差 确定组段数 确定组距
列出各个组段
确定每一组段频数 选 根据变量值大小 把各观察单位归 入各个组段
极差即最大值 与最小值之差
组距=R/组段数, 但一般取一方便 计算的数字
常用的平均数有: 算术平均数(均数)(mean) 几何平均数(geometric mean)
中位数 (median)与百分位数(percentile)
众数(mode)
一、算术平均数
算术平均数:简称均数(mean)
可用于反映一组呈对称分布的变量值
在数量上的平均水平或者说是集中位置
的指标值。
1、算术平均数的计算方法
M X 9 1 X 5 15
2
பைடு நூலகம்
如果只调查了8家外企,则
2 14 15 2 14.5 M X X 8 8 1 2 2
频数分布表资料的中位数
M 所在组段下限值 (n 50% 至该下限值的累计频数) 组距 所在组段下限值至上限值间的频数 (n 50% f L ) M L i fm
i , fm
下限值L
中位数M
上限值U
例1 频数表中位数的计算
N=∑f
中位数=71+3x[(130x50%-59)/26]=71.69
2、中位数的应用
各种分布类型的资料
特别适合大样本偏态分布资料或者 分布末端无确切数值的资料。
第二节 描述集中趋势的统计指标
统计上使用平均数(average)这一指标体系来描述 一组变量值或观察值的集中位置或平均水平。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一节 频数分布表与频数分布图

频数
frequency

频数分布 frequency distribution 频数分布表 frequency distribution table

2
2018/11/19 8
2
2018/11/19 9
2
2018/11/19 10
频数:对一个随机事件进行重复观察,某变量值
2
2018/11/19 18
频数与频数分布
数据如下:
7.42 20.38 8.65 23.02 8.40 17.32 21.61 21.31 29.64 19.69 24.13 21.53 21.46 9.97 22.73 14.94 20.18 21.62 23.07 21.69 23.90 17.45 19.08 20.52 24.14 23.77 11.09 18.89 18.26 23.29 17.67 15.38 18.61 18.36 23.04 24.22
2
2018/11/19 2
研究总体
随机
样本
抽样
统计描述
统计表
统计推断
参数估计 假设检验
统计图
统计指标
2
2018/11/19 3
统计图 统计描述 统计分析 统计推断 假设检验 统计表 统计指标 离散趋势 参数估计 集中趋势
2
2018/11/19 4
第二章 定量资料的统计描述
教学目的
掌握 描述定量资料的集中趋势、离散趋势的
仔细观察原始数据后回答:
1) 2) 3)
此资料为样本信息还是总体信息?指标?同质?变异?
变量类型? 数据类型?
4)
如何从纷繁复杂的数据中发现规律?
2
13
2018/11/19
离散型定量变量的频数分布
表2-1 1998年某地96名妇女产前检查次数分布
检查次数
(1 ) 0
频数
(2) 4
频率(%)
(3) 4.2
2
16
2018/11/19
离散型ቤተ መጻሕፍቲ ባይዱ量资料的频数分布
例2-1(教材11页),仔细观察图2-1然后回答问题:
1) 频数分布图(直条图)如何绘制的?
2) 从直条图中可得到哪些分布信息?
3) 比较直条图与其的频数分布表
2
2018/11/19 17
连续型定量变量的频数分布
例2-2 抽样调查某地120名18岁~35岁健康男性居 民血清铁含量(μmol/L)。
1) 2) 3)
原始数据怎样编制成频数分布表的? 从频数分布表中得到哪些分布规律或信息? 如何估计产前检查的平均次数?
小结:离散型定量资料的频数分布表的编制
2
15
2018/11/19
离散型定量变量的频数分布
频 率 25 (%)
20 15 10 5 0 0 1 2 3 4 5 >5 30
产前检查次数 图2-1 某地96名妇女产前检查次率分布
17.98 20.13 21.00 14.56 19.89 19.82 17.48
26.02 11.34 13.81 10.25 15.94 15.83 18.54 18.46 20.87 17.51 13.12 11.75 17.40 21.36 19.38 23.11 12.67 23.02 24.36 25.61 19.53 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.65 16.32 20.75 22.11 13.17 17.55 19.26 19.22 16.72 27.90 11.74 24.66 14.18 16.52
正常
正常 正常 异常 正常 异常 正常

+ + ++ ++ ++ +++
3
2 1 5 6 3 2
工人
职员 农民 工人 工人 干部 干部
9
31

1.62
O
正常

3
军人
2
1
2018/11/19
变量类型 定量 quantitative (说明数量特征) 计量资料 连续型变量 continuous variable 离散型变量 discrete variable 定性 qualitative(说明类别) 计数资料 分类变量 categorical variable (或名义变量 nominative variable) 有序变量 ordinal variable 等级资料
资料辨认
病例号 1 年龄 35 性别 女 身高 1.65 血型 A 心电图 正常 尿WBC -
产前检 查次数
0
职业 教师
2
3 4 5 6 7 8
44
26 25 41 45 50 28

男 女 男 女 女 男
1.74
1.80 1.61 1.71 1.58 1.60 1.76
B
O AB A B O AB
出现的次数称频数。 若将变量值分组,则某组段包含的变量值个 数称为频数。 频数分布表:将各变量值及相应的频数列成表格
称为频数分布表,简称频数表。
2
11
2018/11/19
2
2018/11/19 12
离散型定量变量的频数分布
例2-1 1998年某山区96名孕妇产前检查次数资 料如下:0,3,2,0,1,5,6,3,2,4,1,0, 6,5,1,3,3,…,4,7等共96个数值
指标的计算、意义和适用条件.
熟悉
了解
定量资料频数表的编制及用途;
百分位数的计算、描述分布形态的指标
第二章 定量资料的统计描述

频数分布表与频数分布图 描述集中趋势的统计指标


描述离散趋势的统计指标
描述分布形态的统计指标
统计内容的报告与中英文表达
案例讨论 电脑实验 小结
2
7
2018/11/19
14.27 17.40 22.55
14.89 18.37 19.50 24.52 19.26 26.13 17.14 13.77 12.50 14.77 14.37 24.75 21.75 19.47 15.51 12.65 18.48 19.83
17.55 16.10
17.08 18.12 16.99 18.89 20.40 20.30 12.73 17.25 10.86 27.81 23.12 19.22
累计人数
(4) 4
累计频率(%)
(5 ) 4.2
1
2 3
7
11 13
7.3
11.5 13.5
11
22 35
11.5
22.9 36.5
4
5 >5
26
23 12
27.1
24.0 12.5
61
84 96
63.5
87.5 100.0
合计
96
100
2
14
2018/11/19
离散型定量变量的频数分布
例2-1(教材11页),仔细观察表2-1然后回答问题:
相关文档
最新文档