经典:医学统计学---第二章--个体变异与变量分布
医学统计学复习重点

整理分析和2.计描述4.(集合)。
1.抽样随机2.分组随机3.实验顺序随机。
称全距,用离散系数,为标准差与均数只比,常:CV=s/x究,1.抽样研究2.个体变异。
系统误差:指数据搜集和测量过程中由于仪器不准确、造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差由于一些非人真实性(validity):观察值与真值的接近程度,受系统误差的影响( (reliabiliy)——也称精密度(precision)或重复性(repeatability)是直接用样本统计量作为对应的总体参数最常用的是95%10095有5在描述两变量间的关系时,若散点图呈直线趋势或有直线相关关系,可进行直线回归分析。
参数:根根据样本的分布特征而计算得到的1、★医学统计学工作基本步骤:统计设计;收集资料.;整理资料;分析资料2、★统计分析包括:统计描述、统计推断3、频数分布的两个重要特征:集中趋势和离散趋势4、正态分布的两个参数:均数;标准差。
5、★频数表的用途:揭示计量资料的分布类型;揭示计量资料的分布特征;便于发现特大值和特小值;便于进一步进行统计分析★常见的统计资料的类型有:计量资料;计数资料;等级资料7、★t检验的应用条件是:①正态分布:当样本含量较小时,要求样本来自正态总体。
②方差齐性:两样本均数比较时,要求两总体方差相等。
U检验的应用条件是:①大样本(如n>50);②小样本,σ已知且样本来自正态总体。
8、★.描述分类变量常用的指标有率、构成比、相对数。
9、率是指某种现象在一定条件下,实际发生的观察单位数与可能发生该现象的总观察单位数之比,常用来描述某种现象发生的频率大小或强度构成比是指一事物内部某一组成部分的观察单位数与该事物各组成部分的观察单位总数之比,常用来描述某一事物内部各组成部分所占的比重或分布。
10、★四格表卡方专用公式应用条件n≥40,且Tmin≥5 研究事物或现象间的线性关系用相关分析,研究事物或现象间的线性数量依存关系用回归分析。
医学统计学 第二章 个体变异与变量分布

个体变异(individual variation) • 是同质观察对象间表现出的差异。 • 变异是生物体在一种或多种、已知或未知的不可控因素作用下所产生的综合反映。 • 就个体而言:变异是随机的(random)。 • 就总体而言:个体变异是有规律的。
个体变异是统计学应用的前提 个体变异
(一)算术均数(arithmetic mean)简称均数(mean) 1 .适用条件:单峰对称分布、正态分布的资料 2 .计算公式: ①小样本:
xx n
加权系数
xww 1x 1w 2x 2...w nx nwi 0, wi 1
例:某门功课的成绩:平时占 0.2 ,期中占 0.3,期末占 0.5 则平均成绩为:
百分位数
0
Px
M
100%
百分位数是一个位置指标,以 PX 表示。 一个百分位数将全部观察值分为两部分: x%的变量值小于 PX ;( 100 -x )%的变量值大于 PX 。 有 10 人的发汞值(umol/Kg) 1.1, 1.8, 3.5, 4.2, 4.8, 5.6, 5.9, 7.1, 10.5,16.3
f i
n
有 25 份血清的抗体效价分别为
抗体效价 1:10 , 1:20 , 1:40 , 1:80 , 1:160 ,
人数 2
5
8
7
3
G l g 1 ( filx g i) l g 1 (2 l1 g 5 0 l2 g 8 0 l4 g 7 0 l8 g 3 0 l1 g)6
n
25
4.7 4 所以,这 25 份血清的平均效价是 1:44.7 。
X = f1x1 f2 x2 ... fk xk n
医学统计学课后习题答案解析

医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
医学统计学定量资料的统计描述和变量分布

滴度 1∶8 1∶16 1∶32 1∶64 1∶128
人数 17 15
11 3
0
G lg 117 lg 8 15 lg16 11 lg 32 3 lg 64
46
=lg-1 1.2041
=16.0
46例正常人血清的HBsAg滴度的几何均数为1:16
2.几何均数应用的注意事项: 1)几何均数常用于等比级数资料或资料 呈倍数关系或对数正态分布资料。 2)观察值中不能有0。 3)观察值中不能同时有正值和负值。
第二节 定量资料的统计描述和变量分布
定量资料的 统计描述
统计图表:频数分布表(图)
集中趋势指标 统计指标:
离散趋势指标
利用统计表对数据进行概括,用统计图对分布形态 及分布间的关系做直观的表达,用于描述定量资料的统 计指标的意义与计算。
一、定量变量的频数分布
(一)连续型定量变量频数表的编制:
频数(frequency):指对一个随机变量做重复观察, 其中某变量值出现的次数。
取整数为0.5 mmol·L-1
(3) 划组段:
下限:每个组段的起点(最小值)
上限:每个组段的终点(近似最大值)
注:①第一个组段的起点数据必须为小于或等于最小值的整数
②最后一个组段应同时写出上限和下限来。
(4) 绘制整理表 “下限≤x<上限”
注:各组段的频数之和应等于总的观察例数。
表4-2-1 某地101例30~49岁骨科病人血清总胆固醇值划记表
例4-2-8 50例咽峡炎患者的潜伏期如下,求M,P25, P75,P2.5,P97.5。
表4-2-3 50例咽峡炎患者潜伏期的M和Px的计算
潜伏期(小时) (1) 12~ 24~ 36~ 48~ 60~ 72~ 84~ 96~
医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。
医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。
总体包括有限总体和无限总体。
样本:从总体中随机抽取的部分观察单位,其实测值的集合。
获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。
资料的类型计量资料、计数资料和等级资料。
误差包括随机误差、系统误差和非系统误差。
抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。
概率:是描述随机事件发生可能性大小的一个度量。
取值范围0≤P ≤1。
小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。
P ≤0.05或P ≤0.01。
医学统计学的步骤:设计、收集资料、整理资料和分析资料。
统计分析包括:统计描述和统计推断。
统计推断包括:参数估计和假设检验。
第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。
对称分布:集中位置在中间,左右两侧頻数基本对称。
偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。
(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。
计量资料集中趋势包括算术均数、几何均数和中位数。
算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。
中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。
医学统计学第1-2章(2015)

3. 方差(variance , 2 , S2)和标准差 (standard deviation , S)
2 X 2
N
S2
2
XX
n1
总体方差
样 本 方 差
37
4.标准差:
X 2
N
总 体 标 准 差
标准差或方差越大,说明个体差异越大,则均数的 代表性越差。
•应用: 对称分布,尤其是正态分布
7
101-
10
104-
18
107-
25
110-
21
113-
15
116-
15
119-
7
122-125
1
合计
120
19
115名正常成年女子的血清转氨酶 (mmol/L)含量分布
血清转氨酶含量
人数
12-
2
15-
9
18-
14
21-
23
24-
19
27-
14
30-
11
33-
9
36-
7
39-
4
42-45
3
20
第二节 集中趋势的描述——平均数
66.67
7
25
32
21.88
62
40
102
60.78
6
分组 血栓组 正常组 合计
表 3. 9 正常妇女和血栓形成者的血型分布
A型
B型
AB 型 O 型
合计
32
8
10
9
59
51
19
12
70
152
83
27
22
预防医学-医考讲义-第二单元 医学统计学方法

第二单元医学统计学方法一、基本概念和基本步骤(一)统计学中的几个基本概念1.总体的类型总体:是根据研究目的而确定的同质的研究对象的集合。
分为有限总体和无限总体。
样本:是指从总体中随机抽取的有代表性的一部分观察单位的集合。
2.同质和变异同质:指被研究指标的影响因素完全相同。
是科学研究的基础,是相对的。
变异:是同质基础上的个体差异。
是绝对的。
统计的任务就是在同质分组的基础上,通过对个体变异的研究,透过偶然现象,反映同质事物的本质特征和规律。
统计数据具有变异的特征。
3.变量和变量值变量:观察对象的特征。
变量分为定量变量、定性变量、有序数据。
变量值:对变量观察或测量的结果。
4.参数和统计量参数:总体的统计指标。
μ,π,σ统计量:样本的统计指标。
,p,s【例如】研究北京2012年正常成年男性的血压值。
研究对象观察单位变量变量值同质变异有限总体总体参数样本统计量5.误差误差:观察值与实际值的差别称为误差。
误差包括抽样误差和非抽样误差。
抽样误差:由于个体变异的存在,在抽样研究中产生的样本统计量与相应的总体参数间的差异。
非抽样误差包括过失误差和系统误差。
6.概率概率:随机事件发生可能性大小的度量。
常用P表示,P值范围在0~1之间。
小概率事件:P<0.05为小概率。
统计学认为小概率事件在一次试验中不大可能发生。
(二)统计学工作基本步骤1.统计设计。
2.数据整理。
3.统计描述。
4.统计推断。
二、定量资料的统计描述描述统计是通过图表或统计指标,对数据资料进行整理、分析,并对数据的分布状态、数字特征进行估计和描述的方法。
(一)集中趋势指标1.算数均数μ,适用于正态分布或近似正态分布资料。
2.几何均数(G)适用于对数正态分布或等比资料。
3.中位数(M)与百分位数(P)中位数:是一组由小到大按顺序排列的观察值中位次居中的数值,用M表示。
百分位数(P X):是把一组数据从小到大排列,分成100等份,各等份含1%的观察值,分割界限上的数值就是百分位数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一组段下限≤ Xmin 最后一组上限 >Xmax
( 4)划记:计算频数、频率 2.分布图
1997 年某市 120 名 12 岁男童的身高 (cm) 频数分布
组段
124~
频数
1
频率
0.0083
划记
128~ 132~
2
0.0167
10
0.0833
正正
136~
22
0.1834
分布类型
对称分布 正偏态(右) 负偏态(左)
幻灯片 1
三、定量资料的统计指标
集中位置的描述 离散趋势的描述
平均数(集中位置描述)
是描述一组变量值的集中趋势或平均水平的统计指 标。是一组变量值的集中水平的代表值。
正正正正
140~
37
0.3083
正正正正正正正
144~
26
0.2167
正正正正正
148~
15
0.1250
正正正正正
152~
4
0.0333
156~
2
0.0167
160~164
1
0.0083
合计
120
1.0000
上一张幻灯片
40 人 数
30
20
10
0 124 132 140 148 156 164 身高(cm)
个体变异是统计学应用的前提
个体变异 抽样误差 统计推断
幻灯片 1
(一)定量资料的频数分布
例: 某市 1997 年 12 岁男童 120 人的身高 (cm) 资料
142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 134.5 134.4 148.8 137.9 151.3 140.8 149.8 145.2 141.8 146.8 150.3 133.1 142.7 143.9 151.1 144.0 145.4 146.2 143.3 141.9 140.7 141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 134.7 138.1 140.2 137.4 145.1 145.8 147.9 150.8 144.5 137.1 142.9 134.9 143.6 142.3 125.9 132.7 152.9 147.9 141.8 140.9 141.4 160.9 154.2 137.9 139.9 149.7 147.5 136.9 134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 129.4 141.2 148.9 154.0 147.7 152.3 146.6 132.1 145.9 146.7 135.5 144.4 143.4 137.4 143.6 150.0 143.3 146.5 149.0 140.2 145.4 142.4 148.9 146.7 139.2 139.6 142.4 138.7
第二章 个体变异与变量分布
一、个体变异 二、频数分布 三、定量资料的统计指标 四、定性资料与等级资料的统计指标
个体变异(individual variation)
• 是同质观察对象间表现出的差异。
• 变异是生物体在一种或多种、已知或未知的不
可控因素作用下所产生的综合反映。 • 就个体而言:变异是随机的(random)。 • 就总体而言:个体变异是有规律的。
某市 120 名 12 岁男童身高的频数分布
70
60
人
50
数
40
30
20
10
0 1 3 5 7 9 11 13 15 17 19 21
发汞含量( mg/kg) 239 人发汞含量的频数分布
400 人 数 300
200
100
0 0 10 20 30 40 50 60 70 80 90 100 自评分
148.8 135.1 156.3 143.8 147.3 147.1 141.4 148.1 142.5 144.0 142.1 139.9
1.频数分布表的制作步骤 ( 1)计算极差( R )
R= Xmax – Xmin=160.9-125.9=35 ( cm )
( 2)确定组数、组距:
组数: 8 ~ 12 组距:i= R/ 组数 =35 / 10 =3.5 ≈ 4 ( cm )
(三)数据的分布类型
对称分布:
正偏态(右)
➢分布的对称 非对称分布(偏态分布) 负偏态(左)
对称分布:频数以中间最多,两侧逐渐减少,基本对称
右偏态(正偏态):高峰在左侧,尾部拖在右侧
左偏态(负偏态):高峰在右侧,尾部拖在左侧
单峰分布: ➢峰的多少
双峰或多峰分布:
40 人 数
30
20
10
0 124 132 140 148 156 164 身高(cm)
某市 120 名 12 岁男童身高的频数分布
(二)定性资料及等级资料的频数分布
定性资料的整理:根据指标的自然属性归类,计数频数 等级资料的整理:根据指标的不同等级归类,计数频数
507 名傣族人血型的频数分布
血型
频数
频率(%)
O A B AB
合计
205
40.43
112
22.09
150
29.59
40
7.89
某城市 892 名老年人生存质量自评分的频数分布
40
人
30
数
20
10
0 0 5 10 15 20 25 30 35 40 45
生存时间 (月) 102 名黑色素瘤患者的生存时间频数分布
4000
人 数 3000
2000
1000
0 0 10 20 30 40 50 60 70 80
死亡年龄 (岁) 某地某年 10000 例死亡者年龄分布
例:某医院探讨不同期次矽肺的胸部平片肺门密度变化, 资料如下表,问矽肺患者肺门密度的增加与矽肺期次有无 关系?
矽肺期次
Ⅰ Ⅱ Ⅲ 合计
肺门密度级别
+
++
++
43
188
14
1
96
72
6
17
55
50
301
141
合计
245 169 78 492
频数分布表和频数分布图的用途
•描述分布类型 •描述分布的特征 •便于发现特大、特小的可疑值 •便于计算有关指标、统计分析与处理
50者吸烟情况
男性
组别 吸烟 不吸烟
女性
合计 吸烟 不吸烟
肺癌 647
2
41
19
709
对照 622
27
28
32
709
合计 1269
29
69
51 1418
此表是Doll和Hill于1948年至1952年间采用回顾性配对调 查方法研究了吸烟与肺癌的关系 得到的资料(此表分类方法是 交叉分类)