第1-2章 绪论、计量资料统计描述
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学课后习题答案

医学统计学课后习题答案 Revised by Jack on December 14,2020医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%5. %6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显着性水准、、 ()11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同答:相同点,均表示计量资料集中趋势的指标。
医学统计学重点概要

第一章 绪论总体:根据研究目的确定的同质的所有观察单位某种变量值的集合。
总体包括有限总体和无限总体。
样本:从总体中随机抽取的部分观察单位,其实测值的集合。
获取样本仅仅是手段,通过样本信息来推断总体特性才是研究的目的。
资料的类型计量资料、计数资料和等级资料。
误差包括随机误差、系统误差和非系统误差。
抽样误差:由抽样造成的样本统计量和总体参数之间的差异或者是各个样本统计量之间的差异称为抽样误差。
概率:是描述随机事件发生可能性大小的一个度量。
取值范围0≤P ≤1。
小概率事件:表示在一次实验或观察中该事件发生的可能性很小,可以认为很可能不发生。
P ≤0.05或P ≤0.01。
医学统计学的步骤:设计、收集资料、整理资料和分析资料。
统计分析包括:统计描述和统计推断。
统计推断包括:参数估计和假设检验。
第二章计量资料的统计描述频数表和频数分布图的用途:(1)描述频数分布的类型,以便选择相应的统计指标和分析方法。
对称分布:集中位置在中间,左右两侧頻数基本对称。
偏态分布:正、负偏态分布正偏态集中位置偏向值小一侧,负偏态反之。
(2)描述頻数分布的特征;(3)便于发现资料中的可疑值;(4)便于进一步计算统计指标和进行统计分析。
计量资料集中趋势包括算术均数、几何均数和中位数。
算术均数:直接法(样本小):n x x ∑=;頻数表法(样本大)x =nfx ∑ 几何均数:直接法:)lg (lg 1n x G ∑-=;頻数表法)lg (lg )lg (lg 11n x f fx f G ∑∑∑--==(常用于等比资料或对数正态分布资料)中位数:直接法:n 为奇数2/)1(+=n x M ,n 为偶数2/)(12/2/++=n n x x M ;頻数表法:∑-⨯+=)%50(L M M f n f iL M 。
中位数的应用注意事项:可用于各种分布资料,不受极端值的影响,主要用于(1)偏态分布资料(2)端点无确切值的资料(3)分布不明确的资料。
医学统计学第1-2章(2015)

3. 方差(variance , 2 , S2)和标准差 (standard deviation , S)
2 X 2
N
S2
2
XX
n1
总体方差
样 本 方 差
37
4.标准差:
X 2
N
总 体 标 准 差
标准差或方差越大,说明个体差异越大,则均数的 代表性越差。
•应用: 对称分布,尤其是正态分布
7
101-
10
104-
18
107-
25
110-
21
113-
15
116-
15
119-
7
122-125
1
合计
120
19
115名正常成年女子的血清转氨酶 (mmol/L)含量分布
血清转氨酶含量
人数
12-
2
15-
9
18-
14
21-
23
24-
19
27-
14
30-
11
33-
9
36-
7
39-
4
42-45
3
20
第二节 集中趋势的描述——平均数
66.67
7
25
32
21.88
62
40
102
60.78
6
分组 血栓组 正常组 合计
表 3. 9 正常妇女和血栓形成者的血型分布
A型
B型
AB 型 O 型
合计
32
8
10
9
59
51
19
12
70
152
83
27
22
《医学统计学》第1-2章

常用平均数的意义及其应用场合
平均数
意义
应用场合
均数 平均数量水平
几何均数 平均增减倍数
中位数 位次居中的观 察值水平
应用甚广,最适用于对称分布, 特别是正态分布
①等比资料;②对数正态分布 资料
①偏态资料;②分布不明资料; ③分布一端或两端出现不确定 值
22
1. 均数 (mean):
, X
应用:正态分布或近似正态分布的定量资料。
女 B 14.67 37.8
疗效
显效 有效 有效 无效
男B
16.80
37.6 无效
标识变量
用于数据管理
分析变量-表示试验效应或观察结果大小的
分组变量
变量或指标
反应变量
5
处理 复方哌唑嗪 复方降压片 安慰剂
合计
表 3.8 三种药物治疗高血压的疗效
有效
无效
合计
有效率(%)
35
5
40
87.50
20
10
30
15
定量资料的频数表和频数图(直方图)
表2.2 某市120名5岁女孩 身高频数表
组段(cm)
频数(f)
95-
1
98-
7
101-
10
104-
18
107-
25
110-
21
113-
15
116-
15
119-
7
122-125
1
合计
120
图2.1 某市城区120名5岁女孩身高频数分布
16
1、 频数分布的特征
如何选用正确的统计指标描述一个定量 资料?
14
第一节 频数分布
医学统计学PPT课件

验结果,每次都有如此好的吻合. 的概率约10万分之4。 6
绪论 Introduction
讲授内容:
一、医学统计学的意义
二、统计学中的几个基本概念
三、统计资料的类型
四、医学统计工作的基本步骤
五、学习医学统计学应注意的问题
.
7
一、医学统计学的意义
• 1.统计学(statistics):应用数学的原理与 方法,研究数据的搜集、整理与分析的科 学,对不确定性数据作出科学的推断。
例如:某药治疗高血压患者30名
样本含量(n)为30
.
21
二、统计学中的几个基本概念
• 4、参数(parameter)和统计量(statistic)
• (1)参数(parameter):根据总体个体 值统 计计算出来的描述总体的特征量。
• 一般用希腊字母表示
• (2)、统计量(statistic):根据样本个体值统 计计算出来的描述样本的特征量。
(120.2cm,118.6cm,121.8cm,…)
研究某人群性别构成 变量值:男、女。
.
15
二、统计学中的几个基本概念
• 2、同质(homogeneity)和变异 (variation)
• (1)、同质(homogeneity):根据研究 目的给研究单位确定的相同性质。
• 研究长沙市2004年7岁 男孩身高的正常值范围?
.
27
二、统计学中的几个基本概念
• (3)、抽样误差(sampling error):由 于抽样所造成的样本统计量与总体参数 的差别。
• 例如:=120.0cm
n=100
•
N=5万 → X =118.6cm
• 特点:1)不可避免性
(完整版)医学统计学复习要点
(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。
②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。
③、等级资料,⼜称半定量资料或者有序分类变量。
为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。
2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。
②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。
③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。
④、样本(sample):指的是从总体中随机抽取的部分观察单位。
⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。
⑥、频率(frequency):指的是样本的实际发⽣率。
⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。
⽤⼤写的P表⽰。
3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。
第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。
统计学与研究方法试题答案
统计学与研究方法试题答案第一章绪论1单选题1、总体是指()A.全部研究对象B.全部研究对象中抽取的一份C.全部样本D.全部研究指标E.全部同质研究对象的某个变量的值2、统计学中所说的样本是指()A.随意抽取的总体中任意部分B.有意识的选择总体中的典型部分C.依照研究者要求选取总体中有意义的一部分D.依照随机原则抽取总体中有代表性的一部分E.有目的的选择总体中的典型部分3、下列资料属等级资料的是()A.白细胞计数B.住院天数C.门急诊就诊人数D.病人的病情分类E.ABO血型分类4、为了估计某年华北地区家庭医疗费用的平均支出,从华北地区的5个城市随机抽样调查了1500户家庭,他们的平均年医疗费用支出是997元,标准差是391元。
该研究中研究者感兴趣的总体是()A.华北地区1500户家庭B.华北地区的5个城市C.华北地区1500户家庭的年医疗费用D.华北地区所有家庭的年医疗费用E.全国所有家庭的年医疗费用5、欲了解研究人群中原发性高血压病(EH)的患病情况,某研究者调查了1043人,获得了文化程度、高血压家族史、月人均收入、吸烟、饮酒、打鼾、脉压差、心率等指标信息。
则构成计数资料的指标有()A.文化程度、高血压家族史吸烟、饮酒、打鼾B.月人均收入、脉压差、心率C.文化程度、高血压家族史、、打鼾D.吸烟、饮酒E.高血压家族史、饮酒、打鼾第二章计量资料统计描述及计数资料统计描述1、描述一组偏态分布资料的变异度,以()指标较好。
A.全距B.标准差C.变异系数D.四分位数间距E.方差2、用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3、各观察值均加(或减)同一数后()。
A.均数不变B.几何均数不变C.中位数不变D.标准差不变E.变异系数不变4、比较某地1~2岁和5~5.5岁儿童身高的变异程度。
宜用()。
A.极差B.四分位数间距C.方差D.变异系数E.标准差5、偏态分布宜用()描述其分布的集中趋势。
计量资料的统计描述
4.66 4.28 3.83 4.20 5.24 4.02 4.33 3.76 4.81 4.17 3.96 3.27
4.61 4.26 3.96 4.23 3.76 4.01 4.29 3.67 3.39 4.12 4.27 3.61
4.98 4.24 3.83 4.20 3.71 4.03 4.34 4.69 3.62 4.18 4.26 4.36
M
x
n
2
x
n
2
1
2
4
百分位数(percentile)
0%
PX
M 即50%分位数就是中位数
100%
27
1.直接计算法
28
例2-9 对某医院细菌性痢疾治愈者的住院天数统计, 119名患者的住院天数从小到大的排列如下, 试求第5百分位数和第99百分位数
患 者 1 2 3 4 5 6 7 8 116 117 118 119 住院天数 1 1 2 2 2 3 4 4 39 40 40 42
3.77 4.20 4.36 3.07 4.89 3.97 4.28 3.64 4.66 4.04 4.55 4.25
4.63 3.91 4.41 3.52 5.03 4.01 4.30 4.19 4.75 4.14 4.57 4.26
4.56 3.79 3.89 4.21 4.95 3.98 4.29 3.67 4.69 4.12 4.56 4.26
第一篇 基本统计方法
1
第二章 计量资料的统计描述
Descriptions of Measurement Data
2
Chapt 2
Frequency distribution
Description of central tendency
计量资料的统计描述(研究生) PPT课件
第二章计量资料的统计描述计量资料的统计描述频数表与频数分布集中趋势(算术均数、几何均数、中位数)离散趋势(极差、四分位间距、方差、标准差、变异系数)福建医科大学流行病与卫生统计一、频数表与频数分布(frequency table and frequency distribution) 福建医科大学流行病与卫生统计(一)连续型计量资料的频数表1、频数表的制作步骤2、频数分布表的作用例2-1 从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果如下,试编制频数分布表。
2.35 4.213.32 5.354.17 4.13 2.78 4.26 3.58 4.34 4.84 4.41 4.78 3.95 3.92 3.58 3.66 4.28 3.26 3.5 2.7 4.61 4.75 2.913.914.59 4.19 2.68 4.52 4.91 3.18 3.68 4.83 3.87 3.95 3.914.15 4.55 4.8 3.41 4.12 3.955.08 4.53 3.92 3.58 5.35 3.843.60 3.514.06 3.07 3.55 4.23 3.57 4.83 3.52 3.84 4.5 3.964.50 3.27 4.52 3.19 4.59 3.75 3.98 4.13 4.26 3.63 3.875.713.304.73 4.175.13 3.78 4.57 3.8 3.93 3.78 3.99 4.48 4.284.065.26 5.25 3.98 5.03 3.51 3.86 3.02 3.7 4.33 3.29 3.25 4.15 4.36 4.95 3.00 3.26频数表的编制步骤(1)求全距(range):即最大值与最小值之差,又称为极差。
本例全距:R=(5.71-2.35)cm=3.36cm(2)划分组段组数:组段常取10~15组为方便计,组距参考极差的十分之一, 再略加调整。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计学(medical statistics)温州医学院环境与公共卫生学院叶晓蕾学习要求1、掌握常见的统计分析方法的适用范围和注意事项,了解其分析思想,能熟练运用统计学知识解决科研工作中一些常见的统计学问题。
2、能针对资料的特点,选用恰当、高效的统计分析方法,并且能比较熟练运用统计软件(如SPSS等)对数据进行统计分析,从而得到可靠的结果和科学的结论。
3、学会在收集、整理、分析统计资料过程中提出系统解决方案的能力。
理论教学内容(共32学时)学时数1绪论、计量资料统计描述42总体均数的估计与假设检验43多个样本均数比较的方差分析44多因素试验的方差分析、重复测量设计的方差分析45计数资料的统计描述、X2检验4 6秩和检验、双变量回归与相关4 7多元线性回归、Logistic回归4 8生存分析、统计总结4第一章绪论一、什么叫统计学?运用概率论和数理统计原理研究(随机)事物或现象的群体数量特征,从而揭示其内在规律的一门学科。
是正确认识世界的一种重要手段。
统计学的地位统计学——是一门方法学生物医学实验室研究临床研究流行病学研究寻求统计学家的合作公共卫生管理……美国国立卫生研究院(NIH)的基金申请要求合作者有统计学家,并必须有统计设计与分析的内容。
根据对国内外公开发表的医药卫生论文中的统计错误调查:粗略估计,70%左右的文章有统计学错误,其中70%的错误出现在基本的统计学方法,30%的错误出现在高级的、复杂的统计学方法。
论文中的统计学错误是学习统计学极好的反面教材二、统计资料的类型●按每一观察对象变量的多少分:单变量资料双变量资料多变量资料●按变量值的性质分:计量资料计数资料等级资料●按变量值的分布特征分:正态分布资料偏态分布资料表100例高血压患者治疗后临床记录患者年龄性别治疗组舒张压体温疗效编号X1X2X3X4X5X61 37 男 A 11.27 37.5 显效2 45 女 B 12.53 37.0 有效3 43 男 A 10.93 36.5 有效4 59 女 B 14.67 37.8 无效┆100 54 男 B 16.80 37.6 无效标识变量用于数据管理分析变量-表示试验效应或观察结果大小的变量或指标反应变量分组变量二、统计资料的类型观察单位的特征—变量变量的测定值—变量值(资料)定量资料(计量资料)(quantitative data)分类资料(categorical data)无序分类(unordered categories) (计数资料)二项分类多项分类有序分类(ordered categories)(等级资料)定量资料(计量资料)(quantitative data)用定量方法测定得到,有大小之分,有度量衡单位。
例某年某市抽样调查的120名5岁女孩身高(cm),资料如下:105.5118.6110.5104.2110.9107.9108.199.1104.8116.5 110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6 109.1108.1109.4118.2103.9116.0110.199.6109.3107.5 108.6100.6108.8103.895.3104.4102.7101.0112.1118.7…………………………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.0分类资料(categorical data)将观察单位按属性或类型分组计数所得的资料。
其观察值是定性的,表现为互不相容的类别或属性。
无序分类(unordered categories)(计数资料)二项分类表3.8 三种药物治疗高血压的疗效处理有效无效合计有效率(%)复方哌唑嗪35 5 40 87.50复方降压片20 10 30 66.67安慰剂7 25 32 21.88合计62 40 102 60.78多项分类表3. 9 正常妇女和血栓形成者的血型分布分组A型B型AB型O型合计血栓组32810959正常组51191270152合计83272279211有序分类(ordered categories)(等级资料)针刺不同穴位的镇痛效果镇痛效果合谷足三里Ⅰ3853Ⅱ4429Ⅲ1228Ⅳ2416资料间的相互转化例:以人为单位,测得一群人Hb值(g/L),此资料为;按Hb量的多少分为: < 60 (重度贫血), 60~(中度贫血), 90~(轻度贫血), 120~160(正常)及> 160 (Hb增高)。
此时资料为。
按Hb正常和异常分为两类,此资料为;分类资料数量化:性别:男—0 女—1贫血程度:正常—0,轻度贫血—1, 中度贫血—2,重度贫血—3 。
案例:大学生伤害调查研究case variable三、统计工作的步骤设计收集资料 整理资料 分析资料1)专业设计2)统计设计1)统计报表2)医疗卫生工作记录3)专题调查和实验1)对数据检查、核对2)按分析要求分组、汇总1)统计描述2)统计推断第二章定量资料的统计描述第一节频数分布例2.2 某年某市抽样调查的120名5岁女孩身高(cm),资料如下105.5118.6110.5104.2110.9107.9108.199.1104.8116.5 110.4105.7118.2117.0112.3116.5113.2107.9104.8109.6 109.1108.1109.4118.2103.9116.0110.199.6109.3107.5 108.6100.6108.8103.895.3104.4102.7101.0112.1118.7……………………………………124.0……………104.1109.1108.8111.0106.8120.2105.8103.1105.0115.0定量资料的频数表和频数图(直方图)图2.1 某市城区120名5岁女孩身高频数分布表2.2某市120名5岁女孩身高频数表组段(cm)频数(f)95-198-7101-10104-18107-25110-21113-15116-15119-7122-12511、频数分布的特征(1)集中趋势(central tendency) (2)离散趋势(dispersion)2、频数分布的类型(1)对称分布其中一种常见的类型为正态分布。
(2)偏态分布有正(左)偏态、负(右)偏态之分。
表2.2某市120名5岁女孩身高频数表组段(cm)频数(f) 95-198-7101-10104-18107-25110-21113-15116-15119-7 122-1251合计120115名正常成年女子的血清转氨酶(mmol/L)含量分布血清转氨酶含量人数12-215-918-1421-2324-1927-1430-1133-936-739-442-453第二节集中趋势的描述——平均数常用平均数的意义及其应用场合平均数意义应用场合均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数平均增减倍数①等比资料;②对数正态分布资料中位数位次居中的观察值水平①偏态资料;②分布不明资料;③分布一端或两端出现不确定值1. 均数(mean):n Xn X X X X n ∑=+++=21X, μ应用:正态分布或近似正态分布的定量资料。
计算:1)直接法: 2)加权法:∑∑=++++++=ffx f f f x f x f x f X kkk 212211式中:f —各组段的频数(相同观察值的个数)SPSS2.几何均数(geometric mean): G⎪⎪⎭⎫ ⎝⎛==∑-n X G X X X G n n lg lg 121 计算:(1)直接法:⎪⎪⎭⎫ ⎝⎛=∑∑-f X f G lg lg1(2)加权法例:6份血清的抗体效价为1:10, 1:20, 1:40, 1:80, 1:80, 1:160, 求其平均效价。
先求平均效价的倒数:该6份血清抗体的平均效价为1:45。
()456522.1lg 6160lg 20lg 10lg lg lg lg 111==⎪⎭⎫ ⎝⎛+++=⎪⎭⎫ ⎝⎛=---∑ n X G SPSS(2)加权法:表2.2 75名儿童平均抗体滴度计算表 抗体滴度 人数,f 滴度倒数,XlgX flgX 1:4 4 4 0.6021 2.4082 1:8 9 8 0.9031 8.1278 1:16 21 16 1.2041 25.2865 1:32 20 32 1.5051 30.1030 1:64 12 64 1.8061 21.6742 1:128 5 128 2.1072 10.5360 1:256 4 256 2.4082 9.6330 合计75————107.767635.27757676.107lg 1=⎪⎭⎫ ⎝⎛=-⎪⎪⎭⎫⎝⎛=∑∑-f Xf G lg lg 1例SPSS应用:(1)变量值呈倍数关系(2)对数正态分布何谓对数正态分布?已知:X 1,X 2,…… X n 呈偏态分布。
设:Y 1=lgX 1,Y 2=lgX 2,…… Y n =lgX n 。
则:Y 1,Y 2,…… Y n 呈正态分布。
此时,将对数值还原为原始数值,则:nYY ∑=()G X Y =⎪⎫ ⎛=∑--lg lg lg 113. 中位数(median): M概念:是一组由小到大按顺序排列的观察值中位次居中的数值。
计算:(1)直接法:某病患者发病潜伏期为2、3、3、3、4、5、6、9、16天,求中位数。
若在第20天又发现1例患者呢?21⎪⎭⎫ ⎝⎛+=n X M ⎥⎤⎢⎡+=⎪⎫ ⎛+⎪⎫ ⎛121n n X X M n 为奇数时,n 为偶数时,(2)频数表法:利用百分位数计算公式进行计算.)是一种位置指标, P X将一组观察值分百分位数(PX为两部分,有X%的观察值比它小,有(1-X)%的观察值比它大。
中位数是一个特定的百分位数,即M= P。
50()∑-⋅+=L XX f X n f i L P %百分位数计算公式:例2.5 某市大气中SO2的日平均浓度(μg/m3),求M、P25、P75、P95。
()∑-⋅+=LXXfXnfiLP%M=P50=104.17P25=69.12P75=145.97P95=258.12求M:同理:应用:(1)偏态分布资料;(2)资料分布一端或两端有未确定值。
集中趋势的描述例:SPSS第三节离散趋势的描述描述离散程度的常用指标1.全距(极差)(R)2、四分位数间距(Q)3、方差(σ2 S2)和标准差(σ、S)4、变异系数(CV)意义指标数值越小,说明观察值的变异度越小,平均数的代表性越好。
1. 全距(极差)(range, R)意义:反映一组同质观察值个体差异的范围。