卫生统计学公式
医学统计学公式整理

集中趋势的描述算术均数: 频数表资料(X0为各组段组中值)n fXffX x OO∑∑∑==几何均数:n nX X X G ...21= 或)log (log 1nX G ∑-=频数表资料:⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)*21+=n X M (2))(21*12*2++=n n X X M百分位数⎪⎭⎫⎝⎛-⋅+=L X X f n X f i L P 100其中:L 为欲求的百分位数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为该组段的的频数 ,L f 为该组段之前的累计频数方差: 总体方差为:式(1); 样本方差为 式(2)(1)N X 22)(μσ-∑=(2)1)(22--∑=n X X S标准差:1)(2--∑=n X X S或 1/)(22-∑-∑=n nX X S频数表资料计算标准差的公式为1/)(22-∑∑∑-∑=f ffx fx S变异系数:当两组资料单位不同或均数相差较大时,对变异大小进行比较,应计算变异系数 %100⨯=X SCV常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化NpN p ii∑='∑=i i p N N p )(' 2.间接法标准化预期人数实际人数=SMR ∑=ii P n rSMR SMR P P ⨯='正态分布:密度函数:)2/()(2221)(σμπσ--=X e X f分布函数: 小于X 值的概率,即该点正态曲线下左侧面积)()(x X P x F <=特征:(1)关于x=μ对称。
(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。
(3)曲线下面积为1。
(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。
(5)曲线下面积分布有一定规律标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换σμ-=X u ,u 服从总体均数为0、总体标准差为1的正态分布。
卫生统计学公式解析(doc 11页)

卫生统计学公式解析(doc 11页)部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑相对数公式(3.1)公式(3.2)公式(3.3)χ2检验公式(3.4)理论频数公式(3.5)χ2基本公式公式(3.6)χ2自由度ν=(R-1)(C-1)公式(3.7)χ2校正的基本公式公式(3.8)四格表专用公式公式(3.9)四格表校正公式公式(3.10)2×k表专用公式公式(3.11)公式(3.12)R×C表通用公式中位数公式(4.1)当n为奇数时公式(4.2)当n为偶数时公式(4.3)频数表上计算公式(4.4)百分位数公式(4.5)频数表上计算算术均数公式(4.6)χ=(1/n)∑X公式(4.7)χ=C+(1/n)(Xi-C)公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1)公式(4.9)χ=(1/n)∑fX几何均数公式(4.10)公式(4.11)四分位数间距公式(4.12)Q=P75-P25均差公式(4.13)标准差公式(4.14)样本标准差公式(4.15)递推计算公式(4.16)直接计算公式(4.17)变异系数公式(4.18)CV=S/X×100%, X>0 正态曲线公式(5.1)正态曲线方程(5.2)正态离差(5.3)标准正态曲线(5.4)正常值范围X±uαs标准误(6.1)理论标准误(6.2)样本均数的标准误(6.3)率的标准误(6.4)t分布(6.5)总体均数的估计(6.6) 95%可信区间X-t0.05,νSχ<μ<X+T0.05,ν Sχ(6.7) 99%可信区间X-t0.01,ν Sχ<μ<X+T0.01,ν Sχ总体率的估计(6.8) 95%可信区间P-1.96Sp<π<P+1.96SP< p> (6.9) 99%可信区间P-2.58Sp<π<P+2.58SP< p> t检验公式(6.5)样本均数与总体均数比较公式(7.1) 两样本均数比较的自由度ν=n1+n2-2 公式(7.2) 合并方差公式(7.3) 两均数相差的标准误公式(7.4) t检验u检验公式(7.5)两均数相关的标准误u检验公式(7.6)两样本率比较公式(7.7)公式(6.4)正态性检验公式(7.8) w检验公式(7.9) 偏度系数公式(7.10)公式(7.11) 峰度系数。
卫生统计学——精选推荐

2、说明频数分布表的用途?描述频数分布的特征、描述频数分布的类型、便于发现一些特大或特小的可疑值、便于进一步做统计分析和处理3、变异系数的用途?常用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童与成人身高变异程度的比较。
4、试举例说明均数的标准差与标准误的区别与联系?例如某医生从某地2000年的正常成年男性中,随机抽取25人,算得其血红蛋白的均数X 为138.5g/l ,标准差S 为5.20g/L,标准误x S 为1.04g/L ,。
在本例中标准差就是描述25名正常成年男性血红蛋白变异程度的指标,它反映了这25个数据对其均数的离散情况。
因此标准差是描述个体值变异程度的指标,为方差的算述平方根,该变异不能通过统计方法来控制。
而标准误则是指样本统计量的标准差, 均数的标准误实质要均数的标准差,它反映了样本均数的离散程度,也反映了样本均数与总体均数的差异,说明了均数的抽样误差。
本例均数的标准误X S 此式将标准差和标准误从数学上有机地联系起来了,同是可以看出通过增加样本含量方法可以减少标准误。
5、标准正态分布与t 分布有何不同?T 分布为抽样分布,标准正态分布为理论分布。
T 分布比标准正态分布的峰值低,且尾部翘起得要高。
随着自由度的增大,t 分布逐渐趋近于标准正态分布,即当v →∞时,t 分布→标准正态分布。
6、假设检验时,一般当P<0.5时,则拒绝0H ,理论根据是什么?P 值是指从0H 规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t 值 或u 值 )的概率。
当P<0.5时,说明在0H 成立的条件下,得到现有检验结果的概率小于通常确定的小概率事件标准0.05.因小概率事件在一次试验中几乎不可能发生,现在的确发生了,说明现有样本信息不支持0H ,所以怀疑原假设0H 不成立,故拒绝0H 。
在下“有差别”的结论的同时,我们能够知道可犯I 型错误的概率不会大于0.05(即通常的检验水准),这在概率上有了保证。
《卫生统计学》考试重点复习资料

卫生统计学Statistics第一章绪论统计学:是一门通过收集、分析、解释、表达数据,目的是求得可靠的结果。
总体:根据研究目的确定的同质(大同小异)的观察单位的全体。
分为目标总体和研究总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体。
变量:表现出个体变异性的任何特征或属性。
分定型变量和定量变量。
定型变量:1)分类变量或名义变量:最简单的是二分类变量。
0-1变量也常称为假变量或哑变量。
2)有序变量或等级变量。
定量变量:分离散型变量和连续型变量。
变量只能由高级向低级转化:定量→有序→分类→二值。
常见的三种资料类型1)计量或测量或数值资料,如身高、体重等。
2)计数资料或分类资料,如性别、血型等。
3)等级资料,如尿蛋白含量-、+、++、+++、…第一章定量变量的统计描述此章节x即为样本均数(X拔)1.离散型定量变量的取值是不连续的。
累计频数为该组及前面各组的频数之和。
累计频率表示各组累计频数在总例数中所占的比例。
可用直条图表达。
2.编制频数表的步骤与要点步骤:1确定极差2确定组数3确定各组段的上下限4列表要点(注意事项)1)制表是为了揭示数据的分布特征,故分组不宜过粗或过细。
2)为计算方便,组段下限一般取较整齐的数值3)第一组段应包含最小值,最后一个组段应包含最大值。
3.频率分布表(图)的用途1)描述变量的分布类型2)揭示变量的分布特征3)便于发现某些离群值或极端值4)便于进一步计算统计指标和统计分析。
4.描述平均水平的统计指标算术均数(mean):描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
适用于服从对称分布变量的平均水平描述,这时均数位于分布的中心,能反应全部观察值的平均水平。
分:直接法和频率表法。
即所有变量值加和除以总数n或所有频数f k乘以组中值X0k后求和再除以总数n。
卫生统计学-重点整理资料

卫生统计学第一章绪论1、卫生统计学的概念(P1)卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。
2、卫生统计学的4个基本步骤(P3):设计、收集资料、整理资料、分析资料3、卫生统计学的几个基本概念(P4):⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称之为同质,或具有同质性。
⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。
⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。
⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。
样本中包含的观察单位个数成为样本含量。
⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总体均数μ、总体率π等。
⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本均数⎺x 、样本率ρ等。
⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变量;变量值的集合成为资料。
⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般有度、量、衡单位。
⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别或属性,一般无度、量、衡单位。
可细分为:①计数资料;②等级资料第二章调查研究设计★1、调查研究的特点(P7):①不能人为施加干预措施;②不能随机分组;③很难控制干扰因素;④一般不能下因果结论2、常用抽样方法(名称、原理):⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。
⑵系统抽样:又称机械抽样或等距抽样。
事先将总体内全部观察单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。
卫生统计学知识点汇总

● 表示符号:G
● 计算方法:直接法和加权法
(1)直接法:
适用范围:小样本资料
方法:将 n 个观察值(X1,X2,3,……Xn)直接相乘再开 n 次方。 公式:G n X1X2 Xn
用对数形式表示为: 举例:设有 5 份血清样品,滴度分别为: 1:1, 1:10, 1:100, 1:1000, 1:10000
G=lg-1 (Σf lgX/Σf ) 举例:有 95 名麻疹易感儿童,接种麻疹疫苗一个月后,血凝抑制抗体滴度见下表,试求平
均滴度(例)。 G=lg-1 (Σf lgX/Σf )=lg-195) =
即 95 名易感儿童接种疫苗一个月后,血凝抑制抗体的 平均滴度为 1:。
计算几何均数(G )注意事项:
(1)观察值不能为 0;
(2)观察值不能同时有正有负;
(3)同一组资料求得的几何均数小于算术均数。
练习:
1.有 8 份血清的抗体效价分别为:1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640
G lg 1[(lg5 lg10 lg 640) / 8]
,,, , 求平均身高
178. 4 X
10
适用范围:小样本资料,n<30
169. 7
( cm )
方法:将观察值 X1、X2、X3、……、Xn 直接相加,再除以观察值的个数 n。
n
公式: X X X1 X 2 X n i1
n
n
(2)加权法:
适用范围:大样本含量的分组资料或频数表资料。
该研究方法叫抽样研究。 统计推断:样本的现象推断所研究总体的特征。即分析样本数据,获得关于总体的知识。 同质(homogeneity):指研究对象在一定范畴的各种可能影响主要观察指标的其它因素处
公共卫生相关数据计算公式

公共卫生相关数据计算公式公共卫生是指全社会为促进和保护人民身体健康而进行的公共卫生行动和卫生保健服务。
而有关公共卫生方面的数据计算公式涉及如下几个方面:1. 疾病发病率(Incidence rate):疾病发病率是指在一定的时间内,人群中新出现其中一种特定疾病的人数,通常以每万人或每十万人为单位进行统计。
计算公式为:疾病发病率=(发病人数/观察人数)×10002. 死亡率(Mortality rate):死亡率是指在一定时间内,人群中死亡人数的比例。
计算公式为:死亡率=(死亡人数/观察人数)×10003. 预期寿命(Life expectancy):预期寿命是指其中一特定年龄的人群平均还能活多少年。
通常以出生时的平均寿命来衡量。
计算公式为:预期寿命=年龄总和/年龄人数4. 婴儿死亡率(Infant mortality rate):婴儿死亡率是指在婴儿出生后的第一年内,男女婴儿死亡人数在婴儿出生活存人数中的比率。
计算公式为:婴儿死亡率=(婴儿死亡人数/婴儿出生活存人数)×10005. 出生率(Birth rate):出生率是指在一定时间内,千名人口中出生人数的比例。
计算公式为:出生率=(出生人数/人口数)×10006. 流行病学调查(Epidemiological survey):流行病学调查通常用于疾病的流行病学研究和控制。
它可以通过计算病例报告率(疫情时间期间的病例数除以疫情时间期间的人口数)、感染率(疾病人群中感染者的比例)、死亡率、攻击率(其中一人群中其中一种疾病的新发病数比例)等指标来评估疾病传播的严重程度和传染性。
7. 接种率(Vaccination coverage):接种率是指人口接受疫苗接种的比例,通常以百分比表示。
可以用于评估预防措施的覆盖范围和疫苗接种效果。
计算公式为:接种率=(接种人数/目标人群)×100以上是一些常见的公共卫生相关数据计算公式,不同的指标可以用于评估疾病的流行情况、公共卫生服务的覆盖范围和效果等。
卫生统计学考试要点复习资料

《卫生统计学》复习资料08生物技术曾洋and林阳第一章绪论名词解释统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。
其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体在规律性,而随机性的数量化,是通过概率表现出来。
总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
抽样:从研究总体中抽取少量有代表性的个体,称为抽样。
概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
变量:表现出个体变异性的任何特征或属性。
随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。
随机变量的具体容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。
系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。
系统误差可以通过实验设计和完善技术措施来消除或使之减少。
随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。
它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相对数
公式(3.1)
公式(3.2)
公式(3.3)
χ2检验
公式(3.4)理论频数
公式(3.5)χ2基本公式
公式(3.6)χ2自由度ν=(R-1)(C-1)公式(3.7)χ2校正的基本公式
公式(3.8)四格表专用公式
公式(3.9)四格表校正公式
公式(3.10)2×k表专用公式
公式(3.11)
公式(3.12)R×C表通用公式
中位数
公式(4.1)当n为奇数时
公式(4.2)当n为偶数时
公式(4.3)频数表上计算
公式(4.4)
百分位数
公式(4.5)频数表上计算
算术均数
公式(4.6)χ=(1/n)∑X
公式(4.7)χ=C+(1/n)(Xi-C)
公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1)
公式(4.9)χ=(1/n)∑fX
几何均数
公式(4.10)
公式(4.11)
四分位数间距
公式(4.12)Q=P75-P25
均差
公式(4.13)
标准差
公式(4.14)样本标准差
公式(4.15)递推计算
公式(4.16)直接计算
公式(4.17)
变异系数
公式(4.18)CV=S/X×100%, X>0 正态曲线
公式(5.1)正态曲线方程
(5.2)正态离差
(5.3)标准正态曲线
(5.4)正常值围X±uαs
标准误
(6.1)理论标准误
(6.2)样本均数的标准误
(6.3)率的标准误
(6.4)
t分布
(6.5)
总体均数的估计
(6.6) 95%可信区间X-t0.05,νSχ<μ<X+T0.05,ν Sχ(6.7) 99%可信区间X-t0.01,ν Sχ<μ<X+T0.01,ν Sχ总体率的估计
(6.8) 95%可信区间P-1.96Sp<π<P+1.96SP< p> (6.9) 99%可信区间P-2.58Sp<π<P+2.58SP< p>
t检验
公式(6.5)样本均数与总体均数比较
公式(7.1) 两样本均数比较的自由度ν=n1+n2-2 公式(7.2) 合并方差
公式(7.3) 两均数相差的标准误
公式(7.4) t检验
u检验
公式(7.5)两均数相关的标准误
u检验
公式(7.6)两样本率比较
公式(7.7)
公式(6.4)
正态性检验
公式(7.8) w检验
公式(7.9) 偏度系数
公式(7.10)
公式(7.11) 峰度系数
公式(7.12)
公式(7.13) g1的抽样误差
公式(7.14) g2的抽样误差
公式(7.15) g1的u检验u1=g1/S g1
公式(7.16) g2的u检验 u2=g2/S g2
两方差齐性检验
公式(7.17)F=S12/S22,S1>S2
方差分析
公式(8.1) 总离均差平方和
公式(8.2) 组间离均差平方和
公式(8.3) 组离均差平方和
公式(8.4) 总变异自由度ν总=N-1
公式(8.5)组间变异自由度ν组间=k-1
公式(8.6) 组变异自由度ν组=N-k
公式(8.7) F检验F=组间均方/组均方
多个均数间两两比较
公式(8.8) 最小显著相差Dα=t,νS A-B
公式(8.9) 两均数的标准误
公式(8.10) 平均例数i=1,2,…,k
公式(8.11) 标准误
多个方差齐性检验
公式(8.12)
公式(8.13)
直线相关
公式(9.1) 直线相关系数
公式(9.2) 离均差积和
公式(9.3) 相关系数t检验
直线回归
公式(9.4) 直线回归方程γ=a+bx
公式(9.5) 回归系数
公式(9.6) 截距a=γ-bχ
公式(9.7) 回归系数t检验
公式(9.8) 回归系数的标准误
公式(9.9) 标准估计误差
公式(9.10) 估计误差平方和
公式(9.11) 两回归系数相关的t检验
公式(9.12) 两回归系数相差的标准误
公式(9.13) 两回归系数的合并方差
符号检验
公式(10.1) 成对资料比较,ν=1 公式(10.2) 秩号的中位数
公式(10.3) 两组符号检验,ν=1
公式(10.4) 两组符号检验,ν=组数-1
秩和检验
公式(10.6) 成对资料比较
公式(10.6) 两组资料求较小R'R'=n1(n1+n2+1)-R
公式(10.7)两组资料比较
公式(10.8) 多组完全随机设计资料的比较
公式(10.9) 多组随机单位组设计资料的比较
公式(10.10) 多组秩和的两两比较
秩相关系数
公式(10.11)Spearman秩相关系数
参照单位分析
公式(10.12) 平均R值
公式(10.13)R的标准误
公式(10.14)R的95%可信限
样本含量的估计
公式(11.1) 两个率比较所需例数,1-β=0.5,α=0.05 公式(11.2) 大样本成对资料比较均数所需例数n=4S2/X2,1-β=0.5,α=0.05
公式(11.3) 小样本成对资料比较均数所需例数,1-β=0.5。