医学统计学公式整理 简洁版

合集下载

医学统计学符号公式重点

医学统计学符号公式重点

医学统计学符号公式重点在医学统计学中,符号和公式起着至关重要的作用,用于表达和传递统计学概念、方法和结果。

了解这些符号和公式的含义和应用是医学研究和实践中必不可少的一部分。

本文将重点介绍一些常用的医学统计学符号和公式。

一、描述性统计符号1. 样本均值:用x表示,表示样本中各个观察值的平均数。

2. 总体均值:用μ表示,表示总体中各个观察值的平均数。

3. 样本标准差:用s表示,表示样本数据与其均值之间的离散程度。

4. 总体标准差:用σ表示,表示总体数据与其均值之间的离散程度。

5. 样本方差:用s^2表示,表示样本数据的离散程度。

6. 总体方差:用σ^2表示,表示总体数据的离散程度。

7. 样本协方差:用sxy表示,表示两个变量之间的关联程度。

8. 总体协方差:用σxy表示,表示两个变量之间的关联程度。

9. 样本相关系数:用r表示,表示两个变量之间的相关程度。

10. 总体相关系数:用ρ表示,表示两个变量之间的相关程度。

二、推断统计符号1. 样本容量:用n表示,表示样本中观察值的个数。

2. 总体容量:用N表示,表示总体中观察值的个数。

3. 统计量:用T表示,表示根据样本数据计算得出的用于推断总体特征的指标。

4. 标准误差:用SE表示,表示样本统计量与总体参数之间的估计误差。

5. 自由度:用df表示,表示样本数据中独立和能够随机变化的观察值的个数。

6. 置信区间:用CI表示,表示对总体参数的一个估计区间,给出了一个置信水平下的估计结果。

7. 假设检验:用H0和H1表示,分别表示原假设和备择假设。

8. 显著性水平:用α表示,表示拒绝原假设的临界点,通常设置为0.05。

9. P值:表示假设检验中拒绝原假设的概率,通常与显著性水平进行比较来进行判断。

三、统计学公式1. 样本均值的计算公式:x= (x1 + x2 + … + xn) / n2. 样本标准差的计算公式:s = sqrt((Σ(xi - x)^2) / (n - 1))3. Z分数的计算公式:Z = (x - μ) / σ4. 标准误差的计算公式:SE = s / sqrt(n)5. t分数的计算公式:t = (x - μ) / (s / sqrt(n))6. 置信区间的计算公式:CI = x ± (Z * (s / sqrt(n)))7. 相关系数的计算公式:r = Σ((xi - x) * (yi - ȳ)) / sqrt(Σ(xi - x)^2 * Σ(yi - ȳ)^2)以上是医学统计学中常用的一些符号和公式,它们在研究、分析和解释医学数据和结果时起到了重要的作用。

医学统计学公式整理简洁版

医学统计学公式整理简洁版

医学统计学公式整理简洁版1. 平均数(Mean):一组数据的平均值,通过将所有值相加然后除以数据的个数得到。

公式:X̄=ΣX/n其中,X̄表示平均数,ΣX表示所有数据的总和,n表示数据的个数。

2. 中位数(Median):一组数据的中间值,将所有数据按升序排列,如果数据个数为奇数,则中位数是中间的值;如果数据个数为偶数,则中位数是中间两个值的平均数。

3. 众数(Mode):一组数据中出现次数最多的数值。

4. 标准差(Standard Deviation):衡量数据的离散程度,计算每个数据值与平均值的差的平方和的平均值的平方根。

公式:σ=√(Σ(X-X̄)²/n)其中,σ表示标准差,Σ(X-X̄)²表示每个数据值与平均值的差的平方和,n表示数据的个数。

5. 方差(Variance):标准差的平方。

公式:σ²=Σ(X-X̄)²/n6. 相关系数(Correlation Coefficient):度量两个变量之间的线性关系的强度和方向。

相关系数的值介于-1和1之间,接近-1表示负相关,接近1表示正相关,接近0表示无线性相关。

7. t检验(t-test):用于比较两组样本均值是否有显著差异。

8. 卡方检验(Chi-square test):用于比较观察频数与期望频数之间的差异是否显著。

9. 线性回归(Linear Regression):用于预测一个变量与另一个变量之间的关系,并且可以根据这个关系进行预测。

10. 生存分析(Survival Analysis):用于分析事件发生的概率和时间关系,常用于研究患者生存率和治疗效果。

研究生医学统计学公式汇总

研究生医学统计学公式汇总

1.nX nXnX X X ∑=+++=21(直接法)∑=+++=fX X f X f X f X k k 2211(加权法)1)(2--=∑n X X s ,1-=n ν;nS S X =2.n 为奇数时,)21(+=n XM ;n 为偶数时,2)12()2(++=n n X XML U Q Q Q -=,)%(∑-+=L xx f x f iL P (频率表:组段1,组中值X i 2,频数3,频率f i /%4,累计频率/%5) 3.变异系数:%100⨯=XSCV4.正态分布:S X 64.1±(90%);S X 96.1±(95%);S X 58.2±(99%)5.二项分布:k n kk n C k XP --==)1()(ππ,πμn =,)1(ππσ-=n6.Poisson 分布:k n k kn nn C k XP --==)1()()(μμ,2σμ=∞→μ,μμ-→=e k k X P k!)(7.两个样本均数间差值:22212121n S n S S X X+=-(2221σσ≠);2122121121n n S n S n S S c c c X X+=+=-,)1()1()1()1(21222211-+--+-=n n S n S n S c (22221c σσσ==)8.二项分类变量:np p S p)1(-=,5)1(n >-p np 、时接近正态分布两个样本频率间差值:21222111,)1()1(21ππ≠-+-=-n p p n p p S p p)11)(1(2221n n p p S c c p p +-=-,2121n n X X p c ++=(c πππ==21)9.nX /σμ-~Z 分布,其置信区间:(X X Z X Z X σσαα2/2/,--)或简写为X Z X σα2/±(σ已知) (X X S t X S t X νανα,2/,2/,+-)或简写为X S t X να,2/±(σ未知)10.两总体均数间差值的置信区间:21,2/21)(X X S t X X -±-να,1)/(1)/()//(22222121212222121-+-+=n n S n n S n S n S ν(2221σσ≠)21,2/21)(XX S t X X -±-να,2)1()1(2121-+=-+-=n n n n ν(2221σσ=)11.二项分类变量总体概率的(1-α)置信区间:),(2/2/p p S Z p S Z p αα+-,5)1(n >-p np 、12.两总体概率间差值的置信区间:])(,)[(21212/212/21p p p p S Z p p S Z p p --+---αα13.总体方差的置信区间:))1(,)1((2)1(),2/1(22)1(,2/2-----n n S n S n ααχχ14.nX Z /0σμ-=(Z 检验),nS X Z /0μ-=(t 检验)np p Z p/)1(000πππσπ--=-=(二项分布Z 检验)15.,)11(21221n n S X X t c +-=2)1()1(212221212-+-+-=n n n S n S S c (两独立样本)22212121//n S n S X X t +-=',1)/(1)/()//(22222121212222121-+-+=n n S n n S n S n S ν(方差不齐时)16.1,1)()(22112221-=-==n n S S F νν,较小较大(方差齐性检验)17.12/)1(5.02/)1(211+-+-=N n n N n T Z,21n n N+=(独立样本秩和检验的正态近似法))()(1,/33N N t t c c Z Z j j c ---==∑(相持较多时)18.1,/-==n nS dt d υ(配对资料的t 检验)(配对号、对照组、配对组、d )配对资料符号秩和检验的正态近似法(配对号1、对照组2、配对组3、差值d4,d的秩次5,带符号的秩次6):2/)1(+=+-+n n T T25,24/)12)(1(,4/)1(,>++=+=-=n n n n n n T Z T T TTσμσμ50,24/)12)(1(5.04/)1(5.0<++-+-=--=n n n n n n T T Z TT σμ48)(24)12)(1(5.04/)1(3∑--++-+-=j jc t t n n n n n T Z ,相持较多(不包括差值为0者)19.Poisson 分布:2121X X X X Z +-=(观察单位相等时),近似服从正态分布N (0,1)221121n X n X X X Z +-=(观察单位不等)20.∑∑==-=-=gi n j ij iN X X SS 1121,)(ν总1,)(21-=-=∑=g X X n SS i gi i ν组间∑∑∑===-=-=-=gi n j gi i i ij ig N S n X X 11122i ,)1()(SS ν组内组内组间总组内组间组内,ννν+=+=SS SS SS组内组间组内组内组内组间组间组间,,MS MS F SS SS ===ννMS MSiij ij g i n j i ij gi i X X Z g N g X z g z z g N F i-=-=-=----=∑∑∑===,,1,)()1()()(211112νν(方差齐性检验)残差i ij ij X X e -=21.n m n T T T A j i ij ki i i i =-=∑=,)(122χ(基本公式)))()()(()(22d b c a d c b a nbc ad ++++⋅-=χ(专用公式,40≥n ,5>ij T )))()()(()5.0(,)5.0(2222d b c a d c b a n n bc ad TT A ++++⋅--=--=∑χχ(40≥n ,51<≤ijT )!!!!!)!()!()!()!(n d c b a d b c a d c b a P ++++=(独立两组二分类)22.40,1,)()(22≥+=+-=c b c b c b νχ;40,1,)()1(22<+=+--=c b c b c b νχ(配对两组二分类)23.)1(12122∑∑==-=R i j ji ijm n A n χ,)(列数行数1-)1-(=ν(独立多组二分类) 24.Pearson 积距相关系数:∑∑∑----=22)()())((Y Y X X Y Y X X r)2/()1(02--=-=n r rS r t r ,2-=n υ(两连续型随机变量)25.相关系数n r+=22χχ(交叉分类22⨯列联表/22⨯配对资料))1(112∑∑==-=Ri Cj cjri ij n n A n χ,)1)(1(--=C R ν(多关联资料)26.XX Y βαμ+=/(总体线性方程的一般表达式)bX a Y+=ˆ(样本的线性回归方程,a 、b 为α、β的估计值) Y=α+βY+ε,X Y Y /με-=~N (0,σ2),YY ˆ-为残差 27.∑∑---=2)())((X X Y Y X X b ,X b Y a -=ˆ(普通最小二乘回归,OLS 回归)28.总变异分解:任一点Y 的离均差)ˆ()ˆ(ˆY Y Y Y YY -+-=- 得∑∑∑-+-=-222)ˆ()ˆ()(Y Y Y YY Y ,即残差回归总SS SS SS +=1-=n 总ν,1=回归ν,2-n =残差ν,残差回归总ννν+=残差回归残差残差回归回归MS MS //==ννSS SS F (回归模型的假设检验)29.2,0-=-=n S b t bν,∑-=2,)(X X S S XY b ,2-n ,残差SS S XY =(回归系数的假设检验) 30.死亡概率某年年初人口数某年内死亡人数=q生存概率某年年初人口数某年活满一年人数=p生存率观察总例数时刻仍存活的例数k k kt t T P t S =>=)()(ˆ若含有删失数据kk k k kp t S p p p t T P t S ⋅=⋅⋅⋅=>=-)(ˆ)()(ˆ121 风险函数t t T t t T t P t ∆≥∆+<≤=→∆)/(limh(t)031.含有因变量时:y 是定量资料,多元线性回归分析; y 是0及1定性资料,Logistic 回归分析; y=t 是生存资料,作COX 回归分析;。

医学统计学计算公式

医学统计学计算公式

《统计学原理》主要公式第四章:统计数据的描述一、平均数: (一)算术平均数简单算术平均数:nx x x x n +++=...21加权算术平均数:∑∑=++++++=fxf x ffffx fx f x nnn (2)12211)(∑∑∙=ffx x(二)调和平均数简单调和平均数:nx xnxh∑∑==111 加权调和平均数:∑∑∑∑∙==mm x x m m x h11(三)几何平均数简单几何平均数:nnn G x x x x x π=∙∙= (21)加权几何平均数:∑=∙∙=+++f fnGxx x xxf f f f f f nn π (21)2121...(四)中位数:下限公式:d ffs X M mm l e ∙-+=-∑12上限公式:d ffs X M mm u e ∙--=+∑12(五)众数 下限公式:d X M l o ∙++=∆∆∆211上限公式:d X M u o ∙+-=∆∆∆212(六)平均差未分组资料:nx x D A ∑-=..已分组资料:∑∑-=ff x x D A ..(七)标准差 未分组资料:nx x ∑-=)(2σ已分组资料:∑∑-=ffx x )(2σ(八)离散系数(或标准差系数)%100⨯=xV σσ第五章抽样与参数估计一、区间估计(参见教材P111) 二、样本容量确定1.总体平均数的样本容量确定 (1)重置抽样条件下)(2∆=σZ n(2)不重置抽样条件下σσ22222)1(ZZN N n +-=∆2.总体比例的样本容量确定 (1)重置抽样条件下∆-=22)1(P P Z n(2)不重置抽样条件下)1()1()1(222P P N P P N n Z Z -+--=∆练习题1.某居民小区共有500户,小区管理者准备采取一项新的供水设施,想了解居民是否赞成。

采用不重置抽样方法随机抽取了50户,其中有32户赞成,18户反对。

要求:(1)在95%的置信水平下,全体住户中赞成该项供水设施户数比例的置信区间(2)如果小区管理者预计赞成的比例能达到80%,估计的极限误差(∆)为10%,问应抽取多少住户进行调查?2.某大学共有本科学生8000人,学校想要估计每个学生一个月的生活费支出金额,准备采取不重置抽样方法。

卫生统计学公式解析(doc 11页)

卫生统计学公式解析(doc 11页)

卫生统计学公式解析(doc 11页)部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑相对数公式(3.1)公式(3.2)公式(3.3)χ2检验公式(3.4)理论频数公式(3.5)χ2基本公式公式(3.6)χ2自由度ν=(R-1)(C-1)公式(3.7)χ2校正的基本公式公式(3.8)四格表专用公式公式(3.9)四格表校正公式公式(3.10)2×k表专用公式公式(3.11)公式(3.12)R×C表通用公式中位数公式(4.1)当n为奇数时公式(4.2)当n为偶数时公式(4.3)频数表上计算公式(4.4)百分位数公式(4.5)频数表上计算算术均数公式(4.6)χ=(1/n)∑X公式(4.7)χ=C+(1/n)(Xi-C)公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1)公式(4.9)χ=(1/n)∑fX几何均数公式(4.10)公式(4.11)四分位数间距公式(4.12)Q=P75-P25均差公式(4.13)标准差公式(4.14)样本标准差公式(4.15)递推计算公式(4.16)直接计算公式(4.17)变异系数公式(4.18)CV=S/X×100%, X>0 正态曲线公式(5.1)正态曲线方程(5.2)正态离差(5.3)标准正态曲线(5.4)正常值范围X±uαs标准误(6.1)理论标准误(6.2)样本均数的标准误(6.3)率的标准误(6.4)t分布(6.5)总体均数的估计(6.6) 95%可信区间X-t0.05,νSχ<μ<X+T0.05,ν Sχ(6.7) 99%可信区间X-t0.01,ν Sχ<μ<X+T0.01,ν Sχ总体率的估计(6.8) 95%可信区间P-1.96Sp<π<P+1.96SP< p> (6.9) 99%可信区间P-2.58Sp<π<P+2.58SP< p> t检验公式(6.5)样本均数与总体均数比较公式(7.1) 两样本均数比较的自由度ν=n1+n2-2 公式(7.2) 合并方差公式(7.3) 两均数相差的标准误公式(7.4) t检验u检验公式(7.5)两均数相关的标准误u检验公式(7.6)两样本率比较公式(7.7)公式(6.4)正态性检验公式(7.8) w检验公式(7.9) 偏度系数公式(7.10)公式(7.11) 峰度系数。

医学统计学公式总结

医学统计学公式总结

一资料的描述性统计(一)算术均数(mean )(1)简单算术平均值定义公式为(直接法):X i X 2 X 3 ........ X n(2)利用频数表计算均数(加权法):f i X i f 2X 2 f 3X 3 f k X kfl + f2 + f3 + …+ fk方差(即标准差的平方)'(X _ X ) 2 ' X 2 X )2/ns n - 1 n-1(三)变异系数CV =■! 100%X二参数估计与参考值范围(三)T 分布(四)总体均数的区间估计X-匕能爪乂 £卩£ X +切2A A计算95%或 99%勺可信区间)(五) 总体率的区间估计 p — u :./2s p = :::p u /2s p(六) 参考值范围估计 双侧1-a 参考值范围:X-U a/2S单侧1-a 参考值范围:X脣或"X U a S(可信区间计算是用标准误,参考值范围计算用标准差,百分位数法大家自己看书)三T 检验与方差分析(一)T 检验(一) 均数的标准误(二) 样本率的标准sS X :J nS p 「P (1nP )(p 为样本率)(u 为总体均数)(一般要求(1)单样本T检验检验假设:(假设样本来自均数为H 0- 严0统计量t值的计算:t _ x一%_ x一%t = h二亦,(2)配对T检验检验假设:H 0:丄1 _」2 =」=0d —» d —卜统计量t值的计算:t :S d S d Nn的差值,Sd为差值的标准差)(3)两样本T检验检验假设:H : . | - . I统计量t值的计算:t =(Xl _ X2)_ (」1 _」2)SXi _X2' (捲一XJ2亠二(x2- x2)2n〔- 2s1两样本方差齐性检验 F 才 r 的比值)S2 m - 12= n2- 1 (即为两样本方差(二)单因素方差分析(1 )完全随机设计资料的方差分析MS合计S S T =' x2- c T = N 一1u 0的正态总体)n -1=n -1 (d为两组数据SS B '、B MS BMS Wsw总二ss组间ss组内―总组间组内SS组间T 2SS B八i-cn组内SSv 二ss■- SS B=k -1 SS B B= N-k SS M'g 2这里C =(瓦X)2/N T =瓦X jj (T即为该组数据之和)j (2)随机单位组设计资料的方差分析SS 总=SS处理+SS区组+SS误差V 总=V处理+V区组+V误差来源 SSVMS F处理组间 SSB^l-Ti^C B1 = k -■ 1 SR 仁■- B1MS B1 MS E 单位组间 SS B2 十 B 2-C • B2 二n -1SS32「B2MS B 2, MS E误差 SS E SS T 「SS B 〔「SS B 2 E="■ T ~ '■- B1 - '■- B2SS E E合计SSr 八 x 2C、、T = kn-1四列联表分析卡方检验(四)多个样本率间的多重比较每一个两两比较的检验水准::-比较的次数注意:1、有1/5以上格子的理论频数小于5;2、 一个理论频数小于 1;3、 总样本例数小于 40当有以上三种情况或之一存在时,均不适宜进行卡方检验基本公式nR*n Cv= (R-1)(C-1)(不太常用,理解)(—)四格表资料的卡方检验(1 )两样本率的比较 四格表专用公式(ad-b 。

医学统计学公式整理

医学统计学公式整理

医学统计学公式整理1. 平均数(Mean):平均数是一组数据的所有观察值之和除以观察值的个数。

用数学符号表示为:μ = (x1 + x2 + ... + xn) / n。

其中,μ表示总体均值,x1,x2,...,xn表示样本数据,n表示样本容量。

2. 中位数(Median):中位数是将一组数据按照大小排序后,位于中间位置的数值。

对于有奇数个数的数据,中位数是中间的那个数;对于有偶数个数的数据,中位数是中间两个数的平均值。

3. 众数(Mode):众数是一组数据中出现次数最多的数值,可以有一个或多个。

4. 方差(Variance):方差是一组数据与其均值之差的平方的平均值,用来衡量数据的离散程度。

用数学符号表示为:σ^2 = ( (x1-μ)^2 + (x2-μ)^2 + ... + (xn-μ)^2 ) / n。

5. 标准差(Standard Deviation):标准差是方差的平方根,用来衡量数据的离散程度。

用数学符号表示为:σ = sqrt( ( (x1-μ)^2 + (x2-μ)^2 + ... + (xn-μ)^2 ) / n )。

6. 相对风险(Relative Risk):相对风险是比较两个暴露组之间罹患其中一种疾病的风险大小的指标。

计算方式为:相对风险=(发病率在暴露组中的比例)/(发病率在非暴露组中的比例)。

相对风险大于1表示暴露组的风险大于非暴露组,相对风险小于1表示暴露组的风险小于非暴露组,相对风险等于1表示两组风险相等。

7. 绝对风险差(Absolute Risk Difference):绝对风险差是比较两个暴露组之间发病率差异的指标。

计算方式为:绝对风险差=(发病率在暴露组中的比例)-(发病率在非暴露组中的比例)。

绝对风险差大于0表示暴露组的发病率高于非暴露组,绝对风险差小于0表示暴露组的发病率低于非暴露组,绝对风险差等于0表示两组发病率相等。

8. 相对危险度(Relative Risk Ratio):相对危险度是比较两个暴露组之间发病率的相对大小的指标。

医疗统计计算公式

医疗统计计算公式

精选资料,欢迎下载门诊主要统计指标实际门诊工作日:一般以月为统计周期日平均门诊人次:分为院日均门诊人次和科日均门诊人次全日门诊天数全月半日门诊天数实际门诊工作日+=2某科期内门诊工作日某科期内门诊人次某科日均门诊人次=门诊工作总时数门诊诊疗次数平均每小时门诊次数=。

精选资料,欢迎下载%100⨯=病人总数经门诊介绍住院的出院与出院诊断相符合数门诊签收住院时的诊断门诊与出院诊断符合率%100⨯=病人数经门诊介绍住院的出院下肯定的诊断数由门诊介绍住院时未能门诊诊断疑诊率。

精选资料,欢迎下载医疗质量统计一、诊断质量%100⨯=入院人数出院病人中经本院门诊两者诊断符合率门诊与出院诊断符合率%100⨯=出院病人数两者诊断符合数入院与出院诊断符合率%100⨯=病理诊断例数两者诊断符合数合率临床诊断与病理诊断符。

精选资料,欢迎下载%100⨯=手术例数两者诊断符合数手术前后诊断符合率%100⨯=出院病人数入院后三日内确诊数入院三日确诊率%100⨯=出院病人数出院待查数出院待查率。

精选资料,欢迎下载二、治疗质量%100⨯=出院病人数治愈人数治愈率%100⨯=出院病人数好转人数好转率%100⨯=某病出院例数某病治愈例数某病治愈率%100⨯=出院病人数死亡人数病死率%100⨯=某病同一时期出院人数一年内某病出院人次数同一疾病重复住院率。

精选资料,欢迎下载 三、工作效率指标天)出院总人数出院者占用床总日数出院者平均住院天数(=()天出院病人总数出院病人占床总日数出院病人平均住院天数=()天某病病人数某病病人占床总日数某病平均住院天数=()天某病治愈人数数某病治愈病人占床总日某病平均治愈天数=。

精选资料,欢迎下载%100⨯=实际开放总床日数实际占用总床日数病床使用率()日平均开放病床数实际占用床总日数平均床位工作日=()次平均开放病床数出院人数平均病床周转次数=()次科平均开放病床数转出人数科出院人数科平均病床周转次数+=。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

集中趋势的描述算术均数: 频数表资料(X0为各组段组中值)n fXffX x OO∑∑∑==几何均数:n nX X X G ...21= 或)log (log1nX G ∑-=频数表资料:⎥⎦⎤⎢⎣⎡=⎥⎥⎦⎤⎢⎢⎣⎡=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)*21+=n X M (2))(21*12*2++=n n X X M百分位数⎪⎭⎫⎝⎛-⋅+=L X X f n X f i L P 100其中:L 为欲求的百分位数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为该组段的的频数 ,L f 为该组段之前的累计频数方差: 总体方差为:式(1); 样本方差为 式(2)(1)N X 22)(μσ-∑=(2)1)(22--∑=n X X S标准差:1)(2--∑=n X X S 或 1/)(22-∑-∑=n nX X S 频数表资料计算标准差的公式为1/)(22-∑∑∑-∑=f ffx fx S变异系数:当两组资料单位不同或均数相差较大时,对变异大小进行比较,应计算变异系数%100⨯=X SCV常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化NpN pii∑='∑=ii p NN p )('2.间接法标准化预期人数实际人数=SMR ∑=ii P n rSMRS M R P P ⨯='正态分布:密度函数:)2/()(2221)(σμπσ--=X e X f分布函数: 小于X 值的概率,即该点正态曲线下左侧面积)()(x X P x F <=特征:(1)关于x=μ对称。

(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。

(3)曲线下面积为1。

(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。

(5)曲线下面积分布有一定规律标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换σμ-=X u ,u 服从总体均数为0、总体标准差为1的正态分布。

u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。

(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为S X 96.1±样本均数标准误的估计值为Xs =t 分布的概念:小样本总体标准差未知时,服从自由度为n-1的t 分布X X X t s μ-=总体均数可信区间的计算:大样本或总体标准差已知:式(1); 小样本:式(2)(1)n SX ⋅±96.1 (2)nS n t t ⋅±-)1(,05.0(前一个t表示均数) 单样本t 检验:n S X t /0μ-=自由度为 n-1;配对样本t 检验: 检验统计量:nS d t d /0-=自由度为n-1(n 为对子数)两样本t 检验:检验统计量: )11(2121n n S X X t c +-=(错:Sc 的平方)2)()(2)1()1(21222211212222112-+-+-=-+-+-=∑∑n n X X X X n n S n S n S c方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1检验统计量:(较小)(较大)2221S S F = 分子自由度为n 1-1,分母自由度为n 2-1方差分析的基本思想: 1、总变异:总离均差平方和:2() 1T ij ijSS SS X X N νν=-==-∑∑总总=∑∑-=N X X ij ij /)(22∑=N XC ij/)(22. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。

21() 1B i i iSS SS n X X k νν-==-∑组间组间===Cn X iiij -∑∑2)(3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。

222()(1) W E ij i i i i j i SS SS SS X X n S N kνν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i ijiSS SS SS X X n S N k νν===-=-==-∑∑∑组内组内1(1)()N k N k ννν=-=-+-=+总组间组内组间均方与组内均方比值一般地服从分子自由度为ν1,分母自由度为ν2的F 分布12 1 MS F k N k MS νννν===-==-组间组间组内组内,二项分布的概率函数P (X ): Xn X X nC X P --=)1()(ππ;)!(!!X n X n C X n -=二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果X 的总体均数为πμn = 总体方差为)1(2ππσ-=n总体标准差为)1(ππσ-=n如果将阳性结果用频率表示nXp =率的总体均数πμ=p 标准差np )1(ππσ-=n p p n p p S p )1(1)1(-≈--=又称率的标准误它反映率的抽样误差的大小。

单侧累积概率计算:出现阳性的次数至多为k 次的概率为∑∑==---==≤kX kX Xn X X n X n X P k X P 00)1()!(!!)()(ππ出现阳性的次数至少为k 次的概率∑∑==---==≥nkX nk X X n X X n X n X P k X P )1()!(!!)()(ππ率的可信区间的估计 正态近似法:当)1(,p n np -均大于等于5时np p p n p p P )1(96.1,)1(96.1-+-⋅-样本率与总体率的比较:检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量)1(000πππ--=n n X Z 或n p Z )1(000πππ--=2. 不满足正态近似时用直接概率计算法两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量:)11)(1(||2121n n p p p p Z c c +--=2121n n X X p c ++= Poisson 分布的概率函数为!)(X e X P X λλ-=POISSON 分布的应用:单侧累计概率计算:稀有事件发生次数至多为k 次的概率为∑∑==-==≤k X kX X X e X P k X P 0!)()(λλ发生次数至少为k 次的概率为)1(1)(-≤-=≥k X P k X P总体均数的区间估计:正态近似法95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为λλ-=X Z两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单位数相等时,检验统计量为:式(1);当两样本观测单位数不等时,检验统计量为:式(2)(1)2121X X X X Z +-= (2)221121n X n X X X Z +-=四格表χ2检验的步骤: 1.检验假设, H0:两总体率相等,H1:两总体率不等。

Α=0.05 。

2.统计量3. 确定p 值。

4. 结论。

n ≥40,且T ≥5,ν=(行数-1)(列数-1)∑-=T T A 22)(χ,n n n T c r =,))()()(()(22d b c a d c b a nbc ad ++++-=χ 当n ≥40,如果有某个格子出现1<T <5,校正公式∑--=TT A 22)5.0(χ))()()(()2/|(|22d b c a d c b a n n bc ad ++++--=χ注意如果出现n <40或一个T <1则不能用χ2检验,用Fisher 确切概率法RxC 列表资料的χ2检验(多样本率和构成比的χ2检验):假设H0:各总体率相等,H1:各总体率不等或不全等,α=0.05,自由度 ν=(行数-1)(列数-1)。

统计量为⎪⎪⎭⎫ ⎝⎛-=∑122c r n n A n χ构成比的比较:假设H0:构成比相同,H1:构成比不同(公式同上)双向无序分类资料的关联性检验:Pearson 列联系数22χχ+=n C配对四格表的χ2检验:配对设计列表:假设H0:B=C 两阳性率相等; H1:B ≠C 两阳性率不等若b+c ≥40:式(1) 若 b+c <40:式(2) (1)cb c b +-=22)(χ (2)c b c b +--=22)1|(|χ两分类变量的关联性检验:假设:H0:两分类变量无关 (满足概率独立性) ,H1:两分类变量有关2χ分割法:1、多个实验组间的两两比较:()12,+=καα2)1()(2-=k k κk 为样本率的个数2、实验组与同一个对照组的比较:)1(2,-=k αα k 为样本率的个数配对设计资料的符号秩和检验:正态近似法:计算u 统计量,如果数据超出表的范围可计算u统计量。

当n ≤50,查T 界值表。

当n>50,如下公式:下式中t j 为第j(j=1,2…)次相持所含相同秩次的个数 48)(24)12)(1(4/)1(3∑--+++-=j j c t t n n n n n T Z两独立样本比较的秩和检验:确定P 值和作出推断结论。

如果n 1≤10或n 2-n 1≤10,查T 界值表如果n 1或n 2-n 1超出了成组设计T 界值的范围,可用正态近似检验。

12)1(2)1(2121211++++-=n n n n n n n T Zc Z Z c =)/()(133N N t t c j j ---=∑ 完全随机化设计多组独立样本的秩和检验(H 检验):统计量∑+-+=)1(3)1(122N n R N N H ii 确定P 值并做出推断结论:如取相同秩次个数较多时需校正c HH c =)()(133N N t tc j j ---=∑多个独立样本两两比较的Nemenyi 法检验 随机化区组设计资料的秩和检验(M 检验):计算统计量M 值,b 为每个区组内个数,k 为区组数(研究因素的水平数)∑-=2)(R R M j ,∑+-=4/)1(222k k b R M j确定P 值并做出推断结论: 当b ≤15和k ≤15时,查M 界值表; 当b>15和k>15时,χ2分布近似法:当处理数k 或区组数b 超出M 界值表的范围时,采用近似χ2 分布法)1(122+=k bk Mr χ 或)1(3)1(12122+-+=∑=k b R k bk kj j r χ自由度为(k-1) 。

相关文档
最新文档