医学统计学总结-精选文档
医学统计学总结

医学统计学总结一、绪论1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。
2,医学统计学得主要内容:1) 统计研究设计调查研究设计与实验研究设计2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。
A:资料得搜集与整理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。
3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。
3,统计工作步骤:1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。
2) 搜集材料A, 搜集材料得原则及时、准确、完整B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。
一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。
C, 资料贮存3) 整理资料 a检查核对b设计分组c拟定整理表d归表4) 分析资料统计分析包括统计描述与统计推断4,同质(homogeneity):指被研究指标得影响因素相同。
变异(variation):同质基础上得各观察单位间得差异。
变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项特征进行测量或观察,这种特征称为变量变量值:变量得观察结果或测量值。
5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。
总体具有得基本特征就是:同质性样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。
样本必须具有代表性。
代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。
统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。
医学统计学重点总结

(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)
医学统计学总结2

九、非参数秩和检验1、非参数统计:有许多资料不符合参数统计的要求,分布是未知,不能用参数统计的方法进行检验,而需要一种不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验,而是对总体的分布或分布位置进行检验,成为非参数检验2、参数检验与非参数检验的比较3、秩和检验:是非参数统计中一种常用的检验方法,其中“秩”又称等级、即按数据大小排定的次序号,上述次序号的和称“秩和”,秩和检验就是用秩和作为统计量进行假设检验的方法4、配对资料符号的秩和检验(1)基本思想假定两种处理效应相同,则差值的总体分布对称,总体中位数为0,也就是说样本的正负秩和绝对值应相近;反之,若两种处理效应不同,则差值总体中位数不为0,中位数偏离0越明显,样本的正负秩和绝对值就会相差越大,原假设H0成立的可能性越小(2)适用条件:1)配对设计的计量资料,但不服从正态分布或分布未知2)配对设计的等级资料(3)一般步骤:1)建立检验假设,确定检验水准H0:差值的总体中位数为0H1:差值的总体中位数不为0a=0.052)编秩次并求秩和统计量先算出各对值的代数差,根据差值绝对值的大小编秩,将秩次冠以正负号;若差值为“0”,舍去不计,总的对子数也要减去此对子数(记为n);若遇到相同数值在不同组,要取平均秩次;最后分别计算正负秩次之和T+和T-,任取其中一个作为检验统计量T(习惯取较小者)3)确定P值,作出推断①当5<n≦50时,可根据n和T查配对设计用的T界值表,若检验统计量T值在上下界值范围内,则P值大于表上方对应的概率值,即0.05;若T值在上下界值外,则P值小于表上方对应的概率值②当n>50时,无法查表,可利用秩和分布的近似正态分布法进行检验;当相同秩次较多时,应采用校正公式进行校正(公式不用记)5、两独立样本比较的秩和检验(1)基本思想如果H0成立,在两样本来自分布相同的总体,两样本的平均秩次应相等或很接近,与总的平均秩次(N+1)/2相差较小;含量为n1的样本的秩和T1应在n1(N+1)/2的左右变化;若T 值偏离此值太远,H0发生的可能性就很小;若偏离出给定的a值所确定的范围内,即P<a,拒绝H0(2)适用条件:完全随机设计的两个样本比较,若不满足参数检验的应用条件,则用本法;两个等级资料比较(3)查表法1)建立假设检验,确定检验水准H0:两总体分布相同H1:两总体分布不同a=0.052)确定秩和检验统计量T首先编秩号,排序时若有相同数据,取平均秩次,进而将两组数据的秩次分别求和,若两组例数相同,则任取一组的秩和作为统计量;若两组秩次不同,则以例数较小者对应的秩和作为统计量3)确定P值,作出推断结论当n1≦10,n2-n1≦10时,查两样本比较的T界值表,将检验统计量T值与T的临界值作为比较,如果T在界值范围内,则P值大于表上方的概率值(0.05),;若T等于界值或在界值范围外,则P值等于或小于表上方的概率值(4)正态近似法当n1或n2-n1超过10时,可用正态近似法计算z值进行z检验;当相同秩次较多时(尤其等级资料),z值需进行校正(公式不用记)6、多个独立样本比较的秩和检验(1)基本思想:如果总体分布位置相同,各组的秩和应该相差不大(2)适用条件:不满足参数检验的应用条件的完全随机设计的多个样本比较;多个等级资料比较(3)一般步骤:1)建立假设,确定检验水准H0:多个总体分布相同H1:多个总体分布不全相同2)计算检验统计量H将多组数据从小到大混合编秩,如有相等数值则取平均秩次;然后分别计算各组的秩和;最后计算H如果相同秩次较多,使用校正公式更加准确3)确定P值,作出推断结论①当k=3,每组例数≦5,查H界值表②k>3,ni>5,近似服从v=k-1的X2分布,查X2界值表7、参数统计和非参数统计的优缺点十、线性相关与回归1、相关:当一个变量增大,另一个也随之增大(或减少),我们称这种现象为共变,或相关;两个变量有共变现象,称为有相关关系;相关关系不一定是因果关系,有可能是伴随关系2、直线相关的资料要求:双变量正态分布3、相关系数:是指衡量两个连续变量之间关联的强度的指标,样本的相关系数用r表示,总体的相关系数用表示;取值范围:-1≦相关系数≦1(1)正相关:0<r≦1,散点云图是斜向上的,这时一个变量增加,另一个变量将增加(2)负相关:-1≦r<0,散点云图是斜向下的,这时一个变量增加,另一个变量将减少(3)相关系数的绝对值越接近1,两变量的关联程度越强;相关系数的绝对值越接近0,两变量的关联程度越弱4、相关系数的显著性检验(1)查表法:当n≦52,v=n-2,查r界值表得到P值1)建立检验假设,确定检验水准H0:=0,XX与XX之间不存在相关关系H1:≠0,XX与XX之间存在相关关系a=0.052)计算统计量3)确定P值,作出结论查r界值表(2)t检验法:当n>52,计算检验统计量tr,查t界值表得到P值1)建立检验假设,确定检验水准2)计算统计量3)确定P值,作出结论查t界值表5、相关注意事项(1)线性相关的前提条件是X、Y都服从正态分布(双变量正态分布)(2)必须在假设检验认为相关的前提下才能以r的大小判断相关程度(3)相关关系并不一定是因果关系,有可能是伴随关系6、自变量(X):原因、容易得到的、变化小的7、因变量(Y):结果、不容易得到的、变化大的8、线性回归:当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系,但在实际生活当中,由于其他因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程反映,为了区别于两变量间的函数方程,我们称这种关系式为直线回归方程,这种关系为直线回归——Y^=a+bX(1)式中的Y^是由自变量X推算因变量Y的估计值,a是回归直线在Y轴上的截距,即X=0时的Y值;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y 平均变动b个单位(2)计算原理:最小二乘法,该方法的原则是保证各实测点到回归直线的纵向距离的平方和最小,从而使计算出的回归直线最能代表实测数据所反映出的直线趋势9、回归方程的假设检验:总体的回归系数一般用β表示(1)方差分析基本思想:如果X与Y之间无线性回归关系,则SS回归与SS残差都只包含随机因素对Y的影响,因此其均方MS回归与MS残差应近似相等,如果两者差别较大,并超出能够用随机波动解释的程度,则认为回归方程具有统计学意义1)建立检验假设,确定检验水准H0:β=0,即XX与XX间无线性回归关系H1:β≠0,即XX与XX间有线性回归关系a=0.052)计算统计量3)确定P值,得出统计结论查F界值表(2)t检验1)建立检验假设,确定检验水准2)计算统计量Sb是样本回归系数b的标准误,反映样本回归系数与总体回归系数之间的抽样误差Sy|x是剩余标准差,表示因变量Y对于回归直线的离散程度3)确定P值,作出结论10、线性回归分析的注意事项(1)只有将两个内在有联系的变量放在一起进行回归分析才是有意义的(2)作回归分析时,如果两个有内在联系的变量之间存在的是一种依存因果的关系,那么应该以“因”的变量为X,以“果“的变量为Y;如果变量之间并无因果关系,则应以易于测定、较为稳定或变异较小者为X(3)在回归分析中,因变量是随机变量,自变量既可以是随机变量(II型回归模型,两个变量都应该服从正态分布),也可以是给定的量(I型回归模型,在X取值固定时Y服从正态分布),如果数据不符合要求,在进行回归分析前,必须先进行变量的变换(4)回归方程建立后必须作假设检验,只有经假设检验拒绝了无效假设,回归方程才有意义(5)使用回归方程计算估计值时,不可把估计的范围扩大到建立方程时的自变量的取值范围外11、线性相关和回归的区别和联系(1)相关系数的计算只适用于两个变量都服从正态分布的情形,而在回归分析中,因变量是随机变量,自变量既可以是随机变量(II型回归模型,两个变量都应该服从正态分布),也可以是给定的量(I型回归模型,在X取值固定时Y服从正态分布)(2)线性相关表示两个变量之间的相互关系是双向的,回归则反映两个变量之间的依存关系是单向的(3)如果对同一资料进行相关与回归分析,则得到的相关系数r与回归方程中的b正负号是相同的(4)无论是相关分析还是回归分析,求出r或b后都要进行假设检验;实际上,对同一样本可以得出r与b互化的公式,同一样本的两种假设检验也是等价的r与b的符号一致,检验等价——t r=t b=(5)相关回归可以相互解释R的平方称为确定系数;R2=r2=SS回归/SS总;R2表示回归平方和在总平方和中所占的比重,即R2越接近1,说明回归效果越好十一、统计表与统计图1、统计表:是把统计资料和统计分析结果用表格的形式进行表达,其目的是简洁、清晰和直观,方便对比和阅读2、统计表的编制原则(1)重点突出,简单明了(2)主谓分明,层次清楚(3)格式规范3、统计表的结构(1)外形上包括:标题、标目、线条、数字及备注(注释)(2)内容上包括:1)主语:被研究的事物,在表的左边作为横标目2)宾语:说明主语的各项指标,在表的右侧3)定语:在标题内4、制作统计表的基本要求(1)标题:是统计表的总名称,放在表的上方中间位置,简明扼要地说明表的主要内容,包括时间、地点和研究内容(2)标目:用来说明表内数据涵义的文字;横标目位于表的左侧;纵标目位于表头右侧;总标目主要是对纵标目内容的概况,在需要时才设置;标目要尽可能简单、明了,指标的单位标示需清楚(3)线条:一般采用“三线表”的格式;表的顶线和底线把表的主要内容与标题分隔开,中间一条线把纵标目与数据分隔开,不宜使用竖线和斜线;如果某些标目或数据需要分层显示,可用短横线分隔(4)数字:用阿拉伯数字表示,位数对齐,小数位数一致;表内不留空格,无数字用“-”表示,缺失数字用“...”表示,并最好以备注的形式进行说明;若数字是“0”,则填写“0”(5)备注:位于表的下方,不列入表内5、统计图:是把数据资料以图示的形式表达,使数据对比更加形象、直观、一目了然6、统计图的制作原则(1)必须根据资料的性质、分析目的及表达效果选用适当的统计图(2)一个图通常只表达一个中心内容和一个主题,即一个统计学指标(3)绘制图形应注意准确、美观,图线粗细适当,定点准确,不同事物用不同线条或颜色表示,给人以清晰的印象7、绘制统计图的基本要求(1)标题:其作用是简明扼要地说明统计资料的内容、时间和地点,一般位于图的下方中央位置并编号,便于引用和说明(2)图域:一般用直角坐标系第一象限的位置表示图域,或者用长方形框架表示;纵横轴长度比例为5:7(3)标目:分为纵标目和横标目,分别表示纵轴和横轴数字刻度的意义,如有度衡量单位则要标出(4)图例:对图中不同颜色或图案代表的指标注释;通常放在横标目与标题之间(5)刻度:刻度可在内侧或外侧,其数值一般按从小到大的顺序,纵轴由下向上,横轴由左向右8、直方图:用直条矩形面积代表各组频数,各矩形面积总和代表频数的总和;主要用于表示连续变量频数分布情况9、线图:是通过线段的上升或下降来表示指标(变量)的连续变化过程,适用于描述一个变量随另一个变量变化的趋势和波动情况;通常纵坐标是统计指标,横坐标是时间变量10、半对数线图:是一种特殊的线图,纵坐标按对数尺度(通常采用常用对数)给出,横坐标仍按算术尺度,适用于描述研究指标变化的速度,比较事物之间相对的变化速度11、箱式图:用于比较两组或多组数据的平均水平和变异程度,各组数据均可呈现其平均水平、四分位间距、最小值和最大值,主要适用于描述偏态分布的资料;中间的横线表示中位数,箱体的长度表示四分位间距,两端分别是P75和P2512、散点图:用点的密集程度和变化趋势表示两指标之间的直线或曲线关系;适用于双变量资料13、直条图:又称条图,即用等宽直条的长短来表示相互独立的统计指标数值大小和它们之间的对比关系,统计指标既可以是绝对数也可以是相对数;纵轴坐标刻度必须从“0”开始;适用于各组统计指标的比较14、误差条图:用于比较多组资料的均值和标准差(或标准误、可信区间)15、百分条图:适用于描述一个计数资料的构成比或比较多个计数资料的构成比;以长条面积为100%,用长条内各段面积所占的百分比来表示各部分在全体中所占的比例16、圆图:把圆的总面积作为100%,表示事物的全部,而圆内各扇形面积用来表示全体中各部分所占的比例;适用于构成比资料十二、研究设计1、实验设计:是指研究者根据研究目的和条件,结合统计学要求,合理安排各种实验因素,严格控制实验误差,最大限度地获得丰富而可靠的数据;周密的研究设计,可以节省人力、物力、财力和时间,使研究因素的效应得以充分体现2、实验设计三要素(1)研究对象:是指根据研究目的而确定的观察总体,也称为受试对象/受试者或实验对象在实验开始前应对研究对象的条件做出严格的规定,以保证其同质性:1)研究对象应具有明确的纳入标准和排除标准2)选择对处理因素敏感的研究对象3)选择依从性好的受试者作为研究对象4)注意医学伦理学问题(2)处理因素:又称研究因素,是指根据研究目的施加于研究对象的干预措施处理水平:处理因素在实验中所处的状态称为因素的水平混杂因素:在实验过程中,除处理因素外也能使受试对象产生效应的因素(非处理因素),它可能干扰处理因素与效应间的关系在确定处理因素时,需注意以下两点:1)处理因素要标准化:处理因素在整个实验过程中应始终保持不变,有利于分析处理因素与实验结果之间的关系2)明确处理因素和非处理因素(3)实验效应:是处理因素作用于受试对象产生的反应和结果,通过具体的观察指标来表达1)主观指标和客观指标:选用的指标要尽量客观,客观指标不易受主观因素影响2)选择灵敏度和特异度高的指标①灵敏度:是指某处理因素存在时,所选指标能够反映处理因素的效应程度,即反映指标检出真阳性的能力②特异度:是指某处理因素不存在时所选指标不显示处理效应的程度,即反映指标鉴别真阴性的能力3)观察指标的准确度和精密度①准确度:是指研究结果与相应测定事物真实情况符合或接近的程度,主要受系统误差的影响②精密度:是指相同条件下对同一对象的某项指标进行重复测量时,观测值与其均值的接近程度,主要受随机因素的影响3、实验设计四原则(1)对照原则:对照是指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小;只有设立了对照组,才能消除非处理因素对实验结果的影响,使处理因素的效应得以体现1)空白对照:指对照组不给予任何处理;临床上一般不宜使用2)安慰剂对照:指对照组使用一种不含药物有效成分的“伪药物”,即安慰剂,其外观、气味、剂型和处置上均与实验药物相同,不能为受试对象所识别,常用于临床试验3)标准对照:对照组采用现有标准方法或常规方法,或不专门设立对照组,而以标准值或正常值作为对照,即为标准对照4)实验对照:对照组不施加处理因素,但施加某种有关的实验因素,其目的是使两组受试对象所受到的刺激、损伤相同,以避免施加处理的方式可能对其产生的影响5)自身对照:是指对照与实验在同一受试对象身上进行,可以是同一受试对象处理前后,也可以是同一受试对象同期接受不同处理6)相互对照:指各实验组之间互为对照7)历史对照(2)随机化原则:随机化是指每个受试对象有相同的概率或机会被分配到不同的处理组;随机化分组可以使各处理组的受试对象具有相近的特征,可比性好,避免研究者的主观因素对实验效应的影响(3)重复原则:重复是指在相同实验条件下重复进行多次观察;重复是消除非处理因素影响的重要方法,表现为样本量的大小和重复次数的多少为了保证研究结论具有一定可靠性,需要在设计阶段估算所需的最少实验单位数,即样本含量(4)均衡原则:均衡是指某因素各水平组中的受试对象所受到的非实验因素的影响是完全平衡的,即这些组之间的差别完全是由于该因素采取了不同水平所致,而并非其他因素取值不同所造成的影响。
医学统计学总结

医学统计学总结一.绪论1,医学统计学:运用概率论和数理统计学的原理和方式,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而说明其客观规律性的一门应用科学。
2,医学统计学的要紧内容:1)统计研究设计调查研究设计和实验研究设计2)医学统计学的大体原理和方式研究设计和数据处置中的大体统计理论和方式。
A:资料的搜集与整理 B:经常使用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估量和假设查验。
3)医学多元统计方式多元线性回归和慢慢回归分析、判别分析、聚类分析、主成份分析、因子分析、logistic回归与Cox 回归分析。
3,统计工作步骤:1)设计明确研究目的和研究假说,确信观看对象与观看单位,样本含量和抽样方式,拟定研究方案,预期分析指标,误差操纵方法,进度与费用。
2)搜集材料A,搜集材料的原那么及时、准确、完整B,统计资料的来源医学领域的统计资料的来源要紧有三个方面。
一是统计报表,二是常常性工作记录,三是专题调查或专题实验。
C,资料贮存3)整理资料 a检查查对b设计分组c拟定整理表d归表4)分析资料统计分析包括统计描述和统计推断4,同质(homogeneity):指被研究指标的阻碍因素相同。
变异(variation):同质基础上的各观看单位间的不同。
变量(variable):搜集资料进程中,依照研究目的确信同质观看单位,再对每一个观看单位的某项特点进行测量或观看,这种特点称为变量变量值:变量的观看结果或测量值。
5,整体(population)依照研究目的所确信的同质研究对象中所有观看单位某变量值的集合。
整体具有的大体特点是:同质性样本(sample)从整体中随机抽取部份观看单位,其变量值的集合组成样本。
样本必需具有代表性。
代表性是指样本来自同质整体,足够的样本含量和随机抽样的前提。
统计量(statistics)描述样本变量值特点的指标(样本率,样本均数,样本标准差)。
医学统计学总结

t
X 0 S/ nຫໍສະໝຸດ ~ t (n 1)t
σ1=σ2 成组均数检验
( X Y ) ( 1 2 ) S12 S22 n1 n2
( X Y ) ( 1 2 ) 1 1 S n1 n2
单向有序列联表
秩和或参照单位法
独立性检验
相关性分析 双向有序属性相同列联表 优势性检验 按单向有序分析 双向有序属性不同列联表 行、列相关性分析 线性趋势检验 关联性分析
一致性分析
配对秩和 数值型资料 两组秩和 秩 和 检 验 单向有序两组 多组秩和 配伍组秩和 数值型资料 单向有序多组
总体均数检验
t
σ1≠σ2
t
两个总体
配对均数检验
d d Sd n
总体方差检验
F
2 2 S2 /2 2 2 S1 / 1
单因素
多个总体均数
两因素(区组) 多因素
一般卡方(n>40且T最小>5) 独立四格表 校正卡方(n>40且1<T最小<5) 确切概率法(n<40或T最小<1) 分 类 资 料 统 计 方 法 双向无序列联表 一般卡方(pearson卡方)
医学统计学重点重点知识总结

医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。
(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。
这个范围称作可信度为1-a的可信区间,又称置信区间。
3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。
三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。
分辨一个样本是否属于某特定总体等。
区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。
医学统计学常用方法小结5篇

医学统计学常用方法小结5篇第一篇:医学统计学常用方法小结一、两组或多组计量资料的比较 1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验 2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验 2.多组资料:1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。
如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。
2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。
如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。
二、分类资料的统计分析1.单样本资料与总体比较1)二分类资料:(1)小样本时:用二项分布进行确切概率法检验;(2)大样本时:用U检验。
2)多分类资料:用Pearson c2检验(又称拟合优度检验)。
2.四格表资料1)n>40并且所以理论数大于5,则用Pearson c2 2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正c2或用Fisher’s 确切概率法检验3)n£40或存在理论数<1,则用Fisher’s 检验3.2×C表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势c2检验 3)行变量和列变量均为无序分类变量(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验4.R×C表资料的统计分析1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH c2或Kruskal Wallis的秩和检验2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH c2 3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析4)列变量和行变量均为无序多分类变量,(1)n>40并且理论数小于5的格子数行列表中格子总数的25%,则用Fisher’s 确切概率法检验三、Poisson分布资料1.单样本资料与总体比较:1)观察值较小时:用确切概率法进行检验。
医学统计学-总结-重点-笔记-复习资料

第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。
可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
总体population根据研究目的而确定的同质观察单位的全体。
样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本。
样本sample从总体中随机抽得的部分观察单位,其实测值的集合。
3选1小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。
P值:P 值即概率,反映某一事件发生的可能性大小。
统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。
P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
2) 拒绝原假设的最小显著性水平。
3) 观察到的(实例的) 显著性水平。
4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。
小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。
统计学中,一般认为等于或小于0.05或0.01的概率为小概率。
资料的类型(3选1)(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。
计量资料亦称定量资料、测量资料。
.其变量值是定量的,表现为数值大小,一般有度量衡单位。
如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。
计量资料measurement data定量资料quantitative data数值变量资料numerical variable为观测每个观察单位某项指标的大小,而获得的资料。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
11.50 54.50
12
Wilcoxon符号秩检验(例8-1)
Test Statistics b
新法 - 原法 Z Asymp. Sig. (2-tailed)
a. Ba se d on n eg ative ra nk s. b. Wilc ox on Sig ned R a nk s Te st
分类 观察性研究 实验研究 临床试验研究
观察性研究(调查研究)
分类 常用抽样方法 样本含量估计:用于参数(均数或率) 估计
实验研究
三要素 三原则(四原则) 样本含量估计:用于假设检验
单变量定量资料 统计分析
单变量定量资料统计描述
频数表(n较大时) 频数分布图(直方图) 统计指标 正态分布或近似正态分布资料:均数±标准差 倍数资料;对数正态分布资料:几何均数±几何 标准差 偏态分布;分布未知;分布末端有不确定数据: 中位数±四分位数间距 度量衡单位不同或单位相同但均数相差悬殊的多 组资料变异度比较:变异系数
-1.913
a
.056
单变量定量资料统计推断 —假设检验
3. 完全随机设计两均数比较
Y
两样本t检验
正态性 方差齐性
N
近似t检验 Wilcoxon 秩和检验
两样本t检验(例3-7)
Group Statistics
分组 N
Mean Std. Dev Std. iation Error Me
空腹血糖下降值 阿卡波糖胶囊 20 2.0650 3.06015 .68427 拜唐苹胶囊 20 2.6250 2.42050 .54124
两样本t检验(例3-7)
Tests of Norma lity
Kolm ogorov-Smirnov 分组 Statistic df 20 20 Sig.
a
Shapiro-Wilk Statistic .970 .971 df 20 20 Sig. .753 .775
空腹血糖下降值 阿卡波糖胶囊 .107 拜唐苹胶囊 .120
统计学的基本概念和思维逻辑 各种统计方法适用于什么资料,对于资料所要 求的条件 根据资料的性质和分析要求,应选用什么统计 方法 如何组织数据,输入数据,建立数据文件 如何运用计算工具或软件进行统计计算 如何阅读软件的输出结果,选择所需要的部分 写入论文 如何正确分析统计结论
医学研究设计
.200*
*. This is a lower bound of the true signif icance. a. Lillief ors Signif icance Correction
配对t检验(例3-6)
Paire d
Pai red
9
Mean Std. Devi Std.
Pai 哥 r 1 特 里 - .27240 罗 紫 .108681 法 - 脂 .0 肪
统计结果是否可靠取决于 以下几个方面
调查或实验设计是否周密完善,是否按设 计要求实施 所选用的指标是否特异性和客观性强, 灵敏度和精确度高 数据是否真实可靠,样本含量是否足够大 所选用的统计方法是否妥当 结果解释是否正确
选择统计分析方法流程
研究目的
病例分析 疗效分析 寻找病因 关系探讨 调查研究:横断面研究 回顾性研究 前瞻性研究
Wilcoxon符号秩检验(例8-1)
Tests of Normality
Kolm ogorov-Sm irnov Statis tic D .233 df 12
a
Shapiro-Wilk df 12 Sig. .076
Sig. Statis tic .070 .875
a. Li l l i efors Si gni fi cance Correcti on
医学统计学总结
山西医科大学卫生统计教研室 余红梅
题型
判断题(10个×2分=20分) 单项选择题(10个×2分=20分) 简答题(2个×10分=20分) 计算分析题(4个×10分=40分) 笔试×80%+实习分=总成绩
统计学的任务
结合专业知识和具体要求进行统计研究 设计 按照设计要求收集和整理资料 对所收集的资料进行统计处理 对统计处理的结果进行分析和解释
设计类型
实验研究:完全随机设计 随机区组设计 拉丁方
设计 交叉设计 析因设计 正交设计
Hale Waihona Puke 资料类型裂区设计 重复测量设计
定量资料 定性资料 等级资料
统计描述 :统计表 统计图 统计指标
统计分析目的
统计推断:参数估计 假设检验
统计分析方法
见后
运算
手工运算 统计软件:SAS SPSS
统计结论
报告
专业结论
医学统计学学习要点
N
Wilcoxon
符号秩检验
单变量定量资料统计推断 —假设检验
2. 配对设计两均数比较
Y
差值正态或 变换后正态 配对t检验
N
Wilcoxon
符号秩检验
配对t检验(例3-6)
Paire d Samp le s Statis tics
M ean Pair哥特里-罗紫法 1 .79520 脂肪酸水解法 .52280
Wilcoxon符号秩检验(例8-1)
Ranks
N 新法 - 原法 Negati ve Ranks Posi tive Ranks Ti es Total
a. 新法 < 原法 b. 新法 > 原法 c. 新法 = 原法
Mean Rank Sum of Ranks 2a 9 1
b c
5.75 6.06
单变量定量资料统计推断 —参数估计
总体均数点估计: X 总体均数区间估计: n较小时: X t, sX
总体 μ
n较大时: X usX 注意可信区间和参考值范围的区别
样本
单变量定量资料统计推断 —假设检验
1. 样本均数与总体均数比较
Y
样本来自正态
分布或变换后 为正态 t检验
N Std. Deviation Std. Error M e 10 .184362 .058300 10 .185981 .058812
配对t检验(例3-6)
Tests of Normality
Kolmogorov-Smirnov Statistic D .100 df 10 Sig.
a
Shapiro-Wilk Statistic .993 df 10 Sig. .999