福建医科大学统计学归纳总结

合集下载

医科大学医学统计学重点知识总结

医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。

医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。

2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。

变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。

注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。

有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。

样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。

在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。

医学统计学重点重点知识总结

医学统计学重点重点知识总结

医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。

(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。

这个范围称作可信度为1-a的可信区间,又称置信区间。

3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。

三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。

分辨一个样本是否属于某特定总体等。

区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。

2023年医学统计学必背重点

2023年医学统计学必背重点

绪论2选1总体:总体(population)指特定研究对象中所有观测单位旳测量值。

可分为有限总体和无限总体。

总体中旳所有单位都可以标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观测单位,其测量成果旳集合称为样本(sample)。

样本应具有代表性。

所谓有代表性旳样本,是指用随机抽样措施获得旳样本。

3选1小概率事件:我们把概率很靠近于0(即在大量反复试验中出现旳频率非常低)旳事件称为小概率事件P值:成果旳记录学意义是成果真实程度(可以代表总体)旳一种估计措施。

p值是将观测成果认为有效即具有总体代表性旳出错概率。

一般成果≤0.05被认为是有记录学意义小概率原理:一种事件假如发生旳概率很小旳话,那么可认为它在一次试验中是不会发生旳,数学上称之小概率原理。

记录学中,一般认为等于或不不小于0.05或0.01旳概率为小概率。

资料旳类型(3选1)(1)计量资料:对每个观测单位用定量旳措施测定某项指标量旳大小,所得旳资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量旳,表现为数值大小,一般有度量衡单位。

如某一患者旳身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

(2)计数资料:将观测单位按某种属性或类别分组,所得旳观测单位数称为计数资料(count data)。

计数资料亦称定性资料或分类资料。

其观测值是定性旳,体现为互不相容旳类别或属性。

如调查某地某时旳男、女性人口数;治疗一批患者,其治疗效果为有效、无效旳人数;调查一批少数民族居民旳A、B、AB、O 四种血型旳人数等。

(3)等级资料:将观测单位按测量成果旳某种属性旳不一样程度分组,所得各组旳观测单位数,称为等级资料(ordinal data)。

等级资料又称有序变量。

如患者旳治疗成果可分为治愈、好转、有效、无效或死亡,多种成果既是分类成果,又有次序和等级差异,但这种差异却不能精确测量;一批肾病患者尿蛋白含量旳测定成果分为+、++、+++等。

医学统计学重点知识梳理

医学统计学重点知识梳理

重点知识梳理第一章1.统计学(statistics)是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。

2.总体(population)与样本(sample)任何统计研究都必须首先确定观察单位亦称个体(individual)总体(population)是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。

总体又分为有限总体(finite population)和无限总体(infinite population),有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个无限总体是抽象的,无时间和空间的限制,观察单位数是无限的3.统计学的研究方法(1)大量观察法对所研究事物的全部或足够数量进行观察的方法。

依据是大数定律(2)综合指标法从数量方面对现象总体特征的概括说明(3)统计推断法在一定的置信度下,根据样本资料的特征对总体特征作出估计和预测的方法第二章1.方差(variance):为了全面考虑观察值的变异情况,克服全距和四分位数间距的缺点,需计算总体中每个观察值X与总体均数的差值(X-μ),称之为离均差。

2.标准差(standard deviation):方差的度量单位是原度量单位的平方,将方差开方后与原数据的度量单位相同。

标准差大,表示观察值的变异度大;反之,标准差小,表示观察值的变异度小。

3.变异系数(coefficient of variation,简记为CV):常用于比较度量单位不同或均数相差悬殊的两组或多组资料的变异度。

第三章1.正态分布(Normal distribution),也称“常态分布”,又名高斯分布。

是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

医学统计学知识点总结

医学统计学知识点总结

知识点1.统计学是应用概率论和数理统计的基本原理和方法,研究数据的搜集、整理、分析、表达和解释的一门学科。

2.医学统计学是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集、整理、分析、表达和解释的一门学科。

3.统计软件包是对资料进行各种统计处理分析的一系列程序的组合。

4.统计工作的基本步骤:研究设计、搜集资料、整理资料和分析资料。

5.科研结果的好坏取决于研究设计的好坏,研究设计是统计工作中的基础和关键,决定着整个统计工作的成败。

6.统计分析包括统计描述和统计推断。

统计描述是对已知的样本(或总体)的分布情况或特征值进行分析表述;统计推断是根据已知的样本信息来推断未知的总体。

7.医学原始资料的类型有:计量资料、计数资料、等级资料。

8.计量资料是用定量的方法对每一个观察单位的某项指标进行测定所得的资料。

9.计数资料是把观察单位按某种属性(性质)或类别进行分组,清点各组观察单位数所得资料。

10.等级资料是把观察单位按属性程度或等级顺序分组,清点各组观察单位数所得资料。

各属性之间有程度的差别。

等级资料的等级顺序不能任意颠倒。

11.同质:是指所研究的观察对象具有某些相同的性质或特征。

12.变异:是同质个体的某项指标之间的差异,即个体变异或个体差异性。

13.总体是根据研究目的确定的同质研究对象的总体。

样本是总体中具有代表性的一部分个体。

14.抽样研究是通过从总体中随机抽取样本,对样本信息进行分析,从而推断总体的研究方法。

抽样误差是由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异,其根源在于总体中的个体存在变异性,只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

15.统计学的主要任务是进行统计推断,包括参数估计和假设检验。

16.概率是某随机事件发生可能性大小(或机会大小)的数值度量。

概率的取值为0≤P≤1。

小概率事件是指P≤0.05的随机事件。

17.频数表和频数分布图的用途:(1)揭示计量资料的分布类型。

医学统计学知识点汇总

医学统计学知识点汇总

医学统计学知识点汇总医学统计学是指应用统计学原理和方法进行医学研究设计、数据分析和结果解释的学科。

医学统计学的知识点非常丰富,包括统计学基础知识、研究设计、样本量计算、控制方法、参数估计、假设检验和数据分析等方面。

以下是医学统计学知识点的一些精华汇总。

1.统计学基本概念:包括基本统计量(均值、中位数、众数)、数据类型(定量数据、定性数据)、数据的描述方法(频数分布表、直方图等)。

2.研究设计:包括随机对照试验、队列研究、病例对照研究等,了解不同研究设计的优缺点及适用场景。

3.样本量计算:确定研究样本量是保证研究结果可靠性的重要一环,需要根据研究目的、效应量和统计显著性水平确定样本量。

4.控制方法:包括随机分组、盲法、配对设计等,用于减少实验误差和避免偏倚。

5.参数估计:常用的参数估计方法有点估计和区间估计。

点估计是通过样本数据得到总体参数的一个点估计值,区间估计是对总体参数的一个区间估计。

6.假设检验:假设检验是用来判断样本数据与总体假设之间的差异是否显著的统计方法。

常用的假设检验方法有t检验、卡方检验、方差分析等。

7.数据分析:包括描述性统计分析和推断性统计分析。

描述性统计分析用来描述研究变量的基本情况,推断性统计分析用来推断样本数据与总体数据之间的关系。

8.相关分析:用来分析变量之间的关联程度,包括皮尔逊相关系数和斯皮尔曼等级相关系数等。

9. 回归分析:用来分析因变量与自变量之间的关系,包括线性回归分析和 logistic回归分析等。

10.生存分析:用来分析时间到达事件发生的概率,包括生存曲线的绘制、生存率的估计和影响因素的分析等。

11. 多变量分析:用来分析多个自变量对因变量的影响,包括多元方差分析、多元回归分析和多元Logistic回归分析等。

12. Meta分析:用于综合多个独立研究结果,对总体效应进行定量分析和综合评价。

以上是医学统计学的一些精华知识点的汇总。

医学统计学的应用非常广泛,不仅在医学研究中需要应用统计学的原理和方法,也在临床实践中需要对医学统计学知识有一定的了解和应用。

医学统计学重点整理汇总

医学统计学重点整理汇总

医学统计学重点第一章绪论1.基本概念:总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本:从总体中随机抽取部分个体的某个变量值的集合。

总体参数:刻画总体特征的指标,简称参数。

是固定不变的常数,一般未知。

统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。

抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。

称m/n为事件A在n次试验中出现的频率或相对频率。

概率:频率所稳定的常数称为概率。

统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断:包括参数估计和假设检验。

用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。

用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。

2.样本特点:足够的样本含量、可靠性、代表性。

3.资料类型:(1)定量资料:又称计量资料、数值变量或尺度资料。

是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。

每个个体都能观察到一个观察指标的数值,有度量衡单位。

(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由各分组标志及其频数构成。

包括二分类资料和多分类资料。

二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。

多分类:将观察对象按多种互斥的属性分类②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单位的个数所得的资料。

4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

第二章实验研究的三要素1.实验设计三要素:被试因素、受试对象、实验效应2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。

3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。

(完整版)医学统计学重点总结

(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。

总体是研究目的确定的所有同质观察单位的全体。

样品是从研究总体中抽取部分有代表性的观察单位。

2.简述参数和统计量的定义,并且举例说明。

描述总体特征的指标称为参数,描述样本特征的指标称为统计量。

3.变量的类型有哪几种?举例说明各种类型变量有什么特点。

①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。

②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。

③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。

4.请举例说明一种类型的变量如何变换为另一种类型的变量。

定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。

≤6.举例说明什么是配对设计。

配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。

①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。

7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。

8.简述P 25 P 50 P 75的统计学意义。

(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。

9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。

10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、统计方法选择的基本思路
正确选择统计方法的基本思路和原则就是根据以下6点来进行
综合判断:
1.研究目的
2.设计类型
3.资料类型
4.数据特征
5.对比组数
6.样本含量
1.研究目的
例如,一个四格表资料可以进行的统计分析或计算的统计量至少有差别性检验和独立性检验、列联系数、Kappa系数、OR值、RR 值、灵敏度、特异度等。

甲、乙两药治疗小儿上消化道出血的效果
组别有效无效合计
甲药27 18 45
乙药40 5 45
合计67 23 90
2.设计类型
完全随机设计的数据分析时,应选择相应的:
A.两样本(成组)t检验
B.单因素(完全随机设计)方差分析
C.卡方检验(独立样本)
D.两样本Wilcoxon秩和检验或多样本Kruskal-Wallis秩和检验
对于配对或配伍设计的数据,则应选择相应的:
A.配对t检验
B.随机区组设计方差分析
C.配对卡方检验
D.配对(Wilcoxon单样本秩和检验)或配伍设计的秩和检验(Friedman秩和检验)等。

3.资料类型
A.对于定量变量,选择它所对应的那些统计方法
如:t检验、方差分析或秩和检验等。

B.对于定性变量,则选择它所对应的统计方法
如:二项分布或Poisson分布的Z检验、卡方检验等。

C.其中等级资料一般采用秩和检验进行分析。

4.数据特征
对于同一设计类型和同一资料类型,仍然有许多方法可以选择。

A.t检验和方差分析属参数检验方法,对数据要求较高,通常要求数
据服从正态分布和方差齐性。

B.如果服从该条件或经变量变换后服从条件,则采用参数检验方法,否则采用秩和检验这类非参数检验方法。

5.对比组数
A.对于单组问题(样本与总体比较),即一个样本均数或率与总体均数或率的比较,可分别采用:
①.样本与总体均数比较的t检验
②.二项分布和正态分布原理进行分析
B.多组均数的比较、多组等级资料的比较,可分别采用:
①.方差分析
②.Kruskal-Wallis H秩和检验
③.Friedman M之和检验
C.多组率或构成比的比较,可采用R×C表卡方检验。

D.注意,多组比较在差别有统计学意义的情况下需再进行两两比较。

6.样本含量
A.在样本较小时:
①.如果是一个样本率与总体率的比较,可采用直接计算概率的方法如基于二项分布的确切概率法(求累计概率)。

②.如果是四格表资料则采用Fisher确切概率法或校正卡方检验。

③.对于均数比较问题,一般情况下采用t检验。

B.在大样本时,可考虑u检验作近似。

PS:循着上述基本思路进行综合判断,对于一个特定的资料,选择一个恰当的统计方法并非一件十分困难的事情。

在实际工作中,遇到的实际问题可能并非如此简单,须结合专业问题和所要分析的具体内容加以综合考虑和仔细判断,有时需对各种统计方法加以综合运用。

二、统计分析需注意的若干问题
1.数据分析通常的步骤:
数据探测+统计描述=统计推断
数据探测
A.数据探测常常是进行统计描述和统计推断的基础。

B.如数据分布特征的考察、方差齐性的判断、散点图的绘制、离群值的发现,以及了解数据是否符合特定统计方法的应用条件等,必要时可进行变量变换或转换以满足分析的需要。

C.数据探测将增加对数据的基本了解,为进一步分析奠定基础。

统计描述
A.统计描述:计算各种统计指标和运用各种统计图表描述和概括数据的数量特征及分布规律。

B.首先需要区分变量类型,定量变量和定性变量的统计描述指标
是不同的。

区间估计:
A.总体均数的区间估计,根据已有条件的不同如样本大小的不同,可采用t分布或正态分布原理进行估计。

B.总体率的区间估计,一般也是根据样本大小的不同以及样本率的大小,采用二项分布、Poisson分布或正态分布原理进行估计。

假设检验:???
集中趋势(x、G、M)
统计描述离散趋势(R、Q75-Q25、S、CV)
统计图表
计量资料点值估计
参数估计
统计推断区间估计
统t检验、u检验
计假设检验
分方差分析
析相对数:率、构成比、相对比
统计描述
计数资料统计图表
统计推断:卡方检验、确切概率法、二项分布、poisson分布等级资料:秩和检验、秩相关、卡方检验、线性趋势
双变量(多变量)资料的关联性分析方法小结
单变量资料差异比较的分析方法小结

料类型数据特征单组设计
完全随机设计配对或配伍设计
两组多组两组多组
定量资料
正态、
方差齐
样本与总体均数比较的
t检验两样本t检验单因素方差分

配对t检验
随机区组设
计方差分析
非正态
和/或
方差不齐
Wilcoxon符合秩和检验
t’检验、
Wilcoxon符
合秩和检验
Kruskal-Wallis
H秩和检验
Wilcoxon符
合秩和检验
Friedman M
秩和检验

性资料无序
二项分布直接计算概率
法、正态近似法(Z检验)
卡方检验、
Fisher确切概
率法
R×C表资料
卡方检验、
Fisher确切概
率法
配对四格表
卡方检验
配对R×C
表资料卡方
检验
有序
—Wilcoxon符
合秩和检验
Kruskal-Wallis
H秩和检验
——数据特征分析方法
相关分析
定量资料X,y服从双变量正态分布直线相关分析
X,y不服从双变量正态分布Spearman秩相关
定性资料
(R×C表)
双向无序卡方检验
双向有序、属性不同Spearman秩相关、线性趋势检验
双向有序、属性相同一致性检验(Kappa系数的假设检验)
回归
分析应变量为连续型定量变量,服从正态分布
一个应变量、一个自变量:直线回归分析
一个应变量、多个自变量:多重线性回归分析。

相关文档
最新文档