医学统计学期末重点总结

合集下载

《医学统计学》复习重点总结

《医学统计学》复习重点总结

计量数据比较的统计公式
X 0 t Sx
样本均数与标准值的比较 *配对数据的比较(不做方 差齐性检验 *两样本均数的比较,例数 较小时(做方差齐性检验)
d d t Sd
X1 X 2 t S x1 x2
t检验与可信区间公式小结
X1 X 2 t , SX1X 2
两独立样本均数的t n1 n2 2 检验公式
病变性质
肿瘤
恶性
1.层次不清,结构混乱,难于理解 2.线条过多,不符要求
修改后:
表 10 病变性质 良性肿瘤 恶性肿瘤﹡ 囊肿 瘤样病变 合 计
口腔颌面部不同病变构成情况 例 数 674 558 192 168 1592 构成比(%) 42.34 35.05 12.06 10.55 100.00
﹡包括癌437例,肉瘤101例,果用统计表表达。
统计表类型:
简单表和组合表
统计图: 要求掌握图形选择. 如线图、直条图、直方图、构成图
例: 简单表格式
某地1980年男女HBsAg阳性率的比较 性别 调查例数 男 4234 女 4530 合计 8764 阳性数 303 181 484 阳性率% 7.16 4.00 5.52
第14章基于秩次的统计方法
掌握概念: 1)何为非参数统计? 2) 什么样数据适合采用秩和检验,以及秩和 检验的优缺点。 3)秩和检验有那几种检验方法?
注意:结果(y)数据为等级时,两组比较采 用秩和检验效率高于χ2检验,应首选秩和检验.
表 某病两组疗效的比较 比较组 无效 有效 显效 痊愈 合计 试验组 18( 31.6) 18 (31.6) 15(26.3) 6 (10.5) 57 对照组 21 (46.7) 15( 33.3) 8(17.8) 1( 2.2) 45 Total 39 33 23 7 102

医学统计学重点总结

医学统计学重点总结
小结:
(1) 单个样本均数 H0:μ=μ0t= ν=n-1 (小样本)
(已知样本——均数) H1:μ≠μ0
α=u= 或u= (大样本)(2)配对:H0:μ=μ0
H1:μ≠μ0t= ν=对子数-1
α=
(3) 两独立样本均数H0:μ=μ0t= ν=n1+n2-2
(4)(已知样本——样本) H1:μ≠μ0
9.对任何参数μ和σ的正态分布,都可以通过一个简单的变量变换成标准正态分布,即μ=X-μ
σ
9
标准正态分布
正态分布
面积或概率
-1~1
μ σ
%
~
μ σ
%
·
μ σ
%
10.医学参考值范围(reference value range)传统上称作正常值范围,指正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围。习惯上是包含95%的参照总体的范围。
实际工作中标准差 σ往往未知,因而通常用样本标准差S代替σ,求得样本均数 准误估计值S ,计算公式为 S = (当n→无穷,S→σ,S →0)
3 95%的可信区间的计算:x (μ,σ ) 1) σ已知,可信区间= σ
2)σ未知,n为小样本: t 3)σ未知,n为大样本:
T变换
μ变换
N (0,1)
3、t分布曲线的形态变化与自由度v=n-1有关。
2.四格表专用公式(
3对于四格表资料,通常规定为:(1)当n≥40且所有的T ≥ 5时,用检验的基本公式或四格表的专用公式;(2)当n ≥ 40 但有1≤T<5时,用四格表资料的校正公式;(3)当n<40,或T<1时,用四格表资料的Fisher确切 概率法。
4 行×列表资料的χ 检验: 自由度:ν=(行数-1)(列数-1)

医学统计学考试重点整理

医学统计学考试重点整理

一、基本概念1.总体与样本总体:所有同质观察单位某种观察值(即变量值)的全体样本:是总体中抽取部分观察单位的观察值的集合2.普查与抽样调查普查:就是全面调查,即调查目标总体中全部观察对象抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查3.参数与统计量参数:总体的某些数值特征统计量:根据样本算得的某些数值特征4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0H0正确Ⅰ型错误(ɑ)推断正确(1−ɑ)H0不正确推断正确(1−β) Ⅱ型错误(β)Ⅰ型错误(ɑ错误):H0为真时却被拒绝,弃真错误Ⅱ型错误(β错误): H0为假时却被接受,取伪错误5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。

(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。

安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。

(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。

安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)6.误差与标准误(区分率与均数)㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。

标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π(1-π)/n7。

方差分析方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。

医学统计学重点总结

医学统计学重点总结
医学统计学
综合练习
三类资料
(1) 定量资料(quantitative data) 以定量值表达每个观察单位的某项观察指标, 如血脂、心率等。 特点:
① 各观察单位间只有量的差别; ② 数据间有连续性。
三类资料
(2) 定性资料(qualitative data) 以定性方式表达每个观察单位的某项观察指标, 如血型、性别等。 特点:
举例 血型(A、B、O、AB) 人群中某病发生与否(发生、不发生)
描述指标: 相对数
率 构成比 相对比
常用相对数(1)
率(rate),又称频率指标,说明某现 象发生的频率和强度。(强度相对数)
率 = 可 实 能 际 发 发 生 生 某 某 现 现 象 象 的 的 观 观 察 察 单 单 位 位 总 数 数 比 例 基 数
比 A B
四格表(fourfold table)的概念
a
b
c
d
这四个格子的频数是整个表的基本数据,其 余数据都是从这四个基本数据推算出来的,这 种资料称为四格表资料。
2检验的基本思想
如果H0假设成立,则实际频数( actual
frequency)与理论频数应该比较接近。
如果实际频数与理论频数相差较大,超出了
区别
r 没有单位,b有单位;所以,相关系数与单位无 关,回归系数与单位有关;
相关表示相互关系;回归表示依存关系; 对资料的要求不同:
当X和Y都是随机的,可以进行相关和回归分析; 当Y是随机的(X是控制的),理论上只能作回归而不能作相关分析

实验研究的基本要素
处理因素:作用于受试对象,要求在实验过 程中观察其处理的因素
两样本比较的秩和检验(基本原理) Wilcoxon符号秩和检验(基本原理)

医学统计学重点重点知识总结

医学统计学重点重点知识总结

医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。

(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。

这个范围称作可信度为1-a的可信区间,又称置信区间。

3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。

三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。

分辨一个样本是否属于某特定总体等。

区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。

(完整版)医学统计学重点总结

(完整版)医学统计学重点总结

1.简述总体和样本的定义,并且举例说明。

总体是研究目的确定的所有同质观察单位的全体。

样品是从研究总体中抽取部分有代表性的观察单位。

2.简述参数和统计量的定义,并且举例说明。

描述总体特征的指标称为参数,描述样本特征的指标称为统计量。

3.变量的类型有哪几种?举例说明各种类型变量有什么特点。

①定量数据:计量资料;定量的观测值是定量的,其特点是能够用数值的大小衡量其水平的高低。

②定性数据:计数资料;变量的观测值是定性的,表现为互不相容的类别或属性。

③有序数据:半定量数据/等级资料;变量的观测值是定性的,但各类别(属性)有程度或顺序上的差异。

4.请举例说明一种类型的变量如何变换为另一种类型的变量。

定量数据>有序数据>定性数据--------------->5.请简述什么是小概率事件?概率是描述事件发生可能性大小的度量,P 0.05事件称为小概率事件。

≤6.举例说明什么是配对设计。

配对设计是将受试对象按某些重要特征相近的原则配成对子,每对中的两个个体随机地给予两种处理。

①同源配对:同一受试对象或同一标本的两个部分,随机分配接受两种不同处理;②异源配对:为消除混杂因素的影响,将两个同质受试对象配对分别接受两种处理。

7.非参数假设检验适合什么类型数据进行分析?①总体分布类型未知或非正态分布数据;②定量或半定量数据;③数据两端无确定的数值。

8.简述P 25 P 50 P 75的统计学意义。

(条件:明显偏态且不能转化为正态或近似对称;一端或两端无确定数值;分布情况未知)用来描述资料的观测值序列在某百分位置的水平,四分位数间距可以作为说明个体差异的指标(说明个体在不同位置的变异情况)。

9.直条图、直方图、圆饼图的使用条件是什么?直条图:各自独立的统计指标的数值大小和他们之间的对比;直方图:连续变量频数分布情况;圆饼图:全体中各部分所占的比例。

10.统计分析包括哪两个方面的内容?为什么要进行统计推断?统计描述和统计分析;统计描述用来描述及总结一组数据的重要特征,其目的是使实验或观察得到的数据表达清楚并便于分析。

医学统计学期末复习总结

医学统计学期末复习总结

医学统计学期末复习总结医学统计学期末复习总结名词解释1.参数Patameter:是指总体的统计指标,如总体均数、标准差,,采用希腊字母分别记为μ、σ。

是固定的常数。

多数情况下,总体参数是不易知道的,但可以通过随机抽样抽取具有代表性的样本,用算得的样本统计量估计未知的总体参数。

2.统计量statistic:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为X、S。

样本统计量是在总体参数附近波动的随机变量,可用来估计总体参数。

3.系统误差systematic error:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是克制的或可能掌握的。

(受确定因素影响,大小变化有方向性)4随机误差random error:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。

(影响因素众多,变化无方向性,不可避免,但可用统计方法进行分析)5 I型错误type I error:拒绝了实际上成立的H0,这类“弃真”的错误称为I型错误,其概率大小用α来表示。

(1-a)即可信度:重复抽样时,样本区间包含总体参数(m)的百分数。

6 II型错误type II error:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误,其概率大小用β来表示。

(1-β)即把握度(或检验效能):两总体确有差别,被检出有差别的能力。

7 P值P-value:在H0成立的前提下,用样本数据获得的样本统计量,及比样本统计量总计更极端的曲线下的面积。

8 置信区间confidence bound / confidence interval, CI:按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围。

9 多重共线性Multicollinearity:是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。

10哑变量dummy variable:用以反映质的属性的一个人工变量,是量化了的自变量,通常取值为0或1。

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。

②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。

③、等级资料,⼜称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。

2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。

③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。

④、样本(sample):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。

⑥、频率(frequency):指的是样本的实际发⽣率。

⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。

⽤⼤写的P表⽰。

3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。

第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

误差:观测值与真实值、样本计量与总体参数之间的差别。

相对数:两个有关的绝对数之比,也可以是两个有关联统计指标之比。

相对比:相对比是A、B两个有关联指标值之比,用以描述两者的对比水平,说明A是B 的若干倍或百分之几。

统计描述:描述及总结一组数据的重要特征,目的是使实验或观察得到的数据表达清楚并便于分析。

统计推断:指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。

同质:指根据研究目的所确定的观察单位其性质应大致相同。

变量:反映实验或观察对象生理、生化、解剖等特征的指标,变量的观测值称为数据。

定量数据:也称计量资料。

变量的观测值是定量的,其特点是能够用数值大小衡量其水平的高低,一般有计量单位。

根据变量的取值特征可分为连续型数据和离散型数据。

有序数据:也称半定量数据或等级资料。

变量的观测值是定性的,但各类别(属性)之间有程度或顺序上的差别。

总体:根据研究目的确定的所有同质观察单位的全体,它包括所有定义范围内的个体变量值。

样本:从研究总体中抽取部分有代表性的观察单位,对变量进行观测得到的数据。

参数:描述总体特征的指标称为参数。

统计量:描述样本特征的指标称为统计量。

概率:描述某事件发生可能性大小的度量。

小概率事件:习惯上将P≤0.05的事件称为小概率事件。

平均数:是描述一组观察值集中位置或平均水平的统计指标,常用的有算术均数、几何均数和中位数。

率:率表示在一定空间或时间范围内某现象的发生数与可能发生的总数之比。

构成比:表示某事物内部各组成部分在整体中所占的比重,常以百分数表示,计算公式为区间估计:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。

线性相关的概念:研究两个变量之间是否具有直线相关关系。

相关系数:是说明具有线性相关关系的两个数值变量间相关的密切程度与相关方向的统计量。

研究对象:根据研究目的而确定的观察总体,也可称为受试对象或实验对象。

处理因素:根据研究目而欲施研究对象的干预措施。

处理水平:处理因素在实验中所处的状态称为因素的水平(level),亦称处理水平。

对照:指在实验中应设立对照组,其目的是通过与对照组效应对比鉴别出实验组的效应大小。

随机化:是指每个受试对象有相同的概率或机会被分配到不同的处理组。

重复:是指在相同实验条件下重复进行多次观察。

统计学的基本内容:统计设计,数据整理,统计描述,统计判断
数据类型:定量数据,定性数据,有序数据
误差的类型:系统误差,随机测量误差,抽样误差
配对样本t检验配对设计:同源配对,异源配对,自身配对
方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。

非参数检验的适用范围:①总体分布类型未知或非正态分布数据;②有序或半定量资料;③数据两端无确定的数值。

标准差与标准误的区别与联系:区别:标准差:意义,描述个体观察值变异程度的大小,标准差越小,均数对一组观察值的代表性越好。

应用,与X拔结合,用以描述个体观察值的
分布范围,常用于医学参考值范围估计。

与N的关系,N越大,S越趋于稳定
标准误Sx拔:描述样本均数变异程度及抽样误差的大小,标准误越小,用样本均数推断总体均数可靠性好。

与X拔结合,用以估计总体的均数可能出现的范围,以及对总体的均数作假设检验。

N越大,Sx拔越小。

联系:标准差与标准误都是描述便宜程度的指标。

Sx拔与S成正比,N一定时,S越大,Sx拔越大
1类错误与2类错误区别联系:区别:依依不通过,1类错误为拒绝了实际上成立的H0,也称弃真错误,第2类错误为不拒绝实际上不成立的H0,也称存伪错误。

概率不同,1类错误的概率为α,是根据研究目的设定的,2类错误概率为β是未知的,β能通过α间接估计大小。

联系:当样本含量一定时,α越大,β越小,α越小,β越大。

要同时减少1、2类错误,可增加样本含量
怎样正确选择用单侧检验和双侧检验:对于假设中的单侧检验和双侧检验的选择,要根据研究目的和专业知识而定。

若目的在于判断两总体均数,是否不等,或者有无差别,则应选择双侧检验,若从专业知识认为不会出现M<M0或M>M0,而检验目的是用以说明M>M0或M<M0时,则应选择单侧检验,在对专业知识不明确时,一般选择双侧检验单侧检验易获得p<α的结论,应慎重使用
线性回归与相关的关系:对同一资料做相关回归分析,相关系数r与回归系数b的正负符号相同,对同一资料做相关与回归分析,相关系数的t检验与回归系数的t检验相同,即t=tb,相关与回归可以相互解释,即r的平方=SS回归/SS总
计量资料的检验方法有哪些:t检验(样本均数总体均数的比较,两个样本的均数的比较,配对资料的t检验)μ检验:大样本均数与总体均数的比较,两个大样本均数的比较。

F检验:完全随机设计单因素方差分析,随机区组设计方差分析,拉丁方设计的f方差分析
描述计量资料离散趋势常用的指标有哪些,其适用条件:指标有:极差,四分位数,方差,标准差,变异系数。

适用条件:极差和四分位数适用于偏态分布资料用以描述其离散程度或变异度。

方差标准差适用于对称分布或正态分布资料用以描述其离散程度或变异度。

变异系数适用于度量衡单位不同,或均数相差比较悬殊的两组资料,比较其离散程度,或变异度描述计量资料集中趋势的指标有哪些,其适用条件:指标:算数平均数,几何均数,中位数。

适用条件:算数平均数适用于对称分布或正态分布资料,几何均数适用于等比分布或对数正态分布资料
卡方资料的假设检验方法(四格表资料卡方检验,行x列资料,配对资料
描述计量资料的统计描述有:频数分布表和频数直方图,集中趋势的描述(常用平均数,算数平均数,几何均数,中位数)离散趋势的描述(极差,四分为间距,方差,标准差,变异系数)
描述方差分析的应用范围:完全随机设计的两个或两个以上的均数比较的方差分析,随机区组设计的方差分析,拉丁方设计的方差分析,回归分析中直线回归方程的假设检验,多个因素的交互作用分析
简述检验假设步骤:建立假设和确定检验水准,选择检验方法和计算检验统计,确定p值和做出统计推断结论
均数的可信区间与参考值范围有何不同:可信区间:是指按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。

计算:正态分布:δ未知
应用:总体均数的区间估计,评估未知总体均数所在的范围;参考值范围:正常人的解剖,生理,生化某项指标波动的范围,95%参考值范围指同质总体包含95%个体值的估计范围,说明个体的波动范围。

计算:
判断观察值的某项指标与否,评价个体指标是否正常。

线性回归分析的应用:1. 线性回归方程可应用于以下三个方面:①分析两个变量之间是否存在线性依存关系;②利用回归方程由自变量X 对应变量Y 进行估计,必要时可以作区间估计;③利用回归方程进行统计控制,即利用回归方程进行逆运算,通过控制自变量X 取值来限定应变量Y在一定范围内波动。

2. 作回归分析时,如果两个有内在联系的变量之间存在因果关系,那么应该以原因变量为X ,以结果变量为Y;如果变量之间因果关系难以确定,则应以易于测定或变异较小者为X。

3. 在回归分析中,自变量X 既可以是随机变量,也可以是给定的量。

如果Y不服从正态分布,在进行回归分析前,应先进行变量的变换以使应变量符合回归分析的要求。

4. 使用回归方程估计Y 值时,尽量不要把估计的范围扩大到建立方程时的自变量的取值范围之外,由于超出样本取值范围,其线性关系是否成立难以判断,外推要慎重。

相关文档
最新文档