医学统计学复习提纲 考试必过

合集下载

医学统计学总复习

医学统计学总复习

总复习一、统计工作的基本步骤:四个步骤:设计(最关键的一步)、搜集资料(统计分析的前提)、整理资料、分析资料。

二、三种资料类型:1. 计量资料(定量资料)2. 计数资料(分类资料)3. 等级资料三、几个基本概念1. 总体与样本2. 概率四、计量资料的统计描述1. 集中趋势:X、G、M(Px):适用条件、计算2. 离散趋势:R、Q、S、CV:意义及适用条件五、集中趋势离散趋势指标的选择判断步骤:资料是抗体滴度 G、S否是偏态、开口 M、Q否X、S六、正态分布1.正态分布的特征2.正态曲线下分布面积的规律3.u变换(见下)七、抽样误差的概念1. 抽样误差(概念)2. 抽样误差的特点:⑴客观存在,可控制但不能消除;⑵它是反映抽样误差大小的指标:用Sx来说明均数的抽样误差大小;用Sp 来说明率的抽样误差大小;⑶均数抽样误差的大小与标准差成正比,与√n成反比;⑷减少抽样误差最切实可行的办法为:增加样本含量。

3. 总体均数的估计方法⑴点(值)估计:⑵区间估计:①95%可信区间:X±1.96Sx②99%可信区间:X±2.58Sx附:①正常参考值范围估计:①95%正常值范围:X±1.96S②99%正常值范围:X±2.58S②可信区间与正常值范围的区别4. u变换与t变换:X-μ X-μu变换: u=──── u=────σσxt变换: X-μt=────Sx八、假设检验的一般步骤:⑴建立假设①H0:无效假设;H1:备择假设②单双侧检验:根据专业知识来定。

⑵确定检验水准:α=0.05⑶选定检验方法并计算检验统计量⑷确定P值:直接计算、查表法⑸作出推断结论:统计结论:是否拒绝H0专业结论:谁高谁低?(有无效果)九、常用t检验(重点是掌握根据资料的性质、分析的目的来选择假设检验方法)1. t(u)检验的应用条件2. 假设检验方法:⑴ X与μ的比较的t检验(一般是单组原始数据)⑵配对设计资料的t检验(关键是掌握什么是配对资料)配对设计的三种情况:①同一对象治疗前后比较;②同一标本分别用两种方法处理;③将条件相同或相近的两个对象配成对子,然后随机分配到两个处理组中,观察两种处理有无差别。

医学统计学复习提纲

医学统计学复习提纲

《医学统计学》复习提纲第二章 统计描述公式:几何均数(1)直接法: nn X X X G ...21=或 )lg (lg )lg ...lg lg (lg 1211nX n X X X G n ∑--=+++=(2)加权法:)lg (lg ....lg ...lg lg (lg 12122111∑∑--=++++++=f X f f f f X f X f X f G k k k中位数(median ) (1) 直接法:n 为奇数 , 2)1(+=n X M n 为偶数,)(21122++=n n X X M(2)频数表法:用于频数表资料。

∑-+=)2(L Mf nf i L M 标准差(standard deviation ): nX ∑-=2)(μσ 1)(2--=∑n X X S离均差平方和2)(∑-X X 常用SS 或l XX 表示。

∑∑∑-=-==NX X X X l SS XX 222)()(直接法: 1)(22--=∑∑n n X X S 加权法:1)(22--=∑∑∑∑f ffX fX S1. 常用的相对数指标有哪些?它们的意义和计算上有何不同?2. 为什么不能以构成比代率?请联系实际加以说明。

率和构成比所说明的问题不同,绝不能以构成比代率。

构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。

例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。

这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。

但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。

若要比较高血压的患病率,应该计算患病率指标。

3. 应用相对数时应注意哪些问题?4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。

医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。

医学统计学复习大纲

医学统计学复习大纲

医学统计学复习大纲(一)绪论1)总体与样本总体:根据研究目的确定的同质研究对象的全体。

分为有限总体与无限总体。

样本:从总体中随机抽取的部分观察单位。

2)参数与统计量参数:总体的统计指标,用希腊字母表示。

如总体均数、标准差,分别记为μ、σ。

固定的常数。

统计量:样本的统计指标,用拉丁字母表示。

如样本均数、标准差,为X(拔)、S。

在参数附近波动的随机变量。

3)抽样误差误差:实际观察值与客观真实值之差a.系统误差在实际观测过程中,由研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。

特点:观察值有方向性、周期性。

可以通过严格的实验设计和技术措施消除b.非系统误差由研究者的偶然失误而造成。

c.随机误差排除上述误差后尚存的误差,受多种无法控制的因素的影响。

特点:大小和方向不固定。

随机测量误差——提高操作者熟练程度可以减少这种误差。

随机抽样误差(由抽样造成的样本统计量和总体参数间的差异。

)——不可避免,但有一定的分布规律,可估计。

4)四种随机抽样方法a.单纯随机抽样——将观察单位逐一编号,然后用随机数字表、抽签或电脑等方法随机抽取部分观察单位组成样本。

为最基本的抽样方法。

b.系统抽样——按一定顺序机械地每隔若干个观察单位抽取一个观察单位以组成样本。

又称间隔抽样、机械抽样、等距抽样。

c.整群抽样——从总体中随机抽取若干个“群体”以组成样本。

这个群体可以是班级、街道社区等。

d.分层抽样——先按影响观察值变异较大的某种特征,将总体分为若干类型或组别(统计上叫“层”),再从每一层内随机抽取一定数量的观察单位,以组成样本。

也即分类抽样。

误差大小排序:整群抽样>单纯随机抽样>系统抽样>分层抽样5)P ≤ 0.05(5%)或P ≤ 0.01(1%)称为:小概率事件,即某事件发生的可能性很小。

6)变量的分类a.数值变量——其变量值是定量的,表现为数值的大小,一般有度量衡单位。

——计量(定量)资料b.分类变量——其变量值是定性的,表现为互不相容的类别或属性。

医学统计学复习资料(完整版)

医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。

1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。

2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。

分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。

反映总体特征的指标为参数,常用小写希腊字母表示。

3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。

(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。

4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。

抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。

其根源在于总体中的个体存在变异性。

只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。

统计分析主要是针对抽样误差而言。

5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。

各类资料间可相互转化。

①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。

6.误差:实测值与真实值之差。

可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。

①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。

医学统计学复习资料与复习题答案

医学统计学复习资料与复习题答案

教学提要(一)《医用统计学》基本概念1、变异:宇宙中的事物,千差万别,各不相同。

即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。

同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。

2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。

3、总体:即根据研究目的确定的同质的研究对象的全体。

更确切地说,是性质相同的所有观察单位的某种变量值的集合。

4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。

为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。

5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资料称为计量资料,一般有度量衡等单位。

6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。

可分为二项式或多项式分类变量。

7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。

这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。

8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。

(二)统计工作的基本步骤1、设计: 这是关键的一步。

要求科学、周密、简明。

2、搜集资料: 要求完整、准确、及时。

医学统计资料的来源主要有三个方面:(1) 统计报表; (2) 日常医疗工作的原始记录和报告卡片; (3) 专题调查3、整理资料: 核查资料; 按性质或数量分组, 拟定整理表。

4、分析资料: 包括指标的计算、统计图表的绘制, 用统计方法如参数估计、假设检验等对资料作统计分析。

医学统计学复习资料

医学统计学复习资料

医学统计学复习资料导言医学统计学是医学领域中非常重要的一门学科,它的作用是帮助医生和研究人员通过收集、分析和解释数据来评估医学检验和治疗的效果。

本文将提供一份医学统计学的复习资料,帮助读者回顾和巩固相关的知识。

一、基本概念1.1 总体和样本在医学统计学中,总体是指我们研究的整体对象,而样本则是总体的一个子集。

例如,我们对某种疾病的患者进行研究时,患者总体就是所有患该病的人群,而样本则是我们实际观察到的一部分患者。

1.2 参数和统计量在医学统计学中,参数是用来描述总体特征的统计量,例如总体均值、总体方差等。

而统计量是通过样本数据来估计总体参数的量,例如样本均值、样本方差等。

假设检验是医学统计学中常用的一种方法,它用于判断总体参数的假设是否成立。

在假设检验中,我们先假设总体参数的某个值是正确的(称为零假设),然后通过收集样本数据来判断该假设是否成立。

二、数据的分布2.1 正态分布正态分布在医学统计学中非常重要,因为许多统计方法都假设数据服从正态分布。

正态分布具有钟形曲线的特点,均值、中位数和众数都重合在一起。

常见的正态分布检验有Shapiro-Wilk检验和Kolmogorov-Smirnov检验。

2.2 t分布t分布是一种在样本量较小的情况下使用的概率分布,它比正态分布的尾部更加厚重。

t分布的形状取决于样本量,当样本量增加时,t分布逐渐趋近于正态分布。

在医学研究中,常用t分布来进行样本均值的假设检验。

非参数检验是一种不依赖于数据分布的统计方法,它对数据的要求相对较低。

与参数检验不同,非参数检验适用于无法确定数据分布或偏离正态分布的情况。

常见的非参数检验方法有Wilcoxon秩和检验和Mann-Whitney U检验。

三、统计推断3.1 置信区间置信区间是一种用来估计总体参数的范围,它是一个区间,表示我们对总体参数的估计在一定置信水平下的可信程度。

通常,置信区间的宽度与置信水平相关,越高的置信水平意味着更宽的置信区间。

医学统计学考前复习提纲

医学统计学考前复习提纲

医学统计学考前复习提纲第1章绪论⼀、名解1、Statistic统计量:由样本观测值获得的统计指标称为统计量。

2、Statistics统计学:收集、分析、解释与呈现数据资料同时处理数据中变异的⼀门学科。

3、Medical statistics医学统计学:运⽤概率论和数理统计学的原理和⽅法,研究医学数据的收集、整理、分析和推断,从⽽发现医学现象的内在规律,⽤以指导医学理论和实践的学科。

4、Individual个体(观察单位observation unit):是医学研究获得数据的基本单位,也是研究者所直接⾯对的研究对象。

5、Population总体:根据研究⽬的,所有的同质的观察单位(个体)某项观测值的全体称为总体。

6、Sample样本:来⾃总体的部分观察单位的观测值称为样本。

7、Descriptive statistics统计描述:⽤统计指标、统计图表等描述资料的数量特征及其分布规律。

8、Statistics inference统计推断:指⽤样本信息推断总体特征的统计学问题,包括参数估计parameter estimation和假设检验hypothesis test两部分内容。

9、Homogeneity同质:同⼀总体中个体的性质,影响条件或背景相同或⾮常相近。

个体的同质性是构成研究总体的必备条件。

10、Variation变异:对于同质的研究对象,其变量值之间的差异称为变异。

11、Variable变量:可以测量的任何特征或属性(不同个体结果可能不同),能表现观察单位变异的某种特征。

12、Variance⽅差/均⽅mean square:13、random variable随机变量:随机实验结果的所有取值称为随机变量。

14、概率与频率:在相同的条件下,独⽴地重复n次实验(如采⽤某种药物治疗多名患者),随机实验地某⼀结果A(如有效)出现f次,则称f/n为结果A出现地频率(frequency)。

当n逐渐增⼤时,频率f/n始终在⼀个常数左右微⼩摆动,称该常数为结果A出现的概率(probability),记为P。

《医学统计学》复习资料

《医学统计学》复习资料

统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。

统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。

二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。

变异是同质基础上的观察单位(亦称为个体)之间的差异。

(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。

样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。

(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。

变量值:变量的测得值。

如身高150cm,体重50Kg等。

(四)参数与统计量参数是指总体特征的统计指标。

如某地健康成年男性的平均血红蛋白值。

统计量是指样本特征的统计指标。

如从某地健康成年男性中抽取一部分人的平均血红蛋白值。

(五)误差误差泛指测量值与真实值之差。

根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。

1.系统误差:测量结果有倾向性。

查明原因,可以避免。

特点:①测量结果有倾向性。

如仪器、试剂、判定标准等。

②查明原因,可以避免。

2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。

特点:①随机误差没有大小和方向。

②不可避免。

3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。

特点:变异是绝对的,抽样误差不可避免。

原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。

(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。

随机事件的概率在0~1之间,即0≤P≤1。

小概率事件:P≤0.05或P≤0.01的事件。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

一、直线回归
n n
直线回归系数的意义及其假设检验 直线回归方程的建立 直线回归的应用
n
二、直线相关
n n
n
直线相关系数的意义和计算 直线相关系数的假设检验 直线回归系数与相关系数的区别和联系 •等级相关系数的适用范围 •等级相关系数的计算和假设检验。
三、秩相关
常用统计图表
1. 列表的原则 2. 列表的基本要求 3. 图的种类 ★ 4. 制图的基本要求
正常
正常
%
双侧
正态分布法
单侧 只有下限 只有上限
百分位数法
单侧 双侧 只有下 只有上限 限
90 95 99
. X ± 1 64 S X - 1 28 S . . X ± 1 96 S X - 1 64 S .
X + 1 28 S .
设计、收集资料、整理资料、统计分 析。其中统计分析包括: (1)统计描述:选择正确的统计指标反映 资料的数量特征;为便于分析和比较,可 绘制相应的统计图表 (2)统计推断:用样本信息推断总体特 征,包括参数估计和假设检验。
定量资料的统计描述 一、频数分布图表
㈠频数分布表编制 ㈡频数分布的类型
二、统计指标
估计参考值范围的步骤与要点
设计:①样本:“正常人”,大样本n≥100。②单侧或双侧。 ③指标分布类型。 计算:①若直方图看来像正态分布,用正态分布法。 ②若直方图看来不像正态分布,用百分位数法。
置信区间示意图
均数的 分布
个体值 的分布
­ t , n S x a ­ t , n S x a
数据类型 定量资料

等级资料

分类资料 统计 描述 率,比, 构成比 总体 率的 置信 区间
正态?
统计 描述
X ± S
统计 描述 Md,Q t 方 检差 验分 析
总体 均数 置信 区间
秩和 检验
2 c 检 验
回归与相关
★ 两个关联变量资料的统计分析步骤: 1. 统计描述: 指标:回归系数b­­­描述Y依赖X的直线变化数量关系 相关系数r­­­相关的密切程度和方向 图表:散点图 2. 参数估计:回归系数的置信区间 3. 假设检验:t检验
当b+c³40时可不校正,而b+c<40时则一定要校正
2 4. 多个率比较的c 检验
秩和检验
★ 1. 非参数统计的基本思想: 非参数统计是不依赖于总体分布具体形式的统计 方法。特点:不受总体参数的影响,比较的是分布 或分布位置,而不是参数。 ★ 2. 几种秩和检验的编秩方法
单变量统计方法的选择
n K ­ 1 N ­ 1
MS
F
MS 处理 MS 误差
SS 处理 n 处理 SS 区组 n 区组
MS 区组 MS 误差
SS 总 ­ SS 处理 ­ SS 区组 (k­1)( n­1) SS 误差 n 误差
X ∑ 2 ­ C
N ­ 1
C = ( X ) / ∑ 2 N
①请指出该资料中一个错误使用的概念,正确的名称应 该是什么? ② 能否据此认为“不饮酒”相对与“饮酒”来说更易于导致 高血压,为什么?应该怎样做? 答:(1)发病率,应该是患病率。 (2)不能,性别构成不齐同。采用直接标化法。
正态分布
一、正态分布的基本特征
(1)正态曲线在横轴上方均数处最高。 (2)正态分布以均数为中心,左右对称。 (3)正态分布有两个参数,即均数(位置参数) 和标准差(变异度参数)。 (4)正态曲线下的面积分布有一定规律。
X + 1 64 S .
P5 ~ P95 P10 P90 P2.5~P97.5 P5 P95 P0.5~P99.5 P1 P99
X ± 2 58 S X - 2 33 S X + 2 33 S . . .
总体均数的估计和假设检验--统计推断
一、均数的抽样误差与标准误
标准正态分布 ­1~1 ­1.96~1.96 ­2.58~2.58
正态分布 面积或概率 68.27% μ±σ 95.00% μ±1.96σ 99.00% μ±2.58σ
四、医学参考值范围
单侧下限­­­过低异常 单侧上限­­­过高异常 双侧­­­过高、过低均异常
异常 双侧下限 正常 异常 异常 异常
抽样误差:在抽样研究中,由个体变异和其它随机因 素造成的样本统计量(如 X )与总体参数(m )的差 别,以及样本统计量( X)之间的差别。 样本均数的标准误:反映了样本均数间的变异程 度,也反映了样本均数与总体均数间的差异,说明 均数抽样误差的大小。
S x = S n
二、t分布 图形和特征:
随机区组设计: SS =SS +SS +SS 总 组内 处理组间 区组间 +SS 误差
ν总= ν组内+ ν 处理组间 + ν区组间 + ν误差
SS
1 ( X ∑∑ ij ) 2 ­ C n i j
1 ( X ∑∑ ij ) 2 ­ C k j i
f(t) 0.3
υ=1 υ=∞(标准正态分布) υ=5
0.2
0.1
­5
­4
­3
­2
­1
0
1
2
3
4
5
图 3.5 标准正态分布和 t 分布的图形 ν=∞时的 t 分布即标准正态分布
三、总体均数的估计
1.点估计:→m 2.置信区间估计: 95%CI:认为算出的置信区间包含总体参数,置信程 度为95%≠总体参数落在该范围的可能性为95%
六、方差分析 1.方差分析基本思想:
(1) 离均差平方和分解(变异数分析),以及自 由度分解 (2) 求方差(均方):计算组间和组内的“平均”变 异程度 (3) 求F统计量:F=MS组间/MS误差(H 成立 0 则F=1)
2.方差分析基本步骤:
(1) 作检验假设:H :总体均数相等; 0 H :总体均数不等或不全相等 1 (2) 计算统计量F值: (3) 确定P值并作出结论: (4) 两两均数间比较(当P≤0.05时)
2 c 检 验
1. c2 检验基本思想: H 成立时,可参照合计率计算理论数,其理论 0 数与实际数的差别代表随机误差,一般不会很大。 2 当c 值大到一定程度,超过检验界值时,便可在a水 准下拒绝H 0
2 ★ 2.四格表c 检验(选公式) 应用条件: 2 ① 当n³40且所有T³5时,用一般的c 检验,若所得 P»a,改用确切概率法; 2 ② 当n³40但有1£T<5时,用校正的c 检验; 2 ③ 当n<40或有T<1时,不能用c 检验,用确切概率法 2 ★ 3.配对四格表c 检验(选公式)
成组设计方差分析与成组设计t检验关系
2 k=2时,F=t , P值相等 ­­­­ 二者等价
配伍设计方差分析与配对设计t检验关系
2 k=2时,F =t , P值相等 ­­­ 二者等价 处理
变异和自由度的分解
完全随机设计: SS =SS +SS , ν总= ν组内+ ν 总 组内 组间
例1 有人为研究饮酒与高血压的关系,普查了 某地区得到如下资料:
饮酒组 不饮酒组 检查人数 患者 发病率 (/千 ) 检查人数 患者 发病率 (/千 ) 1339 35 26.14 591 14 26.69 男 127 7 55.12 895 31 34.64 女 42 28.65 1486 45 30.28 合计 1466
3.概率 概率:描述某件事情发生的可能性大小的数值,记为P。 必然事件 P=1 不可能事件 P=0 随机事件 0≤P≤1 小概率事件 P≤0.05 实际很不可能发生
4. 同质与变异
同质:指事物的性质、影响条件或背景相 同或非常相近。 变异:指同质的个体之间的差异 。
5. 统计工作的基本步骤
t检验以t分布为理论基础。 小样本时要求假定条件: 资料服从正态分布,方差齐同。
2.第一类错误、第二类错误及检验功效
Ⅰ型错误:H 成立却错误 0 地拒绝H ,其概率为α。 0 Ⅱ型错误:H 不成立却不拒 0 绝H ,其概率为β。 0 功效1­β:检验效 能,是当两总体确有差 异,按规定检验水准α 所能发现差异的能力。
α与β的关系: ①当n一定时,α愈小,β愈大; ②要同时减小α、β,增大n。
例1 假设检验中α与P的区别何在?
答:以t检验为例,α 与P都可用t分布尾部面积 大小表示,所不同的是: α 值是指在统计推断时预 先设定的一个小概率值,就是说如果H 是真的,允 0 许它错误的被拒绝的概率。P值是由实际样本获得 的,是指在H 成立的前提下,出现大于或等于现有 0 检验统计量的概率。
平均数指标 离散指标
★据分布类型选用统计指标: 1.服从或近似正态分布:均数±标准差(X ± S ) 2.对数正态分布:几何均数G 3.偏态分布资料:中位数M, 四分位数间距Q
分类资料的统计描述
1.率 2.构成比 3.比 ★ 标准化法基本思想 采用统一的标准人口年龄构成,以消除不同人口 构成对两地死亡率的影响,使得到的标准化死亡率 具有可比性。 应用相对数指标的时候要注意:分母不宜过小;不 要以比代率;资料的可比性;样本指标比较时应做假 设检验。
正常
μ
x
t , n S x a t , n S x a
异常
异常
双侧下限 ­Z S α
双侧上限 Z S α
★二者不可混淆!
参考值范围示意图
四、假设检验
五、t检验
1.要求:根据资料类型正确选用t检验
定量资料(正态)→两均数→一个样本一个总体→单样本t检验
两个样本→配对→配对t检验 未配对→成组t检验
医学统计复习提纲
概论:
1. 统计资料类型 变量:指标,指观察单位的某项特征 资料:观察所得的变量值或指标值 资料类型: 二项分类 定量资料 无序分类 多项分类 定性(分类)资料 有序分类(等级资料)
相关文档
最新文档