医学统计学复习资料
医学统计学总复习

总复习一、统计工作的基本步骤:四个步骤:设计(最关键的一步)、搜集资料(统计分析的前提)、整理资料、分析资料。
二、三种资料类型:1. 计量资料(定量资料)2. 计数资料(分类资料)3. 等级资料三、几个基本概念1. 总体与样本2. 概率四、计量资料的统计描述1. 集中趋势:X、G、M(Px):适用条件、计算2. 离散趋势:R、Q、S、CV:意义及适用条件五、集中趋势离散趋势指标的选择判断步骤:资料是抗体滴度 G、S否是偏态、开口 M、Q否X、S六、正态分布1.正态分布的特征2.正态曲线下分布面积的规律3.u变换(见下)七、抽样误差的概念1. 抽样误差(概念)2. 抽样误差的特点:⑴客观存在,可控制但不能消除;⑵它是反映抽样误差大小的指标:用Sx来说明均数的抽样误差大小;用Sp 来说明率的抽样误差大小;⑶均数抽样误差的大小与标准差成正比,与√n成反比;⑷减少抽样误差最切实可行的办法为:增加样本含量。
3. 总体均数的估计方法⑴点(值)估计:⑵区间估计:①95%可信区间:X±1.96Sx②99%可信区间:X±2.58Sx附:①正常参考值范围估计:①95%正常值范围:X±1.96S②99%正常值范围:X±2.58S②可信区间与正常值范围的区别4. u变换与t变换:X-μ X-μu变换: u=──── u=────σσxt变换: X-μt=────Sx八、假设检验的一般步骤:⑴建立假设①H0:无效假设;H1:备择假设②单双侧检验:根据专业知识来定。
⑵确定检验水准:α=0.05⑶选定检验方法并计算检验统计量⑷确定P值:直接计算、查表法⑸作出推断结论:统计结论:是否拒绝H0专业结论:谁高谁低?(有无效果)九、常用t检验(重点是掌握根据资料的性质、分析的目的来选择假设检验方法)1. t(u)检验的应用条件2. 假设检验方法:⑴ X与μ的比较的t检验(一般是单组原始数据)⑵配对设计资料的t检验(关键是掌握什么是配对资料)配对设计的三种情况:①同一对象治疗前后比较;②同一标本分别用两种方法处理;③将条件相同或相近的两个对象配成对子,然后随机分配到两个处理组中,观察两种处理有无差别。
医学统计学复习资料

小;③要注意分子分母正确选用;④要注意率与比的正确应用;⑤要注 意平均率的计算方法;⑥要注意资料的可比性;⑦率和构成比比较时作 假设检验。 7. 简述直线回归与直线相关的区别。 (1)资料要求上不同:直线回归分析适用于应变量是服从正态分布的随 机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布 的资料。 (2) 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存 关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快; 相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越 大,两个变量的关联程度越大。 9. 假设检验的理论依据是什么?请简述假设检验的基本步骤。 答:假设检验的理论依据是小概率事件原理,步骤为: (1)根据研究目的建立假设,确定检验水准 (2)根据样本统计量的抽样分布规律,选择适当的统计方法,计算检验 统计量 (3)确定P值,做出推断结论 10.方差分析应用广泛,可用于:①两个或多个样本均数间的比较;②分 析两个或多个因素间的交互作用;③回归方程的线性假设检验;④多元 线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计 资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分 析。 11. 完全随机设计的两样本率比较时,如何正确选择统计分析方法 (写出相应的计算公式)。 (1)当总例数n≥40且所有格子的T≥5时,用2检验的基本公式或四格表 资料2检验的专用公式; (2)当n≥40但有1≤T<5时,用四格表资料2检验的校正公式;或改用四 格表资料的Fisher确切概率法的连续性校正法: (3)当n<40,或T<1时,用四格表资料的Fisher确切概率法。 12. 什么是医学参考值范围?估计医学参考值范围如何正确选用统计 方法? 答:医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的 波动范围,亦称正常值范围。如95%的参考值范围包括了95%的观察 值,而有5%的观察值不在这一范围内。 估计医学参考值范围确定方法:
医学统计学复习资料

医学统计学第一章绪论第一节医学统计学的定义和内容1.医学统计学的主要内容 :统计推断、统计描述第二节统计工作的基本步骤1.医学统计工作可分为四个步骤:统计设计搜集资料整理资料分析资料第三节统计资料的类型医学统计资料按研究指标的性质一般分为:定量资料、定性资料、等级资料一、定量资料(计量资料)定量资料(quantitative data)是用定量的方法测定观察单位(个体)某项指标数值的大小,所得的资料称定量资料。
如身高(㎝)、体重(㎏)、脉搏(次/分)、血压(kPa,mmHg)等为数值变量,其组成的资料为定量资料。
二、定性资料(计数资料)定性资料(qualitative data)是将观察单位按某种属性或类别分组,清点各组的观察单位数,所得的资料。
亦称无序分类资料。
如:男-女分组;中医的虚、实,阴、阳等分组;按生存-死亡分组;A、B、O、AB分组。
三、等级资料等级资料(ranked data)是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料。
亦称有序分类资料。
如治疗结果分为治愈、显效、好转、无效四个等级。
:疾病的严重程度可以分为,轻、中、重;中医辨证中舌象的颜色有,淡、红、暗、紫。
♦根据需要,各类变量可以互相转化。
♦若按贫血的诊断标准将血红蛋白分为四个等级:重度贫血、中度贫血、轻度贫血、正常,可按等级资料处理。
有时亦可将定性资料或等级资料数量化,如将等级资料的治疗结果赋以分值,分别用0、1、2…等表示,则可按定量资料处理。
第四节统计学中的几个基本概念一、同质与变异同质(homogeneity)是指观察单位或研究个体间被研究指标的主要影响因素相同或基本相同。
如研究儿童的生长发育,同性别、同年龄、同地区、同民族、健康的儿童即为同质儿童。
变异(variation)由于生物个体的各种指标所受影响因素极为复杂,同质的个体间各种指标存在差异,这种差异称为变异。
如同质的儿童身高、体重、血压、脉搏等指标会有一定的差别。
《医学统计学》总复习

§1 统计分析
一,定量资料的统计分析
定量资料的统计描述
反映集中趋势的指标: X 反映集中趋势的指标: 反映离散趋势的指标: 反映离散趋势的指标:
定量资料的统计推断
G
S
M
S2 Q CV
R
参数估计 假设检验
参数估计
点估计:用样本均数直接作为总体 点估计:
三,等级资料的统计分析(秩和检验) 等级资料的统计分析(秩和检验)
非参数检验的概念 非参数检验的优缺点 常用的秩和检验方法
(1) Wilcoxon符号秩和检验 配对设计 符号秩和检验(配对设计 符号秩和检验 配对设计) (2) Wilcoxon 两样本比较法 成组设计两样本 两样本比较法(成组设计两样本 成组设计两样本) (3) Kruskal-Wallis 法或 检验 (成组设计多样本 法或H 成组设计多样本) 成组设计多样本 (4) Friedman 法(随机区组设计 随机区组设计) 随机区组设计 (5) Nemenyi 法(成组设计多样本两两比较) 成组设计多样本两两比较) 成组设计多样本两两比较 (6) 随机区组设计两两比较的秩和检验
u 检验应用类型: 检验应用类型: 1)样本均数与总体均数的比较 2)完全随机设计的两样本均数的比较 ANOVA 检验应用类型: 检验应用类型: 1)完全随机设计的方差分析 2)随机区组设计的方差分析 3)交叉设计的方差分析 4)析因设计的方差分析 5)重复测量资料的方差分析
二,计数资料的统计分析
t 检验 t'检验 检验 ′
t
u 检验 ANOVA
正态分布的经验判断方法
若 若 , S ≥ 3X可认为资料呈偏态分布
S ≥ ,有理由怀疑资料呈偏态分布 X
医学统计学复习资料(完整版)

第1章绪论医学统计学是一门“运用统计学的原理和方法,研究医学科研中有关数据的收集、整理和分析的应用科学。
1.个体:又称观察单位,是统计研究的最基本单位,也是构成总体的最基本的观察单位。
2.总体:根据研究目的确定的同质观察单位某项指标测量值(观察值)的集合。
分为有限总体(明确规定了空间、时间、人群范围内有限个观察单位)和无限总体(无时间和空间范围的限制)。
反映总体特征的指标为参数,常用小写希腊字母表示。
3.样本:从总体中随机抽取的一部分有代表性的观察单位组成的整体。
(抽样,随机化原则,样本含量)根据样本资料计算出来的相应指标为统计量,常用大写英文字母表示。
4.抽样研究:从总体中随机抽取样本,根据样本信息推断总体特征的方法。
抽样误差是由随机抽样(样本的偶然性)造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。
其根源在于总体中的个体存在变异性。
只要是抽样研究,就一定存在抽样误差,不能用样本的指标直接下结论。
统计分析主要是针对抽样误差而言。
5.变量(一个个体的任意“特征”);资料(变量值的集合),资料类型:①计量资料/定量资料/数值变量资料:表现为数值大小,一般有度量衡单位,又可分为连续型和离散型两类;②计数资料/定性资料/无序分类变量资料/名义变量资料:表现为互补相容的属性或类别,一般无度量衡单位,可分为二分类和多分类;③等级资料/半定量资料/有序分类变量资料:表现为等级大小或属性程度。
各类资料间可相互转化。
①可选分析方法有:t检验、方差分析、相关回归分析等;②可选分析方法有:χ2检验、z检验等;③可选分析方法有:秩和检验、Ridit分析等。
6.误差:实测值与真实值之差。
可分为随机误差(随机测量误差+抽样误差)与非随机误差(系统误差与非系统误差)。
①随机误差:是一类不恒定、随机变化的误差,由多种尚无法控制的因素引起,它是不可避免的;②系统误差:是实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生原因往往是可知的或可以掌握的,它是可以消除或控制的;③非系统误差:又称过失误差,是指在实验过程中由于研究者偶然失误而造成的误差,可以消除。
医学统计学复习资料与复习题答案

教学提要(一)《医用统计学》基本概念1、变异:宇宙中的事物,千差万别,各不相同。
即使是性质相同的事物,就同一观察指标来看,各观察指标(亦称个体)之间,也各有差异,称为变异。
同质观察单位之间的个体变异,是生物的重要特征,是偶然性的表现。
2、变量:由于生物的变异特性,使得观察单位某种指标的数值互相不等,所以个体值称为变量值或观察值。
3、总体:即根据研究目的确定的同质的研究对象的全体。
更确切地说,是性质相同的所有观察单位的某种变量值的集合。
4、样本:即从总体中抽取一部分作为观察单位进行观察,这部分观察单位称为样本。
为了使样本对总体有较好的代表性,抽样必须遵循随机化的原则,即总体中每一观察单位均有相同的机会被抽取到样本中去。
5、计量资料(数值变量资料):对每个观察单位用定量方法测定某项指标量的大小,所得的资料称为计量资料,一般有度量衡等单位。
6、计数资料(分类变量资料):将观察单位按某种属性或类别分组,所得各组的观察单位数,称为计数资料。
可分为二项式或多项式分类变量。
7、等级资料:将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。
这类资料与计数资料不同的是:属性的分组有程度的差别,各组按大小顺序排列;与计量资料不同的是:每个观察单位未确切定量,因而称为半定量资料。
8、抽样误差:由于总体中各观察单位间存在个体差异, 抽样研究中抽取的样本, 只包含总体的一部分, 因而样本指标不一定等于相应的总体指标, 这种样本统计量与总体参数间的差别称为抽样误差。
(二)统计工作的基本步骤1、设计: 这是关键的一步。
要求科学、周密、简明。
2、搜集资料: 要求完整、准确、及时。
医学统计资料的来源主要有三个方面:(1) 统计报表; (2) 日常医疗工作的原始记录和报告卡片; (3) 专题调查3、整理资料: 核查资料; 按性质或数量分组, 拟定整理表。
4、分析资料: 包括指标的计算、统计图表的绘制, 用统计方法如参数估计、假设检验等对资料作统计分析。
医学统计复习资料

医学统计复习资料
以下是一些医学统计学的复习资料:
1. 《医学统计学》(作者:杨晓丽、徐菲、马健等)
这是一本医学统计学的教材,内容全面,包含了医学统计学的基本概念、方法和应用等方面的知识。
2. 《医学统计学与SPSS应用》(作者:陈建华、李晓红、刘静等)
这本书介绍了医学统计学的基本概念和原理,并详细介绍了如何使用SPSS 软件进行医学统计分析。
3. 《医学统计学与临床研究设计》(作者:王伟)
这本书主要介绍了医学统计学在临床研究设计中的应用,包括研究设计的选择、样本量计算、数据收集和分析等方面的内容。
4. 《医学统计学》(作者:梁家全)
这本书详细介绍了医学统计学的基本概念和方法,包括描述统计学、推断统计学、生存分析和回归分析等方面的内容。
此外,还可以参考一些医学统计学的课件和教学视频,如Coursera上的《医学统计学》课程和YouTube上的《医学统计学基础》系列视频等。
同时,还可以参加一些医学统计学的培训班或研讨会,与专业人士交流学习经验和方法。
医学统计学复习资料

医学统计学复习资料导言医学统计学是医学领域中非常重要的一门学科,它的作用是帮助医生和研究人员通过收集、分析和解释数据来评估医学检验和治疗的效果。
本文将提供一份医学统计学的复习资料,帮助读者回顾和巩固相关的知识。
一、基本概念1.1 总体和样本在医学统计学中,总体是指我们研究的整体对象,而样本则是总体的一个子集。
例如,我们对某种疾病的患者进行研究时,患者总体就是所有患该病的人群,而样本则是我们实际观察到的一部分患者。
1.2 参数和统计量在医学统计学中,参数是用来描述总体特征的统计量,例如总体均值、总体方差等。
而统计量是通过样本数据来估计总体参数的量,例如样本均值、样本方差等。
假设检验是医学统计学中常用的一种方法,它用于判断总体参数的假设是否成立。
在假设检验中,我们先假设总体参数的某个值是正确的(称为零假设),然后通过收集样本数据来判断该假设是否成立。
二、数据的分布2.1 正态分布正态分布在医学统计学中非常重要,因为许多统计方法都假设数据服从正态分布。
正态分布具有钟形曲线的特点,均值、中位数和众数都重合在一起。
常见的正态分布检验有Shapiro-Wilk检验和Kolmogorov-Smirnov检验。
2.2 t分布t分布是一种在样本量较小的情况下使用的概率分布,它比正态分布的尾部更加厚重。
t分布的形状取决于样本量,当样本量增加时,t分布逐渐趋近于正态分布。
在医学研究中,常用t分布来进行样本均值的假设检验。
非参数检验是一种不依赖于数据分布的统计方法,它对数据的要求相对较低。
与参数检验不同,非参数检验适用于无法确定数据分布或偏离正态分布的情况。
常见的非参数检验方法有Wilcoxon秩和检验和Mann-Whitney U检验。
三、统计推断3.1 置信区间置信区间是一种用来估计总体参数的范围,它是一个区间,表示我们对总体参数的估计在一定置信水平下的可信程度。
通常,置信区间的宽度与置信水平相关,越高的置信水平意味着更宽的置信区间。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
医学统计复习资料一、名词解释[1].总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
总体可分为有限总体和无限总体。
总体中的所有单位都能够标识者为有限总体,反之为无限总体。
[2].样本:从总体中随机抽取部分观察单位,其实测值的集合。
[3].计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
[4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
[5].等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
[6].随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
[7].概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。
0﹤P(A)﹤1。
频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。
当试验重复很多次时P(A)= m/n。
[8].平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
[9].算术均数(arithmetic mean)描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X表示。
[10].几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G。
[11].中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
反映一批观察值在位次上的平均水平。
[12].方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。
[13].标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。
[14].变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV 表示。
计算:标准差/均数*100%。
[15].正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。
若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。
(曲线下面积和分布规律) [16].标准误及X s :通常将样本统计量的标准差称为标准误。
许多样本均数的标准差X s称为均数的标准误(standard error of mean,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。
[17].可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。
该范围称为总体参数的可信区间(confidence interval ,CI )。
它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α。
[18].假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。
[19].相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。
如率、构成比、比等。
[20].率:强度相对数,说明某现象发生的频率或强度。
[21].构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。
用来说明各构成部分在总体所占的比重或分布。
[22].相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。
两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。
两指标可以是绝对数、相对数或平均数。
(这几种相对数的差别)[23].回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用b 表示,b 的统计意义为X 每增(减)一个单位时,Y 平均改变b 个单位。
[24].相关系数r :用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。
二、需要掌握的几个公式1.均数的计算(1)算术均数nX n Xn X X X ∑=+++= 21(直接法) ∑=+++=fX X f X f X f X k k 2211(加权法)(2)几何均数2.中位数 n 为奇数时,)21(+=n XM ;n 为偶数时,2)12()2(++=n n X XM3.方差4.标准差(S):将方差取平方根,还原为与原始观察值单位相同的变异量度(反映样本值的离散程度)S =5.变异系数: 均数相差较大或单位不同的几组观察值的变异程度的比较100%S CV X=⨯ (百分数,可能大于1) 5.正态分布:S X 64.1±(90%);S X 96.1±(95%);S X 58.2±(99%)6.均数的标准误理论值 X σ= 估计值 X S =7.总体均数的可信区间计算(1)当σ未知时:按照t 分布双侧1-α的可信区间为 X S t X ν,2/05.0(-,),2/05.0X S t X ν+当侧1-α的可信区间为(X X S t X S t X γαγαμμ,, , +<->)(2)当σ已知或σ未知,但是n 足够大(如n>90),按照u 检验双侧1-α的可信区间为,96.1X S X ±当侧1-α的可信区间为X X X X σμσμαα+- ,三、计算和问答1.总体均数的估计(1)标准误:反映样本均数间变异的标准差。
(反映样本均数间的离散程度,也反映样本均数与总体均数的差异)理论值 X σ=,但是在实际情况中,由于总体标准差常常未知,故用样本标准差s 来估计,估计值 X S =(2)区间估计:按预先给定的概率,计算出一个区间,使它能够包含未知的总体均数。
①当σ未知时:按照t 分布双侧1-α的可信区间为 X S t X ν,2/05.0(-,),2/05.0X S t X ν+当侧1-α的可信区间为(X X S t X S t X γαγαμμ,, , +<->)②当σ已知或σ未知,但是n 足够大(如n>90),按照u 检验双侧1-α的可信区间为,96.1X S X ±当侧1-α的可信区间为X X X X σμσμαα+- ,(3)t 分布和u 分布的区别t 分布为抽样分布;u 分布为标准正态分布,为理论分布。
t 分布比标准正态分布的峰值低,且尾部翘得更高。
随自由度的增大,t 分布逐渐趋近标准正态分布。
2.假设检验即显著性检验,是统计推断的重要内容,比较总体参数之间有无差别。
首先对所需比较的总体提出一个无差别假设,然后通过样本数据去推断是否拒绝这一假设。
●基本步骤:⑴建立假设和确定检验水准⑵选择检验方法和计算检验计量⑶确定P 值,作出统计推断●无效假设:H0,指需要检验的假设,如**值治疗前后无差别,即H0:μd=0通常与我们要验证的结论相反,是计算检验统计量和P 值的依据●备择假设:是在H0成立证据不足的情况下而被接受的假设,即H1:μd ≠0双侧检验:无论正或负方向的误差,若显著超出检验水准则拒绝H0单侧检验:仅在正方向或负方向误差超出规定的水准时拒绝H0●P 值:假设检验下结论的主要依据,是指在原假设成立的条件下,观察到的样本差别是由于机遇所致的概率。
P>0.05不显著;0.01<P<=0.05 显著;P<=0.01非常显著3.t 检验(1)t 检验中的注意事项●样本资料必须能代表相应总体●t 检验以正态分布为基础;非正态数据尝试变换为正态,或用非参数检验●完全随机设计的两样本均数比较,要求两组方差齐●对同一资料作单侧检验更容易获得显著结果●假设检验用于推断总体均数间是否相同;可信区间用于估计总体均数所在范围4.方差分析将全部观测值的总变异按影响因素分为相应的若干部分变异,在此基础上,计算假设检验的统计量F 值,实现对总体均数是否有差别的推断。
●条件:来自于正态分布总体,且总体方差相等的k 个样本均数的比较(k>=3)●完全随机设计:又称单因素方差分析,将实验对象随机分配到不同处理组的单因素设计方法。
只考虑一个处理因素总变异 T SS :n 个观测值的离均差平方和组间变异 TR SS :组内均值与总均值之差的平方和组内变异 E SS :组内各个观测值与本组内均值之差的平方和(反映各组内样本的随机波动)●随机区组设计:又称配伍组设计,先将受试对象按条件相同或相近组成m 个区组,每个区组中有k 个受试对象,再将其随机地分到k 个处理组中。
(属于无重复数据的两因素方差分析)5.相对数两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。
如率、构成比、比等。
相对数死亡概率某年年初人口数某年内死亡人数=q 生存概率某年年初人口数某年活满一年人数=p生存率观察总例数时刻仍存活的例数k k k t t T P t S =>=)()(ˆ 相对数使用的注意事项⒈构成比只能说明某事物内部各组成部分的比重和分布,不能说明该事物某一部分发生的强度和概率。
⒉分母过小时相对数不稳定⒊用以比较的资料应是同质的⒋要考虑存在的抽样误差,对总体进行推断时应作统计学检验6.率的标准化为了比较两个不同人群的患病率、发病率、死亡率等资料时,消除其内部构成(年龄、性别、工龄、病程长短等)的影响。
7.2χ检验英国统计学家Peason 提出的一种用途广泛的假设检验方法。
该检验以2χ分布为理论依据,可以推断两个或者多个总体率以及构成比直接有无差异。
(1)四格表资料的2χ检验理论频数 ()RC R c T n n n =•四格表资料2χ检验专用公式 22()()()()()ad bc n a b c d a c b d χ-=++++ 四格表2χ检验校正公式 22(2)()()()()ad bc n n a b c d a c b d χ--=++++ 通常规则:①n ≥40且所有的T ≥5 基本公式(或专用公式)②n ≥40但有1≤T<5 校正公式③n<40,或T<1 Fisher 确切概率法(2)配对四格表资料的2χ检验 公式:㈠22()b c b c χ-=+, ν=1 (b + c) ≥ 40 ㈡22(1)b c b c χ--=+, ν=1 (b + c) < 40 (3)行⨯列表资料的2χ检验 专用公式:221R C A n n n χ⎛⎫=- ⎪⎝⎭∑, ν=(行数- 1)(列数- 1) 条件:⑴1<T<5的格子数,不能超过总格子数的1/5;不能有T<1⑵与分类变量的顺序无关⑶对于有序的R ⨯C 表资料不宜用2χ检验8. 秩转换的非参数检验●如果已知计量满足或近似满足t 检验或者F 检验,优先选择t 检验●秩转换的非参数检验适用于:⑴总体分布为偏态或分布未知的计量资料⑵等级资料⑶个别数据偏大,或数据的某一端无确定数值⑷各组离散程度相差悬殊,即各总体方差不齐●特点:⑴适用范围广,不限方差齐性、变量类型、样本量⑵损失了部分信息,检验效率低⑶极度偏态,犯第二类错误的概率较大●非参数检验,与参数检验的区别。