卫生统计学期末复习重点

卫生统计学期末复习重点
卫生统计学期末复习重点

《卫生统计学》期末复习提要

一、期末考试有关问题的说明

<一>出题的指导思想、原则及题目类型

出题的指导思想是:全面考核学生对本课程的基本概念、基本方法,基本技能的掌握情况,考核学生运用所学的知识和方法综合分析与解决实际问题的能力。

出题的原则是:不超过教学大纲的内容,难度适中但覆盖面较广,基本知识占80─90%,稍难或灵活的题目占10─20%。凡自学的章节不考。

<二>答题要求

选择题:要求选择无误,每题只选一个最佳答案。

计算分析题:要求完整地写出计算步骤(包括计算公式)、用计算器计算出正确结果,并能对所得结果作出相应的分析结论。

二、期末复习范围和重点

绪言

<一>重点复习的名词:

计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。

计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。

总体(population):表示大同小异的对象(某个测量值)全体。

样本(sample):从研究总体中随机抽取的一部分有代表性的个体

变异(variation):同一总体内的个体间存在差异。

抽样误差:消除了系统误差并控制了随机测量误差之后,样本数值仍和总体指标的数值有差异,这种误差称之。

概率: 某事件出现机会大小的量。

<二>重点复习的问题:

1、根据计量、计数、等级资料的概念正确识别统计资料的类型。

等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data),等级资料又称有序变量。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

2、统计工作的步骤及搜集资料的来源和要求。

1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。

2.收集资料:应采取措施使能取得准确可靠的原始数据。

3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。

4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。

3、抽样研究的原因及目的,产生抽样误差的原因。

<三>一般复习的名词:

同质:一些个体处于同一总体么就是指他们大同小异,具有同质性。

参数::参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。

统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

随机化抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

样本含量:

<四>一般复习的问题:

1、卫生统计学的内容及学习卫生统计学的意义。

2、统计工作各个步骤的基本内容和关系。

集中趋势与离散趋势

<一>重点复习的名词:

频数分布表:当变量值个数较多时,对各变量值出现的频率列表即为频率分布表(frequency distribution table)。

中位数(median ,M):将原始观察值从小到大或者从大到小排序后,位次居中的那个数。

<二>重点复习的问题:

1、对频数分布特征的描述。

频数分布分为集中趋势(central tendency)和离散趋势(tendency of dispersion)。

常用描述定量变量集中趋势的统计指标包括算数均数、几何均数、中位数。算数均数适用于对称分布,特别是正态分布的资料;几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分布资料,常用于描述偏峰分布的资料。

常用的描述定量变量离散趋势的统计指标包括极差、四分位数间距、方差、标准差和变异系数。极差只利用最大值和最小值的信息,易受样本含量的影响,很不稳定;四分位数间距适用于各种分布资料;方差和标准差适用于对称分布,特别是正态分布的资料;变异系数常用于量纲不同时,或均数相差较大时变量间变异程度的比较。实际应用中,常将算数均数和标准差结合对正态分布资料进行统计描述;常将中位数和四分位数间距结合对偏峰分布资料进行统计描述。

2、平均指标:算术均数、几何均数、中位数的意义及应用条件,算术均数的计算。

3、变异指标:全距、标准差、变异系数的意义及应用条件,标准差和变异系数的计算。

4、 正态分布的两个参数及正态曲线下面积的分布规律。

正态分布的特征:服从正态分布的变量的频数分布由μ 、σ 完全决定。

(1) μ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以x = μ 为对称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于μ 。

(2) σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲线越瘦高。

正态曲线下面积的分布规律:如果用其标准差作为衡量单位,则以均数为中心,正负1个标准差内,即(μ-σ,μ+σ)区间内,正态分布曲线下的面积为总面积的68.27%;正负2个标准差内,即(μ-2σ,μ+2σ)区间内,面积为95.44%;正负3个标准差,即(μ-3σ,μ+3σ)区间内,面积为99.74%。这是由正态分布的性质所决定的。 <三>一般复习的问题:

1、除<二>4外,正态分布的其余特点。 2、u变换的形式和作用。 3、查阅标准正态曲线下面积表的方法。

均数的抽样误差及标准误 <一>重点复习的名词:

均数的抽样误差:抽样造成的这种样本均数与样本均数之间、样本均数与总体均数之间的差异。

标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。

总体均数的可信区间:用统计量 X 和Sx 确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。 <二>重点复习的问题:

1、 标准误的意义、计算及应用。

标准误:用于表示均数抽样误差大小的指标,也叫样本均数的标准差,它反映了样本均数之间的离散程度。 ? 标准误的计算公式:

? 在实际应用中可通过增加样本含量n 来减小样本均数的标准误,从而降低抽样误差。

对于任意分布,在样本

X σ

=X

s

=

含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,均数的标准误由公式

计算。

2、 标准差与标准误的区别与联系。

样本均数标准误的大小与标准差成正比,与样本含量n 的平方根成反比,即在同一总体中随机抽样,样本含量n 越大,抽样误差越小。

3、 总体均数可信区间的意义和计算。

根据总体标准差σ 是否已知及样本含量n 的大小,总体均数置信区间的计算有t 分布和Z 分布(标准正态分布)两种方法。 1. t 分布方法

当总体标准差σ未知时,正态总体N (μ, σ2

)的样本均数的t 变换结果服从 t 分布,若“砍去”t 分布双侧尾部面积α = 0.05 = 5%,故有95%的t 值满足不等式: -t 0.05/2, ν < < t 0.05/2, ν

-t 0.05/2, ν

< μ < + t 0.05/2, ν μ:( -t 0.05/2, ν , + t 0.05/2, ν

) 总体均数μ 的(1- α ) 可信区间置信区间的一般计算式为 ± t α/2, ν 均数的单侧置信区间为 μ > -t α/2, ν 或 μ < + t α/2, ν 2正态分布近似方法

(1)当总体标准差σ 已知时,总体均数的双侧置信区间为 ± Z α/2 (2)当σ 未知但n 足够大时(n > 50),t 分布的极限分布是标准正态分布,可用z α/2代替公式(5-9)中的t α/2, ν,则总体均数的双侧置信区间为

± Z α/2 同理, 与(5-8)和(5-9)式相对应, 单侧置信区间则为

-z α 或 -z α + z α 或 + z

α

X X s μ

-X s X X s X X X s X s X X s X X s X X s X X

σX X s X X X X X

σX σX s X s

1、抽样误差的规律。

2、提高对总体均数可信区间估计精度的办法。

均数的假设检验

<一>重点复习的名词:

检验假设H0:零假设(null hypothesis),又称原假设。

检验水准α:根据问题的背景,规定一个“小”的概率α,若P值小于α,就认为“P值较小”,若P值不小于α,就认为“P值较大”。通常取α=0.05或0.01以保证犯假阳性错误的概率不超过0.05或0.01。这个α称为检验水准。假设检验中的P值:在零假设成立的条件下,出现统计量目前值及更不利于零假设数值的概率。

可比性:

第Ⅰ类错误和第Ⅱ类错误::假阳性错误称为第I 类错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用a 表示;假阴性错误称为第II 类错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用b 表示。

<二>重点复习的问题:

1、t值;t分布与标准正态分布的关系。

2、假设检验的基本思想和步骤。

基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。

步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P 值并作出推断结论。

3、样本均数与总体均数比较的t检验。

4、两大样本均数比较的u检验。

5、配对设计三种形式的特点及t检验的H。、H1。

配对设计三种形式的特点:1)异体配对:两个受试对象。2)自身配对:同一受试对象的两个部位分别接受两种处理。3)统一受试对象接受某种处理之前和之后的数据,也可以视为自身配对。

6、假设检验时需注意的问题。(重点是可比性和犯第Ⅰ类及第Ⅱ类错误的含义与概率)

可比性:

I 类错误: H0为真(实际无差别),假设检验结果拒绝H 0,接受H 1(推论有差别)所犯的错误称为I 类错

误(type I error),I 类错误的概率记作a 。

II 类错误: H1为真(实际有差别),假设检验结果拒绝H 1 ,接受H 0(推论无差别)所犯的错误称为II 类错误(type II error),II 类错误的概率记作β。

1- β称为检验效能,过去称把握度(power of test ),即两总体确有差别,按a水准能发现该差别的能力。

<三>一般复习的名词:自由度、假设检验。

<四>一般复习的问题:

1、配对设计的t检验。

2、两小样本均数比较的t检验。

3、t检验的应用条件。

方差分析

一般复习的问题:

1、方差分析的基本思想。

2、完全随机设计的特点和方差分析法。

3、配伍组设计的特点和方差分析法。

4、多个样本均数的两两比较。

相对数

<一>重点复习的名词:

构成比:(proportion)说明某一事物内部各组成部分所占的比重或分布。

率:(rate)说明一定时期内某现象发生的频率或强度。

相对比:,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。比=A/B

动态数列:(dynamic series)是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。

<二>重点复习的问题:

1、构成比、率、相对比、定基比、环比的计算。

比=A/B

定基比,即统一用某个时间的指标作基数,其它各时间的指标都与之相比;

环比,即以前一个时间的指标作基数,以相邻的后一个时间的指标与之相比。

2、下述指标的意义及计算:死因构成,发病率,患病率,死亡率,病死率。

死因构成(proportion of dying of a specific cause)指全部死亡人数中,死于某死因者所占的百分比,说明各种死因的相对重要性。死因构成比=同年某死因死亡数/同年内死亡总数*100% (频率型)

发病率(incidence rate,IR)表示在一定时期内,在可能发生某病的一定人群中新发生某病的强度。某病发病率=时期内新发生的某病病例数/年平均人口数*1年(强度型)

患病率(prevalence rate,PR)指某时点上受检人数中现患某种疾病的频率,通常用于描述病程较长或发病时间不易明确的疾病的患病情况。患病率=现患病人数/检查人口数

(频率型)

死亡率(mortality rate)指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水平。死亡率=同年内死亡人数/年平均人口数*1年(强度型)

病死率(case fatality rate,CFR)指在某一期间内(1年)患某病者因该病死亡的百分比,可说明一种疾病的严重程度,也可反映一个医疗单位医疗水平和质量。

某病病死率=同年某病死亡人数/同年患该病总数*100% (频率型)

3、动态数列的分析。

动态数列(dynamic series) 是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。

4、应用相对数时需注意的问题。(重点是不能以比代率)

1.计算相对数的分母一般不宜过小。

2.分析时不能以构成比代替率容易产生的错误有

(1)指标的选择错误如住院病人只能计算某病的病死率,不能认为是某病的死亡率;

(2)若用构成指标下频率指标的结论将导致错误结论,如某部队医院收治胃炎的门

2.诊人数中军人的构成比最高,但不一定军人的胃炎发病率最高。

3.不能用构成比的动态分析代替率的动态分析。

4.对观察单位数不等的几个率,不能直接相加求其总率。

5.在比较相对数时应注意可比性通常应注意:

(1)观察对象,研究方法、观察时间、地区和民族等因素应相同或相近;

(2)其它影响因素在各组的内部构成是否相同。

6.对样本率(或样本构成比)的比较应随机抽样,并做假设检验。

<三>一般复习的名词:时期动态数列、时点动态数列、标准化法。

<四>一般复习的问题:

1、动态数列的分类。

2、标准化法的意义及基本思想。

3、标准化率的直接法和间接法计算。

4、应用标准化法的注意事项。

二项分布及其应用

<一>重点复习的问题:

1、率的抽样误差概念。

在抽样研究中所获得的样本率与总体率也存在率的抽样误差。

2、率的标准误的意义及计算。

表示率抽样误差大小的统计指标成为率的标准误。由于总体率和总体率的标准误一般未知,常用样本率p来估计

总体率π,用杨频率的标准误S p来估计总体率的标准误:

率的标准误是衡量样本率稳定性和可靠性的统计指标,它反应率的抽样误差大小,率的标准误越小,表示率的抽样误差越小,用以估计总体率的可靠性就越大。

3、总体率可信区间的意义及计算。

当n 足够大,且p 和1-p 均不太小,p 的抽样分布逼近正态分布。总体率的可信区间可根据样本含量n和样本频率p的大小,选用查表法或正态近似法来估计其总体概率π的(1-α)置信区间。

P93 例子

<二>一般复习的名词:

二项分布:

<三>一般复习的问题:

1、二项分布的概率函数与图形。

2、二项分布的特点。

3、样本率与总体率比较的u检验。

4、两个样本率比较的u检验。

Poisson分布及其应用

<一>一般复习的名词:

Poisson分布:

<二>一般复习的问题:

1、Poisson分布的概率函数及图形。

2、Poisson分布的特点。

3、总体均数可信区间的意义及计算。

4、样本均数与总体均数比较的u检验。

5、两样本均数比较的u检验。

χ2检验

<一>重点复习的名词:

理论频数: theoretical frequency,在假设多个率或构成比相等的前提下,由合计率(构成比)推算出来的频数。

<二>重点复习的问题:

1、χ2检验的基本思想。

2、四格表资料χ2检验和校正χ2检验的应用条件及方法。

3、计数资料相关分析的设计特点和推断目的。

4、行×列表资料χ2检验的注意事项。

χ2检验的应用条件及注意事项

1.分析四格表资料时,应注意连续性校正的问题,当140 时,用连续性校正χ2检验;T<=1,或n<=40 时,用Fisher 精确概率法。

2.对于R*C 表资料应注意以下两点:

(1)理论频数不宜太小,一般要求:理论频数<5 的格子数不应超过全部格子的1/5;

(2)注意考察是否有有序变量存在。对于单向有序R*C 表资料,当指标分组变量是有序的时,宜用秩和检验;

对于双向有序且属性不同的R*C表资料,若希望弄清两有序变量之间是否存在线性相关关系或存在线性变化趋势,应选用定性资料的相关分析或线性趋势检验;对于双向有序且属性相同的R*C表资料,为考察两种方法检测的一致性,应选用Kappa 检验。

<三>一般复习的问题:

行×列表资料所包括的设计类型及χ2检验法。

秩和检验

<一>重点复习的问题:

等级资料的秩和检验(成组设计两样本比较的秩和检验(Wilcoxon 两样本比较法)

1.检验步骤:

(1)假设:H0:两总体分布相同 H1:两总体分布不同 a = 0.05

(2)编秩:将两组原始数据分别由小到大排队,再将原始数据从小到大统一编秩。编秩时遇同组相同数据,顺次编秩,遇不同组相同数据取平均秩次。

(3)求秩和并确定检验统计量:当两样本例数不等时,以样本例数小者为n1,其秩和为T。相等时,可任取一组的秩和为T。

(4)确定P 值和作出推断结论:查T 界值表,得出P 值。若检验统计量T 值在上、下界值范围内,其P值大于表上方相应概率水平;若T 值在上、下界值上若范围外,其P值小于

表上方相应概率水平。

<二>一般复习的名词:

非参数统计:样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道

总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics ),或称为不拘分布(distribution-free statistics )的统计分析方法,又称为无分布型式假定(assumption free statistics )的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。 <三>一般复习的问题:

1、配对比较的符号秩和检验。

2、配伍组设计的多个样本比较的秩和检验。 3、两个或多个计量样本比较的秩和检验。 4、参数统计和非参数统计的优缺点。 直线相关与回归

<一>重点复习的名词:

相关系数:相关系数又称积差相关系数(coefficient of product -moment correlat ion ),以符号r 表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 回归系数:回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用 b 表示,b 的统计意义为X 每增(减)一个单位时,Y 平均改变b 个单位。 <二>重点复习的问题:

1、 使用电子计算器计算相关系数r、回归系数b、截距α。 2、 散点图的作用和绘制方法。

(1) 散点图可考察两变量是否有直线趋势; (2) 可发现异常点(outlier )

3、 描述直线关系的密切程度和方向时,r值的变化。

相关系数 r 没有单位,其值为-1≤r ≤1。其绝对值愈接近1,两个变量间的直线相关愈密切;愈接近0,相关愈不密切。r 值为正表示正相关,说明一变量随另一变量增减而增减,方向相同;r 值为负表示负相关,说明一变量增加、另一变量减少,即方向相反;r 的绝对值等于1 为完全相关。 直线回归方程的一般形式及最小二乘法原理的内容。 回归参数的估计——最小二乘原则

原则:最小二乘法(least sum of squares),即可保证各实测点至直线的纵向距离的平方和最小 4、 应用直线相关与回归分析的注意事项。

1. 根据分析目的选择变量及统计方法

直线回归用于定量刻画应变量Y 对自变量X 在数值上的依存关系,其中应变量的定夺主要依专业要求而定,可以考虑把易于精确测量的变量作为X ,另一个随机变量作Y ,例如用身高估计体表面积。 两个变量的选择一定要结合专业背景,不能把毫无关联的两种现象勉强作回归分析。 2. 进行回归分析前应绘制散点图

(1) 散点图可考察两变量是否有直线趋势; (2) 可发现异常点(outlier ) 3. 资料的要求

直线回归要求至少对于每个 X 相应的 Y 要服从正态分布,X 可以是服从正态分布的随机变量也可以是能精确测量和严格控制的非随机变量;

* 对于双变量正态分布资料,根据研究目的可选择由 X 估计 Y 或者由 Y 估计 X ,一般情况下两个回归方程不相同)。 4. 结果解释及正确应用

反应两变量关系密切程度或数量上影响大小的统计量应该是回归系数的绝对值,而不是假设检验的P 值。 P 值越小只能说越有理由认为变量间的直线关系存在,而不能说关系越密切或越“显著”。另外,直线回归用于预测时,其适用范围一般不应超出样本中自变量的取值范围。

当实际资料不能满足直线回归模型的要求而无法用最小二乘法估计回归方程时,可使用秩回归

<三>一般复习的名词:剩余标准差Sy.x <四>一般复习的问题:

1、直线相关系数的假设检验。 2、等级相关的应用条件。

3、直线相关和回归分析的联系和区别。

? (121)Y

a bX =-+

正常值范围的估计

<一>重点复习的名词:

正常人:

第X百分位数:

<二>重点复习的问题:

1、研究设计的六个方面的内容。

2、正态性检验的推断目的和正态概率纸的特点。

3、正态分布法的应用条件和估计单侧(上、下限),双侧95%正常值范围界限值的计算。

4、百分位数法的应用条件及单、双侧界限,不同百分范围时应确定的百分位数。

<三>一般复习的名词:正常值范围、假阳性错误、假阴性错误、概率单位。

<四>一般复习的问题:

1、医学正常值范围的意义

2、D检验中,查D界值表确定P值的方法。

统计表与统计图

<一>重点复习的问题:

1、根据资料正确编制统计表。

(1)标题位于表的上方,概括表的主要内容,一般需注明时间与地点。

(2)标目有横、纵标目之分,分别说明横行和纵行数字的含义,应做到文字简明,层次清楚。

(3)线条多采用三条半线,即顶线、底线、纵标目下的横隔线及合计上的半线。忌斜线和竖线。

(4)数字表内数据一律采用阿拉伯数字。同一指标小数点位数要一致,位次要对齐。表内不应有空项,无数字用“—”表示,数字若为零则填“0”,暂缺项或未记录用“?”表示。

(5)备注不为表的必备内容,如有必要,可在表内用“*”号标记,然后在表的下方加以说明。

2、对错表的评价和正确修改。

1)编制整理时,未将有联系的项目安排适当,不便说明事物之间相互的规律性。

2)分组不合理

3)有意将过高或过低的数据筛选掉或无意舍弃掉,使原始资料所提供的信息变样。

4)统计表编制不规范。

5)计算错误

3、根据资料性质和分析目的正确选用统计图类型。

<二>一般复习的问题:

1、统计表和统计图的作用。

2、各种统计图的绘制方法。

调查设计

<一>重点复习的问题:

1、搜集资料的计划内容

1)明确调查目的

2)确定调查对象和观察单位

3)确定调查方法

4)确定调查指标和变量

5)调查工具和调查表:调查工具、调查表和问卷的一般结构、问题的形式

6)确定样本含量

2、四种基本抽样调查方法的特点。

P289有表

(1) 简单随机抽样(也叫纯随机抽样)。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。

(2) 等距抽样(也叫机械抽样或系统抽样)。是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。特点是:抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随机抽样。等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。

(3) 类型抽样(也叫分层抽样)。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。

(4) 整群抽样。就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本。特点是:调查单位比较集中,调查工作的组织和进行比较方便。但调查单位在总体中的分布不均匀,准确性要差些。因此,在群间差异性不大或者不适宜单个地抽选调查样本的情况下,可采用这种方式。

3、样本含量估计的目的。

(1) 可以控制统计量的抽样误差,样本含量越大,标准误越小;

(2) 提高估计的精度,增大样本含量是控制可信区间的宽度的有效办法;

(3) 增大样本含量是控制统计分析中Ⅱ型错误的概率大小的有效措施;

(4) 表示抽样误差的指标(各种标准误)的抽样误差也与样本含量有关(如样本方差的方差)。

<二>一般复习的问题。

1、整理分析资料的计划内容。

2、调查表的设计。

3、样本含量估计的方法。

居民健康统计

<一>重点复习的名词:

死亡概率nqx:年龄组死亡概率(age specific probability of dying)是指X 岁尚存者在今后一年或n 年内死亡的可能性。它和年龄组死亡率不是一个概念。

生存人数lx:表示假想的同时出声的一代人中,X岁尚存者的平均人数。一般假定0~岁组的人数为l0=100000

死亡人数:指理论死亡人数记为D X。表示假象的同时出生的一代人中,X岁尚存者按死亡概率q x死于年龄组“X~X+i”的平均人数。即d x=q x×l x

预期寿命ex:这是寿命表最广泛使用的指标,是指同时出生的一代人活到X岁时,尚能生存的平均年数。ex=t x/l x

<二>一般复习的名词:寿命表、简略寿命表

<三>一般复习的问题:

1、简略寿命表的编制原理。

2、简略寿命表与去某死因寿命表的计算。

3、寿命表的分析应用。

卫生统计学整理笔记

如何绘制频数表? 求组距 确定各组段的两个端点 归组计数 频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式 算数应用条件: 对称分布,尤其正态分布 几何应用条件: 1.对数对称分布、等比资料 2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 中位数条件: 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 极差应用条件:所有分布、尤其偏态分布 不足: 不能全面的反映所有值的偏离程度 不稳定、小样本小于大样本、样本小于总体 四分位数间距应用条件 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 方差应用条件: 对称分布,尤其正态分布 变异系数应用 1.量纲不一致

散点图作用 观察两组数据的总体趋势和明显偏离趋势的观察点 判断两组数据的关联形式、方向和密切程度 相关分类 线性相关 秩相关 分类变量相关 线性相关意义 r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。 |r|→0表示相关性越弱,|r|→1表示相关性越强。 r=0表示没有线性相关,不代表没有相关。 如何判断线性相关 画散点图 计算线性相关系数 假设检验 如何进行秩相关 编秩次 计算秩相关系数 假设检验 回归分析:利用样本信息,找到变量间数量依存关系。 线性回归分析:利用样本信息,找到变量间线性数量依存关系。 决定系数:反映回归贡献的相对程度,即Y的变异被X解释的比例。 如何进行分类变量的相关分析 交叉表的制作,计算各种概率 计算列联系数 假设检验 相关分析的条件 线性相关系数:二元正态分布的定量变量 秩相关系数:非二元正态分布的定量变量、有序分类变量 列联系数:无序分类变量 轶闻数据:由坊间流传或各种媒体报道的一些个案数据,由于其特殊性往往给公众留下突出和深刻的印象。 特点:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。 可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

10级-卫生统计学-整理资料

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本 均数?x 、样本率ρ等。 ⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变 量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料 第二章调查研究设计 ★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。 第三章实验设计 ★1、实验设计的特点(注意与调查研究的特点的区别):

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学 令狐文艳 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越 小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

电大实用卫生统计学期末复习材料

《实用卫生统计学》期末复习题一 《实用卫生统计学》期末复习题一 一、名词解释 1、卫生统计学: 2、随机抽样: 3、构成比: 4、频率: 5、非参数检验: 6、概率 7、变异系数 名词解释答案 1. 卫生统计学:是运用数理统计的基本原理和方法,通过数据的收集,整理和分析,研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。 2. 随机抽样:就是按照随机的原则获得样本,保证总体中每个个体都有同等机会被抽取,使样本对总体有较好的代表性。 3. 构成比:又称构成指标,它表示事物内部各组成部分所占比重或分布。常用百分数表示。 4. 频率:若随机事件在n次重复中出现m次,则n/m比值成为随机事件出现的频率。 5.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。 6.概率是描述随机事件发生的可能性的大小的数值,常用P表示。7.变异系数常记为CV,它被定义为标准差与算术均数之比。 《实用卫生统计学》期末复习题二 单选题 1.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种错误属于()。 A. 系统误差 B. 随机测量误差 C. 抽样误差 D. 随机误差 2.医学人口统计应属于卫生统计学中的哪部分内容( )。 A. 卫生统计学基本原理 B. 卫生统计学基本方法 C. 健康统计 D.卫生服务统计 3. 原始数据分布不明时,表示其集中趋势易采用 ( ) 。 A. 算数均数 B. 几何均数 C. 中位数 D. 标准差 4.描述一组偏态分布资料的变异度时,最适宜选择的指标是( ) 。  A.极差 B.标准差 C.四分位数间距 D.变异系数

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便,对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考 一、353卫生综合参考书目: ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》 二、配套精编复习资料 山东大学353卫生综合《复习全程通》精都考研组编 三、复习全程通内容简介 《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验,由本团队组织目标院校本专业的高分研究生共同合作编写而成,全书考点知识面覆盖全面,权威细致,编排结构科学合理,是专门为本届考研的考生量身定制的必备专业课资料。 通过本精编资料四大模块内容,结合考生每个阶段的复习,有助于考生深入了解目标院校以及专业考点重点,提高复习效率,拓展解题思路。 NO.1历年真题汇编 通过目标院校原版真题,了解命题老师的出题思路,且分析考点重点,快速了解目标院校出题风格及命题思路,提高复习效率,拓展解题思路 NO.2教辅一本通 本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析,通过本书的配套复习,分析专业考点侧重,通过大量典型考题让充分掌握本门科目重点,确保考场应对自如。 NO.3冲刺模拟套卷 书在遵循专业课最新参考书目,结合历年考研真题规律,制定的模拟卷,并有详细的配套答案讲解,适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容 本部分内容为购买全套资料的同学附赠的内容,主要是初试参考书目主编老师的教学讲义以及相关的扩充习题,此部分内容对于跨考的考生相对比较重要,通过讲义了解专业课基础复习侧重,达到专业知识点不缺不漏。 四、解析备考辅导班: 专业课一对一无忧全程班 专业课一对一标准全程班 山东大学在读研究生授课 以上内容是【精都考研网】整理发布,每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269,抓紧时间加入了解你所不知道的考研信息。

卫生统计学复习笔记

卫生统计学复习笔记 一、概述 1、卫生统计学的概念(熟练掌握) 统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。 卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。 卫生统计学的内容(了解): 1)健康统计:医学人口统计、疾病统计和生长发育统计等; 2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤(熟练掌握) 统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤: 1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据 2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。 3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。 4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行

卫生统计学重点整理-预防医学

1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生 服务领域中数据的收集、整理和分析的一门科学。 2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。 否则称为异质(heterogeneity)的或者间杂的。 3.变异(variation):同质事物之间的差别称为变异。[没有个体变异,就没有统计学!] 4.总体(population):根据研究目的所确定的同质观察单位的全体。 5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。 6.样本含量(sample size):样本中包含的观察单位个数。 7.参数(parameter):反映总体特征的指标。特点:未知、唯一,希腊字母表示,如总体均 数、总体率等。 8.统计量(statistic):根据样本观察值计算出来的指标。特点:已知、不唯一,拉丁字母 表示,如样本均数、样本率等。 9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特 征或属性称为变量。 10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value)。 11.资料(data):变量值的集合称之为资料。 12.定量资料(quantitative data):变量值是定量的,表现为数值大小。特点:一般有度、 量、衡单位,一般属连续性资料。 13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。特点: 一般无度、量、衡单位,一般属于离散型资料。可进一步分为计数资料和等级资料。 14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所 得的资料。可进一步分为二项分类资料和无序多项分类资料。 15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点 各组观察单位所得的资料。各属性之间互不相容且有程度的差别。 16.抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的 研究方法。 17.抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量 之间的差异。 18.概率(probability):概率是随机事件发生可能性大小的数值度量。通常用P表示。大小 介于0与1之间,即0≤P ≤1。 19.小概率事件:医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 20.小概率原理:并不表示不可能发生,但在某一次试验中,是不会发生的。

卫生统计学考试题及答案要点

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题

1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数 C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。 - 2 - .抽样时应使得总体中的每一个个体都有同等的机会被抽取A .研究者在抽样时应精心挑选个体,以使样本更能代表总体B .随机抽样即随意抽取个体C .为确保样本具有更好的代表性,样本量应越大越好D B )。6.各观察值均加(或减)同一数后( .均数改变,标准差不变BA.均数不变,标准差改变 .两者均改变 D .两者均不变C )。7.比较身高和体重两组数据变异度大小宜采用(A B.方差.变异系数 A D.标准差C.极差 D )可用来描述计量资料的离散程度。8.以下指标中( .几何均数 B A.算术均数 D.标准差C.中位数 )。9.血清学滴度资料最常用来表示其平均水平的指标是(C B.中位数A.算术平均数 D.平均数C.几何均数 。)10.两样本均数的比较,可用(C 检验B.t A.方差分析 .方差齐性检验 D C.两者均可 ?。D 11.配伍组设计的方差分析中,)等于(配伍???? A.--B.总误差总处理?????? D.---C.+处理总误差总处理误差??|X??|?,的正态总体中随机抽样,)的概率为5% 。12.在均数为标准差为( B tSst?1.96 C.D. A. B.?1.96??,,X20.0520.05X13.完全随机设计方差分析的检验假设是(D )。 A.各处理组样本均数相等B.各处理组总体均数相等 C.各处理组样本均数不相等D.各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 2检验χB A.分别进行比较.两个率比较的 - 3 -

卫生统计学重点笔记之欧阳家百创编

医师资格考试蓝宝书预防医学 欧阳家百(2021.03.07) 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件, <0.05或0.01为小概率事件。 二、变量的分类

变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小,观察值 的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为:CV=s/×100%,公式中s为样本标准差,为样本均数。 三、标准差的应用

16秋实用卫生统计学终考综合练习题

16秋实用卫生统计学期末终考综合练习题说明: 1.本套综合练习题仅针对16秋期末终考而编制,每个题的解题方法在学习网实用卫生统计学课程主页的“每章重难点辅导”中,或在教材后面的习题答案中,找到相应题目或类似题目的详细解答过程和答案。 2.16秋期末终考试题与本综合练习题的题型完全相同。有些数据可能稍有变化,但解题方基本一致。 本次期末考试时间为60分钟,开卷考试,时间短,题量大,希望同学们考前一定要做足准备,考试时仔细审阅试题,争取好成绩。 一、填空题 1.经调查某地10岁男童身高均数为135厘米,标准差为4.74厘米,其变异系数是 3.51% (注意:保留两位小数)。 2.正态分布的两个重要参数是均值和方差。 3.某市6岁男童的身高均数为115.0cm,标准差为10.0cm。试计算6岁男童身高大于13 4.6cm的约占百分数是 2.5% 4.常用的相对数有构成比、率、比。 5.增长速度与发展速度关系为增长速度=发展速度-1 。 6.环比发展速度的算式为以前一个时间(年)数据为作基数,以相邻的后一时间(年)数据与之相比,或当前一年数据与前一年数据之比。 7.动态数列是一列按时间顺序排列起来的统计指标,它包括:绝对数,相对数或平均数,这些指标用以说明事物在时间上的变化和发展趋势。 8.统计表是由标题、标目、线条、数字四部分构成。 9.统计学中常见的统计图形有:普通线图、半对数线图、直条图、直方图、圆图、百分条图和散点图 10.置信区间的两个要素:一是准确度,二是;精确度。 s 11.均数标准误的计算公式为 12.均数的抽样误差是对于抽样过程中产生的同一总体中均数之间的差异。 13.根据总体标准差σ是否已知及样本含量n的大小,总体均数置信区间的计算公式不同。

卫生统计学知识点整理

卫生统计学考点整理(一) 2017年11月24日 一、绪论: 1、什么是卫生统计学: 卫生统计学是运用数理统计的基本原理和方法对预防医学和公共卫生领域中的科学研 究进行设计,以及研究资料的收集、整理和分析的一门应用科室。 2、卫生统计学的基本内容包括哪些 ①卫生统计学的基本理论和方法,包括研究设计和数据分析中的统计理论和方法。 ②健康统计,包括医学人口统计、疾病统计和生长发育统计等。 ③卫生服务统计,包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等 的统计问题。 3、什么是计量资料 用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得到的数据(即测量值) 成为计量资料(计量资料含有单位) 4、什么是计数资料 将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样得到 的数据成为计数资料(也称分类资料)(不含单位) 5、什么是等级资料 将全体观察单位按照某种性质的不同程度分为若干组,分别清点各组中观察单位的个数。 6、什么是总体 根据研究目的的确定的同质观察单位的全体。(是同质的所有观察单位某种变量值的集合) 研究对象具有相同的背景、条件、属性 8、什么是变异 同一性质的事物,其个体观察值(变量值)之间的差异。 9、什么是样本 从总体中随机抽取具有代表性的一部分个体,其测量值(或观察值)的集体成为样本。 10、什么是抽样研究 对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。 11、抽样研究的目的是什么 通过用样本资料计算的指标去推论总体。 12、什么是参数 参数是指总体指标。(如:总体均数μ、总体率π、总体标准差σ等) 13、什么是统计量 统计量是指样本指标。(如:样本均数、样本率p、样本标准差S等) 14、什么是统计描述 用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征 15、什么是统计推断 根据样本资料的特性对总体的特性作估计或者推论的方法。(常用方法是参数估计和假 设检验)

卫生统计学重点笔记

医师资格考试蓝宝书-预防医学 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。 二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为:CV=s/X ×100%,公式中s为样本标准差,X为样本均数。 三、标准差的应用 表示观察值的变异程度(或离散程度)。 在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性较差;反之,表示各观察值多集中在均数周围,均数的代表性较好。(常考!) 四、医学参考值的计算方法,单双侧问题,医学为95% 医学参考值是指正常人体或动物体的各种生理常数,由于存在变异,各种数据不仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即正

相关文档
最新文档