10级-卫生统计学-整理资料

10级-卫生统计学-整理资料
10级-卫生统计学-整理资料

卫生统计学

第一章绪论

1、卫生统计学的概念(P1)

卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。

2、卫生统计学的4个基本步骤(P3):

设计、收集资料、整理资料、分析资料

3、卫生统计学的几个基本概念(P4):

⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称

之为同质,或具有同质性。

⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。

⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。

⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中

包含的观察单位个数成为样本含量。

⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总

体均数μ、总体率π等。

⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本

均数?x 、样本率ρ等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变

量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般

有度、量、衡单位。

⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别

或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料

第二章调查研究设计

★1、调查研究的特点(P7):

①不能人为施加干预措施;②不能随机分组;

③很难控制干扰因素;④一般不能下因果结论

2、常用抽样方法(名称、原理):

⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数

字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。

⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一

顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。

⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若

干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。

⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组

成,随机抽取一部分群,调查抽中群的全部次级观察单位。

第三章实验设计

★1、实验设计的特点(注意与调查研究的特点的区别):

⑴研究者可人为设置处理因素;

⑵受试对象接受何种处理因素或处理因素的何种水平是随机的。

★2、实验设计的三要素、四原则:

⑴基本要素:①处理因素②受试对象③实验效应

⑵基本原则:①对照原则②随机原则③重复原则④均衡原则

4、实验设计的基本步骤:

⑴明确实验目的;⑵确定研究对象;⑶确定可比的实验组和对照组;

⑷确定把受试对象分配到各处理组中的原则;⑸确定样本含量;

⑹确定方法和指标;⑺偏倚及其控制

5、常用的实验设计方案:主要掌握完全随机设计和配对设计。

第四章定量资料的统计描述

★1、频数表的编制:①求极差②确定组数和组距(一般8~15组)

③确定组段(上限=下限+组距)④归组计数,整理成表

★2、频数表的用途:

⑴揭示资料的频数分布特征和频数分布类型

①频数分布的特征:集中趋势和离散趋势;

②频数分布的类型:对称分布和偏态分布(高峰位置偏向数值小的一侧

——正/右偏态分布;高峰位置偏向数值大的一侧——负/左偏态分布)

⑵便于发现某些特大或特小的可疑值

⑶便于进一步计算指标和统计处理

3、连续型的定量资料,其频数图中各长方形是相连的,又称直方图;离散型的

定量资料,其频数图是非连续的,其频数图中各长方形是又间隔的,称直条图。

4、定量资料集中趋势的描述,常用平均数——表达一组同质定量数据的平均

水平或集中位置。(结合书本的例题加深理解)

⑴ 算术均数:适用于对称分布特别是正态分布资料;

⑵ 几何均数:适用于①对数正态分布 ②等比级数资料;观察值中不能有0 ⑶ 中位数:是一种位置平均数,适用于偏态分布资料、 一端或两端无确切

值、 总体分布不明的资料;

百分位数:一组数据某一百分位置的水平;确定非正态分布资料的医学

参考值范围。

平均数 意义 应用场合

均数 平均数量水平 对称分布,尤其正态分布 几何均数 平均增减倍数 等比、对数正态分布

中位数 位次居中的观察值水平 偏态、分布不明确、分布

末端无确定值

5、离散趋势是频数分布的另一特征,反映了观察值之间的变异情况。

★6、正态分布的特征:

⑴ 正态曲线在横轴上方均数处最高;并以均数为中心,左右对称;两端与横

轴永不相交,呈钟形的曲线。

离散趋势指标

意义 应用 极差 四分位数间距 方差和标准差 变异系数 反映一组数据的变异范围 反映全部观察值居中一半的范围 反映全部观察值之间的变异程度 标准差相对于均数的大小

资料不限 资料不限 适用于对称分布,尤正态 适用于单位不同或均数差别较大的变量之间的比较

⑵ 正态分布有两个参数,即位置参数μ和形状参数σ;σ固定不变时,μ越

大,曲线沿横轴越向右移动;μ固定不变时,σ越大,曲线越平阔。

⑶ 正态曲线下面积的分布有一定的规律:

①正态曲线与横轴之间的面积恒等于1或100%;

②对称分布,对称轴两侧的面积各为50%;

③在(μ-σ,μ+σ)区间的面积为68.27%;

在(μ-1.96σ,μ+1.96σ)区间的面积为95.00%;

在(μ-2.58σ,μ+2.58σ)区间的面积为99.00%

7、医学参考值范围:

⑴正态分布法:适用于正态或近似正态分布的资料

双侧界值:

单侧界值: 常用z 值表 ⑵ 百分位数法:偏态分布资料以及资料中一端或两端无确切数值

双侧界值:P 2.5~P 97.5

单侧界值:上界为:P 95

下界为:P 5

参考值范围(%) 单侧

双侧 80 0.842

1.282 90 1.282

1.645 ★95 ★1.645

★1.960 99

2.326 2.576 /2x z S α±x z S α+x z S

α-

第五章定性资料的统计描述

1、常用相对数:

⑴率是指某现象实际发生数与可能发生某现象总数之比,用以说明某现象发

生的频率或强度。常以百分率,千分率,万分率,十万分率等表示。

⑵构成比是事物内部某一观察单位数与事物内部各组成部分观察单位的总数

之比,说明事物内部各部分所占的比重。常以百分数表示。

⑶相对比是两个有关的指标之比,用以描述两者的对比水平。两个指标可以

是绝对数、相对数或平均数;可以性质相同,也可以性质不同。

★2、应用相对数注意的事项:

⑴计算相对数分母不宜过小;

⑵不能以构成比代替率。率反映事物发生的频率,构成比表示事物内部各

组分所占的比重,二者性质不同。各个组成部分的构成比之和应为

100%,事物内部各组成部分之间呈此消彼长的关系;

⑶计算合计率时,不能简单地相加求平均;

⑷率的比较时应注意可比性。

3、标准化法是在一个指定的标准构成条件下进行率的对比的方法。意义:用统

一的“标准”消除资料由于内部构成不同而对所比较的总率产生的影响。

标准化法的基本思想:确定一个标准的人口年龄构成,男、女人口都按该标准的人口年龄构成,计算年龄别发病情况,最后计算出男、女的合计发病率。

4、应用标准化法应注意的问题:

⑴标准化率便于比较,但不能反映实际水平;

⑵比较几个标准化率时,应在采用同一标准标化的情况下进行;

⑶若各组间的率出现明显交叉时,不宜采用标准化法比较,可直接比较各组的率;

⑷两样本标化率的比较应作假设检验。

第六章 总体均数和总体率的估计

1、抽样误差:由抽样引起的样本统计量与总体参数间的差异称抽样误差。不可

避免、可以控制。表现:样本统计量与总体参数之间的差异样本统计量之间的差异。产生原因:个体变异+抽样。

2、标准误:样本统计量的标准差称为标准误;样本均数的标准差称为均数的标

准误。

均数的标准误表示样本均数的变异度 : 总体标准差未知时,用样本标准差代替: ★3、标准差与标准误的区别:

⑴标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样

误差的大小。

⑵标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误

用于总体均数的区间估计和假设检验。

4、t 分布的特征:

⑴以0为中心,左右对称;

⑵自由度ν 越小,t 值越分散,曲线越平阔,尾部越高;

⑶当ν 趋于∞时, t 分布逼近标准正态分布;

⑷t 分布曲线下面积为1.

5、从界值表可看出:

(1)自由度ν 相同时,t 界值越大其对应的P 值越小

(2)概率P (或尾部面积)相等时,ν 越大,t 界值越小

(3)t 值相等时,双侧概率为单侧概率的两倍

(4) ν = ∞ 时,t 界值即为z 界值

n

X σσ=n S

S X

=

6、总体均数可信区间的计算:

z 分布法:

⑴当σ已知,

服从标准正态分布 ,则总体均数的双测 可信区间为:

⑵σ未知但n 足够大(n >50): t 分布法:当σ未知n 较小 : 7、常用单双侧u 值

α

单侧 双侧

0.10 1.282 1.645

0.05 1.645 1.960

0.02 2.054 2.326

0.01 2.326 2.578

8、可信区间的涵义:从总体中作随机抽样,每个样本可以算得一个可信区间。

如95%可信区间意味着做100次抽样,算得100个可信区间,平均有95个估计正确。

可信区间的两个要素:一是准确度: 反映在可信度的大小

二是精密度: 反映在区间的长度 第七章 假设检验

★1、假设检验的基本思想:应用反证法和小概率原理,先对总体的参数或分布作出

某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。

★2、假设检验的基本步骤:

x z =(0,1)N ()22,x x x x z αασ+()2,x x x z S x z S αα-+()

2,2,,x x x t S x t S α

ναν-+

⑴建立检验假设,确定检验水准

⑵选定检验方法和计算检验统计量

⑶确定P 值,作出推断结论

★3、Ⅰ型错误与Ⅱ型错误:

Ⅰ型错误:拒绝了实际上成立的 ,犯“弃真”的错误。其概率大小用α

表示,α 可取单侧亦可取双侧。

Ⅱ型错误:不拒绝了实际上不成立的H 0,犯“存伪”的错误。其概率大小

用β表示。β 只取单侧,其大小一般未知,只有在已知两总体差

值δ,α 及 n 时,才能估算出来。

推断结论与两类错误

注:当样本含量固定时,α增大,β减小;反之亦然。

若欲同时减小α与β,则只有增加样本含量。

若重点减小Ⅰ型错误,α可取小一些,如α=0.01;

若重点减小Ⅱ型错误,α可取大一些,如α=0.1或α=0.2

★4、检验效能:若两总体确有差别,按照α水准能够发现这种差别的能力。

它的大小用(1-β)表示。

检验效能的影响因素:容许误差 δ、总体标准差 σ、Ⅰ型错误 α、样本含量n ★5、假设检验应注意的事项:

⑴ 应有严密的研究设计:总体中的每个研究个体应具有同质性、样本的获

取必须遵循随机化原则、比较的组间应具有可比性。

实际情况

检验结果

拒绝H 0

不拒绝H 0 成立

第一类错误(α) 结论正确(1-α) 不成立 结论正确(1-β) 第二类错误(β)

⑵ 正确理解α水准和P 值的意义:α是人为预先设定的一个概率值,可有多

个 ; P 是假定

成立,得到实际观测数据的可能性的大小 ,一个样本按某一方法只能得出一个。

⑶ 正确理解结论的统计学意义 。

⑷ 假设检验的结论不能绝对化。

第八章 t 检验

★1、t 检验的适用条件:

⑴σ 未知; ⑵ n 较小(n<60);⑶样本来自正态总体;

⑷两样本所来自的总体方差齐,即 2、配对设计主要情况:(看书本例题)

①配对的两个受试对象分别接受两种处理

②同一样品用两种不同方法测量同一指标, 或接受不同处理

③同一受试对象处理前后的结果进比较

④同一对象的两个部位给予不同的处理

步骤:①建立检验假设,确定检验水准(差值的总体均数)

: : ②计算检验统计量 ν =n-1

③确定P 值,作出统计推断

3、两样本均数的比较:(看书本例题)

⑴步骤:

①建立检验假设,确定检验水准

0H 2

2

21σσ=0H 0=d μ1H 0≠d μ05

.0=αn S x t /0

μ-=

: :

②计算检验统计量 ③确定P 值,作出统计推断

⑵两独立样本资料的t 检验,又称成组t 检验,适用于完全随机设计的两样

本均数的比较。

第九章 方差分析

1、方差分析的基本思想:根据资料的设计类型(即变异的不同来源),将全部

观察值之间的变异(总变异)分解为两个或多个部分,除随机误差外其余每个部分的变异都可由某个因素的作用加以解释,通过比较不同变异来源的均方,借助F 分布作出统计推断,以了解某因素对观察指标是否有影响或某因素是否有效应。

★2、方差分析的应用条件 :

⑴各样本须是相互独立的随机样本(独立性)

⑵各样本来自正态分布总体(正态性)

⑶ 各总体方差相等(方差齐性)

3、完全随机设计:又称成组设计。在实验研究中,按随机化原则将受试对象随

机分配到某一研究因素的多个水平中去,然后观察实验效应;在调查研究中,按一个研究因素的不同水平分组,比较各组的效应。目的都是推断不同水平下各组均数之间的差别是否有统计学意义。

注:方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一

资料所得结果与t 检验等价,即F = t 2。

4、随机区组设计:又称配伍组设计,是配对设计的扩展。其设计方法是将全部

受试对象按某种或某些特征分为若干个区组,使每个区组内研究对象的特征尽可能接近,然后分别使每个区组内的观察对象随机地接受研究因素某一水平的处理。

1H )11(-2

1221n n S x

x t c +=2n n ν21-+=

随机区组设计的方差分析:总变异= 处理组间变异+区组间变异+误差;

和完全随机设计的方差分析相比,误差减小了,检验效率提高了。

5、多个样本均数的两两比较:

⑴SNK-q 检验,适用于探索性研究,对任意两个样本均数都进行检验。 ⑵LSD-t 检验,最小显著性差异检验,适用于某一对或某几对在专业上有特

殊意义的均数间的比较,如多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段确定哪些均数需进行多重比较。

第十章 χ2 检验

★1、χ2 检验主要用途:

⑴推断两个或两个以上总体率(或构成比)之间有无差别

⑵两变量间有无相关关系(有无关联)

⑶检验频数分布的拟合优度

2、2×2表的卡方检验(会列表)

⑴完全随机设计χ2 检验的注意事项:

当 n >40 且所有 T ≥5 时:

基本公式为: 专用公式为: 当 n ≥40 但有 1≤T<5 时:

校正的基本公式为: 校正的基本公式为: 当n <40或T<1时,采用四格表确切概率法

⑵配对四格表资料 χ2 检验的计算公式:

当 b+c ≥40 时:

-=T

T A 2

2)(χ))()()(()(22d b c a d c b a n bc ad ++++-=χ∑

--=T T A 2

2)5.0|(|χ))()()(()2/|(|22

d b c a d c b a n n bc ad ++++--=χc b -22

)(

χ2计算公式为:

当 b+c<40 :

校正χ 2计算公式为: 3、行×列(R×C)表资料的 χ2 检验:

★注意事项:⑴允许有不超过1/5的基本格子理论频数大于1小于5,但不

能有理论频数小于1;

⑵如果有1/5以上格子的理论频数大于1小于5,或有1个格子的理论频

数小于1,可采用以下处理方法:

①增加样本含量,可以增大理论频数;

②将理论频数太小的行或列与性质相近的邻行或邻列中的实际频数合并; ③删去理论频数太小的格子所对应的行或列。

第十一章 非参数检验

★1、参数检验与非参数检验的区别:

参数检验:已知总体分布类型,对未知参数(μ,π)进行统计推断;依赖于特定分布类型 ,比较的是参数。

非参数检验:不依赖总体分布类型,不针对总体参数;不受总体参数影响,比较分布或分布位置 。

2、非参数检验的检验效率没有参数检验高,犯第二类错误的概率β较大。

3、非参数检验应用范围:

⑴ 总体分布形式未知或分布类型不明;

⑵ 偏态分布的资料;

⑶等级资料:不能精确测定,只能以严重程度优劣等级、次序先后等表示 ⑷不满足参数检验条件资料:各组方差明显不齐;

c b c b +--=2

2

)1|(|χ

⑸数据的一端或两端是不确定数值,如“>50mg”。

4、Wilcoxon符号秩和检验:

★编秩:按照差值的绝对值从小到大编秩

差值为0者不参加编秩

绝对值相等,符号相同时顺次编秩

绝对值相等,符号相反时取平均秩次

5、两样本比较的秩和检验:

★编秩原则:将两组数据混合起来从小到大统一编秩

数值相等且组别相同时顺次编秩

数值相等但组别不同时取平均秩次

第十二章双变量关联性分析

★1、直线相关,又称简单相关,是用来描述具有直线关系的两变量x、y的相互关系的统计方法。要求两变量均来自于双变量正态总体的随机变量。

相关系数r没有单位,取值介于-1与1之间。r>0,表示正相关;r<0,表示负相关;r=0,表示零相关。

∣r∣≥0.7时,两变量有高度相关关系;

0.4≤∣r∣<0.7时,两变量有中度相关关系;

∣r∣<0.4时,两变量有低度相关关系;

∣r∣=1表示完全相关;∣r∣=0表示无直线相关,但不一定没有关联性。

★2、等级相关应用范围:

(1)不服从双变量正态分布的资料

(2)总体分布类型未知的资料

(3)等级资料

第十三章 直线回归分析

★1、直线回归(注意与直线相关的区别):又称简单回归,用于研究一个变量随另一个变量变化而变化的依存关系(回归关系),从而预测或控制未知变量的一种统计分析方法,通过拟合线性方程来描述两变量间的回归关系。

应用条件:要求因变量Y 呈正态分布;自变量X 是可以精确测量和控制的变量。

★2、直线回归方程式: ★ b 为样本回归系数 (直线的斜率)其统计学意义是X 每增加/ 减小 1个单位,Y 平均改变b 个单位。b=0,x 与y 之间没有直线关系。

★3、最小二乘法原理:各实测点至回归直线的纵向距离的平方和最小。 4、S Y.X 为剩余标准差 ,表示应变量y 在扣除自变量x 的线性影响后的离散程度,反映实际观察值在回归直线周围的分散状况 。

5、对同一资料,相关系数t 检验与回归系数t 检验结果相同,t r =t b ; 同一资料,有 ★★

6、直线回归与相关区别与联系:

区别

⑴ 资料要求不同:

回归要求因变量y 服从正态分布; x 是可 以精确测量和严格控制的变量; 相关要求x 和y 均呈正态分布。

⑵ 变量地位不同:

回归的变量y 称为因变量,处在被解释的地位,x 称为自变量,用于预测因变量的变化;

相关中变量x 变量y 处于平等的地位,彼此相关关系 。

⑶ 用途不同:

bX b Y +=0?F

t =

说明两变量间依存变化的数量关系用回归;

说明变量间的相关关系用相关。

联系:

⑴r与b的方向一致;

⑵r与b的假设检验等价;

⑶r与b可相互换算;

⑷用回归解释相关。

第十四章生存分析

★1、生存资料的特点:

⑴蕴涵有结局和时间两个方面的信息;⑵结局为两分类互斥事件;

⑶一般是通过随访收集得到,随访观察往往是从某统一时间点开始,观察

到某规定时间点截止;

⑷常因失访等原因造成某些研究对象的生存时间数据不完整,分布类型复杂,不能简单地套用前面介绍过的统计方法,如t检验、方差分析、检验、四格表资料确切概率法或秩和检验进行分析。

★2、生存分析中的几个基本概念:

⑴死亡事件又称失效事件,不单是指通常意义下的生物体死亡,而是泛指标志某种处理措施失败或失效的特征事件。

⑵生存时间:指观察到的存活时间,不单是指通常意义下生物体的存活时间,而是泛指研究者所关心的某现象的持续时间。(广义概念)

生存时间根据其特点,可分为以下两种类型:

①完全数据:指从观察起点到发生死亡事件所经历的时间;

②截尾数据:从起点至截尾点所经历的时间,观察过程的截止不是由于死亡事件,而是由于其他原因引起的,称为截尾(censored),常用t + 表示。

截尾原因:失访、退出(死于其它原因)、终止(观察结束时病人尚存活) ⑶死亡概率:指在某单位时段开始时存活的个体在该时段内死亡的可能性大小,记为q 。

⑷生存概率:表示在某单位时段开始时存活的个体到该时段结束时仍存活的可能性大小,记为p 。

⑸ 生存率:记为 ,指观察对象活过t k 时刻的概率。

第十六章 Meta 分析

1、Meta 分析的概念:Meta 分析是对具有共同研究目的的多个研究进行综合分析的一系列过程。

2、Meta 分析的目的: 提高检验效能、解决若干单个研究结论不一致问题、改善效应量的估计、提出新的研究问题和研究方向

3、Meta 分析的基本方法:⑴固定效应模型,统计方法有Mentel-Haenszel 法、Peto 法和General Variance-based 法;⑵随机效应模型,方法有Dersimonian and Laird 法(D-L 法)。

4、发表偏倚:指有统计学意义的研究结果较无统计学意义或无效的研究结果被报告和发表的可能性大,提高或夸大了实验效应量及危险因素的关联强度,而引发的偏倚。

产生原因:研究者认为无统计学意义的研究意义不大,不发表或推迟发表;作为杂志编辑则更有可能对此类研究不予以发表。

发现和估计发表偏倚的方法:漏斗图分析、失效安全数法 。

第十七章 样本含量估计

1、 样本含量的估计是在保证研究结论具有一定可靠性的条件下,确定最少的调查单位或实验单位数。

?()k

S t

★2、样本含量估计应具备的条件:

⑴I型错误的概率α或区间估计中的可信度1-α;

⑵Ⅱ型错误的概率β,或检验效能1-β;

⑶容许误差或差值δ,即欲比较或估计的总体参数与样本统计量之间或总体参数相差所容许的限度;

⑷总体平均数μ、总体率π或总体标准差σ。

★3、检验效能:假设检验的功效(1-β),其意义是,当所研究的总体确有差别时,按照检验水准α能够发现它(拒绝H0)的能力。

第十八章生命统计常用指标

1、人口统计常用指标:

人口构成:性别比、老龄人口比重、抚养比

2、生育统计常用指标:

⑴生育水平的指标:出生率、生育率、年龄别生育率、总和生育率、终生生育率;

⑵人口再生育指标:自然增长率、粗再生育率、净再生率、平均世代年数;

⑶计划生育工作指标:避孕先用率、避孕失败率、Pearl怀孕率、累计失败率、人工流产率、人流活产比

3、死亡统计常用指标:

⑴反映死亡水平的指标:粗死亡率、年龄别死亡率、死因别死亡率、婴儿死亡率、新生儿死亡率、围生儿死亡率、5岁以下儿童死亡率、孕产妇死亡率;

⑵反映死因构成和死因顺位指标:死因构成或相对死亡比、死因顺位

4、疾病统计常用指标:

⑴反映疾病发生水平的指标:发病率、患病率、检出率、感染率、疾病构成比

⑵反映疾病防治效果的指标:治愈率、有效率、★病死率、★某病死亡率

⑶反映疾病严重程度的指标:减寿年数、寿命损失率

⑷反映残疾统计的指标:残疾患病率、残疾构成

第十九章常用统计表与统计图

1、统计表的制作原则:重点突出、层次清楚、简单明了

2、统计表的结构:标题、标目、线条、数字、备注

3、统计图的结构:标题、图域、标目、刻度、图例

《卫生统计学》(案例版)授课章节选择题参考答案第一章绪论

一、选择题 1.e 2.c 3.d 4.b 5.b

第二章调查研究设计

一、选择题 1.b 2.d 3.a 4.b 5.c

第三章实验设计

一、选择题 1.d 2.e 3.b 4.c 5.d 6.a 7.e 8.a

第四章定量资料的统计描述

一、选择题 1.d 2.c 3.c 4.d 5.d 6.d 7.c 8.b 9.d

第五章定性资料的统计描述

一、选择题 1.a 2.无 3.a 4.d 5.b 6.a 7.e 8.e 9.c

第六章总体均数和总体率的估计

卫生统计学整理笔记

如何绘制频数表? 求组距 确定各组段的两个端点 归组计数 频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式 算数应用条件: 对称分布,尤其正态分布 几何应用条件: 1.对数对称分布、等比资料 2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 中位数条件: 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 极差应用条件:所有分布、尤其偏态分布 不足: 不能全面的反映所有值的偏离程度 不稳定、小样本小于大样本、样本小于总体 四分位数间距应用条件 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 方差应用条件: 对称分布,尤其正态分布 变异系数应用 1.量纲不一致

散点图作用 观察两组数据的总体趋势和明显偏离趋势的观察点 判断两组数据的关联形式、方向和密切程度 相关分类 线性相关 秩相关 分类变量相关 线性相关意义 r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。 |r|→0表示相关性越弱,|r|→1表示相关性越强。 r=0表示没有线性相关,不代表没有相关。 如何判断线性相关 画散点图 计算线性相关系数 假设检验 如何进行秩相关 编秩次 计算秩相关系数 假设检验 回归分析:利用样本信息,找到变量间数量依存关系。 线性回归分析:利用样本信息,找到变量间线性数量依存关系。 决定系数:反映回归贡献的相对程度,即Y的变异被X解释的比例。 如何进行分类变量的相关分析 交叉表的制作,计算各种概率 计算列联系数 假设检验 相关分析的条件 线性相关系数:二元正态分布的定量变量 秩相关系数:非二元正态分布的定量变量、有序分类变量 列联系数:无序分类变量 轶闻数据:由坊间流传或各种媒体报道的一些个案数据,由于其特殊性往往给公众留下突出和深刻的印象。 特点:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。 可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学 令狐文艳 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越 小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便,对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考 一、353卫生综合参考书目: ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》 二、配套精编复习资料 山东大学353卫生综合《复习全程通》精都考研组编 三、复习全程通内容简介 《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验,由本团队组织目标院校本专业的高分研究生共同合作编写而成,全书考点知识面覆盖全面,权威细致,编排结构科学合理,是专门为本届考研的考生量身定制的必备专业课资料。 通过本精编资料四大模块内容,结合考生每个阶段的复习,有助于考生深入了解目标院校以及专业考点重点,提高复习效率,拓展解题思路。 NO.1历年真题汇编 通过目标院校原版真题,了解命题老师的出题思路,且分析考点重点,快速了解目标院校出题风格及命题思路,提高复习效率,拓展解题思路 NO.2教辅一本通 本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析,通过本书的配套复习,分析专业考点侧重,通过大量典型考题让充分掌握本门科目重点,确保考场应对自如。 NO.3冲刺模拟套卷 书在遵循专业课最新参考书目,结合历年考研真题规律,制定的模拟卷,并有详细的配套答案讲解,适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容 本部分内容为购买全套资料的同学附赠的内容,主要是初试参考书目主编老师的教学讲义以及相关的扩充习题,此部分内容对于跨考的考生相对比较重要,通过讲义了解专业课基础复习侧重,达到专业知识点不缺不漏。 四、解析备考辅导班: 专业课一对一无忧全程班 专业课一对一标准全程班 山东大学在读研究生授课 以上内容是【精都考研网】整理发布,每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269,抓紧时间加入了解你所不知道的考研信息。

卫生统计学重点整理资料东大

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本 均数?x 、样本率ρ等。 ⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变 量;变量值的集合成为资料。 ⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料第二章调查研究设计

★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。 第三章实验设计 ★1、实验设计的特点(注意与调查研究的特点的区别): ⑴研究者可人为设置处理因素; ⑵受试对象接受何种处理因素或处理因素的何种水平是随机的。 ★2、实验设计的三要素、四原则: ⑴基本要素:①处理因素②受试对象③实验效应 ⑵基本原则:①对照原则②随机原则③重复原则④均衡原则 4、实验设计的基本步骤: ⑴明确实验目的;⑵确定研究对象;⑶确定可比的实验组和对照组; ⑷确定把受试对象分配到各处理组中的原则;⑸确定样本含量; ⑹确定方法和指标;⑺偏倚及其控制 5、常用的实验设计方案:主要掌握完全随机设计和配对设计。 第四章定量资料的统计描述 ★1、频数表的编制:①求极差②确定组数和组距(一般8~15组)

卫生统计学复习笔记

卫生统计学复习笔记 一、概述 1、卫生统计学的概念(熟练掌握) 统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。 卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。 卫生统计学的内容(了解): 1)健康统计:医学人口统计、疾病统计和生长发育统计等; 2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤(熟练掌握) 统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤: 1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据 2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。 3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。 4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行

卫生统计学考试题及答案要点

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 二、单项选择题

1.观察单位为研究中的( D )。 A.样本B.全部对象 C.影响因素D.个体 2.总体是由(C )。 A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是(B )。 A.研究样本统计量B.由样本统计量推断总体参数 C.研究典型案例研究误差D.研究总体统计量 4.参数是指( B )。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的(A )。 - 2 - .抽样时应使得总体中的每一个个体都有同等的机会被抽取A .研究者在抽样时应精心挑选个体,以使样本更能代表总体B .随机抽样即随意抽取个体C .为确保样本具有更好的代表性,样本量应越大越好D B )。6.各观察值均加(或减)同一数后( .均数改变,标准差不变BA.均数不变,标准差改变 .两者均改变 D .两者均不变C )。7.比较身高和体重两组数据变异度大小宜采用(A B.方差.变异系数 A D.标准差C.极差 D )可用来描述计量资料的离散程度。8.以下指标中( .几何均数 B A.算术均数 D.标准差C.中位数 )。9.血清学滴度资料最常用来表示其平均水平的指标是(C B.中位数A.算术平均数 D.平均数C.几何均数 。)10.两样本均数的比较,可用(C 检验B.t A.方差分析 .方差齐性检验 D C.两者均可 ?。D 11.配伍组设计的方差分析中,)等于(配伍???? A.--B.总误差总处理?????? D.---C.+处理总误差总处理误差??|X??|?,的正态总体中随机抽样,)的概率为5% 。12.在均数为标准差为( B tSst?1.96 C.D. A. B.?1.96??,,X20.0520.05X13.完全随机设计方差分析的检验假设是(D )。 A.各处理组样本均数相等B.各处理组总体均数相等 C.各处理组样本均数不相等D.各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( D )。 2检验χB A.分别进行比较.两个率比较的 - 3 -

卫生统计学重点笔记之欧阳家百创编

医师资格考试蓝宝书预防医学 欧阳家百(2021.03.07) 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件, <0.05或0.01为小概率事件。 二、变量的分类

变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小,观察值 的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为:CV=s/×100%,公式中s为样本标准差,为样本均数。 三、标准差的应用

调查资料的整理与分析

第7章调查资料的整理与分析 调查资料的整理 调查资料的分析 第一节资料整理的意义和一般步骤 一、资料整理的意义 二、资料整理的原则 三、资料整理的一般步骤 一、资料整理的意义 所谓资料整理,是指运用科学的方法,将调查所得的原始资料按调查目的进行审核、汇总与初步加工,使之系统化和条理化,并以集中、简明的方式反映调查对象总体情况的过程。 是对调查调查资料的全面检查,是进一步分析研究资料的基础,保存资料的客观要求 二、资料整理的原则:真实性;准确性;完整性;统一性;简明性 三、资料整理的一般步骤 1、资料的审核 2、资料的编码 3、资料的分组 4、资料的汇总 5、制作统计表和统计图 第二节资料的审核与汇总 一、资料审核的一般要求: 1、真实性:来源的客观性;本身的真实性 2、准确性:检查含糊不清、相互矛盾; 3、完整性:资料总体的完整性;每份调查资料的完整性 二、资料审核的方法 逻辑审核;计算审核 调查当天结束时,需要进行初步的整理,重点审核资料的真实性、准确性和完整性 三、资料的编码 将问卷或调查表中的信息转化成计算机能识别的数字符号。 举例:山东农村养老状况与需求调查 四、资料的分类和汇总 1)对量化资料进行分类和汇总 (1)分类标志应根据研究的目的和统计分析的要求而定 (2)使用的间隔要使最常出现的答案在中间 (3)分类间隔多比分类间隔少好 (4)学会使用复合分类,在不知道要做何种分析时,应该使用复合分类 2)对定性资料进行分类和汇总 (1) 在分类前,看是否有一定量的回答存在 (2) 使用的分类标准与其他的资料相适应,以利于比较 (3) 分类是简洁互斥的,每个回答只能放在一个间隔里 (4) 包容所有可能的回答。通常用“其他”来包括所有没有指出的答案选择

16秋实用卫生统计学终考综合练习题

16秋实用卫生统计学期末终考综合练习题说明: 1.本套综合练习题仅针对16秋期末终考而编制,每个题的解题方法在学习网实用卫生统计学课程主页的“每章重难点辅导”中,或在教材后面的习题答案中,找到相应题目或类似题目的详细解答过程和答案。 2.16秋期末终考试题与本综合练习题的题型完全相同。有些数据可能稍有变化,但解题方基本一致。 本次期末考试时间为60分钟,开卷考试,时间短,题量大,希望同学们考前一定要做足准备,考试时仔细审阅试题,争取好成绩。 一、填空题 1.经调查某地10岁男童身高均数为135厘米,标准差为4.74厘米,其变异系数是 3.51% (注意:保留两位小数)。 2.正态分布的两个重要参数是均值和方差。 3.某市6岁男童的身高均数为115.0cm,标准差为10.0cm。试计算6岁男童身高大于13 4.6cm的约占百分数是 2.5% 4.常用的相对数有构成比、率、比。 5.增长速度与发展速度关系为增长速度=发展速度-1 。 6.环比发展速度的算式为以前一个时间(年)数据为作基数,以相邻的后一时间(年)数据与之相比,或当前一年数据与前一年数据之比。 7.动态数列是一列按时间顺序排列起来的统计指标,它包括:绝对数,相对数或平均数,这些指标用以说明事物在时间上的变化和发展趋势。 8.统计表是由标题、标目、线条、数字四部分构成。 9.统计学中常见的统计图形有:普通线图、半对数线图、直条图、直方图、圆图、百分条图和散点图 10.置信区间的两个要素:一是准确度,二是;精确度。 s 11.均数标准误的计算公式为 12.均数的抽样误差是对于抽样过程中产生的同一总体中均数之间的差异。 13.根据总体标准差σ是否已知及样本含量n的大小,总体均数置信区间的计算公式不同。

卫生统计学知识点整理

卫生统计学考点整理(一) 2017年11月24日 一、绪论: 1、什么是卫生统计学: 卫生统计学是运用数理统计的基本原理和方法对预防医学和公共卫生领域中的科学研 究进行设计,以及研究资料的收集、整理和分析的一门应用科室。 2、卫生统计学的基本内容包括哪些 ①卫生统计学的基本理论和方法,包括研究设计和数据分析中的统计理论和方法。 ②健康统计,包括医学人口统计、疾病统计和生长发育统计等。 ③卫生服务统计,包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等 的统计问题。 3、什么是计量资料 用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得到的数据(即测量值) 成为计量资料(计量资料含有单位) 4、什么是计数资料 将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样得到 的数据成为计数资料(也称分类资料)(不含单位) 5、什么是等级资料 将全体观察单位按照某种性质的不同程度分为若干组,分别清点各组中观察单位的个数。 6、什么是总体 根据研究目的的确定的同质观察单位的全体。(是同质的所有观察单位某种变量值的集合) 研究对象具有相同的背景、条件、属性 8、什么是变异 同一性质的事物,其个体观察值(变量值)之间的差异。 9、什么是样本 从总体中随机抽取具有代表性的一部分个体,其测量值(或观察值)的集体成为样本。 10、什么是抽样研究 对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。 11、抽样研究的目的是什么 通过用样本资料计算的指标去推论总体。 12、什么是参数 参数是指总体指标。(如:总体均数μ、总体率π、总体标准差σ等) 13、什么是统计量 统计量是指样本指标。(如:样本均数、样本率p、样本标准差S等) 14、什么是统计描述 用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征 15、什么是统计推断 根据样本资料的特性对总体的特性作估计或者推论的方法。(常用方法是参数估计和假 设检验)

卫生统计学重点整理-预防医学

1.卫生统计学:是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生 服务领域中数据的收集、整理和分析的一门科学。 2.同质(homogeneity):在统计学中,若某些观察对象具有相同的特征或属性称为同质的。 否则称为异质(heterogeneity)的或者间杂的。 3.变异(variation):同质事物之间的差别称为变异。[没有个体变异,就没有统计学!] 4.总体(population):根据研究目的所确定的同质观察单位的全体。 5.样本(sample):是从总体中随机抽取的具有代表性的部分观察单位的集合。 6.样本含量(sample size):样本中包含的观察单位个数。 7.参数(parameter):反映总体特征的指标。特点:未知、唯一,希腊字母表示,如总体均 数、总体率等。 8.统计量(statistic):根据样本观察值计算出来的指标。特点:已知、不唯一,拉丁字母 表示,如样本均数、样本率等。 9.变量(variable):研究者需要对每个观察单位的某项特征或属性进行观察或测量,这种特 征或属性称为变量。 10.变量值(value of variable):变量的观察值或测量值称为变量值或观察值(observed value)。 11.资料(data):变量值的集合称之为资料。 12.定量资料(quantitative data):变量值是定量的,表现为数值大小。特点:一般有度、 量、衡单位,一般属连续性资料。 13.定性资料(qualitative data):观察值是定性的,表现为互不相容的类别或属性。特点: 一般无度、量、衡单位,一般属于离散型资料。可进一步分为计数资料和等级资料。 14.计数资料(count data):将观察单位按某种类别或属性进行分组,清点各组观察单位数所 得的资料。可进一步分为二项分类资料和无序多项分类资料。 15.等级资料(ordinal data):将观察单位按照某种特质或属性的程度或等级顺序分组,清点 各组观察单位所得的资料。各属性之间互不相容且有程度的差别。 16.抽样研究(sampling research):从总体中随机抽取样本,通过样本信息推断总体特征的 研究方法。 17.抽样误差(sampling error):由随机抽样造成的样本统计量与总体参数之间、样本统计量 之间的差异。 18.概率(probability):概率是随机事件发生可能性大小的数值度量。通常用P表示。大小 介于0与1之间,即0≤P ≤1。 19.小概率事件:医学研究中,将概率小于等于0.05或0.01的事件称为小概率事件。 20.小概率原理:并不表示不可能发生,但在某一次试验中,是不会发生的。

卫生统计学重点笔记

医师资格考试蓝宝书-预防医学 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。 二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为:CV=s/X ×100%,公式中s为样本标准差,X为样本均数。 三、标准差的应用 表示观察值的变异程度(或离散程度)。 在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性较差;反之,表示各观察值多集中在均数周围,均数的代表性较好。(常考!) 四、医学参考值的计算方法,单双侧问题,医学为95% 医学参考值是指正常人体或动物体的各种生理常数,由于存在变异,各种数据不仅因人而异,而且同一个人还会随机体内外环境的改变而改变,因而需要确定其波动的范围,即正

相关文档
最新文档