卫生统计学(个人整理)

卫生统计学(个人整理)
卫生统计学(个人整理)

卫生统计学

一、概述

1、卫生统计学的概念(熟练掌握)

统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。

卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。

由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。

卫生统计学的内容(了解):

1)健康统计:医学人口统计、疾病统计和生长发育统计等;

2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。

2、卫生统计学的工作步骤(熟练掌握)

统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤:

1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据

2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。

3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行

准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。

4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行描述;后者是指如何抽样,以及如何用样本信息推断总体特征。进行资料分析时,需根据研究目的、设计类型和资料类型选择恰当的描述性指标和统计推断方法。

统计工作的四个步骤紧密相连、不可分割,任何一步的缺陷,都将影响整个研究结果。

3、基本概念:

1)、同质与变异。严格地讲,同质是指被研究指标的影响因素完全相同。但在医学研究中,有些影响因素往往是难以控制的(如遗传、营养等),甚至是未知的。所以,在统计学中常把同质理解为对研究指标影响较大的、可以控制的主要因素尽可能相同。例如研究儿童的身高时,要求性别、年龄、民族、地区等影响身高较大的、易控制的因素要相同,而不易控制的遗传、营养等影响因素可以忽略。

同质基础上的个体差异称为变异。如同性别、同年龄、同民族、同地区的健康儿童的身高、体重不尽相同。事实上,客观世界充满了变异,生物医学领域更是如此。哪里有变异,哪里就需要统计学。若所研究的同质群体中所有个体一模一样,只需观察任一个体即可,无须进行统计研究。

2)、总体与样本

任何统计研究都必须首先确定观察单位,亦称个体。观察单位是统计研究中最基本的单位,可以是一个人、一个家庭、一个地区、一个样品、一个采样点等。

总体是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。例如欲研究山东省2002年7岁健康男孩的身高,那么,观察对象是山东省2002年的7岁健康男孩,观察单位是每个7岁健康男孩,变量是身高,变量值(观察值)是身高测量值,则山东省2002年全体7岁健康男孩的身高值构成一个总体。它的同质基础是同地区、同年份、同性别、同为健康儿童。总体又分为有限总体和无限总体。有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个,如上例;无限总体是抽象的,无时间和空间的限制,观察单位数是无限的,如研究碘盐对缺碘性甲状腺病的防治效果,该总体的同质基础是缺碘性甲状腺病患者,同用碘盐防治;该总体应包括已使用和设想使用碘盐防治的所有缺碘性甲状腺病患者的防治效果,没有时间和空间范围的限制,因而观察单位数无限,该总体为无限总体。

在实际工作中,所要研究的总体无论是有限的还是无限的,通常都是采用抽样研究。样本是按照随机化原则,从总体中抽取的有代表性的部分观察单位的变量值的集合。如从上例的有限总体(山东省2002年7岁健康男孩)中,按照随机化原则抽取100名7岁健康男孩,他们的身高值即为样本。从总体中抽取样本的过程为抽样,抽样方法有多种。抽样研究的目的是用样本信息推断总体特征。

统计学好比是总体与样本间的桥梁,能帮助人们设计与实施如何从总体中科学地抽取样本,使样本中的观察单位数(亦称样本含量)恰当,信息丰富,代表性好;能帮助人们挖掘样本中的信息,推断总体的规律性。

3)、资料与变量及其分类

总体确定之后,研究者应对每个观察单位的某项特征进行测量或观察,特征称为变量。如“身高”、“体重”、“性别”、“血型”、“疗效”等。变量的测定值或观察值称为变量值或观察值,亦称为资料。

按变量的值是定量的还是定性的,可将变量分为以下类型,变量的类型不同,其分布规律亦不同,对它们采用的统计分析方法也不同。在处理资料之前,首先要分清变量类型。

1)数值变量:其变量值是定量的,表现为数值大小,可经测量取得数值,多有度量衡单位。如身高(cm)、体重(kg)、血压(mmHg kPa)、脉搏(次/min)和白细胞计数(×10 9 /L)等。这种由数值变量的测量值构成的资料称为数值变量资料,亦称为定量资料。大多数的数值变量为连续型变量,如身高、体重、血压等;而有的数值变量的测定值只能是正整数,如脉搏、白细胞计数等,在医学统计学中把它们也视为连续型变量。

2)分类变量:其变量值是定性的,表现为互不相容的类别或属性。分类变量可分为无序变量和有序变量两类:

(1)无序分类变量是指所分类别或属性之间无程度和顺序的差别。它又可分为①二项分类,如性别(男、女),药物反应(阴性和阳性)等;②多项分类,如血型(O、A、B、AB),职业(工、农、商、学、兵)等。对于无序分类变量的分析,应先按类别分组,清点各组的观察单位数,编制分类变量的频数表,所得资料为无序分类资料,亦称计数资料。

(2)有序分类变量各类别之间有程度的差别。如尿糖化验结果按-、±、+、++、+++分类;疗效按治愈、显效、好转、无效分类。对于有序分类变量,应先按等级顺序分组,清点各组的观察单位个数,编制有序变量(各等级)的频数表,所得资料称为等级资料。

变量类型不是一成不变的,根据研究目的的需要,各类变量之间可以进行转化。例如血红蛋白量(g/L)原属数值变量,若按血红蛋白正常与偏低分为两类时,可按二项分类资料分析;若按重度贫血、中度贫血、轻度贫血、正常、血红蛋白

增高分为五个等级时,可按等级资料分析。有时亦可将分类资料数量化,如可将病人的恶心反应以0、1、2、3表示,则可按数值变量资料(定量资料)分析。

4、随机事件与概率

医学研究的现象,大多数是随机现象,对随机现象进行实验或观察称为随机试验。随机试验的各种可能结果的集合称为随机事件,亦称偶然事件,简称事件。例如用相同治疗方案治疗一批某病的患者,治疗转归可能为治愈、好转、无效、死亡四种结果,对于一个刚入院的患者,治疗后究竟发生哪一种结果是不确定的,可能发生的每一种结果都是一个随机事件。

对于随机事件来说,在一次随机试验中,某个随机事件可能发生也可能不发生,但在一定数量的重复试验后,该随机事件的发生情况是有规律可循的。概率是描述随机事件发生的可能性大小的数值,常用P表示。例如,投掷一枚均匀的硬币,随机事件A表示“正面向上”,用 n表示投掷次数;m表示随机事件A发生的次

数;f表示随机事件A发生的频率(f=m/n),0≤m≤n, 0≤f≤1。

用不同的投掷次数n作随机试验,结果如下:m/n=8/10=0.8, 7/20=0.35,…… , 249/500=0.498, 501/1000=0.501, 10001/2000=0.5000,由此看出当投掷次数n 足够大时,f=m/n→0.5,称P(A)=0.5,或简写为:P=0.5。当n足够大时,可以用f估计P。

随机事件概率的大小在0与1之间,即0

近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。P=1表示事件必然发生,P=0表示事件不可能发生,它们是确定性的,不是随机事件,但可以把它们看成随机事件的特例。

若随机事件A的概率P(A)≤a,习惯上,当a=0.05时,就称A为小概率事件。其统计学意义是小概率事件在一次随机试验中不可能发生。例如,某都市大街上疾驶的汽车撞伤行人的事件的发生概率为1/万,但大街上仍有行人,这是因为“被撞”事件是小概率事件,所以行人认为自己上街这“一次试验”中不会发生“被撞”事件。“小概率”的标准a是人为规定的,对于可能引起严重后果的事件,如术中大出血等,可规定a=0.01,甚至更小。

误差是指测定结果与真实结果之间的差值。对任何一个物理量进行的测量都不可能得出一个绝对准确的数值,即用测量技术所能达到的最完善的方法,测出的数值也和真实值存在差异,这种测量值和真实值的差异称为误差。

误差的分类

误差分为绝对误差和相对误差。也可以根据误差的来源分为系统误差(又称偏性)和随机误差(又称机会误差)。

1、绝对误差是测量值对真值偏离的绝对大小,因此它的单位与测量值的单位相同。

2、相对误差则是绝对误差与真值的比值,因此它是一个百分数。一般来说,相对误差更能反映测量的可信程度。相对误差等于测量值减去真值的差的绝对值除以真值,再乘以百分之一百。

3、系统误差是由一些固有的因素(如测量方法的缺陷)产生的,理论上总是可以通过一定的手段来消除。如天平的两臂应是等长的,可实际上是不可能完全相等的;天平配置的相同质量的砝码应是一样的,可实际上它们不可能达到一样。

4、随机误差是由于在测定过程中一系列有关因素微小的随机波动而形成的具有相互抵偿性的误差(也称为偶然误差和不定误差)。

第二节疾病统计常用指标

一、疾病统计的意义

疾病统计(morbidity statistics)从数量方面研究疾病在人群中的发生、发展和流行分布的特点与规律,为病因学研究,为防治疾病和评价防治工作效果提供科学依据。

二、疾病统计资料的来源

包括以下三个方面:

1.疾病报告和报表资料

2.医疗卫生工作记录

3.疾病调查资料

三、疾病和死因分类

疾病和死因的分类是按国际疾病和死因分类(international classification of diseases,简称ICD), 目前正在使用的版本是ICD-10。见有关书籍。

四、常用疾病统计指标

1.反映疾病发生水平的指标

(1)发病率(incidence rate)

(2)患病率(prevalence rate)

2.反映疾病构成情况的指标

3.反映疾病危害程度和防治效果的指标

(1)某病死亡率:见死因别死亡率。

(2)某病病死率(case fatality)

(3)治愈率(cure rate)

(4)有效率

(5)生存率(survival rate):指病人能活到某一时点的概率。常用于对慢性病的治疗效果或预后估计。

(五)、残疾统计

1.残疾的定义及分级

残疾是指在心理、生理、人体结构上,某种组织、功能丧失或者不正常,全部或者部分丧失以正常方式从事某种活动能力的人。分为功能、形态残疾(impairment)、丧失功能残疾( disability)和社会功能残疾(handicap)三个此次。

2.残疾的常用统计指标

(1)残疾患病率

(2)残疾构成

第一节医学人口统计常用指标

一、医学人口统计资料的来源

1.来源于人口普查资料

2.来源于人口抽样调查资料

3.来源于人口抽样资料,包括生命时间登记、人口迁移变动登记、户口登记等途径。

二、人口数与人口构成

(一)人口总数

人口总数(Population)一般指一个国家或某一特定时间的人口数,一般采用一年的中点,即7月1日零时为标准时刻统计。

(二)人口构成及其分析

1、基本人口学特征包括年龄、性别、文化、职业等,其中最常用的是性别和年龄,用以描述人口构成情况。

2、人口年龄构成指各年龄组人口在总人口中所占的比例。在人口年龄构成的基础上,可以导出许多有用的描述人口状况的指标,比如:

(1)人口系数

1)老年(人口)系数:

老年人口系数越大,表明人口中老年人口所占比重越大;在一定程度上反映人群的健康水平。

2)少年儿童(人口)系数

少年儿童人口系数越大,表明人口中少年人口所占比重越大,人口越年轻。该指标主要受生育水平的影响。

(2)负担系数又称抚养比或抚养系数,是指人口中非劳动年龄人数与劳动年龄人数之比。负担系数包括三个指标:

总负担系数=

少年儿童负担系数=

老年负担系数=

(3)老少比:是划分人口类型的标准之一。

老少比=

3、性别比指男性人口与女性人口的比值,即

性别比=

4、人口金字塔是将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,

以人口数或年龄构成比为横轴,按左侧为男、右侧为女绘制的直方图,其形如金字塔,故称为人口金字塔。

人口金字塔更形象直观地反映了人口的年龄构成,便于说明和分析人口现状、类型及发展趋势。

三、生育与计划生育统计

(一)、生育与计划生育统计资料的来源

有关原始资料包括人口、出生、死亡、结婚登记、育龄妇女资料等,可向有关部门索取,也可根据需要自行调查取得。

(二)生育与计划生育统计指标

1.反映生育水平的指标

(1)粗出生率(crude birth rate,简记为CBR):

粗出生率=

上式中平均人口数的取值,若在人口普查年,可用普查所得的该地该年7月1 日零时的人口总数;在非人口普查年,则用上年末及本年末两个人口数的平均值。

粗出生率的优点在于资料易获得,计算简单,但它的主要缺点是受人口的年龄、性别构成和婚姻状况的影响。粗出生率只能粗略地反映生育水平。

总生育率(general fertility rate,简记为GFR):指某地某年平均每千名妇女的活产数。

总生育率=

总生育率消除了总人口中年龄性别构成不同对生育水平的影响,较粗出生率能更确切地反映生育水平。但受育龄妇女内部年龄构成的影响。

(3)年龄别生育率(age-specific fertility rate,简记为ASFR):又称年龄组生育率,其算式为:

某年龄组生育率=

年龄别生育率消除了育龄妇女内部年龄构成不同对生育水平的影响。

(4)终生生育率(life-time fertility rate,简记为LTFR)与总和生育率(total fertility rate,简记为TFR)

终生生育率说明一批经历过整个生育期的同龄妇女一生的生育水平,其算式为:

终生生育率=

总和生育率的算式为:总和生育率=n

2.测量人口再生育的

统计指标

(1)自然增长率(natural increase rate,简记为NIR):是粗出生率(CBR)与粗死亡率(CDR)之差,即NIR=CBR-CDR(15.13)

自然增长率容易理解,计算简单,但它受人口的性别、年龄构成不同的影响,只能粗略地估计人口的一般增长趋势,不能用来预测未来人口的发展速度。

(2)粗再生育率(gross reproduction rate,简记为GRR)

粗再生育率是只计算女婴的总和生育率。

(3)净再生育率(net reproduction rate,简记为NRR)

NRR=(15.14)

式中ASFR为只记女婴的年龄别生育率。

(4)平均世代年数(mean length of generation,简记为LG)

LG=

上式中NRR的计算前已述及;分子育龄妇女总人年数的计算见课本表15.1第(6)栏。

3.反映计划生育工作情况的统计指标

(1)避孕现用率

(2)Pearl怀孕率(Pearl pregnancy rate):是评价避孕效果的指标。

(3)累计失败率(cummulative failure rate):是在给定时间内,妇女用某一措施后意外怀孕的人数。能较准确地反映避孕效果。

(4)人工流产率(induce abortion rate):反映育龄妇女中人工流产的强度。

(5)人流活产比(ratio of induced abortion and live birth):用于间接地反映计划外怀孕情况。

(6)计划生育率:用于综合说明计划生育的质量。

(7)节育率:反映计划生育工作质量。

4.与出生有关的其他常用指标

(1)低出生体重百分比(proportion of low birth weight):反映居民健康水平及孕期保健的情况。

(2)儿童妇女比(child-women ratio):是一个间接反映生育水平的指标,其优点在于不需要活产数,在没有生命事件登记的地区常用它间接测量生育水平。

四、人口死亡统计

(一)、人口死亡资料的来源

我国人口死亡资料主要由公安部门负责收集,并按ICD-10中的死因分类填写。(二)、常用人口死亡统计指标

1.测量死亡水平的指标

(1)粗死亡率(crude death rate, CDR):具有资料易获得,计算简单的优点,但受人口的年龄、性别构成情况的影响。

K为比例系数,常用/千,/万,或/10万。

(2)年龄别死亡率(age-specific death rate, ASDR):年龄别死亡率消除了人口的年龄构成不同对死亡水平的影响,不同地区同一年龄组的死亡率可以直接进行比较。

(3)婴儿死亡率(infant mortality rate, IMR):是反映社会卫生状况和婴儿保健工作的重要的指标,不受年龄的影响,可直接比较。

(4)新生儿死亡率(neonatal mortality rate, NMR):是反映妇幼卫生工作质量的重要指标。

(5)围生儿死亡率(perinatal mortality):是衡量孕前、孕期、产期、产后保健工作质量的敏感指标之一。

(6)5岁以下儿童死亡率(child mortality under age 5):是综合反映儿童健康水平和变化的主要指标。

?

(7)孕产妇死亡率(maternal mortality rate):这一指标不仅可以评价妇女保健工作,而且间接反映一个国家的卫生文化水平。

(8)死因别死亡率(cause-specific death rate):是死因分析的重要指标,反映各类病伤死亡对居民生命的危害程度。

2.反映死因构成及死因顺位的指标

(1)死因构成或相对死亡率(proportion of dying of a specific cause):反映各种死因的相对重要性。

(2)死因顺位:是指按各类死因构成比的大小由高到低排列的位次,说明各类死因的相对重要性。

第十二章统计表和统计图

1.掌握统计表的编制基本原则

2.掌握统计表的编制基本要求

要求

统计表和统计图是统计描述的重要方法。医学科学研究资料经过整理和计算各种统计指标后,所得结果除了用适当的文字说明外,常将统计资料及其指标以表格列出(称为统计表,statistical tables),或将统计资料形象化,利用点的位置、线断的升降、直条的长短或面积的大小等形式直观表示事物间的数量关系(称为统计图,statistical graph)。统计表与统计图可以代替冗长的文字叙述,表达清楚,对比鲜明。

一、常用统计表

(一)统计表的结构与编制

1.统计表的结构统计表由标题、标目、线条和数字构成。如下表所示:

表号标题

横标目名称纵标目合计

横标目数字

合计

2.列表的原则重点突出,简单明了,即一张表一般表达一个中心内容,便于分析比较;主谓分明,层次清楚,符合逻辑,明确被说明部分(主语)与说明部分(谓语)。

3.编制要求

(1)标题要能概括表的内容,写于表的上端中央,一般应注明时间与地点。

(2)标目标目是表格内的项目。以横、纵向标目分别说明主语与谓语,文字简明,层次清楚。横标目列在表的左侧,一般用来表示表中被研究事物的主要标志;纵标目列在表的上端,一般用来说明横标目的各个统计指标的内容。

标目内容一般应按顺序从小到大排列,小的放在上面,不同时期的资料可按年份、月份先后排列,有助于说明其规律性。

(3)线条线条不易过多,常用3条线表示,谓之“三线图”。表的上下两条边线可以用较粗的横线,一般省去表内的线条,但合计可用横线隔开。表的左右两侧的边线可省去,表的左上角一般不用对角线。

(4)数字以阿拉伯数字表示。表内的数字必须正确,小数的位数应一致并对齐,暂缺与无数字分别以“…”、“-”表示,为“0”者记作“0”,不应有空项。为方便核实与分析,表一般应有合计。

(5)说明一般不列入表内。必要说明者可标“※”号,于表下加以说明。

(二)统计表的种类

通常按分组标志多少分为简单表与组合表。

?简单表(simple table)由一组横标目和一组纵标目组成,如表2-10。

表2-10 2001年某省不同地区的卫生系统反应性评分比较

地区调查人数评分均值

省会城市333 703.63

一般城市152 507.15

县及乡村971 679.06

合计1456 666.73

?复合表(combinative table)是由2组及以上的横标目和纵标目相结合起来或1组横标目和2组及以上纵标目结合起来以表达他们之间关系的统计表,如表2-11。

表2-11 2001年某省不同地区、性别的卫生系统反应性评分比较

地区

男女

调查人数评分均值调查人数评分均值

省会城市217 706.60 116 698.07

一般城市100 517.15 52 487.92

县及乡村371 669.88 600 684.74 合计688 659.26 768 673.43

二、常用统计图

医学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。

?绘制统计图的基本要求

o根据资料的性质和分析目的决定适当的图形。

o标题应说明资料的内容、时间和地点,一般位于图的下方。

o图的纵、横轴应注明标目及对应单位,尺度应等距或具有规律性,一般自左而右、自上而下、由小到大。

o为使图形美观并便于比较,统计图的长宽比例一般为7:5,有时为了说明问题也可加以变动。

o比较、说明不同事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多。

常用统计图的适用条件与绘制

1.条图(bar graph)条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关系,一般有单式(图2-3)与复式(图2-4)之分.

制图要求:

(1)一般以横轴为基线,表示各个类别;纵轴表示其数值大小。

(2)纵轴尺度必须从0开始,中间不宜折断。在同一图内尺度单位代表同一数量时,必须相等。

(3)各直条宽度应相等,各直条之间的间隙也应相等,其宽度与直条的宽度相等或为直条宽度的1/2。

(4)直条的排列通常由高到底,以便比较。

(5)复式条图绘制方法同上,所不同的是复式条图以组为单位,1组包括2个以上直条,直条所表示的类别应用图例说明,同一组的直条间不留空隙。

图2-3 2001年某省不同地区的卫生系统反应性评分比较

图2-4 2001年某省不同地区、性别的卫生系统反应性评分比较

2.圆图(pie graph)圆形图适用于百分构成比资料,表示事物各组成部分所占的比重或构成。以圆形的总面积代表100%,把面积按比例分成若干部分,以角度大小来表示各部分所占的比重(图2-5)。

图2-5 2001年某医科大学公共卫生学院专业技术人员构成

制图要求:

(1)先绘制以大小适当的圆形。由于圆心角为360度,因此每1%相当于3.6度的圆周角,将各部分百分比分别乘以3.6度即为各构成部分应占的圆周角度数。

(2)圆形图上各部分自圆的12点开始由大到小按顺时针方向依次绘制,其他置最?简单表(simple table)由一组横标目和一组纵标目组成,如表2-10。

表2-10 2001年某省不同地区的卫生系统反应性评分比较

地区调查人数评分均值

省会城市333 703.63

一般城市152 507.15

县及乡村971 679.06

合计1456 666.73

?复合表(combinative table)是由2组及以上的横标目和纵标目相结合起来或1组横标目和2组及以上纵标目结合起来以表达他们之间关系的统计表,如表2-11。

表2-11 2001年某省不同地区、性别的卫生系统反应性评分比较

地区

男女

调查人数评分均值调查人数评分均值

省会城市217 706.60 116 698.07 一般城市100 517.15 52 487.92

县及乡村371 669.88 600 684.74 合计688 659.26 768 673.43

二、常用统计图

医学领域中常用的统计图有条图、百分条图、圆图、线图、半对数图、直方图、散点图、箱式图与统计地图等。

?绘制统计图的基本要求

o根据资料的性质和分析目的决定适当的图形。

o标题应说明资料的内容、时间和地点,一般位于图的下方。

o图的纵、横轴应注明标目及对应单位,尺度应等距或具有规律性,一般自左而右、自上而下、由小到大。

o为使图形美观并便于比较,统计图的长宽比例一般为7:5,有时为了说明问题也可加以变动。

o比较、说明不同事物时,可用不同颜色或线条表示,并常附图例说明,但不宜过多。

?常用统计图的适用条件与绘制

1.条图(bar graph)条图用等宽长条的高度表示按性质分类资料各类别的数值大小,用于表示他们之间的对比关系,一般有单式(图2-3)与复式(图2-4)之分.

制图要求:

(1)一般以横轴为基线,表示各个类别;纵轴表示其数值大小。

(2)纵轴尺度必须从0开始,中间不宜折断。在同一图内尺度单位代表同一数量时,必须相等。

(3)各直条宽度应相等,各直条之间的间隙也应相等,其宽度与直条的宽度相等或为直条宽度的1/2。

(4)直条的排列通常由高到底,以便比较。

(5)复式条图绘制方法同上,所不同的是复式条图以组为单位,1组包括2个以上直条,直条所表示的类别应用图例说明,同一组的直条间不留空隙。

图2-3 2001年某省不同地区的卫生系统反应性评分比较

图2-4 2001年某省不同地区、性别的卫生系统反应性评分比较

2.圆图(pie graph)圆形图适用于百分构成比资料,表示事物各组成部分所占的比重或构成。以圆形的总面积代表100%,把面积按比例分成若干部分,以角度大小来表示各部分所占的比重(图2-5)。

图2-5 2001年某医科大学公共卫生学院专业技术人员构成

制图要求:

(1)先绘制以大小适当的圆形。由于圆心角为360度,因此每1%相当于3.6度的圆周角,将各部分百分比分别乘以3.6度即为各构成部分应占的圆周角度数。

(2)圆形图上各部分自圆的12点开始由大到小按顺时针方向依次绘制,其他置最

绘制要求(普通线图):

(1)横轴表示某一连续变量(时间或年龄等);纵轴表示某种率或频数,其尺度必须等距(或具有规律性)。

(2)同一图内不应有太多的曲线,通常≤5条,以免观察不清。

(3)如有几根线,可用不同的图线(实线、虚线等)来表示,并用图例说明。

(4)图线应按实际数字绘制成折线,不能任意改为光滑曲线。

5.直方图(histogram)直方图用于表达连续性资料的频数分布。以不同直方形面积代表数量,各直方形面积与各组的数量成正比关系(图2-8)。

图2-8 2001年某地区居民受教育年限分布

制图要求:

(1)一般纵轴表示被观察现象的频数(或频率),横轴表示连续变量,以各矩形(宽为组距)的面积表示各组段频数。

(2)直方图的各直条间不留空隙;各直条间可用直线分隔,但也可不用直线分隔。

(3)组距不等时,横轴仍表示连续变量,但纵轴是每个横轴单位的频数。

6.散点图(scatter diagram)散点图以直角坐标系中各点的密集程度和趋势来表示两现象间的关系(图2-9)。根据点的散布情况,推测2种事物或现象有无相关,故常在对资料进行相关分析之前使用。

图2-9某地区饮水氟含量与氟骨症患病率散点图

制图要求:

(2)一般横轴代表自变量或可进行精确测量、严格控制的变量,纵轴则代表与自变量有依存关系的因变量。

(2)纵轴和横轴的尺度起点可根据需要设置。

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

卫生统计学整理笔记

如何绘制频数表? 求组距 确定各组段的两个端点 归组计数 频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式 算数应用条件: 对称分布,尤其正态分布 几何应用条件: 1.对数对称分布、等比资料 2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 中位数条件: 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 极差应用条件:所有分布、尤其偏态分布 不足: 不能全面的反映所有值的偏离程度 不稳定、小样本小于大样本、样本小于总体 四分位数间距应用条件 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 方差应用条件: 对称分布,尤其正态分布 变异系数应用 1.量纲不一致

散点图作用 观察两组数据的总体趋势和明显偏离趋势的观察点 判断两组数据的关联形式、方向和密切程度 相关分类 线性相关 秩相关 分类变量相关 线性相关意义 r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。 |r|→0表示相关性越弱,|r|→1表示相关性越强。 r=0表示没有线性相关,不代表没有相关。 如何判断线性相关 画散点图 计算线性相关系数 假设检验 如何进行秩相关 编秩次 计算秩相关系数 假设检验 回归分析:利用样本信息,找到变量间数量依存关系。 线性回归分析:利用样本信息,找到变量间线性数量依存关系。 决定系数:反映回归贡献的相对程度,即Y的变异被X解释的比例。 如何进行分类变量的相关分析 交叉表的制作,计算各种概率 计算列联系数 假设检验 相关分析的条件 线性相关系数:二元正态分布的定量变量 秩相关系数:非二元正态分布的定量变量、有序分类变量 列联系数:无序分类变量 轶闻数据:由坊间流传或各种媒体报道的一些个案数据,由于其特殊性往往给公众留下突出和深刻的印象。 特点:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。 可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。

卫生统计学方法与应用中

1、甲乙两地某病得死亡率进行标准化计算时,其标准选择() * ? A、不能用甲地数据 ? B、不能用乙地数据 ? C、不能用甲地与乙地得合并数据 ? D、可能用甲地或乙地得数据 ? E、以上都不对 2、实验设计应遵循得基本原则就是() * ? A、随机化、对照、盲法 ? B、随机化、盲法、配对 ? C、随机化、重复、配对 ? D、随机化、齐同、均衡 ? E、随机化、对照、重复 3、对于一组服从双变量正态分布得资料,经直线相关分析得相关系数r=0、9,对该资料拟 合回归直线,则其回归系数b值() * ? A、b>0 ? B、b=0 ? C、b<0 ? D、b=1 ? E、不能确定正负 4、以下属于分类变量得就是() * ? A、IQ得分 ? B、心率 ? C、住院天数 ? D、性别 ? E、胸围 5、抽样调查某市正常成年男性与女性各300人,测得其血红蛋白含量( g/L)。欲比较男性 与女性得血红蛋白含量就是否有差异,假设男性与女性得血红蛋白含量得总体方差相等,应采用() *c ? A、样本均数与总体均数比较得t检验 ? B、配对t检验 ? C、成组t检验 ? D、配对设计差值得符号秩与检验 ? E、成组设计两样本比较得秩与检验

6、进行方差分析时,数据应满足() * ? A、独立性、正态性、大样本 ? B、独立性、正态性、方差齐性 ? C、独立性、方差齐性、大样本 ? D、独立性、正态性、平行性 ? E、正态性、方差齐性、大样本 7、同类定量资料下列指标,反映样本均数对总体均数代表性得就是() *? A、四位分数间距 ? B、标准误 ? C、变异系数 ? D、百位分数 ? E、中位数 8、完全随机设计得方差分析组间变异来自于() * ? A、个体 ? B、全部观察值 ? C、随机因素 ? D、处理因素 ? E、随机因素与处理因素 9、统计工作得基本步骤就是() * ? A、及时收集完整、准确得资料 ? B、综合资料 ? C、方差分析时要求个样本所在总体得方差相等 ? D、完全随机设计得方差分析时,组内均方就就是误差均方 ? E、完全随机设计得方差分析时,F=MS组间/MS组内 10、生存分析中得结果变量就是() *d ? A、生存时间 ? B、寿命表法生存曲线呈阶梯型 ? C、生存率 ? D、生存时间与随访结局 ? E、生存时间与生存率 11、反映血型为AB型得人在人群中所占得比例,宜计算() * ? A、率 ? B、标准化率

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

2019住院医师规培考试卫生统计学方法与应用(上)

2019住院医师规培考试卫生统计学方法与 应用(上) https://www.360docs.net/doc/ce14996334.html,work Information Technology Company.2020YEAR

1、一般不放在统计表中的项目为() * A.线条 B.横标目 C.纵标目 D.数字 E.备注 2、说明某现象发生强度的指标为() * A.构成比 B.相对比 C.定基比 D.环比 E.率 3、某医院收集了近期门诊病人的病种构成情况资料,宜绘制()* ? A.直线图 ? B.圆图 ? C.线图 ? D.直方图 ? E.半对数线图 4、统计表的主语通常放在统计表()* ? A.下面 ? B.上面

? C.左侧 ? D.右侧 ? E.中间 5、若X值的均数等于7,标准差等于2,则X+3的均数()* ? A.也等于7 ? B.等于9 ? C.等于10 ? D.界于7-3与7+3之间 ? E.界于7-1.96×2与7+1.96×2之间 6、一般来说,一个基本的统计表其标题、标目和线条的数量为()* ? A.1、2、3 ? B.1、3、2 ? C.2、1、3 ? D.3、1、2 ? E.3、2、1 7、为了反映某地区五年间鼻咽癌死亡病例的年龄分布,可采用()* ? A.直方图 ? B.普通线图 ? C.半对数线图 ? D.直条图 ? E.复式直条图

8、计算相对数的目的是()* ? A.为了进行显著性检验 ? B.为了表示绝对水平 ? C.为了便于比较 ? D.为了表示实际水平 ? E.为了表示相对水平 9、不是样本的指标的是()* ? A.p ? B.s ? C.t ? D.F ? E.μ 10、为表示某地近20年来婴儿死亡率的变化情况,宜绘制()* ? A.普通线图 ? B.直方图 ? C.直条图 ? D.散点图 ? E.统计地图 11、截至2014年7月23日,全球共有21个国家累计报告中东呼吸综合征(MERS)实验室确诊病例837例,死亡291例,利用该信息计算得34.8%是()* ? A.患病率

卫生统计学试题参考答案

医学统计方法选择题一: 医学统计方法概述 l.统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示B A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对 3.抽签的方法属于 D A分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样 4.测量身高、体重等指标的原始资料叫:B A计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数8 23 6 3 1 该资料的类型是:D A计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的C A有价值的部分B有意义的部分C有代表性的部分 D任意一部分E典型部分 7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对 8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则D A对照的原则B随机原则C重复原则 D交叉的原则E以上都不对 第八章数值变量资料的统计描述 11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率 12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择C A X B G C M D S E CV 13.各观察值均加(或减)同一数后:B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对 14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学 令狐文艳 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越 小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学试题(含答案)

医学统计方法选择题一 医学统计方法概述 l .统计中所说的总体是指: A A 根据研究目的确定的同质的研究对象的全体 B 随意想象的研究对象的全体 C 根据地区划分的研究对象的全体 D 根据时间划分的研究对象的全体 E 根据人群划分的研究对象的全体 2. 概率P=0,则表示B A 某事件必然发生 B 某事件必然不发生 D 某事件发生的可能性很大 E 以上均不对 7. 将计量资料制作成频数表的过程,属于 A 统计设计 B 收集资料 C 整理资料 8. 统计工作的步骤正确的是 C A 收集资料、设计、整理资料、分析资料 C 设计、收集资料、整理资料、分析资料 E 搜集资料、整理资料、分析资料、进行推断 ¬¬ 统计工作哪个基本步骤: C D 分析资料 E 以上均不对 B 收集资料、整理资料、设计、统计推断 D 收集资料、整理资料、核对、分析资料 B 10. 以下何者不是实验设计应遵循的原则 D A 对照的原则 B 随机原则 C 重复原则 D 交叉的原则 E 以上都不对 第八章 数值变量资料的统计描述 11. 表示血清学滴度资料平均水平最常计算 B A 算术均数 B 几何均数 C 中位数 D 全距 E 率 12. 某计量资料的分布性质未 明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13. 各观察值均加(或减)同一数后: B A 均数不变,标准差改变 B 均数改变,标准差不变 C 两者均不变 D 两者均改变 E 以上均不对 14. 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问 3.抽签的方法属于 D A 分层抽样 B 系统抽样 C 整群抽样 4.测量身高、体重等指标的原始资料叫: A 计数资料 B 计量资料 某种新疗法治疗某病患者 治愈 8 D 单纯随机抽样 E 二级抽样 5. 治疗结果 治疗人数 该资料的类型是: A 计数资料 6.样本是总体的 A 有价值的部分 D 任意一部分 显效 23 B C 等级资料 41 人, 好转 6 D 分类资料 治疗结果如下: 恶化 3 E 有序分类资料 计量资料 C B 有意义的部分 C 有代表性的部分 E 典型部分 C 无序分类资料 死亡 1 D 有序分类资料 E 数值变量资料 A 抽样误差 B 系统误差 C 随机误差 D 责任事故 E 以上都不对 C 某事件发生的可能性很小 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:

住院医师规培考试 卫生统计学方法与应用(上)

1、一般不放在统计表中的项目为()* ? A.线条 ? B.横标目 ? C.纵标目 ? D.数字 ? E.备注 2、说明某现象发生强度的指标为() * ? A.构成比 ? B.相对比 ? C.定基比 ? D.环比 ? E.率 3、某医院收集了近期门诊病人的病种构成情况资料,宜绘制() * ? A.直线图 ? B.圆图 ? C.线图 ? D.直方图 ? E.半对数线图 4、统计表的主语通常放在统计表() *

? A.下面 ? B.上面 ? C.左侧 ? D.右侧 ? E.中间 5、若X值的均数等于7,标准差等于2,则X+3的均数() * ? A.也等于7 ? B.等于9 ? C.等于10 ? D.界于7-3与7+3之间 ? E.界于7-1.96×2与7+1.96×2之间 6、一般来说,一个基本的统计表其标题、标目和线条的数量为() * ? A.1、2、3 ? B.1、3、2 ? C.2、1、3 ? D.3、1、2 ? E.3、2、1 7、为了反映某地区五年间鼻咽癌死亡病例的年龄分布,可采用() * ? A.直方图

? B.普通线图 ? C.半对数线图 ? D.直条图 ? E.复式直条图 8、计算相对数的目的是() * ? A.为了进行显著性检验 ? B.为了表示绝对水平 ? C.为了便于比较 ? D.为了表示实际水平 ? E.为了表示相对水平 9、不是样本的指标的是() * ? A.p ? B.s ? C.t ? D.F ? E.μ 10、为表示某地近20年来婴儿死亡率的变化情况,宜绘制() * ? A.普通线图 ? B.直方图

? C.直条图 ? D.散点图 ? E.统计地图 11、截至2014年7月23日,全球共有21个国家累计报告中东呼吸综合征(MERS)实验室确诊病例837例,死亡291例,利用该信息计算得34.8%是() * ? A.患病率 ? B.死亡率 ? C.病死率 ? D.相对比 ? E.发病率 12、图示某地某年流行性乙型脑炎患者的年龄分布,宜绘制() * ? A.条图 ? B.百分条图 ? C.圆图 ? D.直方图 ? E.线图 13、以下哪项不属于定量资料() * ? A.身体质量指数(体重/身高2) ? B.白蛋白与球蛋白比值

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

北京市住院医师规范化培训卫生统计学方法与应用(中)

1、对2007年某地人口指标进行统计,发现与2006年相比,2007年少年儿童人口比 例增加,则可能出现该地未来的() * ? A.死亡率增加 ? B.死亡率下降 ? C.出生率增加 ? D.出生率下降 ? E.人口自然增长率下降 2、某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的 正常值范围一般指该指标在() * ? A.所有人中的波动范围 ? B.所有正常人中的波动范围 ? C.绝大部分正常人中的波动范围 ? D.少部分正常人中的波动范围 ? E.一个人不同时间的波动范围 3、下列关于统计表的要求,叙述错误的是() * ? A.标题位于表的上方中央 ? B.不宜有竖线及斜线 ? C.备注不必列入表内 ? D.线条要求三线式或四线式 ? E.无数字时可以不填 4、在统计学中,参数的含义是() * ? A.变量 ? B.参与研究的数目 ? C.研究样本的统计指标 ? D.总体的统计指标 ? E.与统计研究有关的变量 5、频数分布集中位置偏向数值较小的一侧称为() * ? A.偏态分布 ? B.不对称型分布 ? C.对称分布 ? D.正偏态分布 ? E.负偏态分布 6、统计学中的小概率事件,下面说法正确的是() *

? A.反复多次观察,绝对不发生的事件 ? B.在一次观察中,可认为不会发生的事件 ? C.发生概率小于0.1的事件 ? D.发生概率小于0.001的事件 ? E.发生概率小于0.001的事件 7、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研 究总体为() * ? A.所有成年男子 ? B.该市所有成年男子 ? C.该市所有健康成年男子 ? D.120名该市成年男子 ? E.120名该市健康成年男子 8、调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于() *? A.统计资料 ? B.计量资料 ? C.总体 ? D.个体 ? E.样本 9、下列不属于相对比的指标是() * ? A.相对危险度RR ? B.比值比OR ? C.病死率 ? D.变异系数 ? E.发展速度 10、关于概率的说法,错误的是() * ? A.通常用P表示 ? B.用于描述随机事件发生的可能性大小 ? C.某时间发生的频率即概率 ? D.在实际工作中,概率常难以直接获得 ? E.某事件发生的概率P≤0.05时,称为小概率事件 11、下列关于相对数表述正确的是() * ? A.治疗2人治愈1人,其治愈率为50% ? B.构成比和率的作用是相同的

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学试卷(附答案)

2004~2005学年第(1)学期预防医学专业本科 期末考试试卷 (卫生统计学课程) 姓名____________________ 班级____________________ 学号____________________ 考试时间:200 年月日午 —(北京时间)

一、选择题(每题1分,共60分) 1、A1、A2型题 A. 48.0 B. 49.0 C. 52.0 D .53.0 E.55.0 2. 比较7岁男童与17岁青年身高的变异程度,宜用: A. 极 差 B. 四分位数间距 C. 方差 D. 标准差 E. 变异系数 3. 根据观测结果,已建立y 关于x 的回归方程? 2.0 3.0y x =+,该回归方程表示x 每增加1个单位,y 平均增加几个单位? A. 1 B. 2 C. 3 D. 4 E.5 4. 设从 5.11=μ的总体中作五次随机抽样(n =5),问哪一个样本的数据既精确又准确? A. 8,9,10,11,12 B. 6,8,10,12,14 C. 6,10,12,14,18 D. 8,10,12,14,16 E. 10,11,12,13,14 5. 为表示某地近20年来婴儿死亡率的变化情况,宜绘制 A.散点图 B. 直条图 C. 百分条图 D. 普通线图 E. 直方图 6. 临床上用针灸治疗某型头痛,有效的概率为60%现用该法治疗5例,问其中至少2例有效的概率约为 A. 0.913 B. 0.087 C. 0.230 D.0.317 E. 以上都不对 7.二项分布、Poisson 分布、正态分布各有几个参数? A. 1,1,2 B. 2,1,2 C. 1,2,2 D. 2,2,2 E. 1,2,1 8. 假定某细菌的菌落数服从Poisson 分布,经观察得平均菌落数为9,问菌落数的标准差为: A. 18 B. 9 C. 3 D. 81 E. 27 9. 对于同一资料的直线相关系数与回归系数,下列论断有几句是正确的? 相关系数越大,回归系数也越大。 相关系数与与回归系数符号一致。 相关系数的t r 等于回归系数的t b 。 相关系数描述关联关系,回归系数描述因果关系。 A.1句 B.2句 C. 3句 D. 4句 E. 0句 10.下列四句话有几句是正确的? 标准差是用来描述随机变量的离散程度的。 标准误是用来描述统计量的变异程度的。 t 检验只用于检验两样本均数的差别。 χ2可用来比较两个或多个率的差别。 A. 0句 B. 1句 C. 2句 D. 3句 E. 4句

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便,对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考 一、353卫生综合参考书目: ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》 二、配套精编复习资料 山东大学353卫生综合《复习全程通》精都考研组编 三、复习全程通内容简介 《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验,由本团队组织目标院校本专业的高分研究生共同合作编写而成,全书考点知识面覆盖全面,权威细致,编排结构科学合理,是专门为本届考研的考生量身定制的必备专业课资料。 通过本精编资料四大模块内容,结合考生每个阶段的复习,有助于考生深入了解目标院校以及专业考点重点,提高复习效率,拓展解题思路。 NO.1历年真题汇编 通过目标院校原版真题,了解命题老师的出题思路,且分析考点重点,快速了解目标院校出题风格及命题思路,提高复习效率,拓展解题思路 NO.2教辅一本通 本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析,通过本书的配套复习,分析专业考点侧重,通过大量典型考题让充分掌握本门科目重点,确保考场应对自如。 NO.3冲刺模拟套卷 书在遵循专业课最新参考书目,结合历年考研真题规律,制定的模拟卷,并有详细的配套答案讲解,适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容 本部分内容为购买全套资料的同学附赠的内容,主要是初试参考书目主编老师的教学讲义以及相关的扩充习题,此部分内容对于跨考的考生相对比较重要,通过讲义了解专业课基础复习侧重,达到专业知识点不缺不漏。 四、解析备考辅导班: 专业课一对一无忧全程班 专业课一对一标准全程班 山东大学在读研究生授课 以上内容是【精都考研网】整理发布,每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269,抓紧时间加入了解你所不知道的考研信息。

卫生统计学-重点整理资料东大

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差 异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值 的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集 合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表 示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表 示,如样本 均数x 、样本率等。

⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属 性称为变 量;变量值的集合成为资料。 ⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大 小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相 容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料; ②等级资料 第二章调查研究设计 ★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后 采用随机数字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察 单位按某一顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i 号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将 总体分成若干层,该特征的测定值在层内变异较小,层间变异

卫生统计学复习笔记

卫生统计学复习笔记 一、概述 1、卫生统计学的概念(熟练掌握) 统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。 卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。 卫生统计学的内容(了解): 1)健康统计:医学人口统计、疾病统计和生长发育统计等; 2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤(熟练掌握) 统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤: 1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据 2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。 3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。 4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行

《卫生统计学》习题及答案

1.表示均数抽样误差大小的统计指标是(C ) A)标准差B)方差 C)均数标准误D)变异系数 2?抽样研究中,s为定值,若逐渐增大样本含量,则样本(B )。 A)标准误增大B)标准误减少 C)标准误不改变D)标准误的变化与样本含量无关 3. 均数标准误越大,则表示此次抽样得到的样本均数(C )。 A)系统误差越大B)可靠程度越大 C)抽样误差越大D)可比性越差 4. 假设已知某地35岁以上正常成年男性的收缩压的总体均数为 120.2mmHg,标准差为11.2 mmHg,后者反映的是(A )。 A)个体变异B)抽样误差 C)总体均数不同D)抽样误差或总体均数不同 5. 配对计数资料差别的卡方检验,其备择假设是(D )。 A)p1=p2 B)p1 Mp2 C)B=C D)B 丸 6. 下列关于总体均数可信区间的论述是正确的,除了( C )外。 A)总体均数的区间估计是一种常用的参数估计 B)总体均数可信区间所求的是在一定概率下的总体均数范围 C)求出总体均数可信区间后,即可推断总体均数肯定会在此范围内

D )95%是指此范围包含总体均数在内的可能性是 95%,即估计错误的概率 是5% 试题来源:【2016公卫执业医师考试宝 典免 费下载】 小编教你如何快速通过公卫执业医师考 试 查看其他试题,请扫描二维码,立即获 得本 题库手机版详情咨询阪imo 7.总体率可信区间的估计符合下列 (C )情况时,可以借用正态近似法处理。 A )样本例数n 足够大时 B )样本率p 不太大时 C)np 和n(1-p)大于5时 D )p 接近1或0时 8.正太近似法估计总体率95%可信区间用(D ) B) p ±1.96(T C) p ±2.58(T 10. 关于假设检验,下列哪个是正确的 A )检验假设是对总体作的某种假设 A)p ±1.96s D)p ±1.96sp 9.统计推断的内容(C )。 A )用样本指标估计相应总体指标 B )假设检验 C )A 和B 答案均是 D )估计参考值范围

卫生统计学重点笔记之欧阳家百创编

医师资格考试蓝宝书预防医学 欧阳家百(2021.03.07) 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件, <0.05或0.01为小概率事件。 二、变量的分类

变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越小,观察值 的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为:CV=s/×100%,公式中s为样本标准差,为样本均数。 三、标准差的应用

实用卫生统计学自考试题及答案

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为7.5分; 乙班平均分为75分,标准差为7.5分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() A.520公斤 B.530公斤 C.540公斤 D.550公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% B.400% C.120% D.1200%

6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为 哪个回归方程可能是正确的?() A.y=125-10x B.y=-50+8x C.y=150-20x D.y=-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值

相关文档
最新文档