卫生统计学考研试题名词解释总结

卫生统计学考研试题名词解释总结

典型调查就是在调查对象中有意识的选择若干具有典型意义

2、 箱式图(box plot ):用于多组数据的直观比较分析。一般选用5个描述统计量(最小值、 P25、

中位数、P75最大值)来绘制。

3、 二项分布(binorminal distribution ):若一个随机变量 X ,它的可能取值是0,1,…,而 且相应的

取值概率为 称此随机变量X 服从n , n 为参数的二项分布。

4、 morbidity statistics :疾病统计,是居民健康统计的重要内容之一,它的任务是研究 疾病在人

群中发生、发展及其流行的规律,为病因学研究、疾病防治和评价疾病防治效果提 供科学依据。

5、 life expectancy :期望寿命,是指x 岁尚存者预期平均尚能存活的年数,它是评价居 民健康状况的主要指标。

6 life table :寿命表,又称为生命表,是根据特定人群的年龄组死亡率编制出来的一种 统计表。由于它是根据各年龄组死亡率计算出来的,因此,各项指标不受人口年龄构成的影 响,不同人群的寿命表指杯具有良好的可比性。

7、 预测(forecast ):这是回归方程的重要应用方面。所谓预测就是把预测因子 (自变量X ) 代入回归方程,对预报量(应变量丫进行估计,其波动范围可以按照个体 丫值容许区间方法 计算。

8、 standard deviation :标准差,常用来描述数据离散趋势的统计指标,其能反映均数代 表性的好

坏,以及变量值与均数的平均离散程度。

9、 cluster sampling :整群抽样,首先将总体按照某种与研究目的无关的分布特征 (如地 区范

围、不同的团体、病历、格子等 )划分为若干个 “群”组,每个群包括若干观察单位;然后 根据需要随机抽取其中部分 “群”, 并调查被抽中的各 ”群”中的全部观察单位。 这种抽样方法 称为整群抽样。

10、 precision :精密度,是指重复观察时,观察值与其均数的接近程度,其差值属于随 机误差

11、 正交设计(orthogonal design ):当实验涉及的因素在三个或三个以上,且因素间可能 存在交

互作用时,可用正交试验设计。它利用一套规格化的正交表,将各试验因素、各水平 之间的组合均匀搭配,合理安排,可以用较少的、有代表性的处理组合数,提供充分有用的 信息,还可找出较优组合,用以指导实践,因而是一种高效、快速的多因素试验设计方法。

12、 maternal morality rate :孕产妇死亡率,是指某年妇女在妊娠至产后 42天以内,因 为

怀孕和分娩及其并发症所造成的孕产妇死亡人数与同年出生活产数之比。

13、 定群寿命表(cohort life table ):亦称队列寿命表,它是对某特定人群中的每一个人, 从进入该特定人群直到最后一个人死亡记录的实际死亡过程。 由于人的生命周期很长, 如果 用现时寿命表方法研究人群的生命或死亡过程. 不仅随访人数要很多, 而且随访时间要上百 年。

14、 人口金字塔:将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人 口数或年

龄构成比为横轴,按左侧为男、右侧为女绘制的直方图,其形如金字塔,故名人口 金字塔。它形象直观的反映了人口的年龄性别构成,便于说明和分析人口的现状、类型。

15、 截矩(intercept ):中的a ,表示X 为0时,丫的平均水平的估计值。

16、method of moment :矩法,亦称动差法。它是应用数学上矩的原理推导出偏度系数 g1 和峰度系

数 g2

17、 proportion :构成比,又称构成指标,它说明一事物内部各组成部分所占的比重或 分布,常

以百分数表示。计算公式: 医.学教育网搜 .集整理

18、 chi-square tes :卡方检验,,常用于分类变量资料的统计推断。该检验以 分布 和拟合优度检验为理论依据, 用来推断两个及多个总体率或构成比有无差别, 两种属性及两 个变量之或者代表的 单位进行非全面调查

1、typical survey :典型调查,

间有无关联性,及频数分布的拟合优度检验。

19、Poisson distributen:Poisson分布,如果离散型随机变量X的取值为0,1,…,k且相应的取值概率为(0),则称随机变量X服从以卩为参数的泊松分布,记为X-P(卩。)

20、prevale nee rate:患病率,指在某时点检查时可能发生某病的一定人群中,现患的病人总数。

21、生存人年数:即Lx, X岁尚存者在今后一年(n年)内的生存人年数,即lx曲线下,X〜(X+n)间的面积。

22、cause eliminated life table:去死因寿命表,是用来分析某种疾病或某类疾病对平均预期寿命等指标的影响,可以综合说明某类死因对人群生命的影响程度,它不受人口年龄结构的影响,而且它既能说明某类死因对全人口的综合作用,又能表达对某年龄组人口的作用。

23、剩余平方和(residual of square):,它反映X对丫的线性影响以外的一切因素对丫变异的作用,也就是总平方和中无法用X解释的部分。

25、析因试验设计:factorial design,实验研究常常涉及两个或多个处理因素。这些因素间可能存在交互作用。析因试验设计是将两个或多个因素的各个水平进行排列组合,交叉分组进行试验,可用于分析各因素间的交互作用,比较各因素不同水平的平均效应和因素间不同水平组合下的平均效应,寻找最佳组合。

26、vital statistics:生命统计,以人口生命事件为内容的统计活动。生命事件包括人口的出生、死亡、婚姻,以及有关民事身份的变动等。从广义上说,生命统计活动可以概括为有关人口生命事件的原始登记、资料整理,以及统计和分析。

27、人流活产比(ratio of induced abortion and live birth) :这个指标表示每100个活产,有多少人工流产,它间接反映了计划外怀孕的情况。

28、中心极限定理:

29、截尾值(censored data):由于失访、改变防治方案、研究时间结束时事件尚未发生等情况,使得部分病人不能随访到底,称之为截尾。从起点到截尾所经历的时间,称为截尾数据。

30、enumeration data :计数资料,无序变量的分析,应先分类汇总,计算观察单位数,编制分类资料频数表,又称计数资料。

31、percentile :百分位数,是将n个观察值从小到大依次排列,再把它们的位次依次转

化为百分位。百分位数的一个重要用途是确定医学参考值范围。医学教.育网搜集

32、列联表:是指两个变量按照从小到大的顺序分类整理出来的一类表,目的是为了研究两变量之间有无关联性。

33、rank correlation :等级(秩)相关

34、multiple comparison :多重比较,多个样本均数间的两两比较又称为多重比较。常用的统计方法有q 检验。

35、current life table:现时寿命表,指从一个横断面看问题,假定有同时出生的一代人,按照某种人群现实人口实际年龄组死亡率陆续死去,计算出这一代人按年龄的一系列指标。

36、slope:斜率,回归系数B又称为斜率,表示X变化一个单位,丫平均变化B个单位。

37、决定系数(coefficient of determination):表示回归平方和SS回归占离均差总平方和SS总的比例,记为R2。

38、overall survey:普查,也称全面调查,即对调查范围内的全部观察对象进行调查的方式。

39、community intervention trial :社区干预试验,往往在某个地区的所有人群中进行,持续时间一般较长,目的是通过干扰某些危险因素或施加某些保护性措施,然后了解它们在人群中产生的预防效果。由于社区干预试验难以贯彻随机化原则,故又称为类实验研究。

40、life-time fertility rate :终生生育率,是指一出生队列的妇女到49 岁时的累积生育率,其意义是指该队列妇女到生育年龄结束时,平均每一个妇女生育的活产数,等于该队列妇女从15 岁到

49 岁的年龄别生育率总和。

41、参数(parameter):用来描述总体特征的指标叫做参数。

42、把握度(power of test): 1-B称为检验效能,过去称为把握度,即当两总体确有差别时,按照规定的检验水准a所能发现该差异的能力。

43、统计推断(statistical inference):通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。

44、dynamic series:动态数列,是指一系列按照时间顺序排列起来的统计指标(包括绝对数、相对数或平均数) ,用以说明事物在时间上的变化发展和趋势

45、non parametric statistics:非参数检验,针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于该方法不受总体参数的限制,故称为非参数检验,或称为不拘分布的统计分析方法,又称为无分布形式假定的统计分析方法。

46、方差(varianee):是用来描述一组数据平均离散程度的指标,由离均差的平方和除以样本个数得到。

47、variable transformation :变量变换,变量变换是将原始数据作某种函数转换,如转换对数值。它的目的是: ① 使各组达到方方差齐性;② 使资料转化为正态分布,以满足方差分析和t 检验的应用条件;③ 直线化。常用于曲线拟合。

48、四分位数间距(inter-quartile range, IQR):是由第三(上)四分位数减去第一(下) 四分位数所得,常常与中位数一起使用,用来描述偏态分布资料的分布特征,较极差稳定。

49、社会功能残疾(handicap):由于身体的形态和功能的缺陷或异常,影响残疾者参加社会活动,或虽具备参加社会活动的能力,因受到社会上一些人的歧视而被迫脱离社会活动的残疾。

51、抚养比(dependency ratio):又称为负担系数,是指人口中非劳动年龄(14岁以下及65岁以上)人口数与劳动年龄(15〜64岁)人口数之比。有3个常用指标:总负担系数、少年儿童负担系数和老年负担系数。

52、人工流产率: 指某一地区一定时期内平均每100 名育龄妇女中的人工流产次数,它是反映一定时期内育龄妇女实施人工流产手术的频度指标,主要反映孕前计划生育管理情况。

53、standard deviation of Y for fixed X剩余标准差,指X对Y的影响被扣除后,Y仍存

在变异,此变异由抽样误差造成,与X无关。用来反映丫的剩余变异。

54、统计地图(statistical map):用于表示某现象的数量在地域上的分布。如将疾病的发病率、患病率或死亡率等以乡或县等为单位,根据指标大小分级,采用不同程度的线条或不同颜色绘在地图上,有助于分析疾病的地理分布特征。

55、type I error :第I类错误,是指拒绝了实际上成立的H0,这类弃真”的错误称为I

型错误,其概率大小用a表示。

56、丧失功能残疾(disability):是指人体的结构缺陷和功能障碍,使得残疾人丧失他应具备的能力(与残疾人性别、年龄、文化程度和职业等相应的能力) 。

57、功能、形态残疾(impairment) :是残疾人的第一级,一般为伤病的后遗症,使人体结构和功能发生缺陷或异常。

59、剩余标准差(residual standard deviation):,指X对丫的影响被扣除后,丫仍存在变异,此变异由抽样误差造成,与X无关。用来反映丫的剩余变异。

60、总和生育率:假定同时代出生的一代妇女,按照某年的年龄别生育率水平度过一生的生育历程,平均每名妇女可能生育的子女数。它等于各年龄组生育率之和乘以年龄组组距。

61、con traceptive prevale nee:避孕现用率,反映避孕的普及程度的指标,是指100名育龄妇女当中,已经采用避孕的人数。

62、复相关系数:决定系数R2的平方根R即为复相关系数,它表示P个变量共同对应变量线性相关的密切程度,它不取负值,即0三R三1。

63、分层抽样(stratified sampling):是先按对观察指标影响较大的某种特征,将总体分为

若干类别(统计学上,称之为“层”),再从每一层内随机抽取一定数量的观察单位,合起来组成样本。分层的原则是层间差别越大越好,层内差别越小越好。

64、median survival time:中位生存时间,又叫半数生存期,是用来概括样本生存情况的描述统计量,表示恰好有50%的个体活过此时间。生存时间并非正态分布,故常用中位生存时间作为某个人群生存过程的概括性描述指标,其值越长,表示疾病预后越好。

65、标准正态分布:均数为0,标准差为 1 的正态分布被称为标准正态分布(standard normal distribution) ,通常记为N(0, 12)。

66、检验效能(power of test): 1- p称为检验效能,它是指当两总体确有差别,按照规定的检验水准a所能发现该差异的能力。

68、偏回归系数:多元线性回归中的偏回归系数表示在其他自变量固定不变的情况下,自变量Xj 每改变一个单位时,单独引起应变量丫的平均改变量。

69、交叉设计(cross-over design)是一种特殊的自身对照设计。在进行设计时,首先将

条件相近的观察对象配对,再用随即分配的方法决定其中之一先采用处理A,再采用处理B,

另一个研究对象则先采用处理B,再采用处理A。

71、生存率(survival rate):用S(t)表示,是指0时刻存活的个体在t时刻仍存活的概率。随访的起始时间点不同,所得生存率也不同。

72、abridged life table:简略寿命表,如果年龄分组的组矩不是1岁时,称为简略寿命

表,简略寿命表的组矩一般是 5 岁,但是0 岁作为一个独立组。

73、系统抽样(systematic sampling)又称机械抽样和等矩抽样,现将总体的观察单位按照某一顺序分成n 个部分,再从第一部分随机抽取第k 号观察单位,依次用相等的间隔,从每一部分抽取一个观察单位组成样本。

75、survival analysis生存分析:是将事件的结果和出现这一结果所经历的时间,结合起来分析的一种统计分析方法,它不仅可以从事件结局的好坏,如疾病的治愈(成功)或死亡(失败),而且可以从事件的持续时间,如某病经治疗后存活的时间长短进行分析比较,因而能够更全面、更精确的反应该治疗的效果。

76、bias:偏倚,属于系统误差,它是指在实验中由于非实验因素干扰所形成的,歪曲了处理因素的真实效应。

77、平均世代年数(mean Ion gth of gen eratio n, LG)指母亲一代所生的女婴取代母亲执行生育职能所需要的年数,即两代人的间隔年数。等于育龄妇女生存总人年数除以净再生育率。

79、新生儿死亡率(neonatal mortality rate):是指某地平均每千名活产数中,未满28天

的新生儿死亡数。它是反映妇幼卫生工作的一项重要指标。

80、儿童妇女比(child-women ratio):指0〜14岁儿童与15〜49岁妇女之比。

81、incidenee rate:发病率,表示一定时期内,在可能发生某病的一定人群中,新发生的某病病例数。

82、偏回归平方和(Sum of squares of partial regression:) 在回归分析中,把取消某一个自变量Xk后回归平方和减小的数值称为该自变量Xk对丫应变量的偏回归平方和。利用偏回归平方和的大小可以衡量每个因素在回归关系中所起作用的大小。

83、层次分析法(analytic hierarchy process, AHP:) 利用系统分析的方法,对评价对象依据评价目的所确定的总评价目标进行连续性分解,得到各级(层)评价目标,并以最下层作为衡量目标达到程度的评价指标。然后依据这些指标计算出一个综合评分指数对评价对象的总评价目标进行评价,依其大小来确定评价对象的优劣等级。目前该方法多用于卫生事业管理方面,如医院工作质量的评价。

84、总负担系数:

85、homogeneity:同质,被研究指标的影响因素相同,在统计学中指影响变量的主要影响因素相同。

86、拟合优度检验(goodness of fit test):拟合优度检验旨在根据样本的频率分布检验其总体分布是否等于某给定的理论分布。

87、连续型变量(continuous variable):定量变量的一种,其取值范围可以在数轴上连续变动,血压、身高、体重等均属于连续型变量。

88、normal curve:正态曲线是函数

对应的曲线,此曲线呈钟型,两头低,中间高,左右对称。

89、生存概率(survival probability):是指单位时间段开始时存活的个体到该时段结束时仍然存活的可能性。用p表示。

90、least squared estimation:最小二乘估计,是指能使观测样本的实测反应变量值(Yi) 与方程估计值之差的平方和最小的回归参数估计。

91、residual analysis残差分析,旨在通过残差深入了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识别异常点等。

92、标准化死亡比(SMR):被标准化组的实际死亡数与按标准人口死亡算得的被标准化组的期望死亡数之比。

93、standard error of mean:均数的标准误,样本均数的标准差即为均数的标准误,它反映样本均数的离散程度,也反映样本均数与总体均数的差异,说明样本均数抽样误差的大小。

94、Standardized mortality rate:标准化死亡率,寻找一个统一的分布作为标准组,然后每个比较组均按该分布标准计算相应的死亡率,所得到的死亡率是相对于标准组的,故称为标准化死亡率,也称调整死亡率。由于采用了统一的标准,消除了内部分布不同对总死亡率的影响,使算得的标准化死亡率具有可比性。

95、回归平方和(residual of square):,它反应在Y的总变异中由于X与Y的直线关系而使丫变异减小的部分,也就是在总平方和中可以用X解释的部分。

96、假设检验的功效:当假设检验不拒绝H0 时,推断正确的概率称为检验功效。假设检验发现真实差异的功效不低于1-B。

卫生统计学 名词解释

1、动态数列dynamic series--按时间顺序将一系列统计指标(可以使绝对数、相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。 2、统计表的种类---简单表sample table--只按单一变量分组,由一组横标目和一组纵标目组成。复合表--将两个或两个以上变量结合起来分组,即由一组横标目和两组及以上纵标目结合起来。 3、编制统计表应注意的事项--简明扼要,重点突出;合理安排主语谓语的位置;表内数据要认真核对、准确可靠; 4、条图bar chart--用等宽直条的长短表示相互独立的各项指标数量的大小,所比较的数据可以是绝对数也可以是相对数(单式条图/复式条图)。 5、百分条图percent bar chart--表示事物内部各部分的比重或所占比例。与圆图pie chart类似。 6、线图line chart--线图是用线段的升降表示统计指标的变化趋势,或某现象随另一现象的变迁情况,适用于连续性变量。 7、半对数线图semi-logarithmic line chart--用于表示事物的发展速度(相对比);横轴为算术尺度,纵轴为对数尺度;线图上的数量关系为相对数关系。在比较几组数据的变化速度时,特别是两组数据相差悬殊时,宜选用半对数线图。 8、散点图scatter chart--用点的密集程度、趋势表示两变量间的相关关系。 9、直方图histogram--表示连续型变量的频数或频率分布 10、统计地图statistical chart--表示某种现象在地域空间上的分布。 11、箱式图box plot--描述连续型变量的分布特征(5个特征值-最小值、下四分位数、中位数、上四分位数、最大值) 12、中心极限定理设从均值为μ,方差为σ的任意一个总体中抽取样本量为n的样本,当n足够大时,样本均值的抽样分布近似服从均值为μ,方差为σ的正态分布。 13.

卫生统计学名词解释

1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3.2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 4.3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 5.4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 8.等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 9.等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 10.5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 11.概率是描述随机事件发生可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P≤的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。 12.6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 13.抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 14.7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 15.8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 16.9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 17.10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。

卫生统计学名词解释

1、抽样误差:有个体变异产生的,抽样造成的样本统计量与总体参数之间的差异,称之。 2、标准误:将样本统计量的标准差称为标准误。 3、均数的标准误:样本均数的标准差也称为均数的标准误(SEM),它反映样本均数间的离散程度,也反映样本均数与相应总体均数间的差异,因而说明了均数抽样误差的大小。 4、u分布:若某一随机变量X服从总体均数为υ、总体标准差为σ的正态分布N(υ,σ2),则通过u变换(X-u/σ)可将一般正态分布转化为标准正态分布N(0,1 2),即u分布。 5、t分布:在实际工作中,由于σ-X未知,用S-X代替,则-X-υ/S-X不再服从标准正态分布,而服从t分布。 6、可信区间:是按照预先给定的概率(1-α)所确定的包含总体均数的区间估计范围。 其确切含义为:如果能够进行重复抽样试验,平均有1-α(如95%)的可信区间包含了 总体均数,而不是总体均数落在该可信区间。 7、假设检验:也称为显著性检验,是利用小概率反证法思想,从问题的对立面(Ho)出发间接判定要解决的问题(H1)是否成立。然后在Ho成立的条件下计算检验统计量,最后获得P值来判断。 8、Ⅰ型错误:拒绝了实际上成立的Ho,这类“弃真”的错误称之。 Ⅱ型错误:“接受”了实际上不成立的Ho,这样的“取伪”的错误称之。 9、检验效能:1-β,即把握度,指当两总体确有差异,按规定检验水准α所能发现该差异的能力。 10、变量转换:是指原始数据作某种函数转换,如转换为对数值等。 1、方差分析:又称变异数分析或 F检验,适用于对多个平均值进行总体的假设检验,以检验实验所得的多个平均值是否来自相同总体。 2、单向方差分析(one way analysis of variance)是指处理因素只有一个。这个处理因素包含有多个离散的水平,分析在不同处理水平上应变量的平均值是否来自相同总体。 3均方:每种来源的离均差平方和用相应的自由度去除,可得到平均的离均差平方和,简称均方(mean square,MS) 4、LSD-t检验:即最小显著性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。 5、SNK(student-Newman-Keuls)法:又称q检验,是根据q值的抽样分布作出统计推论,适用于多个样本均数两两之间的全面比较。 6、Tukey法:又称为真正显著差(honestly significant difference,HSD)的单一值作为判断标准。 7、Dunnett-t检验:适用于g-1个实验组与一个对照组均数差别的多重比较。 8、完全随机设计:是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分布接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。 9、析因设计(factorial design)实验:凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计(factorial design)实验。 10、随机区组设计(randomized block design)是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组(block),使每一区组内的受试对象例数与处理因素的分组数相等,使每个实验组从每一区组得到一例受试对象。 1、二项分布:是指只会产生两种可能结果如“阳性”或“阴性”之一的n次独立重复试验中,当每次试验的“阳性”概率π保持不变时,出现阳性次数X=0,1,2,3……的一种概率分布。

卫生统计学 名词解释

医学统计学名词解释 1.总体与样本:总体是根据研究目的确定的同质研究对象的全体。样本是总体中具有代表性的一部分个体。 2.交叉设计:一种特殊的自身对照设计。克服了实验前后自身对照由于观察期间各种非实验因素造成的偏倚。即将观察对象随机分为两组,并使一组对象先接受处理方式A,再接受处理方式B;另一组先接受B,再接受A,两种处理方式在研究过程中交叉进行。 3.方差:离均差平方和与观测例数之比,反映一组数据的平均变异。 4.检验效能:1-β,也称把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 5.相对比:表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 6.参数与统计量:总体的指标称为参数,用希腊字母表示;样本的指标称为统计量,用英文字母表示。 7.抽样研究与抽样误差:抽样研究是从总体中随机抽取样本,对样本信息进行研究,从而推断总体的研究方法。抽样误差是由随机抽样造成的样本指标和总体指标之间、样本指标和样本指标之间的差异;其根源在于总体中的个体存在变异性。只要是抽样研究,就一定存在抽样误差,不能用样本指标直接下结论。 8.概率:概率是某随机事件发生可能性大小(或机会大小)的数值度量。小概率事件是指P ≤0.05的随机事件。 9.统计推断:根据已知的样本信息来推断总体特征的过程称为统计推断。 10.抽样误差:由个体差异和抽样所导致的样本均数和样本均数之间、样本均数和总体均数之间的差异称为均数的抽样误差。 11.第I类错误:指检验假设H0本来是成立的,经过检验后被拒绝了,即“弃真”。其发生的概率为α,为已知。 12.第II类错误:指假设检验H0本来不成立,经过检验后被接受了,即“取伪”。其发生概率为β,为未知。 13.区间估计:区间估计是按预先给定的概率1-α,由样本指标确定的包含总体参数的一个范围。 14.随机化原则:随机化原则包括随机抽样和随机分组。随机抽样是指保证总体中的每一个个体都有同等的机会被抽出来作为样本。随机分组是指保证总体中的每一个个体都有同等的机会被分配到实验组或对照组。 15.重复原则:重复是指研究样本要有一定的数量,即在保证研究结果有一定可靠性的条件下,确定最少的样本例数。 16.盲法试验:试验结束之前,不让研究者或受试者知道受试对象分在何组、接受何种处理。 17.安慰剂:一种无药理作用或治疗作用的假药。目的是观察新药治疗时是否是自然痊愈或心理的问题。 18.完全随机设计:又称随机对照试验,是将受试对象按照随机分配的原则分配到实验组和对照组中,然后给予不同的处理因素,对各组的效应进行同期平行观察,最后比较各组的观察指标有无差别。 19.配对设计:配对设计是比较受试对象实验前后某个指标的变化或将受试对象按一定条件配成对子,再随机分配每队中的两个受试对象到不同的处理组。 20.随机区组设计:将几个条件相同的受试对象划分为一个区组,再将区组中的受试对象采用随机的方法分配到不同的处理组中,以增强各处理组间的均衡性。

卫生统计学名词解释

卫生统计学名词解释 总体(population):根据研究目的确定的同质观察单位的观察值全体所构成的集合。 样本(sample):从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料 变量:观察单位或个体的某种属性或标志称为变量 变量值:对变量进行测量或观察的值称为变量值。 分类变量 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现

为各种生理测量值的参差不齐。 数值变量: 概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,随机事件A发生的概率记为P(A),随机事件的概率取值在0~1之间,即0≤P≤1. 小概率事件:如果随机事件发生的概率P≤0.05,或P≤0.01,表示该事件发生的可能性很小,对于一次随机抽样,一般认为是不可能发生的事件。 频数表:用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 算术均数:描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用 X 表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数

浙大卫生综合考研真题353解析(卫生统计学部分)

卫生统计真题考点 一、名词解释 1.抽样误差:从同一样本中反复多次的随机抽取相同样本量的若干份样本,由于个体差异和偶然 因数的影响,使得样本统计量与总体参数之间存在差异,这种差异就叫抽样误差,可通过增大样本量来减小抽样误差。 2.误差:实际观察值与客观真实值之差,样本指标与总体指标之差,包含系统误差,随机误差, 非系统误差 3.动态数列:按照一定的时间顺序,将描述的某事物的一系列统计指标依次排列起来。用以观察 4. 5. 6. 7. 8. 9. 10. 限。 11.为劳动 12. PR=IR*D。 而患病率常用于描述病程较长或发病时间不明确的疾病患病情况,分子包括新旧病例,分母是受检总人数,是个静态指标。 13.生存率和生存曲线:生存率是指观察对象经历tk个时段后仍存活的可能性。以生存时间为横 轴,生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线称为生存曲线。 14.期望寿命:ex是指同时出生的一代人活到X岁时,尚能生存的平均年数。 15.总体和样本:根据研究目的所确定的同质观察单位的全体。可分为有限总体和无限总体。从总 体中随机抽取部分观察单位,其观测结果的集合称谓样本,应具有代表性。 16.总体:根据研究目的所确定的同质观察单位的全体。可分为有限总体和无限总体。 17.检验效能和检验水准:1—b是指当两总体确实有差异时,按规定的检验水准a能发现该差异 的能力。检验水准是假设检验中预先规定的允许犯一类错误的概率最大值。通常取0.05或0.01

18.第一类错误和第二类错误:指拒绝了实际上成立的H0,这类弃“真”的错误称为一类错误或 假阳性,理论上其概率大小用事先给定的a来控制。接受了实际上不成立的H0,这类存伪错误称为二类错误,理论上用其概率大小用b控制。N一定时,a大b小,b大a小。B大小往往无法获知,但通过调节a大小控制。 19.区间估计:是用已知样本统计量和标准误确定一个有概率意义的并具有较大置信度包含总体参 数的区间的参数估计方法。 20.统计推断:由样本信息对相应总体的特征进行推断的过程。 21.综合评价:是利用表现事物不同方面特征的多个有关指标,构建综合评价模型,求出综合评价 值,对评价事物进行评定,排出优劣顺序并得出相应结论的一种统计分析方法。 22.Y的 23.b个单 位。 24. 25.…..N且 X=K 26. 27. 28. 1. P值系在 概率。 2.简述二项分布、Poisson分布和正态分布的区别和联系 二项分布和poisson分布是离散型随机变量的常见分部,正态分布是连续型随机变量常见分部,三者有一定关系。 ①n很大,π很小时,且nπ为一常数时,二项分布近似poisson分布… ②n很大,nπ>5且n(1-π)>5时,二项分布近似正态分布 ③λ≧20时poisson分布近似正态分布N() 3.样本均数的抽样分布有何特点? ①:从正态分布总体X-N(u,)中随机抽样,样本均数呈正态分布X-(u)。从非正态分布总体中随机 抽样,当样本量n足够大时,样本均数的分布近似正态分布。 ②:样本均数之间,样本均数与总体均数之间有差别

卫生统计学考试复习题及参考答案(1)

《卫生统计学》 一、名词解释(见答案) 二、单项选择题 1.观察单位为研究中的( )。 A.样本 B.全部对象 C.影响因素 D.个体 2.总体是由()。 A.个体组成 B.研究对象组成 C.同质个体组成 D.研究指标组成 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数C.研究典型案例研究误差 D.研究总体统计量 4.参数是指()。 A.参与个体数 B.总体的统计指标 C.样本的统计指标 D.样本的总和 5.关于随机抽样,下列那一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变 B.均数改变,标准差不变C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数 B.方差 C.极差 D.标准差 8.以下指标中()可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差

9.血清学滴度资料最常用来表示其平均水平的指标是( )。 A .算术平均数 B .中位数 C .几何均数 D .平均数 10.两样本均数的比较,可用( )。 A .方差分析 B .t 检验 C .两者均可 D .方差齐性检验 11.配伍组设计的方差分析中,ν 配伍等于( )。 A .ν总-ν 误差 B .ν总-ν处理 C .ν总-ν处理+ν误差 D .ν总-ν处理-ν误差 12.在均数为μ,标准差为σ的正态总体中随机抽样,≥-||μX ( )的概率为5%。 A .1.96σ B .1.96X σ C .0.052,t s ν D. 0.052,X t S ν 13.完全随机设计方差分析的检验假设是( )。 A .各处理组样本均数相等 B .各处理组总体均数相等 C .各处理组样本均数不相等 D .各处理组总体均数不全相等 14.已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率,但甲乡人口女多于男,而乙乡男多于女,适当的比较方法是( )。 A .分别进行比较 B .两个率比较的χ2 检验 C .不具备可比性,不能比较 D .对性别进行标准化后再比较 15.率的标准误的计算公式是( )。 A .)1(p p - B .n p p )1(- C.1-n p D.n p p )1(- 16.非参数统计应用条件是( )。 A .总体是正态分布 B .若两组比较,要求两组的总体方差相等 C .不依赖于总体分布 D .要求样本例数很大 17.下述哪些不是非参数统计的特点( )。 A .不受总体分布的限定 B .多数非参数统计方法简单,易于掌握 C .适用于等级资料 D .检验效能总是低于参数检验 18.设配对设计资料的变量值为X 1和X 2,则配对资料的秩和检验( )。 A .把X 1与X 2的差数绝对值从小到大编秩

卫生统计学 第6版 名词解释

小概率事件:某随机事件发生的概率小于0.05或0.01,表明在一次观察或实验中该事件发生的可能性很小。 总体:根据研究目的确定的观察单位的全体,确切地说,是同质的所有观察单位某种变量值的集合。 样本:从总体中随机抽取部分观察单位的变量值的集合。 抽样误差:由个体变异产生的、由于抽样而造成的样本统计量与样本统计量及样本统计量与总体参数之间的差异称为抽样误差。无倾向性,不可避免。 计量资料:。通过度量衡的方法,测量每一个观察单位的某项研究指标的量的大小,得到的资料。亦称定量资料、测量资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。计数资料亦称定性资料,没有度量衡单位。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料。 参数估计:指用样本统计量估计总体参数。参数估计有两种方法:点估计和区间估计。 统计推断:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。 方差分析:就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和与自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对观测指标有无影响。 正态分布:若资料的频率曲线对应于数学上的正态曲线,则称该资料服从正态分布。通常用记号表示均数为,标准差为的正态分布。 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布,通常记为。 中位数:将一组观察值由小到大排列,位次居中的那个数。 极差:亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。方差:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。 标准差:是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。 变异系数:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。 标准误:通常将样本统计量的标准差称为标准误。 相对数:是两个有联系的指标之比,是分类变量常用的描述性统计指标,常用相对数有率、构成比、相对比。 直线回归:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归。直线相关:是用来描述具有直线关系的两变量x、y间的相互关系。 相关系数:又称积差相关系数,以符号r表示样本相关系数,ρ表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。 回归系数: 为直线的斜率,其统计学意义是自变量x改变一个单位时,应变量y平均变化个单位。 相关系数:说明两变量之间关联的密切程度(绝对值大小)与关联的性质(正负号),又称Pearson积差相关系数。 构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 标准化法:当比较两个或多个总率时,若比较的两组或多组内部构成明显不同,需按统一的标准进行调整,使之具备可比性,这种方法称为标准化法. 基本思想:就是采用统一的标准

卫生统计学名词解释

卫生统计学名词解释 一、基础概念 1.总体(Population):在一定时空范围内同质的所有观察单位或个体的集合。 2.样本(Sample):从总体中随机抽取的一部分观察单位的集合。 3.变量(Variable):观察单位的基本特征或特性,可以分为定量变量和定性变量。 4.总体参数(Population Parameter):描述总体特征的概括性数值,如总体均数、总体率等。 5.样本统计量(Sample Statistic):描述样本特征的数值,如样本均数、样本率等。 二、资料类型与搜集方法 1.计数资料(Count Data):通过计数或分类得到的资料,一般用相对数(率)表示。 2.计量资料(Measure Data):通过测量得到的数值资料,一般用均数、中位数等表示。 3.等级资料(Ordinal Data):具有一定顺序或等级的资料,一般用等级或有序分类表示。 4.调查法(Survey Method):通过问卷、访谈等方式收集资料的方法,常用于大样本调查。 5.实验法(Experimental Method):通过实验设计、随机分组等方式收集资料的方法,常用于实验研究。

6.观察法(Observational Method):通过观察记录收集资料的方法,常用于临床观察、生态学研究等。 7.纵向研究(Longitudinal Study):对同一组观察单位在不同时间点进行重复观察的方法,可获取纵向数据。 8.横向研究(Cross-sectional Study):在某一时间点对不同组观察单位进行同时观察的方法,可获取横截面数据。 9.随机抽样(Random Sampling):按照随机原则从总体中抽取样本的方法,保证每个观察单位被抽中的概率相等。 10.系统抽样(Systematic Sampling):按照某种规则或顺序从总体中抽取样本的方法,如每隔一定数量的观察单位抽取一个样本。 三、卫生统计学方法 1.描述性统计(Descriptive Statistics):通过对数据进行整理、归类、简化和表示,描述数据的基本特征和分布情况。包括统计表、统计图和统计量等。 2.参数估计(Parameter Estimation):利用样本信息推断总体参数的方法,如点估计、区间估计等。区间估计可以给出总体参数的可能范围,提高推断的准确性。 3.假设检验(Hypothesis Testing):根据研究目的提出假设,然后利用样本信息对假设进行检验的方法。常用的假设检验方法包括t检验、卡方检验、秩和检验等。

卫生统计学名词解释和简答题

卫生统计学 一、名词解释 1、总体:根据研究目的确定的同质观察单位的观察值全体所构成的集合。 2、样本:从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。 3、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间 的差异以及样本与总体指标的差异,称为抽样误差。 4、计量资料定量资料(quantitative data ):亦称计量资料,其变量值是定量的, 表现为数值大小,一般有度量衡单位,如上例中的身高(cm)、体重(kg)资料等均为定量资料。 5、定性资料:定性资料(qualitative data ):亦称分类资料(categorical data ),其 观察值是定性的,表现为互不相容的类别或属性,一般无度量衡单位。可进一步细分为以下两种资料。 6、变异系数:变异系数是一种相对变异指标,常用于比较度量单位不同或单位相 同但均数相差悬殊的两组或多组对称分布特别是正态分布资料的变异程度。 7、回归系数:b称为回归系数(coefficient of regression),含义为当x每变化1个 单位,因变量γ平均变化b个单位。 8、决定系数:也称判定系数或者拟合优度。它是表征回归方程在多大程度上解释 了因变量的变化,或者说方程对观测值的拟合程度如何。 9、率:说明某现象发生的频率或强度的指标。 10、构成比:说明事物内部各组成部分所占的比重,不能说明某现象发生的频率或 强度大小。 11、粗出生率:指某年某地平均每千人口的活产数,是反映一个国家或地区的人口自

然变动的基本指标。 12、粗死亡率:指某地某年平均每千人口中的死亡数,反映当地居民总的死亡水 平。 二、简答题 1.简述方差分析的基本思想和应用条件。 方差分析的基本思想:将全部观察值之间的变异按照设计的要求和分析的需要分解成两个或多个部分,然后再作分析。 方差分析的应用条件为:1、各样本是相互独立的随机样本;2、各样本均来自正态分布总体;3、各样本的总体方差相等,即方差齐。 2.简述假设检验的基本原理和基本步骤。 假设检验的基本原理:假设检验的思想是,首先对所需要比较的总体提出一个无差别的假设,然后通过样本数据去推断是否拒绝这一假设。 假设检验的基本步骤: 1.建立假设和确定检验水准,2.选择检验方法和计算检验统计量 3.确定P值,并做出统计推断结论。 3.简述线性相关、直线回归的应用条件。 简单线性相关:要求两定量变量的数据变化在散点图上呈直线趋势;简单相关分析的前提条件:两个随机变量;散点图呈线性关系;服从双变量正态分布。 直线回归的应用条件:(1)两变量的变化趋势呈直线趋势。 (2)因变量y为来自正态分布的随机变量;x可以是规律变化: 选定的一些数值(Ⅰ型回 归),也可以是随机变量(Ⅱ型回归)。 (3)对于Ⅰ型回归,当x取不同数值时,y的分布都是正态分布,并且这些分布的方差相等; 对于Ⅱ型回归,要求x、y服从双变量正态分布。 4.简述频数表的编制步骤及其用途。 编制步骤:①计算极差d(或全距R)d(R)=Xmax一Xmin ②定组距(i)i= int( R /10 ) ③定组段(下限,上限) ④列表划记。 用途:1.揭示频数分布的特征 2、揭示频数分布的类型 3.便于发现资料中含有的异常值 4.以频率作为概率的估计值 5、作为陈述资料的形式 5.简述直线相关与直线回归的异同。 ( 一)区别是: 1.资料要求不同,相关要求两个变量是双变量正态分布,回归要求因变量Y服从正态分布,而自变量X是能精测量或严格控制的变量。 2.统计意义不同,相关反应两变量间的伴随关系,回归反应两变量之间的依存关系。 3.分析目的的不同,相关分析的目的是把两变量的直线关系的密切程度及方向用统计 指标表示出来,回归分析的目的,就是把自变量与因变量间的关系用函数公式定量表达出来。 (二)联系:1.变量间关系的方向一致2.假设检验等价3.r与b值可相互换算 4.用回归 解释相关。 6.简述统计表的列表原则和基本要求。 编制原则:1.重点突出,简单明了2. 主谓分明,层次清楚3.数据准确、可靠,文字和线条尽量从简。 7.简述二项分布的应用条件。

卫生统计学考研试题名词解释总结

卫生统计学考研试题名词解释总结 1、typical survey:典型调查,典型调查就是在调查对象中有意识的选择若干具有典型意义或者代表的单位进行非全面调查。 2、箱式图(box plot):用于多组数据的直观比较分析。一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。 3、二项分布(binorminal distribution):若一个随机变量X,它的可能取值是0,1,…,n,而且相应的取值概率为称此随机变量X服从n,π为参数的二项分布。 4、morbidity statistics:疾病统计,是居民健康统计的重要内容之一,它的任务是研究疾病在人群中发生、发展及其流行的规律,为病因学研究、疾病防治和评价疾病防治效果提供科学依据。 5、life expectancy:期望寿命,是指x岁尚存者预期平均尚能存活的年数,它是评价居民健康状况的主要指标。 6、life table:寿命表,又称为生命表,是根据特定人群的年龄组死亡率编制出来的一种统计表。由于它是根据各年龄组死亡率计算出来的,因此,各项指标不受人口年龄构成的影响,不同人群的寿命表指杯具有良好的可比性。 7、预测(forecast):这是回归方程的重要应用方面。所谓预测就是把预测因子(自变量X)代入回归方程,对预报量(应变量Y)进行估计,其波动范围可以按照个体Y值容许区间方法计算。 8、standard deviation:标准差,常用来描述数据离散趋势的统计指标,其能反映均数代表性的好坏,以及变量值与均数的平均离散程度。 9、cluster sampling:整群抽样,首先将总体按照某种与研究目的无关的分布特征(如地区范围、不同的团体、病历、格子等)划分为若干个“群”组,每个群包括若干观察单位;然后根据需要随机抽取其中部分“群”,并调查被抽中的各”群”中的全部观察单位。这种抽样方法称为整群抽样。 10、precision:精密度,是指重复观察时,观察值与其均数的接近程度,其差值属于随机误差 11、正交设计(orthogonal design):当实验涉及的因素在三个或三个以上,且因素间可能存在交互作用时,可用正交试验设计。它利用一套规格化的正交表,将各试验因素、各水平之间的组合均匀搭配,合理安排,可以用较少的、有代表性的处理组合数,提供充分有用的信息,还可找出较优组合,用以指导实践,因而是一种高效、快速的多因素试验设计方法。 12、maternal morality rate:孕产妇死亡率,是指某年妇女在妊娠至产后42天以内,因为怀孕和分娩及其并发症所造成的孕产妇死亡人数与同年出生活产数之比。 13、定群寿命表(cohort life table):亦称队列寿命表,它是对某特定人群中的每一个人,从进入该特定人群直到最后一个人死亡记录的实际死亡过程。由于人的生命周期很长,如果用现时寿命表方法研究人群的生命或死亡过程.不仅随访人数要很多,而且随访时间要上百年。 14、人口金字塔:将人口的性别、年龄分组数据,以年龄(或出生年份)为纵轴,以人口数或年龄构成比为横轴,按左侧为男、右侧为女绘制的直方图,其形如金字塔,故名人口金字塔。它形象直观的反映了人口的年龄性别构成,便于说明和分析人口的现状、类型。

卫生统计学名词解释

1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量 2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位;例如:体重与身高 3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数 4.二分类变量:称为0-1变量;例如,性别男、女、疾病有、无和结局生、死等;二分类变量常用0和1来编码,0-1变量常称为假变量dummy variable或哑变量,可以和真变量一样参与计算 5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料 6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质 7.变异:同质事物个体间的差异 8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合;简言之,研究对象的全体; 9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本;简言之,总体中有代表性的一部分; 10.参数parameter:是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数mean和总体方差variance 11.统计量statistic:由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差; 12.因果关系causality:在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系;但也需要时间顺序等标准进行因果判断 13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差;主要有以下二种:系统误差和随机误差随机测量误差,抽样误差; 14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差;特点:具有累加性;有倾向性;可以消除 15.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的;特点:随测量次数增加而减小; 16.随机测量误差:在消除了系统误差的前提下,由于非人为的偶然因素,对于同一测量对象多次测定结果不完全一致;特点:没有倾向性;不可消除,但多次测量计算平均值可以减小随机测量误差; 17.抽样误差消除了系统误差,并把随机测量误差控制在一定的范

医学统计学名词解释及问答题

1、总体(population):是根据研究目的确定的同质研究对象的全体。 2、样本(sample):从总体中抽取的一部分有代表性的个体。 3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。 4、变异(variation):指同质个体的某项指标之间的差异. 5、参数(parameter):反映总体特征的指标称为参数. 6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率(probability):某事件发生的可能性大小。 9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线. 10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。 12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差(variance):是各个数据与平均数之差的平方的平均数。 14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。 16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。 17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验. 19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知. 20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。 21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 22、可信区间(confidence interval):指总体参数可能所在的范围. 23、率(rate):说明某现象发生的频率或强度。 24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。 25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

卫生统计学名词解释(绝对完美)

1.总体(population):根据研究目的所确定的同质观察单位的全体。只包括(确定的时间和空间范围内)有 限个观察单位的总体,称为有限总体(finite population)。假想的,无时间和空间概念的,称为无限总体(infinite population)。 2.参数(parameter) (总体):总体的统计指标或特征值。总体参数是事物本身固有的、不变的。 3.样本(sample):指从研究总体中抽取的一部分有代表性的个体。 4.样本含量(sample size):样本中所包含的个体数。 5.同质:是指同一总体中个体的性质、影响条件或背景相同或非常相近。 6.统计量的偏倚:抽样分布的均值与带估计参数的差值。 7.变量(variable):观察对象个体的特征或测量的结果。 8.随机变量(random varible):随机实验中产生的结果用数值表示的变量。 9.数值变量(Numerical variable):又称为计量资料、定量资料,指构成其的变量值是定量的,其表现为 数值大小,有单位。对每个观察单位用定量的方法测定某项指标的数值,组成的资料。 10.计数资料:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数。 11.等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组 计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 12.统计描述(statistical description):选用合适统计指标(样本统计量)、统计图、统计表对数据的数量 特征及其分布规律进行刻画和描述。 13.统计推断(statistical inference):包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相 应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。 14.正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。若指标X的频率分布曲线对 应于数学上的正态分布曲线,则称该指标服从正态分布。 15.偏态分布:指集中位置偏向一侧,频数分布不对称。(1)正偏态分布:集中位置偏向数值小的一侧。(2) 负偏态分布:集中位置偏向数值大的一侧。 16.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系 统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 17.系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可 知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。 18.抽样(sampling):从总体中抽取部分观察单位的过程称为抽样。 19.抽样误差(sampling error):由于抽样研究所造成的样本统计量与总体参数之间的差异或各样本统计量 之间的差异称为抽样误差,特点是不能避免的,可用标准误描述其大小。 20.误差(error):统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种: 系统误差和随机误差。 21.可信区间(confidence interval, CI):按一定的概率或可信度(1-α)用一个区间估计总体参数所在范 围,这个范围称作可信度1-α的可信区间,又称置信区间。 22.参考值范围(reference range):也称为正常值范围(normal range),医学上常把绝大多数正常人的解 剖、生理、生化等各种指标的正常值范围。绝大多数:可以是90%、95%、99%等等,最常用的是95%。正常人:不是指健康人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。 23.变异(variation):同质事物间的差别。由于观察单位通常即为观察个体,故变异亦称为个体变异 (individual variation)。

相关主题
相关文档
最新文档