卫生统计学名词解释系统误差

卫生统计学名词解释系统误差

1.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性;有倾向性;可以消除

卫生统计学名词解释

卫生统计学health statistics:卫生统计学是运用概率论、数理统计原理和方法,研究医学事物或现象的群体数量特征的科学。 总体population:总体是根据研究目的而确定的同质个体的全体。 样本sample:样本是从总体中随机抽取的一部分个体或个体值的 集合。 数值变量numerical variable:其变量值是定量的,表现为数值的大小,通常有度量衡单位。 分类变量categorical variable:其变量值是定性的,表现为互不 相容的类别或属性,没有度量衡单位。 同质homogeneity:指观察单位(研究个体)间被研究指标的影 响因素。 概率probablity:概率是描述随机事件可能发生的量度,用P表示,其波动在0~1之间。不可能事件发生的概率为0,必然事件发生的 概率为1. 抽样误差sampling error:抽样误差是指由抽样造成的样本统计量和总体参数的差别。 中位数median:是指把一组观察值,按大小顺序排列,位置居中 的变量值(n为奇数)或位置居中的两个变量值的均数(n为偶数)。 标准差standard deviation:是描述一组计量资料离散趋势的指标,说明数据间参差不齐的程度。 正态分布normal distribution:是指频数分布以均属为中心,左 右两侧基本对称,靠近均属两侧频数较多,离均数越远,频数越少,形成一个中间多、两侧逐渐减少、基本对称的分布。

区间估计interval estimation:是根据选定的置信度(用概率表示)估计总体参数所在的区间。 率rate:又称频率指标,表示一定时间内,实际发生某现象的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发 生的频率或强度。 构成比constituent ratio:指事物内部某一组成部分的观察单位数与该事物各组成部分观察单位总数之比,常用来说明事物内部各组 成部分所占的比重或分布情况。 相对比relative ratio:至两个有联系的指标之比,常用百分数或 倍数表示。 标化法比standardization:是指在进行几个总率比较时,先采用 统一的标准对几个总率的内部够成作调整,然后进行比较。这种按 统一标准调整两个率内部构成使之具有可比性的方法称标准化法。 生存分析surival analysis:是将事件的结局和出现这一结局所经 历的实践结合起来分析的一种统计分析方法。 失效事件(死亡事件或终点事件):标志某种处理措施失败或失效 的特征事件,即研究者所关心的特定事件,一般在设计阶段根据研 究目的确定。 生存时间survival time:指观察到的存活时间,可用小时、天、周、月、年等时间单位记录,常用符号t表示。 完全数据complete date:指从观察起点到发生死亡事件所经历的时间。 截尾数据:简称截尾值,又称删失值或终检值,指生存时间观察过 程的截止不是由于死亡事件,而是由于其他原因引起的,称为截尾。截尾的主要原因有失访、退出和终止。

卫生统计学名词解释

1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 2.概率是描述随机事件发生可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P≤0.05的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。 6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

实用卫生统计学复习题与答案2

《卫生统计学》 一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 21.假设检验中P的含义 22.I型和II型错误 23.检验效能 24.检验水准 25.方差分析 26.随机区组设计 27.相对数

28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔 44.灵敏度 45.特异度 46.误诊率 47.漏诊率 48.阳性似然比 49.阴性似然比 50.Youden指数 51.ROC曲线 52.统计图 二、单项选择题 1.观察单位为研究中的( )。 A.样本B.全部对象C.影响因素D.个体2.总体是由()。

A.个体组成B.研究对象组成 C.同质个体组成D.研究指标组成 3.抽样的目的是()。 A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量 4.参数是指()。 A.参与个体数B.总体的统计指标 C.样本的统计指标D.样本的总和 5.关于随机抽样,下列那一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用()。 A.变异系数B.方差 C.极差D.标准差 8.以下指标中()可用来描述计量资料的离散程度。 A.算术均数B.几何均数 C.中位数D.标准差 9.血清学滴度资料最常用来表示其平均水平的指标是()。A.算术平均数B.中位数 C.几何均数D.平均数 10.两样本均数的比较,可用()。 A.方差分析B.t检验 C.两者均可D.方差齐性检验 11.配伍组设计的方差分析中,ν配伍等于()。 A.ν总-ν误差B.ν总-ν处理

电大实用卫生统计学期末复习材料

《实用卫生统计学》期末复习题一 《实用卫生统计学》期末复习题一 一、名词解释 1、卫生统计学: 2、随机抽样: 3、构成比: 4、频率: 5、非参数检验: 6、概率 7、变异系数 名词解释答案 1. 卫生统计学:是运用数理统计的基本原理和方法,通过数据的收集,整理和分析,研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。 2. 随机抽样:就是按照随机的原则获得样本,保证总体中每个个体都有同等机会被抽取,使样本对总体有较好的代表性。 3. 构成比:又称构成指标,它表示事物内部各组成部分所占比重或分布。常用百分数表示。 4. 频率:若随机事件在n次重复中出现m次,则n/m比值成为随机事件出现的频率。 5.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。 6.概率是描述随机事件发生的可能性的大小的数值,常用P表示。7.变异系数常记为CV,它被定义为标准差与算术均数之比。 《实用卫生统计学》期末复习题二 单选题 1.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种错误属于()。 A. 系统误差 B. 随机测量误差 C. 抽样误差 D. 随机误差 2.医学人口统计应属于卫生统计学中的哪部分内容( )。 A. 卫生统计学基本原理 B. 卫生统计学基本方法 C. 健康统计 D.卫生服务统计 3. 原始数据分布不明时,表示其集中趋势易采用 ( ) 。 A. 算数均数 B. 几何均数 C. 中位数 D. 标准差 4.描述一组偏态分布资料的变异度时,最适宜选择的指标是( ) 。  A.极差 B.标准差 C.四分位数间距 D.变异系数

卫生统计学名词解释

卫生统计学名词解释 总体(population):根据研究目的确定的同质观察单位的观察值全体所构成的集合。 样本(sample):从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料 变量:观察单位或个体的某种属性或标志称为变量 变量值:对变量进行测量或观察的值称为变量值。 分类变量 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其

表现为各种生理测量值的参差不齐。 数值变量: 概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,随机事件A发生的概率记为P(A),随机事件的概率取值在0~1之间,即0≤P≤1. 小概率事件:如果随机事件发生的概率P≤0.05,或P≤0.01,表示该事件发生的可能性很小,对于一次随机抽样,一般认为是不可能发生的事件。 频数表:用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 算术均数:描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用 X 表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时

卫生统计学考题

卫生统计学考题

一、 名词解释 1、总体与样本 2、Ⅰ类错误与Ⅱ类错误 3、统计描述与统计推断 4、S X 96.1±与x S t X ν ,2/05.0± 5、偏回归平方 和与偏回归系数 二、选择题(请从5个备选答案中选择一 个正确或最佳答案,将其字母填在 上,) 1、某医师用某药治疗不同病情的老年慢性支气管炎病人,疗效见下表: 分 组 控制 显效 有效 近控 单纯型 65 18 30 13 单纯型合并肺气肿 42 6 23 11 欲比较该药对两种病型的疗效,宜采用 。 A 、 2 χ = ∑-) 1(2 C R RC n n A n B 、

2 χ = ∑--T T A 2)5.0|(| C 、t= 2 12 1x x S X X -- D 、∑+-+=) 1(3)1(12 2N n R N N H i i E 、 c b c b +--= 2 2 )1|(|χ 2、2 )?(2 .--= ∑n y y S x y ,∑-= 2 .) (x x S S x y b ,x y S .和b S 分 别表示 。 A 、y 的离散度和b 的抽样误差 B 、 y 对y ?的离散度和标准估计误差 C 、y 的离散度和b 的抽样误差 D 、 y 的离散度和x 的离散度 E 、y 对y ?的离散度和b 的抽样误差 3、最小组段无下限或最大组段无上限的频数分布资料,可用 描述其集中趋势。 A 、均数 B 、标准差 C 、中位数

D、四分位数间距 E、几何均数 4、某检验人员用两种方法测定盐中的铁含量,部份测量值见下表: 两种方法测量盐中铁含量(mg/kg) 样本号原子吸收法比色法

卫生统计学 名词解释

1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量 2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。例如:体重与身高 3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数 4.二分类变量:称为0-1变量。例如,性别(男、女)、疾病(有、无)和结局(生、死)等。二分类变量常用0和1来编码,0-1 变量常称为假变量(dummy variable)或哑变量,可以和真变量一样参与计算 5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料 6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质 7.变异:同质事物个体间的差异 8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合。简言之,研究对象的全体。 9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本。简言之,总体中有代表性的一部分。 10.参数(parameter):是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数(mean)和总体方差(variance) 11.统计量(statistic):由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差。 12.因果关系(causality):在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系。但也需要时间顺序等标准进行因果判断 13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。 14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性;有倾向性;可以消除 15.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。特点:随测量次数增加而减小。 16.随机测量误差:在消除了系统误差的前提下,由于非人为的偶然因素,对于同一测量对象多次测定结果不完全一致。特点:没有倾向性;不可消除,但多次测量计算平均值可以减小随机测量误差。

《卫生统计学》考试题及答案

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 《卫生统计学》考试题及答案 《卫生统计学》一、名词解释 1. 计量资料 2. 计数资料 3. 等级资料 4. 总体 5. 样本 6. 抽样误差 7. 频数表 8. 算术均数 9. 中位数 10. 极差 11. 方差 12. 标准差 13. 变异系数 14. 正态分布 15. 标准正态分布 16. 统计推断 17. 抽样误差 18. 标准误 19. 可信区间 20. 参数估计 21. 假设检验中 P 的含义 22. I 型和 II 型错误 23. 检验效能 24. 检验水准 25. 方差分析 26. 随机区组设计 27. 相对数-1- 1/ 29

28. 标准化法 29. 二项分布 30. Yates 校正 31. 非参数统计 32. 直线回归 33. 直线相关 34. 相关系数 35. 回归系数 36. 人口总数 37. 老年人口系数 38. 围产儿死亡率 39. 新生儿死亡率 40. 婴儿死亡率 41. 孕产妇死亡率 42. 死因顺位 43. 人口金字塔二、单项选择题 1.观察单位为研究中的( D )。 A.样本 C.影响因素 2.总体是由( C )。 A.个体组成 C.同质个体组成 3.抽样的目的是( B )。 A.研究样本统计量 C.研究典型案例研究误差 4.参数是指( B )。 A.参与个体数 C.样本的统计指标 B.总体的统计指标 D.样本的总和 B.由样本统计量推断总体参数 D.研究总体统计量B.研究对象组成 D.研究指标组成 B.全部对象 D.个体5.关于随机抽样,下列那一项说法是正确的( A )。 -2-

卫生统计学名词解释

1,总体总体是根据研究目的确定的同质的研究对象的全体。更确切地说,是性质相同的所有观察单位某种变量值的集合。2,样本医学研究中实际观测或调查的一部分个体称为样本 3,参数用来描述总体特征的指标叫做参数。4,统计量 5,抽样误差抽样误差是指由于随机抽样的偶然周素使样本各单位的结构对总体各单位结构的代表性差别,而引起的抽样指标和全及指标之间的绝对离差。如抽样平均数与总体平均数的绝对离差,抽样成数与总体成数的绝对离差等等。 6,概率7,小概率事件 8,定量资料定量资料是以数字形式表现出来的研究资料。 9,定性资料定性资料是以文字、图形、录音、录象等非数字形式表现出来的研究资料。定性资料有两个来源——实地源和文献源。 10,正态分布指变量的频数或频率呈中间最多,两端逐渐对称地减少,表现为钟形的一种概率分布 11,正态曲线高峰位于中央(均数所在处),两侧逐渐降低且左右对称,不与横轴相交的光滑曲线图3.1(3)。这条曲线称为频数曲线或频率曲线,近似于数学上的正态分布 12,医学参考值范围医学参考值范围是指绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标的波动范围。这里的“绝大多数”可以是90%、95%或99%等,最常用的是95%。所谓“正常人”不是指完全健康的人,而是指排除了影响所研究指标的疾病和有关因素的同质人群。对于服从正态分布的指标,其参考值范围可根据正态分布曲线下面积分布规律确定;对于不服从正态分布的指标,可先进行变量变换使之服从正态分布或直接利用百分位数法制定医学参考值范围。制定某指标的医学参考值范围时,应根据专业知识确定计算双侧参考值范围或单侧参考值范围。若一个指标过大或过小均属异常,则相应的参考值范围既有上限,又有下限,是双侧参考值范围;若一个指标仅过大属于异常,则参考值范围仅有上限;若一个指标仅过小属于异常,参考值范围仅有下限,即所谓单侧参考值范围。 13 ,置信区间总体率的估计包括点估计和区间估计。点估计是直接用样本率来估计总体率,没有考虑抽样误差。区间估计则考虑到抽样误差,按一定的概率1-α(即置信度为1-α)估计总体率的可能范围,此范围称为总体率的置信区间。 14,率15,构成比16,相对比17,相关系数18,回归系数 19, 统计推断(statistical inference):通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断。 nonparametric statistics:非参数检验,针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于该方法不受总体参数的限制,故称为非参数检验,或称为不拘分布的统计分析方法,又称为无分布形式假定的统计分析方法。 46、方差(variance):是用来描述一组数据平均离散程度的指标,由离均差的平方和除以样本个数得到。 标准正态分布:均数为0,标准差为1的正态分布被称为标准正态分布(standard normal distribution),通常记为N(0, 12)。 66、检验效能(power of test):1-β称为检验效能,它是指当两总体确有差别,按照规定的检验水准α所能发现该差异的能力。 1、总体:根据研究目的确定的同质的观察单位其变量值的集合。 2、计量资料:又称为定量资料,指构成其的变量值是定量的,其表现为数值大小,有单位。 3、抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 4、总体均数的可信区间:按一定的概率大小估计总体均数所在的范围(CI)。常用的可信度为95%和99%,故常用95%和99%的可信区间。 1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是

卫生统计学名词解释

卫生统计学名词解释 总体(population):根据研究目的确定的同质观察单位的观察值全体所构成的集合。 样本(sample):从研究总体中抽取的一部分满足代表性的个体观察值所构成的集合。 计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料。计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料 变量:观察单位或个体的某种属性或标志称为变量 变量值:对变量进行测量或观察的值称为变量

值。 分类变量 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 数值变量: 概率:又称几率,是度量某一随机事件A发生可能性大小的一个数值,随机事件A发生的概率记为P(A),随机事件的概率取值在0~1之间,即0≤P≤1. 小概率事件:如果随机事件发生的概率P≤0.05,或P≤0.01,表示该事件发生的可能性很小,对于一次随机抽样,一般认为是不可能发生的事

件。 频数表:用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…20个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 算术均数:描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时, 取位次居中的两个变量的平均值。

卫生统计学名词解释

卫生统计学名词解释集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

1.变量:研究者对每个观察单位的某项特征进行观察和测量,这种特征称为变量 2.定量变量:是用仪器、工具或其它定量方法对每个观察单位的某项标志进行测量,并把测量结果用数值大小表示出来的资料,一般带有度量衡或其它单位。例如:体重与身高 3.定性变量:将全体观测单位按照某种性质或特征分组,然后再分别清点各组观察单位的个数 4.二分类变量:称为0-1变量。例如,性别(男、女)、疾病(有、无)和结局(生、死)等。二分类变量常用0和1来编码,0-1变量常称为假变量(dummy variable)或哑变量,可以和真变量一样参与计算 5.等级资料:是先将观察单位按某种属性或类别的不同等级分成若干组,再清点各组观察单位个数所得到的资料 6.同质:在调查和实验研究中,除了实验因素外,影响被研究指标的非实验因素相同被称为同质 7.变异:同质事物个体间的差异 8.总体:根据研究目的确定的同质研究对象所有观察单位某变量值的集合。简言之,研究对象的全体。 9.样本:从总体中抽取的部分观察单位,某变量值的实测值构成样本。简言之,总体中有代表性的一部分。 10.参数(parameter):是统计模型的特征指标,是对总体而言,其大小是客观存在的,然而往往是未知的,如总体均数(mean)和总体方差(variance) 11.统计量(statistic):由观察资料计算出来的量,如计算观察样本中的个体得到的样本均数,样本方差。 12.因果关系(causality):在排除了人为联系、虚假联系后仍然存在的、无法用其他联系解释的两个变量之间的关系。但也需要时间顺序等标准进行因果判断 13.误差:统计上所说的误差泛指测量值与真值之差,样本指标与总体指标之差。主要有以下二种:系统误差和随机误差(随机测量误差,抽样误差)。 14.系统误差:指数据搜集和测量过程中由于仪器不准确、标准试剂未经校正,操作人员掌握的标准不准等原因,造成观察结果呈倾向性的偏大或偏小,这种误差称为系统误差。特点:具有累加性;有倾向性;可以消除 15.随机误差:由于一些非人为的偶然因素使得结果或大或小,是不确定、不可预知的。特点:随测量次数增加而减小。 16.随机测量误差:在消除了系统误差的前提下,由于非人为的偶然因素,对于同一测量对象多次测定结果不完全一致。特点:没有倾向性;不可消除,但多次测量计算平均值可以减小随机测量误差。

卫生统计学考研试题名词解释总结

卫生统计学考研试题名词解释总结 1、typical survey:典型调查,典型调查就是在调查对象中有意识的选择若干具有典型意义或者代表的单位进行非全面调查。 2、箱式图(box plot):用于多组数据的直观比较分析。一般选用5个描述统计量(最小值、P25、中位数、P75、最大值)来绘制。 3、二项分布(binorminal distribution):若一个随机变量X,它的可能取值是0,1,…,n,而且相应的取值概率为称此随机变量X服从n,π为参数的二项分布。 4、morbidity statistics:疾病统计,是居民健康统计的重要内容之一,它的任务是研究疾病在人群中发生、发展及其流行的规律,为病因学研究、疾病防治和评价疾病防治效果提供科学依据。 5、life expectancy:期望寿命,是指x岁尚存者预期平均尚能存活的年数,它是评价居民健康状况的主要指标。 6、life table:寿命表,又称为生命表,是根据特定人群的年龄组死亡率编制出来的一种统计表。由于它是根据各年龄组死亡率计算出来的,因此,各项指标不受人口年龄构成的影响,不同人群的寿命表指杯具有良好的可比性。 7、预测(forecast):这是回归方程的重要应用方面。所谓预测就是把预测因子(自变量X)代入回归方程,对预报量(应变量Y)进行估计,其波动范围可以按照个体Y值容许区间方法计算。 8、standard deviation:标准差,常用来描述数据离散趋势的统计指标,其能反映均数代表性的好坏,以及变量值与均数的平均离散程度。 9、cluster sampling:整群抽样,首先将总体按照某种与研究目的无关的分布特征(如地区范围、不同的团体、病历、格子等)划分为若干个“群”组,每个群包括若干观察单位;然后根据需要随机抽取其中部分“群”,并调查被抽中的各”群”中的全部观察单位。这种抽样方法称为整群抽样。 10、precision:精密度,是指重复观察时,观察值与其均数的接近程度,其差值属于随机误差 11、正交设计(orthogonal design):当实验涉及的因素在三个或三个以上,且因素间可能存在交互作用时,可用正交试验设计。它利用一套规格化的正交表,将各试验因素、各水平之间的组合均匀搭配,合理安排,可以用较少的、有代表性的处理组合数,提供充分有用的信息,还可找出较优组合,用以指导实践,因而是一种高效、快速的多因素试验设计方法。 12、maternal morality rate:孕产妇死亡率,是指某年妇女在妊娠至产后42天以内,因为怀孕和分娩及其并发症所造成的孕产妇死亡人数与同年出生活产数之比。

实用卫生统计学复习资料(汇总).

《实用卫生统计学》一、名词解释 1.变异:同一性质的事物,其观察值(变量值)之间的差异,统计上称为变异。 2.抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,抽样研究的目的是通过用样本资料计算的指标去推论总体。 3.统计描述:用统计图表或计算统计指标的方法表达一个特定群体(这个群体可以是总体也可以是样本)的某种现象或特征,称统计描述。 4.统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。 5.均数:是反映计量资料全部观察值平均水平的统计指标,适用于对称分布尤其是正态分布资料,公式如下: 6.标准差:是反映计量资料全部观察值离散程度的统计指标,用于描述对称分布资料,尤其正态分布资料的离散趋势,公式如下: 7.标准正态变换:将服从正态分布 的原始变量x~n(μ,σ)进行变量变换, 这种变换叫标准正态变换(或M变换)。 8.构成比:又称构成指标,它表示事 物内部各组成部分所占的比重或分布。 9.动态数列:是一系列按时间顺序排 列起来的统计指标,包括绝对数、相对数 或平均数,用以说明事物在时间上的变化 和发展趋势。计指标,它是对资料进行统 计描述时的一种常用手段。 (如点、线、 面或立体)显示数据的大小、升降、分布 以及关系等,它也是对资料进行统计描述 时的一种常用手段。 12.抽样误差:在同一总体中随机抽 取样本含量相同的若干样本时,样本指标 之间的差异以及样本指标与总体指标的 差异,称为抽样误差。 13.均数的抽样误差:在同一总体中 随机抽取样本含量相同的若干样本时,样 本指标之间的差异以及样本指标与总体 指标的差异,称为抽样误差。统计学上, 对于抽样过程中产生的同一总体中均数 之间的差异称为均数的抽样误差。 14.率的抽样误差:在同一总体中随 机抽取样本含量相同的若干样本时,样本 指标之间的差异以及样本指标与总体指 标的差异,称为抽样误差。统计学上,对 于抽样过程中产生的同一总体中率之间 的差异称为率的抽样误差。 15.检验水准:也称为显著性水准, 符号为α。α是预先规定的概率值,通常 取0.05,它是“是否拒绝H。的界限”。 16.可比性:是指除了处理因素外, 其他可能影响结果的非处理因素在各组 间应该尽可能相同或相近,即“齐同”。 17.检验效能:检验效能又称为把握 度(1一β)。它的含义是:当两总体确实 有差别时,按规定的检验水准α,能够发 现两总体间差别的能力。 18.四格表资料:两个样本率的资料 又称为四格表资料,在四格表资料中两个 样本的实际发生频数和实际未发生频数 为基本数据,其他数据均可由这四个基本 数据推算出来。 19.列联表资料:对同一样本资料按 其两个无序分类变量(行变量和列变量) 归纳成双向交叉排列的统计表,其行变量 可分为R类,列变量可分为C类,这种表 称为R×C列联表。 20.参数检验:参数检验是一种要 求样本来自总体分布型是已知的(如正态 分布),在这种假设的基础上,对总体参 数(如总体均数)进行统计推断的假设检 验。 21.非参数检验:非参数检验是一种 不依赖总体分布类型,也不对总体参数 (如总体均数)进行统计推断的假设检验。 22.秩次:秩次即通常意义上的序号。 实际上就是将观察值按顺序由小到大排 列,并用序号代替了变量值本身。 23.直线相关系数:它是说明具有直 线关系的两个变量间,相关关系的密切程 度与相关方向的统计指标。相关系数没有

实用卫生统计名词解释简答题

《实用卫生统计学》 一、名词解释 1.变异:同一性质的事物,其观察值(变量值)之间的差异,统计上称为变异。 2.抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,抽样研究的目的是通过用样本资料计算的指标去推论总体。 3.统计描述:用统计图表或计算统计指标的方法表达一个特定群体(这个群体可以是总体也可以是样本)的某种现象或特征,称统计描述。 4.统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。 5.均数:是反映计量资料全部观察值平均水平的统计指标,适用于对称分布尤其是正态分布资料,公式如下: ∑X X=———— n 6.标准差:是反映计量资料全部观察值离散程度的统计指标,用于描述对称分布资料,尤其正态分布资料的离散趋势,公式如下: 7.标准正态变换:将服从正态分布的原始变量x~n(μ,σ)进行变量变换,,这种变换叫标准正态变换(或M变换)。 8.构成比:又称构成指标,它表示事物内部各组成部分所占的比重或分布。 9.动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。 10.统计表:统计表是以表格的形式列出统计指标,它是对资料进行统计描述时的一种常用手段。11.统计图:统计图是以各种几何图形(如点、线、面或立体)显示数据的大小、升降、分布以及关系等,它也是对资料进行统计描述时的一种常用手段。 12.抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。13.均数的抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。统计学上,对于抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差。 14.率的抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异,称为抽样误差。统计学上,对于抽样过程中产生的同一总体中率之间的差异称为率的抽样误差。 15.检验水准:检验水准,也称为显著性水准,符号为α。α是预先规定的概率值,通常取0.05,它是“是否拒绝H。的界限”。 16.可比性:可比性是指除了处理因素外,其他可能影响结果的非处理因素在各组间应该尽可能相同或相近,即“齐同”。 17.检验效能:检验效能又称为把握度(1一β)。它的含义是:当两总体确实有差别时,按规定的检验水 准α,能够发现两总体间差别的能力。 18.四格表资料:两个样本率的资料又称为四格表资料,在四格表资料中两个样本的实际发生频数和实际未发生频数为基本数据,其他数据均可由这四个基本数据推算出来。 19.列联表资料:对同一样本资料按其两个无序分类变量(行变量和列变量)归纳成双向交叉排列的统计表,其行变量可分为R类,列变量可分为C类,这种表称为R×C列联表。 20.参数检验:参数检验是一种要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行统计推断的假设检验。 21.非参数检验:非参数检验是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。 22.秩次:秩次即通常意义上的序号。实际上就是将观察值按顺序由小到大排列,并用序号代替了变量值本身。 23.直线相关系数:它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的统 计指标。相关系数没有单位,取值范围是-1≤r≤1, r的绝对值越大表明两变量的关系越密切。 24.直线回归系数:它是直线回归方程的重要参 数之一,即回归直线的斜率。当b>0时,表示直 线由左下方走向右上方,y随x增大而增大。回 归系数b的统计学意义是x每增加(或减少)一个单 位时,y平均改变b个单位。 25.正相关:它是说明具有直线关系的两个变量 间,存在有正的相关方向,即当x增大时,y有 相应增大的趋势,所算得的相关系数r为正值。 26.完全负相关:这是一种极为特殊的负相关关 系,从散点图上可以看出,由X与y构成的散点 完全分布在一条直线上,x增加,y相应减少,算 得的相关系数r=-1。 27.等级相关:等级相关是对等级数据作相关分 析,它又称为秩相关,是一种非参数统计方法。 28.评价:所谓评价,是通过对照某些标准来判 断观测结果,并赋予这种结果以一定的意义和价 值的过程。 29.综合评价:所谓的综合评价,是指人们根据 不同的评价目的,选择相应的评价形式,据此选 择多个因素或指标,并通过一定的数学模型,将 多个评价因素或指标转化为能反映评价对象总体 特征的信息。 30.综合评分法:综合评分法是在以专家评分法 作为权重估计的基础上而建立的一种综合评价方 法。 31.优序法:为了比较某几个事物或方案的优劣, 在选定各项评价指标后,将待评价的对象或方案 就各项评价指标的测量值大小分别排序,并分别 对各序号(等级)以相应的评分值即优序数,然后综 合诸评价指标,分别计算评价对象的总赋优序数, 并按总赋优序数大小评定其优劣顺序的方法即优 序法。 32.Topsis法:Topsis法常用于系统工程中有限 方案多目标决策分析,此外,也可用于效益评价、 卫生决策和卫生事业管理等多领域。 33.层次分析法:用层次分析法作系统分析,首 先需要把问题层次化,根据问题的性质和评价目 的,将问题分解为不同的组成因素,得到各层的 评价指标,并以最下层的评价目标作为衡量目标 达到程度的评价指标。然后依据这些指标计算出 综合评分指数,对评价对象的总评价目标进行评 价,最后依其大小来确定评价对象的优劣等级。 34.发病率:发病率是指一定时期(年、季、月) 内,可能发生某病的人群中实际发生某病新病例 的频率。 35.时点患病率:时点患病率:指在某时点检查 时,接受检查的人群中现患病例所占的比例,分 子为新老病人数,又称现患率或流行率。 36.某病病死率:某病病死率:表示在规定的观 察期间内,某病患者中因该病而死亡的频率。 37.某病死亡率:某病死亡率是一定时期内某人 群因某病而死亡的频率。 38.卫生服务调查统计:1.卫生服务调查统计是 卫生统计的主要内容之一,卫生服务调查统计是 从卫生服务资料的设计、收集,整理、分析的角 度,来阐述卫生服务研究的特点、研究方法和注 意事项,以便使卫生服务研究工作更具有科学性。 39.卫生服务调查:卫生服务调查是指对卫生服 务状况、人群健康的危险因素、人群卫生服务的 需求和利用、卫生服务资源的分配和利用所进行 的一种社会调查。 40.调查表:把调查项目按调查时提问的逻辑顺 序列成表格就是调查表,调查表又称调查问卷。 41.卫生服务需要:卫生服务需要是指人们因疾 病影响健康,引起人体正常活动的障碍,实际应 当接受各种卫生服务的需要(如预防保健、治疗、 康复)。 42.两周患病率:两周患病率指在每千名被调查 者的居民中,在调查日之前两周之内患病的人数。 43.两周就诊率:两周就诊率指每千名被调查的 居民中,在调查之日前两周内因病、伤去医疗机 构就诊的人(次)数。 44.住院分娩率:住院分娩率某年某地每百名活 产中在县级或县级以上医院接受住院分娩的产妇 数。 45.卫生资源:卫生资源是指卫生人力,卫生费 用、卫生设施和设备、卫生技术和卫生信息。 二、简答题 1.卫生事业管理专业与卫生统计学的关系是什 么。卫生事业管理的研究对象也存在许多不确定 性,因此,要利用卫生统计这个有效工具,充分 发挥卫生统计的信息、咨询、监督的整体功能, 为满足决策管理和卫生服务研究的需要。 2.总体和样本的关系是什么。样本是从总体中随 机抽取的一部分有代表性的个体组成,除了数量 比总体少,其他构成均与总体一样,是总体具体 而微的缩影。 3.收集资料时,对统计资料的要求是什么?要做 到①资料必须完整、正确和及时;②要有足够的数 量;③注意资料的代表性和可比性。 6.正态分布有哪些参数?为什么说正态分布是很 重要的连续性分布?总体均数卢和总体标准差a 被称为正态分布参数。卢为位置参数,它描述了 正态分布集中趋势的位置;a为变异度参数,反 映正态分布的离散程度。若已知某数值变量服从 正态分布或近似正态分布,如同年龄、同性别儿 童及同性别健康成人身高、体重等,可按正态分 布的规律估计其个体变量值所在范围,如95%的 医学参考值的估计。同时正态分布是很多统计分 析方法的基础。 4.标准正态曲线下横轴上下侧尾部面积为 O.5 %、2.5%、5%时所对应的u值?标准正态 曲线下横轴上下侧尾部面积的0.5%、2.5%、5% 时所对应的u值分别为-2.58、-1.96、-1.64。 5.了解正态曲线下面积分布规律有何用处?根据 正态曲线下面积的分布规律,可以估计观察值的 频数分布情况,通常用于估计95%的观察值所在 范围和99%的观察值所在范围,临床医学常用以 估计医学参考值范围。 7.应用相对数时有哪些注意事项?(1)构成比与率 是意义不同的两个统计指标,应用时不能相互混 淆。构成比说明事物内部各组成部分所占的比重, 而率则说明某事物或现象的发生频率或强度,不 能以构成比代替率来说明问题。(2)样本含量太小 时,不宜计算相对数,最好用绝对数来表示。(3) 对各组观察例数不等的几个率,不能直接相加求 其总率。(4)在比较相对数时应注意资料的可比性。 8.率的标准化法的基本思想?直接标化法需要的 条件是什么?当不同人群的总率进行比较时,若其 人群的内部构成(如年龄、性别、病情轻重等)存在 差异,而年龄、性别等因素对率有影响。为消除 构成的影响,要按照统一标准构成对两个人群进 行校正,使两个人群构成一致。这种选择统一构 成,然后计算标准化率的方法称为率的标准化法。 直接法计算标化率需下面2个条件:(1)资料条件: 已知实际人群的年龄别(组)率,且各年龄组率无明 显交叉。(2)选择标准:可选择标准人群的年龄组 人口数或构成比。 10.统计表和统计图在表达资料中有何特殊作用? 统计表和统计图是我们分析、对比事物的重要工 具,统计图表的合理采用可以使资料得以准确表 达,使人印象深刻和一目了然,便于资料的计算、 分析和对比。 11.绘制统计表的基本原则是什么?绘制统计表有 两个基本原则是:1)一张表只能有一个中心,要 说明什么问题,应该十分明确;2)横纵标目的排 列要合理,主谓分明。 12.绘制统计表的基本要求是什么?①标题不可缺 少,要求用一句简明扼要的话来说明表的内容, 写在表的上方;②横纵标目的设计要符合逻辑, 主谓分明,标目的文字应简明,有单位的要注明; ③线条同样应力求简洁,除基本线条外,应 尽量减少其他不必要的线条;④数字应准确无误, 要求一律采用阿拉伯数字表示,同一指标的数字 的小数位数应一致,位次对齐,表中不宜留空项; ⑤备注一般不列入表内,而写在表的下方。 13.绘制统计图有哪些总要求?①要根据资料的性 质以及分析目的,选择合适的图形;②统计图要 有标题,要求能简明扼要的说明图的内容,一般 写在图体下方的中央位置;③对于有横纵坐标轴 的图形,要说明横纵轴分别代表的事物的名称, 并标注单位。横纵轴的长度比例通常为7:5;④ 在同一张图内比较不同事物时,要用不同颜色或 线条区别它们,并附图例说明,图例的摆放位置 要与图体协调。 15.普通线图与半对数线图在绘制方法上的主要 区别是什么?普通线图与半对数线图都是有横纵 坐标轴的图形,在绘制普通线图时,横纵轴均采 第 1 页

相关文档
最新文档