医学统计学第3版,02计量资料的统计描述试题
考试题医学统计学第三版

考试题医学统计学第三版1,统计设计的基本原则有哪些?(1)对照:以排除偶然的非处理因素的干扰,如成组对照、配对对照。
(2)随机:总体中每一个体都有同等的机会被抽中,其目的是使样品有代表性,如抽签、随机数字表等。
(3)均衡:处理组与对照组的内部构成一致,如性别一致、年龄一致等。
(4)重复(样本含量):样本一般要求≧30例。
2. 怎样的数据资料属分类资料?数据不代表数值大小,只是一种编码,每个编码代表一种属性,这种资料叫分类资料,又称分类变量或定性资料。
其观察值是定性的,表现为互不相容的类别或属性。
有无序分类、有序分类两种情况。
3. 简述什么叫总体和样本,医学研究中的样本有什么要求?总体:是指根据研究目的确定的同质观察单位的全体,是同质的所有观察单位某中观察值(变量值)的集合。
样本:用随机方法从总体中抽出的、有代表性的部分观察单位的某变量值的集合。
医学研究中的样本应按随机化原则获取,即总体中每一个观察单位都有同等的机会被选入到样本中来,以避免误差和偏倚对研究结果有所影响。
4. 统计描述的基本方法有哪些,各自有何特点?(1)频数表与频数图:由组段和频数两栏组成的整理表即频数表,将频数表数据在直角坐标系上绘制成图即频数图。
特点:①.较具体、直观的描述一组数据的特征;②便于发现可疑的异常值;③有助于正确选用统计指标和便于计算。
(2)描述性统计量可以用来定量的刻画统计分布的特征,常用的有三类:描述集中趋势的有算术均数,几何均数,中位数。
描述离散趋势的有极差,四分位数间距,方差,标准差,变异系数,描述分布类型的偏度系数峰度系数。
(3)百分位数是一种位置参数既可用干描述离散趋势又可描述集中趋势可用于各种连续型分布。
5. 统计描述的意义是什么?试举例说明。
统计描述,是指用适当的统计指标、统计表、统计图等方法对资料的数量特征及其分布规律进行测定和描述,其目的是用直观、简单的形式揭示大量数据所蕴涵的内在信息。
例如随机抽取某市六十名十二岁男孩测身高面对这六十个不同的数据,无论多认真审视也无法说清这些男孩的身高情况,这就要用统计描述来解决这些问题,对数据进行整理归纳总结分析制作频数表图这样就能具体直观的描述这些数据的特征如有三组同龄男孩体重如下,其平均体重是30千克,由表面看这三组资料的均数相等,即集中趋势相同,但各组的数据参差不齐,也就是离散趋势不同,描述这组同质数值变量数据离散程度就用全距、四分位数间距、方差、标准差等6. 描述计量资料集中趋势(一般水平)的指标有哪些,各适用于什么情况?描述计量资料集中趋势的指标有:算术平均数、几何平均数、中位数。
医学统计学第2讲 计量资料的统计描述

x=
17.3+18+ … 25.5 10
=21.35(kg)
加权法:
x =
=
f1x1+ f2x2 + f3x3 + … fnxn f1+ f2 + f3 + … fn fx f 权数
均数的特性
• 各观察值与均数之差(离均差)的总和等于零, 即 , • 各观察值的离均差平方和最小,即 ( X X )2 ( X a)2 (a X ) , 均数是一组观察值最理想的代表。
便于发现某些特大或特小的可疑值
便于进一步计算指标和统计分析处理
集中趋势指标 1.算术均数: 简称均数,是用得最多的统计 描述指标。
总体均数
μ
x
样本均数
计算方法: 直接法:
X1 X 2 X 3 X n X n
X i n
例:10名七岁儿童体重(kg)分别为:
17.3,18.0,19.4,20.6,21.2,21.8,22.5, 23.2,24.0,25.5,求平均体重
何为分布?
刀鱼分布在长江下游水域 熊猫分布在温暖多雨的山区,尤以中 国西南部 长寿村的由来
统计描述
统计描述:用统计指标、统计表、统计图 等方法对资料的数量特征及其分布规律 进行测定和描述。
统计分析
统计描述(descriptive statistics)
统计推断(inferential statistics)
• 个体变异是同质观察对象间表现出的差异。 • 变异是生物体在一种或多种、已知或未知 的不可控因素作用下所产生的综合反映。 • 就每个观察单位而言,其观察指标的变异 是不可预测的,或者说是随机的(random)。 • 就总体而言,个体变异是有规律的。
卫生统计学题库

《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录:单项选择题参考答案第一章绪论一、名词解释1. 参数 (parameter)2. 统计量 (statistic)3. 总体 (population)4. 样本 (sample)5. 同质 (homogeneity)6. 变异 (variation)7. 概率 (probability) 8. 抽样误差 (sampling error)二、单选题1.在实际工作中,同质是指:A.被研究指标的影响因素相同B.研究对象的有关情况一样C.被研究指标的主要影响因素相同D.研究对象的个体差异很小E.以上都对2. 变异是指:A.各观察单位之间的差异B.同质基础上,各观察单位之间的差异C.各观察单位某测定值差异较大D.各观察单位有关情况不同E.以上都对3.统计中所说的总体是指:A.根据研究目的而确定的同质的个体之全部B.根据地区划分的研究对象的全体C.根据时间划分的研究对象的全体D.随意想象的研究对象的全体E.根据人群划分的研究对象的全体4. 统计中所说的样本是指:A.从总体中随意抽取一部分B.有意识地选择总体中的典型部分C.依照研究者的要求选取有意义的一部分D.从总体中随机抽取有代表性的一部分E.以上都不是5.按随机方法抽取的样本特点是:A.能消除系统误差B.能消除随机测量误差C.能消除抽样误差D.能减少样本偏性E.以上都对6.统计学上的系统误差、测量误差、抽样误差在实际工作中:A.均不可避免B.系统误差和测量误差不可避免C.测量误差和抽样误差不可避免D.系统误差和抽样误差不可避免E.只有抽样误差不可避免7.统计工作的基本步骤是:A.设计、调查、审核、整理资料B.收集、审核、整理、分析资料C.设计、搜集、整理、分析资料D.调查、审核、整理、分析资料E.以上都不对8.统计工作的关键步骤是:A.调查或实验设计B.整理分组C.收集资料D.审核资料E.分析资料9.欲研究某种药物对高血压病的疗效,临床观察300名病人的血压情况,确切地说,研究总体是: A.这300名高血压患者 B.这300名高血压患者的血压值C.所有的高血压患者D.所有的高血压患者的血压值E.这种药物10.抽样误差是由:A.计算引起B.测量引起C.抽样引起D.采样结果不准引起E.试剂、仪器未经校正引起11.抽样误差指的是:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数值之差D.不同的总体参数之差E.以上都不是12.习惯上,下列属于小概率事件的为:A. P=0.09B. P=0. 10C. P=0.15D. P=0.03E.以上都不是13.治疗效果判定资料属于A. 计量资料B. 计数资料C. 等级资料D. 无序分类资料E. 以上都不是14.概率P的范围:A. -1≤P≤1B. 0C. P≥1D. -1≤P≤0E. 0≤P≤1三、简答题1、统计学的基本步骤有哪些?2、总体与样本的区别与关系?3、抽样误差产生的原因有哪些?可以避免抽样误差吗?4、何为概率及小概率事件?第二章定量资料的统计描述第三章正态分布一、名词解释1. 正态分布 (normal distribution)2. 中位数 (median)3. 四分位数间距 (quartile interval)4. 方差 (variance)5. 正偏态分布 (positively skewed distribution)6. 负偏态分布 (negatively skewed distribution)7. 对数正态分布 (logarithmic normal distribution )8. 医学参考值范围 (medical reference range)二、单选题1.μ确定后,δ越大, 则正态曲线:A.越陡峭B. 形状不变C. 越平缓D.向左移动E.向右移动2. 平均数可用于分析下列哪种资料:A.统计资料B.等级资料C.计数资料D.计量资料E.调查资料3. 常用的平均数指标有:A.样本均数、总体均数、中位数B.算术均数、总体均数、几何均数C.算术均数、几何均数、中位数D.中位数、样本均数、几何均数E.以上都不对4. 描述一组正态或近似正态分布资料的平均水平用:A.算术均数B.几何均数C.中位数D.平均数E.以上均是5. 用/n公式计算均数的方法称为:A.加权法B.简捷法C.目测法D.平均法E.直接法6. 用频数表计算均数时, 若以各组段下限值作为组中值计算均数, 要使所得值等于原均数, 则应:A.减一个组距B.加一个组距C.减半个组距D.加半个组距E.以上均不对7. 对于一组呈负偏态分布的资料,反映其平均水平应用哪个指标:A.几何均数B.中位数C.平均数D.均数E.算术均数8. 用频数表法计算均数时,组中值应为:A.(本组段下限值+本组段上限值)/2B.(本组下限值+下组下限值)/2C.(本组下限值+下组上限值)/2D.本组段的上限值E.本组段的下限值9. 原始数据加上一个不为0的常数后:A. 不变、CV变B. 变或CV变C. 不变、CV不变D. 变、CV不变E. 、CV均改变10. 对于对称分布的资料来说:A.均数比中位数大B.均数比中位数小C.均数等于中位数D.均数与中位数无法确定孰大孰小E.以上说法均不准确11. 血清学滴度资料最常计算_______以表示其平均水平。
《医学统计学》计算题答案

《医学统计学》计算分析题参考答案孙振球主编. 医学统计学.第3版. 北京:人民卫生出版社,2010第二章计量资料的统计描述计算分析题(P26)1. 根据某单位的体检资料,116名正常成年女子的血清甘油三酯测量结果如下,请据此资料:(1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
(3)求该地正常成年女子血清甘油三酯的95%参考值范围。
(4)试估计该地正常成年女子血清甘油三脂在0.8mmol/L以下者及1.5mmol/L者各占正常成年女子总人数的百分比?表2-1某单位116名正常成年女子的血清甘油三酯(mmol/L)测量结果组段频数0.6~ 10.7~ 30.8~ 90.9~ 131.0~ 191.1~ 251.2~ 181.3~ 131.4~ 91.5~ 51.6~1.7 1合计116(1)数据文件数值变量名:组段,频数;用Compute产生新变量“组中值”(也可直接输入组中值)。
(2)操作步骤Analyze èData èWeight Cases ;Weight Cases by 频数。
Analyze èDescriptives èDescriptives ;将“组中值”选入V ariable 框中;单击OK 。
(3)结果解释表2-1显示某单位116名正常成年女子的血清甘油三酯测量结果呈正态分布,故选择均数描述集中趋势,选择标准差描述离散趋势。
某单位116名正常成年女子的血清甘油三酯测量结果的均数为1.16(mmol/L ),标准差为0.20(mmol/L );该地正常成年女子血清甘油三酯的95%参考值范围是(0.77,1.55)mmol/L 。
计算过程根据公式s x 96.1±,即1.16±1.96×0.20。
该单位正常成年女子血清甘油三酯在0.8 mmol/L 以下者估计占总人数的3.59%,1.5 mmol/L 以下者估计占总人数的95.54%。
医用统计学-计量资料的统计描述练习题

医用统计学-计量资料的统计描述练习题一、名词解释1.中位数2.四分位数间距3.标准差4.变异系数5.正态分布二、是非题1.不论数据呈什么分布,都可以用算术均数和中位数表示其平均水平。
()2.少数几个数据比大多数数据大几百倍,一般不宜用算术均数表示其平均水平。
()3.只要单位相同,用s和用CV来表示两组资料的离散程度,结论是完全一样的。
()4.四分位数间距也是描述连续分布数据离散度的指标。
()5.理论上,对于正态分布资料,总体百分位数的P5~P95和μ±1.96σ范围内都包含95%的变量值。
()三、最佳选择题1、描述一组偏态分布资料的变异度,以()指标较好。
A.全距B.标准差C.变异系数D.四分位间距E.方差2、用均数和标准差可以全面描述()资料的特征。
A.正偏态分布B.负偏态分布C.正态分布D.对称分布E.对数正态分布3、各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变E.以上都不对4、比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.方差C.极差D.标准差E.四分位间距5、偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位间距E.方差6、各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数B.标准差C.几何均数D.中位数E.变异系数7、()分布的资料,均数等于中位数。
A.对数正态B.正偏态C.负偏态D.偏态E.正态8、对数正态分布是一种()分布。
(说明:设X变量经Y=lgX变换后服从正态分布,问X变量属何种分布?)A.正态B.近似正态C.左偏态D.右偏态E.对称9、最小组段无下限或最大组段无上限的频数分布资料,可用()描述集中趋势。
A.均数B.标准差C.中位数D.四分位间距E.几何均数10、血清学滴度资料最常用来表示其平均水平的指标是()。
A.算术均数B.中位数C.几何均数D.变异系数E.标准差11、中位数是表示变量值_______的指标。
医学统计学习题(计量资料)

欢迎来到医学统计学习题目简介!在这个学习题目中,我们将探索样本、总 体和估计量的概念,了解中心极限定理的重要性,以及学习如何进行假设检 验与显著性水平的判断。
我们还将研究t检验、F检验和方差分析的应用,并探讨多元线性回归和案例 分析的技巧。加入我们的学习,一起探索医学统计的精髓吧!
学知识的掌握和理解。
3
应用技巧分享
分享一些解决实际问题的技巧和策略, 帮助您更好地应用医学统计学知识。
样本、总体、估计量
了解如何选择合适的样本以及如何进行总体估计是医学统计学的基础。通过实例和练习,我们将学习如 何正确应用这些概念。
样本选择
了解如何选择具有代表性的样本,以便更准确地 推断总体参数。
总体参数估计
学习使用样本数据来估计总体参数,从而推断总 体特征。
中心极限定理
掌握中心极限定理是进行推断性统计分析的关键。了解这个重要的概念将使您能够更好地理解样 本分布和总体参数的估计。
F检验
了解如何使用F检验来比较多 个样本的方差。
方差分析
掌握如何使用方差分是医学统计学中最重要的分析方法之一。通过多元线性回归,我们可以研究多个自变量与 因变量之间的关系。
1 模型建立
2 数据解读
学习如何选择适当的自变量,并建立多元 线性回归模型。
掌握如何解读多元线性回归结果,并通过 案例分析深入理解。
案例分析与综合应用
在医学统计学中,案例分析和综合应用是将所学知识应用于真实场景的关键。通过分析真实案例,我们 可以加深对医学统计学的理解和应用。
1
实际案例分析
通过真实案例的分析和讨论,学习如
综合应用
2
何将所学知识应用于实际问题。
医学统计学第三版习题答案

医学统计学第三版习题答案医学统计学第三版习题答案医学统计学是医学领域中的一门重要学科,它通过收集、整理和分析医学数据,为医学研究和临床实践提供科学依据。
而习题是学习医学统计学的重要方式之一,通过解答习题可以帮助我们巩固所学知识,提高分析和解决实际问题的能力。
下面将给出医学统计学第三版习题的答案,希望对大家的学习有所帮助。
第一章:医学统计学概述1. 医学统计学是什么?医学统计学是应用统计学原理和方法研究医学问题的学科,它通过收集、整理和分析医学数据,为医学研究和临床实践提供科学依据。
2. 医学统计学的应用领域有哪些?医学统计学的应用领域包括流行病学、临床试验、医学决策分析、质量控制等。
3. 为什么医学统计学对医学研究和临床实践至关重要?医学统计学通过数据的收集和分析,可以帮助医学研究者和临床医生进行科学的研究和决策。
它可以帮助我们了解疾病的发病率和死亡率,评估治疗方法的效果,预测疾病的发展趋势等。
第二章:数据的收集和整理1. 什么是数据?数据是用于描述和表示事物特征、属性或变化的信息。
在医学统计学中,数据可以是疾病患者的年龄、性别、病情等信息。
2. 数据的收集方法有哪些?数据的收集方法包括问卷调查、观察记录、实验、抽样调查等。
3. 数据的整理方法有哪些?数据的整理方法包括数据的录入、清理、编码和校验等。
第三章:描述性统计学1. 描述性统计学的主要内容是什么?描述性统计学主要研究如何对数据进行整理、总结和描述,以便更好地理解和分析数据的特征和规律。
2. 描述性统计学的常用指标有哪些?描述性统计学的常用指标包括频数、频率、平均数、中位数、众数、标准差等。
3. 描述性统计学在医学研究中的应用有哪些?描述性统计学可以帮助医学研究者对疾病的发病率、死亡率、治疗效果等进行描述和分析,为医学研究和临床实践提供科学依据。
第四章:概率与概率分布1. 什么是概率?概率是描述事件发生可能性的数值,它介于0和1之间。
2. 什么是概率分布?概率分布是描述随机变量取值可能性的分布情况,常见的概率分布有正态分布、泊松分布、二项分布等。
【孙振球第三版】医学统计学复习题(名词解释和简答)

一、名词解释:1、总体:根据研究目的确定的同质观察单位的全体。
是同质所有观察单位的某种变量值的集合。
2、有限总体:是指空间、时间范围限制的总体。
3、无限总体:是指没有空间、时间限制的总体。
4、样本:从总体中随机抽取部分观察单位,其实测值的集合。
5、@计量资料:又称定量资料或数值变量资料。
为观测每个观察单位的某项指标的大小,而获得的资料。
其变量值是定量的,表现为数值大小,一般有度量衡单位。
根据其观测值取值是否连续,又可分为连续型或离散型两类。
6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。
其变量值是定性的,表现为互不相容的性或类别。
分两种情形:(1)二分类:两类间相互对立,互不相容。
(2)多分类:各类间互不相容。
7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。
其变量值具有半定量性质,表现为等级大小或属性程度。
8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。
9、平均数:描述一组变量值的集中位置或水平。
常用的平均数有算术平均数、几何平均数和中位数。
10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本统计量之间的差异。
11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I 型错误。
检验水平,就是预先规定的允许犯I型错误概率的最大值。
I型错误概率大小也用α表示,α可取单尾亦可取双尾。
12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。
其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 计量资料的统计描述一、教学大纲要求(一)掌握内容1. 频数分布表与频数分布图 (1)频数表的编制。
(2)频数分布的类型。
(3)频数分布表的用途。
2. 描述数据分布集中趋势的指标掌握其意义、用途及计算方法。
算术均数、几何均数、中位数。
3. 描述数据分布离散程度的指标掌握其意义、用途及计算方法。
极差、四分位数间距、方差、标准差、变异系数。
(二)熟悉内容连续型变量的频数分布图:等距分组、不等距分组。
二、 教学内容精要计量资料又称为测量资料,它是测量每个观察单位某项指标值的大小所得的资料,一般均有计量单位。
常用描述定量资料分布规律的统计方法有两种:一类是用统计图表,主要是频数分布表(图);另一类是选用适当的统计指标。
(一)频数分布表的编制频数表(frequency table )用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。
对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2,…20个病人的天数。
如描述某学校学生性别分布情况,男、女生的人数即为各自的频数。
对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。
制作连续型数据频数表一般步骤如下:1.求数据的极差(range )。
min max X X R -= (2-1) 2.根据极差选定适当“组段”数(通常8—10个)。
确定组段和组距。
每个组段都有下限L 和上限U ,数据χ归组统一定为L ≤χ<U 。
3.写出组段,逐一划记。
频数表可用于揭示资料的分布特征和分布类型,在文献中常用于陈述资料,它便于发现某些特大或特小的可疑值,也便于进一步计算指标和统计分析处理。
(二)描述频数分布中心位置的平均指标描述中心位置的平均指标,但常因资料的不同而选取不同的指标进行描述。
1.算术均数(对称分布)算术均数(arithmetic mean )简称均数,描述一组数据在数量上的平均水平。
总体均数用μ表示,样本均数用X 表示,其计算方法如下: (1)直接法:直接用原始观测值计算。
nX X ∑= (2-2)(2)加权法:在频数表基础上计算,其中X 为组中值,f 为频数。
∑∑=ffX X (2-3) 2.几何均数(常用于免疫学的指标))几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。
记为G 。
其计算公式为:(1)直接法⎪⎭⎫ ⎝⎛∑=-n X G lg lg 1 (2-4) (2)加权法⎪⎪⎭⎫ ⎝⎛∑∑=-f X f G lg lg 1 (2-5) 3.中位数(尤其适合偏态分布资料和一端或两端无确切数值的资料)中位数(median )将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。
为奇数时 ⎪⎭⎫ ⎝⎛+=21n X M (2-6)为偶数时 ()(1)2212n n M X X +⎛⎫=+ ⎪⎝⎭(2-7)2-1 常用平均数的意义及其应用场合平均数 意义 应用场合均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布几何均数 平均增(减)倍数 等比资料;对数正态分布中位数 位次居中的观察值水平 偏态分布;分布不明;分布末端无确定值(一)反映数据变异程度大小的变异指标变异指标的应用亦根据资料的不同而选取不同指标进行描述。
常用的变异指标有极差、四分位数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。
1.极差极差(range )亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。
min max X X R -= (2-1) 2.百分位数与四分位数间距(1)百分位数(percentile )是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。
百分位数的另一个重要用途是确定医学正常参考值范围。
百分位数用P x 表示,0< x <100,如25%位数表示为P 25。
在频数表上,百分位数的计算公式为:()∑-⋅+=L xxx x f x n f i L P % (2-8) (2)四分位数间距(inter-quartile range )是由第3四分位数(Q 3= P 75)和第1四分位数(Q 1= P 25)相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,比极差稳定。
其计算公式:31QR Q Q =- (2-9)3.方差方差(variance )表示一组数据的平均离散情况,其计算公式为:()122-∑-=n X Sμ (2-10)4.标准差标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用,其计算公式为:S ==(2-11)5.变异系数变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。
用CV 表示,计算公式为:%100⨯=XS CV (2-12)平均指标和变异指标分别反映资料的不同特征,作为资料的总结性统计量,两类指标要求一起使用。
如常用S X ±或M (QR )。
三、典型试题分析1.名词解释:平均数答案:平均数(average )是描述数据分布集中趋势的指标,在卫生领域中最常用的平均数指标:算术均数、几何均数和中位数。
[评析]本题考察平均数的概念。
平均数是一类统计指标,并不单纯指算术均数。
2.描述一组偏态分布资料的变异度,以( )指标较好。
A.全距 B.标准差 C.变异系数 D.四分位数间距 答案:D[评析]标准差和变异系数均用于描述正态分布资料的变异度,全距和四分位数间距可用于任何资料,而四分位数间距更为稳定,故选D 。
3.用均数和标准差可以全面描述( )资料的特征。
A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 答案:C[评析]本题考察均数和标准差的应用条件。
4.同一资料的标准差是否一定小于均数?答案:均数和标准差是两类不同性质的统计指标。
标准差用于描述数据的变异程度,变异程度大,则该值大,变异程度小,则该值小。
标准差可大于均数,也可小于均数。
5.试述极差、四分位数间距、标准差及变异系数的适用范围。
答案:这三个指标均反映计量资料的离散程度。
极差与四分位数间距可用于任何分布,后者较前者稳定,但均不能综合反映各观察值的变异程度;标准差最为常用,要求资料近似服从正态分布;变异系数可用于多组资料间度量衡单位不同或均数相差悬殊时的变异程度比较。
四、习题(一)名词解释1.频数表2.算术均数3.几何均数4.中位数5.极差6.百分位数7.四分位数间距8.方差9.标准差 10.变异系数(二)单项选择题1.各观察值均加(或减)同一数后()。
A.均数不变,标准差改变B.均数改变,标准差不变C.两者均不变D.两者均改变2.比较身高和体重两组数据变异度大小宜采用()。
A.变异系数B.差C.极差D.标准差3.以下指标中()可用来描述计量资料的离散程度。
A.算术均数B.几何均数C.中位数D.标准差4.偏态分布宜用()描述其分布的集中趋势。
A.算术均数B.标准差C.中位数D.四分位数间距(描述其变异程度)5.各观察值同乘以一个不等于0的常数后,()不变。
A.算术均数 B.标准差C.几何均数D.中位数6.()分布的资料,均数等于中位数。
A.对称B.左偏态C.右偏态D.偏态7.对数正态分布是一种()分布。
A.正态B.近似正态C.左偏态D.右偏态8.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。
A.均数B.标准差C.中位数D.四分位数间距9.()小,表示用该样本均数估计总体均数的可靠性大。
A. 变异系数B.标准差C. 标准误D.极差10.血清学滴度资料最常用来表示其平均水平的指标是()。
A. 算术平均数B.中位数C.几何均数D. 平均数11.变异系数CV的数值()。
A. 一定大于1B.一定小于1C. 可大于1,也可小于1D.一定比标准差小12.数列8、-3、5、0、1、4、-1的中位数是()。
A. 2B. 0C. D.13.关于标准差,那项是错误的()。
A.反映全部观察值的离散程度B.度量了一组数据偏离平均数的大小C.反映了均数代表性的好坏D.不会小于算术均数14.中位数描述集中位置时,下面那项是错误的()。
A. 适合于偏态分布资料B.适合于分布不明的资料C.不适合等比资料D.分布末端无确定值时,只能用中位数15. 5人的血清滴度为 <1:20、1:40、1:80、1:160、1:320描述平均滴度,用那种指标较好()。
A.平均数 B.几何均数C.算术均数D. 中位数16.数列0、48、49、50、52、100的标准差为()。
A.50 B.C. D.17.一组变量的标准差将()。
A.随变量值的个数n的增大而增大B.随变量值的个数n的增加而减小C.随变量值之间的变异增大而增大D.随系统误差的减小而减小18.频数表计算中位数要求()。
A.组距相等B.原始数据分布对称C.原始数据为正态分布或近似正态分布D.没有条件限制19.一组数据中20%为3,60%为2,10%为1,10%为0,则平均数为()。
A. B.C. D. 不知道数据的总个数,不能计算平均数20.某病患者8人的潜伏期如下:2、3、3、3、4、5、6、30则平均潜伏期为()。
A.均数为7天,很好的代表了大多数的潜伏期B.中位数为3天C.中位数为4天D.中位数为天,不受个别人潜伏期长的影响21.某地调查20岁男大学生100名,身高标准差为,体重标准差为,比较两者的变异程度,结果( )。
A. 体重变异度大B.身高变异度较大C.两者变异度相同D.由单位不同,两者标准差不能直接比较 (三)判断正误并简述理由 1.均数总是大于中位数。
( x ) 2.均数总是比标准差大。
( x) 3.变异系数的量纲和原量纲相同。
( x ) 4.样本均数大时,标准差也一定会大。
( x ) 5.样本量增大时,极差会增大。
( ) (四)计算题1.某卫生防疫站测得大气中的二氧化硫的浓度,用两种计量单位表示: mg/m 3: 1 2 3 4 5 ug/m 3 : 1000 2000 3000 4000 5000分别计算几何均数及标准差,会发现两种不同单位得标准差相等,试解释其原因。
2.尸检中测得北方成年女子80人的肾上腺重量(g )如下,试(1)编制频数表,(2)求中位数、均数和标准差。
3.测得某地300名正常人尿汞值,其频数表如下。
试计算均数、中位数、何者代表性较好。
表2-2 300例正常人尿汞值(μg/L )频数表尿汞值 例数尿汞值 例数 尿汞值 例数 0- 49 24- 16 48- 3 4- 27 28- 9 52- - 8- 58 32- 9 56- 2 12- 50 36- 4 60- - 16- 45 40- 5 64- - 20- 2244--68-14.有5个变量值7,9,10,14,15,试计算X 及()X X -∑。