医学统计学问答题含答案

医学统计学问答题含答案

简答题 0. 算术均数、几何均数和中位数各有什么适用条件?

答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。

(2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。

(3)中位数:适用各种类型的资料,尤其以下情况:

A 资料分布呈明显偏态;

B 资料一端或两端存在不确定数值(开口资料或无界资料);

C 资料分布不明。

1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么?

(1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势

(2)S 为标准差,说明正态分布或近似正态分布的离散趋势

(3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。

2.试述正态分布、标准正态分布的联系和区别。正态分布

标准正态分布原始值X 无需转换

作u=(X-μ)/σ转换分布类型对称

对称集中趋势μ

μ=0 均数与中位数的关系

μ=M μ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。

3.说明频数分布表的用途。

1)描述频数分布的类型2)描述频数分布的特征3)便于发现一

些特大或特小的可疑值 4)便于进一步做统计分析和处理

4.变异系数的用途是什么?

多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。

5.试述正态分布的面积分布规律。

(1)X 轴与正态曲线所夹的面积恒等于1或100%;

(2)区间μ±σ的面积为%,区间μ±σ的面积为%,区间μ±σ的面积为%。

6.试举例说明均数的标准差与标准误的区别与联系。

7.标准正态分布(u 分布)与t 分布有何不同?

t 分布为抽样分布,标准正态分布(u 分布)为理论分布。t 分布比正态分布的峰值低,且尾部翘得更高。随着自由度的增大,t 分布逐渐趋近于标准正态分布。即当自由度ν→∞时,t 分布→标准正态分布。

8.均数的可信区间与参考值范围有何不同?

9.假设检验时,一般当P <时,则拒绝H 0,理论根据是什么?

10.假设检验中?和P 的区别何在?

检验的应用条件是什么?

型错误与II 型错误有何区别与联系?

I 型错误是指拒绝了实际上成立的0H 所犯的“弃真”错误,其概率大小用α表示。II 型错误则是“接受”了实际上不成立的0H 所犯的“取伪”错误,其概率大小用β表示。当样本含量n 确定时,α愈小,β愈大;反之α愈大,β愈小。

13.假设检验和区间估计有何联系?

假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大小即判断总体参数的范围。两者既互相联系,又有区别。假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了0H ,则按α水准,不拒绝0H ;若不包含0H ,则按α水准,拒绝0H ,接受1H 。也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。

14.为什么假设检验的结论不能绝对化?

因为通过假设检验推断作出的结论具有概率性,其结论不可能完全正确,有可能发生两类错误。拒绝0H 时,有可能犯I 型错误;“接受” 0H 时可能犯II 型错误。无论哪类错误,假设检验都不可能将其风险降为0,因此在结论中使用绝对化的字如“肯定”,“一定”,“必定”就不恰当。

15.方差分析的基本思想和应用条件是什么?

方差分析的基本思想是: 根据研究资料设计的类型及研究目的,把全部观察值总变异分解为两个或多个组成部分,其总自由度也分解为相应的几个部分。例如完全随机设计的方差分析,可把总变异分解为组间变异和组内变异,即SS 总=SS 组内+SS 组间,总的自由度也分解为相应的两部分,即ν 总=ν 组内+ν 组间。离均差平方和除以自由度得均方MS ,组间均方(MS 组间)与误差均方(MS 误差)之比为F 值;如果各组处理的效应一样,则组间均方等于组内均方,即F =1;但由于抽样误差,F 值不正好等于1,而是接近 1;如果F 值较大,远离1,说明组间均方大于误差均方,反映各处理组的效应不一样,即各组均数差别有意义,至于F 值多大才能认为差别有意义,可查F 界值表(方差分析用)来确定。

方差分析的应用条件:①各样本是相互独立的随机样本且来自正态总体②各组总体方差相等,即方差齐性。

16.在完全随机设计方差分析中SS 组间、SS 组内各表示什么含义?

组间SS 表示组间变异,指各组处理样本均数大小不等,是由处理因素(如果有)和随机误差造成的;组内SS 表示组内变异,指各处理组内变量值大小不等,是由随机误差造成的。

17.随机区组设计的方差分析与完全随机设计方差分析在设计和变异分解上有什么不同?

区别点

完全随机设计随机区组设计设计采用完全随机化的分组方法,将全部试验

对象分配到g 个处理组(水平组),各组

分别接受不同的处理。

随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个受试对象数量相同,区组内均衡。变异分解三种变异:总SS =组间SS +组内SS 四种变异:

总SS =处理SS +区组SS +误差SS

18.以实例说明为什么不能以构成比代替率?

19.秩和检验的优缺点?

20.简述直线回归与直线相关的区别与联系。

联系:1对于既可做相关又可做回归分析的同一组数据,计算出的b 与r 正负号一致。

2相关系数与回归的假设检验等价,即对于同一样本,tb=tr

3同一组数据的相关系数和回归系数可以互相换算:r=by ,x*Sx/Sy

4用回归解释相关:由于决定系数

总回ss ss r /2=,当总和平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则2r 越接近1,说明相关的效果越好。

二者的区别:(1)资料要求上:相关要求X 、Y 服从双变量正态分布,这种资料进行回归分析称为Ⅱ型回归;胡桂要求Y 在给定某个X 值时服从正态分布,X 是可以精确测量和严格控制的变量,称为Ⅰ型回归。(2)应用上:说明两变量间互相关系用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,说明Y 如何依赖于X 而变化。(3)意义上:r 说明具有直线关系的两变量间相互关系的方向和密切程度;b 表示X 每变化一个单位所导致Y 的平均变化量。

(4)计算上:xy xx xy l l l r //=,xx xy l l b /=

(5)取值范围:-1≤r ≤1,-∞

2、二项分布、Poission 分布的应用条件二项分布的应用条件:医学领域有许多二分类记数资料都符合二项分布(传染病和遗传病除外),

但应用时仍应注意考察是否满足以下应用条件:(1) 每次实验只有两类对立的结果;

(2) n 次事件相互独立;(3) 每次实验某类结果的发生的概率是一个常数。 Poisson 分布的应用条件:医学领域中有很多稀有疾病(如肿瘤,交通事故等)资料都符合Poisson 分布,但应用中仍应注意要满足以下条件:(1) 两类结果要相互对立;(2) n 次试验相互独立;(3) n 应很大, P 应很小。

3、极差、四分位数间距、标准差、变异系数的适用范围有何异同?答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分

布,特别是正态分布或近似正态分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。

4.中位数、均数、几何均数的适用条件有何异同。(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

5.第一类错误与第二类错误的区别与联系。当假设检验拒绝了实际上成立的零假设时,所犯的错误称为第一类错误,其概率用α表示。当假设检验接受实际上不成立的零假设时,所犯的错误称为第二类错误,其概率用β表示。当样本含量一定时,α愈大,β愈小,反之,α愈小,β愈大。1-β称为检验效能或把握度,其意义是两总体确有差别,按α水准能发现它们有差别的能力。

6.运用相对数时要注意哪些问题?应用相对数时应注意以下几个事项(1)计算率和构成比时观察单位不宜过小;(2)注意正确区分

构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。

7.方差分析后进行两两比较能否用t 检验?为什么? t 检验仅用在单因素两水平设计(包括配对设计和成组设计)和单组设计(给出一组数据和一个标准值的资料)的定量资料的均值检验场合;而方差分析用在单因素k 水平设计(k≥3)和多因素设计的定量资料的均值检验场合。方差分析有十几种,不同的方差分析取决于不同的设计类型。t 检验进行两两比较其一,将多因素各水平的不同组合、简单地看作单因素的多个水平(即视为单因素水平),混淆了因素与水平之间的区别,从而错误地确定了实验设计类型;其二,分析资料时,常错误用单因素多水平设计或仍采用多次t 检验进行两两比较。误用这两种方法的后果是,不仅无法分析因素之间的交互作用的大小,而且,由于所选用的数学模型与设计不匹配,易得出错误的结论。

参数检验与非参数检验的区别何在?各有何优缺点?(1)区别:参数检验:以已知分布(如正态分布)为假定条件,对总体参数进行估计或检验。非参数检验:不依赖总体分布的具体形式,检验分布位置是否相同。(2)优缺点:参数检验:优点是符合条件时,检验效能高。缺点是对资料要求严格,如等级资料、分布不明或末端有不明确数据的资料不能用参数检验,要求资料的分布类型已知且总体方差相等。非参数检验:优点是应用范围广、简便;缺点是对于符合参数统计的资料,如果用非参数统计会造成资料信息的丢失,致使检验效能下降,犯第二类错误的概率增大。故符合参数统计条件的资料,要首先选用参数统计的方法。当参数统计的应用条件得不到满足时,应选用非参数统计。

11.对于同一资料,又出自同一研究目的,用参数检验和非参数检验所得结果不一致时,应以何种结果为准。当资料满足参数检验方法的条件时,应使用参数检验方法,当资料不满足参数检验方法的条件时,必须采用非参数检验方法。

12、常见的统计图有哪些?如何根据资料的性质选用适当的统计

图?常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及远圆图,适用于构成比资料,反映各组成部分的大小;

③普通线图: 适用于连续性资料,反映事物在时间上的发展变化的趋势,或某现象随另一现象变迁的情况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。⑥散点图: 适用于成对数据,反映散点分布的趋势。

14.极差、四分位数间距、标准差、变异系数的适用范围有何异同?答:这四个指标的相同点在于均用于描述计量资料的离散程度。其不同点为:极差可用于各种分布的资料,一般常用于描述单峰对称分布小样本资料的变异程度,或用于初步了解资料的变异程度。若样本含量相差较大,不宜用极差来比较资料的离散程度。四分位数间距适用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度。标准差常用于描述对称分布,特别是正态分布或近似正态分布资料的离散程度。变异系数适用于比较计量单位不同或均数相差悬殊的几组资料的离散程度。

t检验、u检验和F检验的应用条件各是什么?

t检验的应用条件是:①σ未知而且n较小时,要求样本来自正态总体;②两小样本均数比较时,还要求两样本所属总体的方差相等。u 检验的应用条件是:①σ已知;②σ未知但样本含量较大。方差分析的应用条件是:①各样本是相互独立的随机样本;②各样本来自正态总体;③各处理组总体方差相等。

2.普通线图和半对数线图在制作和应用中有何主要区别?

普通线图绘制时,纵轴的尺度为算术尺度,并且一般应从“0”开始;而半对数线图纵坐标的尺度为对数尺度,起点没有0。应用上,普通线图反映某事物随时间变动的趋势或某现象随另一现象变迁的情况;而半对数线图用来比较两种或两种以上事物物随时间变动的速度(相对比)。

应用相对数的注意事项应用相对数时应注意以下几个事项(1)计

算率和构成比时观察单位不宜过小;(2)注意正确区分构成比和率,不能以比代率;(3)对率和构成比进行比较时,应注意资料的可比性;(4)当比较两个总率时,若其内部构成不同,需要进行率的标准化;(5)两样本率比较时应进行假设检验。

简述率的标准化法的基本思想当比较两个总率时,如果两组内部某种重要特征在构成上有差别,则直接比较这两个总率是不合理的;因为这些特征构成上的不同,往往造成总率的升高或下降,从而影响两个总率的对比。率标准化法的基本思想就是采用统一的内部构成计算标准化率,以消除内部构成不同对指标的影响,使算得的标准化率具有可比性。例如比较两人群的死亡率、出生率、患病率时,常要考虑人群性别、年龄的构成是否相同;试验组和对照组治愈率的比较时,常要考虑两组病情轻重、年龄、免疫状态等因素的构成是否相同。如其构成不同,需采用统一的标准进行校正,然后计算校正后的标准化率进行比较,这种方法称为标准化法。

简述非参数检验的适用资料。(1)等级资料;(2)偏态资料;(3)分布不明的资料;(4)资料中各组方差不齐,且转换后不能达到方差齐性。

简述进行直线相关回归分析应注意的事项(1)相关分析注意的事项相关系数r是用来描述两个变量间线性相关关系的密切程度和方向的统计指标。所以,如果目的是想定量地描述两个变量间相互关系的密切程度和方向,则应作相关分析。而且,r的绝对值大小,对利用回归方程进行变量预测具有指导意义,如果r的绝对值很小,利用回归方程从一个变量预测另一个变量的值是没有多大意义的。应用相关分析时应注意的问题:①进行相关分析时要有实际意义,不能把毫无关联的两事物或现象作相关分析。②相关关系不一定是因果关系,可能仅是表面上的伴随关系,或两个变量同时受另一因素的影响。③不能只根据相关系数绝对值的大小来推断两事物现象之间有无相关以及相关的密切程度,而必须进行相关系数的显着性检验。另外,不要把相关系数的显着性误解为两事物或现象相关的强度。④关于相关分析的样本的合并与分层问题,应审慎对待。⑤散点图在相关分析中具有重要作

用,要充分利用。(2)回归分析的注意事项①作回归分析要有实际意义,不能把毫无关联的两种现象,随意进行回归分析,忽视事物现象间的内在联系和规律。②直线回归分析的资料,一般要求因变量Y是来自正态分布总体的随机变量,自变量X可以是正态随机变量,也可以是精确测量和严格控制的值。③进行回归分析时,应先绘制散点图。

④绘制散点图后,若出现一些特大特小的离群值(异常点),则应及时复核检查。⑤回归直线不要外延。

均数、几何均数和中位数的适用范围是什么?(1)均数适用于描述对称分布,特别是正态分布的数值变量资料的平均水平;(2)几何均数适用于描述原始数据呈偏态分布,但经过对数变换后呈正态分布或近似正态分布的数值变量资料的平均水平;(3)中位数适用于描述呈明显偏态分布(正偏态或负偏态),或分布情况不明,或分布的末端有不确切数值的数值变量资料的平均水平。

全距、四分位数间距、方差、标准差、变异系数各有何特点?(1)全距是一组观察值中最大值与最小值之差,计算简单,意义明了,但全距的不能反映组内其他观察值之间的离散情况,并且容易受个别特大值或特小值的影响,稳定性较差;(2)四分位数间距内包括了全部观察值的一半,可看作为中间一半观察值的全距,它比全距稳定,但仍未考虑每个观察值的离散度,它适用于描述偏态分布资料,特别是分布末端无确定数据资料的离散度;(3)方差是离均差平方和的均数,克服了全距和四分位数间距不能反映组内每个观察值离散度的缺点,但方差把观察值的原度量单位变成了平方单位,导致计算结果难于解释;(4)方差开方,即为标准差,它适宜于描述对称分布,特别是正态分布的数值变量资料的离散程度;(5)变异系数是标准差与均数之比,它适宜于描述度量单位不同的观察值的离散程度和度量单位相同但均数相差悬殊的观察值的离散程度。

1、统计资料可以分成几类?

答: 根据变量值的性质,可将统计资料分为数值变量资料(计量资料),无序分类变量资料(计数资料),有序分类变量资料(等级资料或半定量资料)。用定量方法测定某项指标量的大小,所得资料,即为计量

资料;将观察对象按属性或类别分组,然后清点各组人数所得的资料,即为计数资料;按观察对象某种属性或特征不同程度分组,清点各组人数所得资料称为等级资料。

2、不同类型统计资料之间的关系如何?

答: 根据分析需要,各类统计资料可以互相转化。如男孩的出生体重,属于计量资料,如按体重正常与否分两类,则资料转化为计数资料;如按体重分为: 低体重,正常体重,超体重,则资料转化为等级资料。计数资料或等级资料也可经数量化后,转化为计量资料。如性别,结果为男或女,属于计数资料,如男性用0(或1),女性用1(或0)表示,则将计数资料转化为计量资料。

3、频数分布有哪两个重要特征?

答:频数分布有两个重要特征:集中趋势和离散趋势,是频数分布两个重要方面。将集中趋势和离散趋势结合起来分析,才能全面地反映事物的特征。一组同质观察值,其数值有大有小,但大多数观察值集中在某个数值范围,此种倾向称为集中趋势。另一方面有些观察值较大或较小,偏离观察值集中的位置较远,此种倾向称为离散趋势。

4、标准差有什么用途?

答: 标准差是描述变量值离散程度常用的指标,主要用途如下: ①描述变量值的离散程度。两组同类资料(总体或样本)均数相近,标准差大,说明变量值的变异度较大,即各变量值较分散,因而均数代表性较差;反之,标准差较小,说明变量异度较小,各变量值较集中在均数周围,因而均数的代表性较好。②结合均数描述正态分布特征;③结合均数计算变异系数CV;④结合样本含量计算标准误。

5、变异系数(CV)常用于哪几方面?

答: 变异系数是变异指标之一,它常用于以下两个方面: ①比较均数相差悬殊的几组资料的变异度。如比较儿童的体重与成年人体重的变异度,应使用CV;②比较度量衡单位不同的几组资料的变异度。如比较同性别,同年龄人群的身高和体重的变异度时,宜用CV。

6、制定参考值范围有几种方法?各自适用条件是什么?

答: 制定参考值范围常用方法有两种: ①正态分布法: 此法是根据正

态分布的原理,依据公式:

X±uS计算,仅适用于正态分布资料或对数正态分布资料。95%双侧参考值范围按: X±计算;95%单侧参考值范围是: 以过低为异常者,则计算: X-,过高为异常者,计算X+。若为对数正态分布资料,先求出对数值的均数及标准差,求得正常值范围的界值后,反对数即可。

②百分位数法。用~估计95%双侧参考值范围;P5或P95为95%单侧正常值范围。百分位数法适用于各种分布的资料(包括分布未知),计算较简便,快速。使用条件是样本含量较大,分布趋于稳定。一般应用于偏态分布资料、分布不明资料或开口资料。

7、计量资料中常用的集中趋势指标及适用条件各是什么?

答: 常用的描述集中趋势的指标有: 算术均数、几何均数及中位数。

①算术均数,简称均数,反映一组观察值在数量上的平均水平,适用于对称分布,尤其是正态分布资料;②几何均数: 用G表示,也称倍数均数,反映变量值平均增减的倍数,适用于等比资料,对数正态分布资料;③中位数: 用M 表示,中位数是一组观察值按大小顺序排列后,位置居中的那个观察值。它可用于任何分布类型的资料,但主要应用于偏态分布资料,分布不明资料或开口资料。

8、标准差,标准误有何区别和联系?

答: 标准差和标准误都是变异指标,但它们之间有区别,也有联系。区别: ①概念不同;标准差是描述观察值(个体值)之间的变异程度;标准误是描述样本均数的抽样误差;②用途不同;标准差常用于表示变量值对均数波动的大小,与均数结合估计参考值范围,计算变异系数,计算标准误等。标准误常用于表示样本统计量(样本均数,样本率)对总体参数(总体均数,总体率)的波动情况,用于估计参数的可信区间,进行假设检验等。③它们与样本含量的关系不同: 当样本含量 n 足够大时,标准差趋向稳定;而标准误随n的增大而减小,甚至趋于0 。联系: 标准差,标准误均为变异指标,如果把样本均数看作一个变量值,则样本均数的标准误可称为样本均数的标准差;当样本含量不变时,标准误与标准差成正比;两者均可与均数结合运用,但描述的内容各不相同。

9、统计推断包括哪几方面内容?

答: 统计推断包括: 参数估计及假设检验两方面。参数估计是指由样本统计量( 样本均数,率)来估计总体参数(总体均数及总体率),估计方法包括点值估计及区间估计。点值估计直接用样本统计量来代表总体参数,忽略了抽样误差;区间估计是按一定的可信度来估计总体参数所在的范围,按X±uσX或

X±uS X来估计。假设检验是根据样本所提供的信息,推断总体参数是否相等。

10、假设检验的目的和意义是什么?

答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。如果是由于抽样误差原因引起的差别,则这种差异没有统计学意义,认为两个或两个以上的样本来自同一总体,;另一方面如果样本是来自不同的总体而引起的差异,则这种差异有统计学意义,说明两个或两个以上样本所代表的总体的参数不相等。样本统计量之间的差异是由什么原因引起,可以通过假设检验来确定。因此假设检验的目的是推断两个或多个样本所代表的总体的参数是否相等。

何谓假设检验?其一般步骤是什么?所谓假设检验,就是根据研究目的,对样本所属总体特征提出一个假设,然后根据样本所提供的信息,借助一定的分布,观察实测样本情况是否属于小概率事件,从而对所提出的假设作出拒绝或不拒绝的结论的过程。假设检验一般分为以下步骤: ①建立假设:包括: H0,称无效假设;H1: 称备择假设;②确定检验水准:检验水准用α表示,α一般取;③计算检验统计量:根据不同的检验方法,使用特定的公式计算;④确定P值:通过统计量及相应的界值表来确定P值;⑤推断结论:如P>α,则接受H0,差别无统计学意义;如P≤α,则拒绝H0,差别有统计学意义。

12、假设检验有何特点?

答: 假设检验的特点是: ①统计检验的假设是关于总体特征的假设;

②用于检验的方法是以检验统计量的抽样分布为理论依据的;③作出

的结论是概率性的,不是绝对的肯定或否定。

13、如何正确理解差异有无显着性的统计学意义?

答: 在假设检验中,如P≤α,则结论是: 拒绝H0,接受H1,习惯上又称“显着”,此时不应该误解为相差很大,或在医学上有显着的(重要的)价值;相反,如果P>α,结论是不拒绝H0。习惯上称“不显着”,不应理解为相差不大或一定相等。有统计学意义( 差异有显着性)不一定有实际意义;如某药平均降低血压5mmHg,经检验有统计学意义,但在实际中并无多大临床意义,不能认为该药有效。相反,无统计学意义,并不一定无实际意义。如用新疗法治疗某病,有效率与旧疗法无差异,此时无统计学意义,如果新疗法方法简便,省钱,更容易为病人接受,则新疗法还是有实际意义。

15、X2检验有何用途?

答: X2检验有以下应用: ①推断两个或两个以上总体率(或构成比)之间有无差别;②检验两变量之间有无相关关系;③检验频数分布的拟合优度。

16、四格表资料的u检验和X2检验的应用条件有何异同?

答:(1) 相同点:四格表资料的u检验是根据正态近似原理进行的,凡能用u检验对两样本率进行检验的资料,均能使用X2检验,两者是等价的,即u2=X2;u检验和X2检验都存在连续校正的问题。(2) 不同点:由于u 分布可确定单、双侧检验界值,可使用u检验进行单侧检验;满足四格表u检验的资料,可计算两率之差的95%可信区间,以分析两率之差有无实际意义;X2检验可用于2×2列联表资料有无关联的检验。

18、非参数检验适用于哪些情况?

答: 非参数检验应用于以下情况: ①不满足参数检验的资料,如偏态分布资料;②分布不明的资料;③等级资料或开口资料。

20、常用的统计图有哪几种?它们的适用条件是什么?

答: 常用的统计图及适用条件是: ①条图,适用于相互独立的资料,以表示其指标大小;②百分条图及园图,适用于构成比资料,反映各组成部分的大小;③普通线图: 适用于连续性资料,反映事物在时间上

的发展变化的趋势,或某现象随另一现象变迁的情况。④半对数线图,适用于连续性资料,反映事物发展速度(相对比)。⑤直方图: 适用于连续性变量资料,反映连续变量的频数分布。⑥散点图: 适用于成对数据,反映散点分布的趋势。

医学统计学部分试题及答案

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历 3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高[参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民6.简述小概率事件原理。

答:当某事件发生的概率很小,习惯上认为小于或等于时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念 答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随机抽取2000人,分别测得其红细胞数,组成样本,其样本含量为2000。 第二章调查研究设计 1. 以下五个问题中,最符合调查问卷设计要求的是 A.你一个月工资多少? B.你一个月吃多少克盐? C.你是否有婚外恋:①有②无 D.你和你的妈妈认为女孩几岁结婚比较好? E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可 [参考答案]E.如果只生一个孩子,你希望孩子的性别是:①女②男③男女均可 2.普查是一种全面调查的方法,与抽样调查相比,叙述正确的是 A.确定对象较为简单 B.适于发病率较低疾病的调查 C.不易获得反映平均水平的统计指标

(完整版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学问答题含答案

医学统计学问答题含答案 简答题 0. 算术均数、几何均数和中位数各有什么适用条件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。 (2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。 (3)中位数:适用各种类型的资料,尤其以下情况: A 资料分布呈明显偏态; B 资料一端或两端存在不确定数值(开口资料或无界资料); C 资料分布不明。 1.对于一组近似正态分布的资料,除样本含量n 外,还可计算S X ,和S X 96.1±,问各说明什么? (1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势 (2)S 为标准差,说明正态分布或近似正态分布的离散趋势 (3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。 2.试述正态分布、标准正态分布的联系和区别。正态分布 标准正态分布原始值X 无需转换 作u=(X-μ)/σ转换分布类型对称 对称集中趋势μ μ=0 均数与中位数的关系 μ=M μ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。 3.说明频数分布表的用途。 1)描述频数分布的类型2)描述频数分布的特征3)便于发现一

些特大或特小的可疑值 4)便于进一步做统计分析和处理 4.变异系数的用途是什么? 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5.试述正态分布的面积分布规律。 (1)X 轴与正态曲线所夹的面积恒等于1或100%; (2)区间μ±σ的面积为%,区间μ±σ的面积为%,区间μ±σ的面积为%。 6.试举例说明均数的标准差与标准误的区别与联系。 7.标准正态分布(u 分布)与t 分布有何不同? t 分布为抽样分布,标准正态分布(u 分布)为理论分布。t 分布比正态分布的峰值低,且尾部翘得更高。随着自由度的增大,t 分布逐渐趋近于标准正态分布。即当自由度ν→∞时,t 分布→标准正态分布。 8.均数的可信区间与参考值范围有何不同? 9.假设检验时,一般当P <时,则拒绝H 0,理论根据是什么? 10.假设检验中?和P 的区别何在? 检验的应用条件是什么? 型错误与II 型错误有何区别与联系? I 型错误是指拒绝了实际上成立的0H 所犯的“弃真”错误,其概率大小用α表示。II 型错误则是“接受”了实际上不成立的0H 所犯的“取伪”错误,其概率大小用β表示。当样本含量n 确定时,α愈小,β愈大;反之α愈大,β愈小。 13.假设检验和区间估计有何联系? 假设检验用于推断质的不同即判断两个(或多个)总体参数是否不等,而可信区间用于说明量的大小即判断总体参数的范围。两者既互相联系,又有区别。假设检验与区间估计的联系在于可信区间亦可回答假设检验的问题,若算得的可信区间包含了0H ,则按α水准,不拒绝0H ;若不包含0H ,则按α水准,拒绝0H ,接受1H 。也就是说在判断两个(或多个)总体参数是否不等时,假设检验和可信区间是完全等价的。

医学统计学课后习题答案解析

医学统计学课后习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是: (1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。

(完整版)医学统计学试题及其答案

l.统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小 D某事件发生的可能性很大 E以上均不对 3.抽签的方法属于 D A分层抽样 B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样 4.测量身高、体重等指标的原始资料叫:B A计数资料 B计量资料 C等级资料 D分类资料 E有序分类资料 5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好 转恶化死亡 治疗人 数 8 23 6 3 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资 料 E数值变量资料 6.样本是总体的 C A有价值的部分 B有意义的部分 C有代表性的部分 D任意一部分 E典型部分 7.将计量资料制作成频数表的过程,属于??统计工作哪个基本步骤:C A统计设计 B收集资料 C整理资料 D分析资料 E以上均不对 8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差 B系统误差 C随机误差 D责任事故 E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则 B随机原则 C重复原则 D交叉的原则 E以上都不对

医学统计学的基础知识习题及答案

【单项选择题】 1.医学统计学的主要内容不包括()C A,变量计算 B.统计设计 C.统计描述 D.统计推断 【答案】A 【解析】P111;医学统计学的主要内容 1)统计设计; 2)统计描述; 3)统计推断。 2.医学统计工作的基本步骤不包括()

A.研究设计

B.健康教育 C.收集资料 D.整理资料 【答案】B 【解析】P112;医学统计工作的基本步骤:研究设计、收集资料、整理资料和分析资料是统计工作的 4个基本步骤这4个步骤是紧密联系不可分割的,某一环节发生问题,都将影响最终的统计分析结果。 3.描述集中趋势的指标有()。 A,算数均数 B,方差与标准差 C.极差 D.百分位数 【答案】:A

【解析】:P115;描述集中趋势的指标:

1)算术均数,简称均数; 2)中位数(median); 3)几何均数(geometrymean)。 4.统计学中的总体是指()。 A.根据研究目的确定的同质观察单位的全体 B.根据地区划分的研究对象的全体 C.根据时间划分的研究对象的全体 D.根据人群划分的研究对象的全体 【答案】A 【解析】P114;总体(population)是根据研究目的确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某种变量值的集合。 5.下列不属于离散趋势的描述指标是() A.极差

B.百分位数 C,方差与标准差 D,几何均数 【答案】D 【解析】P116;描述离散趋势的指标; 1)方差与标准差; 2)极差:亦称全距(range),用符号R表示; 3)百分位数(percentile):是一个位置指标,用符号Px表示; 4)变异系数(coefficientofvariation):用符号CV表。 而几何均数是描述集中趋势的指标。 6.血清学滴度资料最常用来表示其平均水平的指标是()。A,算术平均数 B.中位数

医学统计学试题和答案

B. 由样本统计量推断总体参数 D. 研究总体统计量 B. 总体的统计指标 D. 样本的总和 a )。 B. 差 D. 标准差 d )可用来描述计量资料的离散程度。 B. 几何均数 D.标准差 c )描述其分布的集中趋势。 B. 标准差 D. 四分位数间距 b )不变。 (一) 单项选择题 3.抽样的目的是( b ) A. 研究样本统计量 C •研究典型案例研究误差 4.参数是指( b )。 A. 参与个体数 C.样本的统计指标 5. 关于随机抽样,下列那一项说法是正确的( a )。 A. 抽样时应使得总体中的每一个个体都有同等的机会被抽取 B. 研究者在抽样时应精心挑选个体,以使样本更能代表总体 C. 随机抽样即随意抽取个体 D. 为确保样本具有更好的代表性,样本量应越大越好 6. 各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C.两者均不变 D.两者均改变 7. 比较身高和体重两组数据变异度大小宜采用( A. 变异系数 C. 极差 8. 以下指标中( A. 算术均数 C.中位数 9. 偏态分布宜用( A. 算术均数 C.中位数 10. 各观察值同乘以一个不等于 0 的常数后,( A. 算术均数 B.标准差 C.几何均数 D.中位数 11. ( a )分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D. 偏态 12. 对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D. 右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其 集中趋势。 A. 均数 B. 标准差 C.中位数 D.四分位数间距 14. ( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是( c )。

医学统计学习题及答案

医学统计学试题及答案 习题医学统计学第二版五年制临床医学等本科生用一单项选择题 1.观察单位为研究中的 d. A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由 c . A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是b. A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指b . A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.随机抽样,下列那一项说法是正确的 a . A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加或减同一数后 b . A.均数不变,标准差改变 B.均数改变,标准差不变

C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用 a. A.变异系数 B.差 C.极差 D.标准差 8.以下指标中 d可用来描述计量资料的离散程度. A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用 c描述其分布的集中趋势. A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后, b不变. A.算术均数 B.标准差 C.几何均数 D.中位数 11. a 分布的资料,均数等于中位数. A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种 c 分布. A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用 c 描述其集中趋势. A.均数 B.标准差 C.中位数 D.四分位数间距 14. c小,表示用该样本均数估计总体均数的可靠性大. A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是 c. A. 算术平均数 B.中位数 C.几何均数 D. 平均数 16.变异系数CV的数值

医学统计学历年考题及答案

医学统计学历年考题及答案Lt D

试题】2021-01-05/山东大学/医学院/2021级/研究生/医学统计简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料〔分组变量无序,指标变量有序〕,用了卡方检验,问你对不对?为什么?如果是你,用什么? 3 假设检验的根本思想和原那么 4 给了多元线性回归的资料〔列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值〕,判断哪个方程回归效果最好,为什么? 5 给了甲流的例子,用某药治疗,用了自身对照〔用药前后抗体浓度变化为指标〕,得出了药物有效。问你合不合理,为什么?你的设计是什么? 6一型错误和二型错误的区别和联系 7什么是抽样误差?举例说明分类资料和数量资料的抽样误差计算 1 给了健康人的白天和晚上血压的相关数值〔x和y各自的平均数,和,平方和,以及两者差值的均数等〕注:计算时直接带入公式的相关数值 〔1〕比拟白天晚上血压有无差异(配对t检验计算) 〔2〕白天和晚上血压有无相关(相关分析) 〔3〕如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是

否相同〔方差分析〕 〔也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分〕 3 样本率与总体率的比拟(u检验)〔也有人说:配伍组方差分析〕 2021 1. 列出样本标准误的估计值的公式,至少五个〔包括两样本差值的标准误,两样本率差值的标准误等〕 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式 3. 数值资料的统计描述指标?公式? 4. 多元回归模型的根本形式?参数含义?回归效果的评价? 5. 什么叫截尾值?产生原因?举例说明 6. 一同学两样本率的比拟用了卡方检验,你有什么建议?假设不符合卡方检验的应用条件,你又有什么建议?他再比拟三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议? 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值

医学统计学 问答题考试必备

医学统计学问答题 1.试述医学参考值范围的制定方法。 答:(1)选择足够数量的正常人作为参照样本。所谓“正常人”指排除了影响所研究指标的疾病和有关因素的同质人群。(2)对选定的正常人进行准确的测定。要严格控制检测误差,同时必须对测量条件做出统一的规定和说明。(3)决定取单侧还是双侧范围值。根据研究目的和专业知识选择适当的方法,一般选用双侧。(4)选择适当的百分范围。最常用的百分界限是95%。(5)估计参考值范围的界限。最基本的有百分位数法和正态分布法。 2.相对数使用时应注意哪些问题? 答:(1)分析时构成比和率不能混淆构成比说明事物内部各部分所占的比重或分布,不能说明某现象发生的强度或频率大小。(2)使用相对数时,分母不易过小分母过小时结果不稳定。观察单位数少时最好用绝时数表示。(3)要注意资料的可比性用以比较的资料应是同质的,除了研究因素之外,其余的因素应相同或相近。(4)要注意使用率的标准化对于内部构成不同的资料,应先进行标准化后再做比较。(5)要考虑存在抽样误差,样本之间的差异应做统计学检验。 3.试述线性相关系数与线性回归系数的意义。 答:线形相关系数是说明具有直线关系的两个变量间相关密切程度和相关方向的统计量。它没有测量单位,其数值为 -1≤r≤+1。r为正,表示正相关;r为负,表示负相关;r为0,表示零相关即无直线关系;r绝对值为1时,表示完全相关。 线形回归系数是表示两变量之间的依存关系的统计量,它的数值表示当自变量变化一个单位,因变量随之变化的单位数。 4. 描述计量资料离散趋势的指标有哪些?试述各指标的应用条件。 描述计量资料离散趋势的指标有极差、四分位数间距、方差和标准差、变异系数。 (1)极差(全距):应用于粗略地说明变量的变动范围。 (2)四分位数间距:应用于偏态分布的资料、开口资料或分布不明的资料。 (3)方差和标准差:应用于正态分布的资料。 (4)变异系数:应用于均数相差较大或单位不同的几组观察值得变异程度的比较。 5.正态分布的特征: 1)正态分布以均值u为中心,左右对称。X取值范围理论上没有边界,x离u越远,函数值越接近0,但是不会是0。2)正态分布中,曲线下面积集中在以均值u为中心的中心部分,越远离中心,曲线越接近x轴,曲线下面积越小,超过一定范围以外的面积可以忽略。 3)所有的正态分布曲线在u左右的相同倍数的标准差范围内面积相同,并且在u+-0范围内的面积约为68.3%,在u+-1.96o 范围内是95%,在u+-2.58o范围内是99%。 4)正态分布完全由参数u和决定。u是位置参数,决定分布区县在横轴上的偏轴位置是0。o是变异系数,决定分布曲线的形态。 6.非参数检验的使用条件: 1)总体分布的偏态或者分布形式的位置的计量资料。2)登记资料。3)个别数据偏大或者数据的某一端无确定的数值。4)各组离散程度相差悬殊,即各总体方差不齐。 7.方差分析基本思想和使用条件。 1)基本思想:将全部观察值的总变异按影响实验结果的诸因素分解为若干变异,构造出反映各部分变异作用的统计量,之后构造假设检验统计量f。实现对总体均数的推断。 2)使用条件:各样本相互独立的随机样本;各样本均来自正态分布总体;各总体方差相等。

医学统计学执医考试超全题库(14章69页附答案)

一、统计学的几个基本概念 一、A1 1、下列关于概率的说法,错误的是 A、通常用P表示 B、用于描述随机事件发生的可能性大小 C、某事件发生的频率即概率 D、在实际工作中,概率常难以直接获得 E、某事件发生的概率P≤0.05时,称为小概率事件 2、用样本的信息推断总体,样本应该是 A、总体中的典型部分 B、总体中有意义的一部分 C、从总体中随便抽取的一部分 D、总体中有价值的一部分 E、从总体中随机抽取的一部分 3、欲测量某地2002年正常成年男子的血糖值,其总体为 A、该地所有成年男子 B、该地所有成年男子血糖值 C、2002年该地所有正常成年男子血糖值 D、2002年所有成年男子 E、2002年所有成年男子的血糖值 4、下列关于总体和样本说法正确的是 A、总体的指标称为参数,用拉丁字母表示 B、样本的指标称为统计量,用希腊字母表示 C、总体中随机抽取的部分观察单位组成了样本 D、总体中随机抽取的部分观察单位的变量值组成了样本 E、总体中随意抽取的部分观察单位的变量值组成了样本 5、计量资料的正确定义是指 A、每个观察单位的观测值都是绝对数的资料 B、每个观察单位的观测值都是相对数的资料 C、每个观察单位的观测值都是平均数的资料 D、每个观察单位都有1个数值,无论该观测值是绝对数、相对数还是平均数的资料 E、将每个观察单位按某种属性或类别分组,然后清点各组的观测单位数得到的资料 6、总体的定义是指根据研究目的确定的 A、所有样本的全体 B、观察单位的全体 C、根据研究目的确定的同质观察单位的全体 D、观察单位某种变量值的集合 E、样本中同质观察单位某种变量值的集合 7、统计推断的两个方面为 A、点估计与区间估计

医学统计学第七版课后答案及解析

医学统计学第七版课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1 答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2 答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3 答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P值得出相互比较是否有差别的结论。 4 答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的 指标可由“全体”数据算出。 5 答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6 答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析

医学统计学试题及答案

医学统计学试题及答案 (一)单项选择题3.抽样的目的是(b)。 a.研究样本统计量b.由样本统计量推断总体参数c.研究典型案例研究误差d.研究 总体统计量4.参数是指(b)。 a.参予个体数b.总体的统计数据指标c.样本的统计数据指标d.样本的总和5.关 于随机抽样,以下那一项观点就是恰当的(a)。 a.抽样时应使得总体中的每一个个体都有同等的机会被抽取b.研究者在抽样时应精心挑选个体,以使样本更能代表总体c.随机抽样即随意抽取个体 d.为保证样本具备更好的代表性,样本量应当越大越好6.各观测值均提(或减至) 同一数后(b)。 a.均数不变,标准差改变 b.均数改变,标准差不变 c.两者均不变 d.两者均改变7.比 较身高和体重两组数据变异度大小宜采用(a)。a.变异系数b.差 c.极差 d.标准差8.以下指标中(d)需用去叙述计量资料的线性程度。a.算术均数b.几何均数c.中位数d.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。a.算术均数b.标准差 c.中位数 d.四分位数间距10.各观测值同除以一个不等同于0的常数后,(b)维持 不变。a.算术均数b.标准差c.几何均数d.中位数11.(a)原产的资料,均数等同于中 位数。a.等距b.左偏态c.右偏态d.偏态12.对数正态分布就是一种(c)原产。a.正态b.对数正态c.左偏态d.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用(集中趋势。 a.均数 b.标准差 c.中位数 d.四分位数间距 14.(c)小,表示用该样本均数估计总体均数的可靠性大。a.变异系数b.标准差c. 标准误d.极差 15.血清学滴度资料最常用去则表示其平均水平的指标就是(c)。a.算术平均数b.中位数c.几何均数d.平均数 c)描述其16.变异系数cv的数值(c)。 a.一定大于1 b.一定大于1 c.可以大于1,也可以大于1 d.一定比标准差大17.数列8、-3、5、0、1、4、-1的中位数就是(b)。a.2b.1c.2.5d.0.519.关于标准差,那项就是错 误的(d)。

医学统计学方法试题及答案(一)

医学统计学方法试题及答案(一) 1.呈对数正态分布的数值变量资料,描述集中趋势的指标最宜选用() A.几何均数 B.众数 C.算术均数 D.调和均数 E.中位数 2.某课题组获得某校新入学大学男生腹部皮下脂肪厚度(cm)和身高(cm)资料,现比较这两个变量的离散趋势,最佳的指标是() A.变异系数 B.全距 C.方差或标准差 D.偏度系数 E.四分位数间距 3.研究者预比较两种中成药对口腔溃疡的治疗效果是否有差别,用“有效、一般、无效”作为评价疗效的指标。宜采用的统计分析方法是() A.t检验 B.方差分析 C.Z检验 D.秩和检验 E.回归分析 4.不是四分位数间距特点的是() A.适用条件同中位数 B.反映数值变量资料的离散趋势 C.较极差稳定 D.考虑了每个变量值的变异情况

E.不受两端极大值、极小值的影响 5.对于正偏态分布的资料,M与X的关系为() A.M=X B.MX D.M=2X E.M与X无确定关系 6.某种人群(如成年男子)的某个生理指标(如收缩压)或生化指标(如血糖水平)的正常值范围一般指() A.该指标在所有人中的波动范围 B.该指标在所有正常人中的波动范围 C.该指标在绝大部分正常人中的波动范围 D.该指标在少部分正常人中的波动范围 E.该指标在一个人不同时间的波动范围 7.对于一组经对数变换后亦不服从正态分布的偏态分布资料,描述该组的离散趋势应选用() A.方差 B.样本标准差 C.总体标准差 D.四分位数间距 E.变异系数 8.不是正态分布特征的是() A.曲线位于横轴上方均数处最高 B.以零为中心,左右对称 C.均数为其位置参数

医学统计学--问答题

1、标准正态分布(u分布)与t分布有何异同? 相同点:集中位置都为0,都是单峰分布,是对称分布,标准正态分布是t分布的特例(自由度是无限大时)不同点:t分布是一簇分布曲线,t 分布的曲线的形状是随自由度的变化而变化,标准正态分布的曲线的形状不变,是固定不变的,因为它的形状参数为1。 3、简述直线回归与直线相关的区别。 1资料要求上不同:直线回归分析适用于应变量是服从正态分布的随机变量,自变量是选定变量;直线相关分析适用于服从双变量正态分布的资料。 2 两种系数的意义不同:回归系数是表明两个变量之间数量上的依存关系,回归系数越大回归直线越陡峭,表示应变量随自变量变化越快;相关系数是表明两个变量之间相关的方向和紧密程度的,相关系数越大,两个变量的关联程度越大。 第一章医学统计中的基本概念 2、抽样中要求每一个样本应该具有哪三性? 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。 3、什么是两个样本之间的可比性? 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 实习一统计研究工作的基本步骤 1、什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何了解与区别? 医学统计学:是运用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科 统计学:是研究数据的收集、整理、分析与推断的科学。 卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。 生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计,取样,分析,资料整理与推论的科学。 2、医学统计的资料主要来源于那些方面?有何要求? 医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。 这些资料的手机过程中,必须进行质量抗旨,包括它的统一性、确切性、可重复性。这些原始数据的精读和偏性应有明确的范围。 3、医学统计学的资料类型有哪些? (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数

医学统计学习题及答案

医学统计学习题及答案Revised at 16:25 am on June 10, 2019

一、最佳选择题 1.卫生统计工作的步骤为 c A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为

相关主题
相关文档
最新文档