(完整word版)医学统计学第二版高等教育出版社课后习题答案

第一章绪论

1.举例说明总体和样本的概念。

研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。

2.简述误差的概念。

误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。

3.举例说明参数和统计量的概念。

某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。

4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就

是所谓的小概率事件原理,它是进行统计推断的重要基础。

第二章调查研究设计

1.调查研究主要特点是什么?

调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。

2.简述调查设计的基本内容。

①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。

3.试比较常用的四种概率抽样方法的优缺点。

(1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。

(2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。

(3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。

(4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机抽样的误差,。

4.常用的非概率抽样方法有哪些?

有偶遇抽样、立意抽样、定额抽样、雪球抽样等。

5.简述调查问题的顺序安排。

调查问题顺序安排总原则:①符合逻辑②一般问题在前,特殊问题在后③易答题在前,难答题在后④如果采用封闭式和开放式相结合的问题,一般先设置封闭式问题⑤敏感问题一般放在最后。此外,在考虑问题顺序时,还应注意问题是否适合全部调查对象,并采用跳答的形式安排问题和给出指导语。

第四章定量资料的统计描述

1.均数、中位数、几何均数的适用范围有何异同?

相同点是都用于描述定量资料的集中趋势。不同点:①均数用于单峰对称分布,特别是正态分布或近似正态分布的资料②几何均数用于变量值间呈倍数关系的偏态分布资料,特别是变量经过对数变换后呈正态分布或近似正态分布的资料③中位数用于不对称分布资料、两端无确切值的资料以及分布不明确的资料。

2.同一资料的标准差是否一定小于均数?

同一资料的标准差不一定小于均数。均数描述的是一组同质定量变量的平均水平,而标准差是描述单峰对称分布资料离散程度最常用的指标。标准差大,表示观察值之间变异大,即一组观察值的分布较分散;标准差小。表示观察值之间变异小,即一组观察值的分布较集中。若标准差远大于均数表明数据离散程度较大,可能为偏态分布,此时应考虑改用其他指标来描述资料的集中趋势。

3.极差、四分位数间距、标准差、变异系数的适用范围有何异同?

相同点是都用于描述资料的离散程度。不同点:①极差可用于描述单峰对称分布小样本资料的离散程度,或用于初步了解资料的变异程度②四分位数间距可用于

描述偏态分布资料、两端无确切值或分布不明确的资料的离散程度③标准差用于描述正态分布或近似正态分布资料的离散程度④变异系数用于比较几组计量单位不同或均数相差悬殊的正态分布资料的离散程度。

4.正态分布有哪些基本特征?

①正态曲线在横轴上方均数处最高②正态分布以均数为中心,左右对称③正态分布有两个参数,即位置参数μ和形态参数σ④正态曲线下的面积分布有一定规律,正态曲线与横轴间的面积恒等于1。曲线下区间(μ-1.96σ,μ+1.96σ)内的面积为95.00%;区间(μ-2.58σ,μ+2.58σ)内的面积为99.00%

5.制定医学参考值范围时,正态分布法和百分位数法分别适用于何种资料?

①通过大量调查证实符合正态分布的变量或近似正态分布的变量,可按正态分布曲线下面积的规律制定医学参考值范围,服从对数正态分布的变量,可对观察值取对数后按正态分布法算出医学参考值范围的对数值,然后求其反对数②对于经正态性检验不服从正态分布的变量,应采用百分位数法制定医学参考值范围。

第五章、定性资料的统计描述

1.应用相对数时需要注意哪些问题?

①应有足够的观察单位数;②不能以构成比代替率;③计算观察单位数不等的及格率的合计率和平均率时,不能简单的把各组率相加求其平均值而得,而应该分别将分子和分母合计,再求出合计率和平均率;④相对数的比较应注意其可比性,如果内部构成不同,应计算标准化率;⑤样品率或样品构成比的比较应作检验假设。

2.为什么不能以构成比代替率?

率是指某现象实际发生数和某时间点或某时间段可能发生该现象的观察单位总数之比,用以说明该现象发生的频率或强度。构成比是指事物内部某一组成部分观察单位数与同一事物各组成部分的观察单位总数之比,以说明事物内部各组成部分所占比重,不能说明某现象发生的频率或强度大小。

3.标准化率计算的直接法和间接法的应用有何区别?

如对死亡率的年龄构成标准化,当已知被标化组的年龄别死亡率时,宜采用直接法;当不知道被标化组的年龄别死亡率,只有年龄别人口数和死亡总数时,可采用间接法。

4.常用动态数列分析指标有哪几种?各有何用途?

绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

绝对增长量是指事物现象在一定时期增长的绝对值;发展速度与增长速度都是相对比指标,用以说明事物现象在一定时期的速度变化;平均发展速度是指一定时期内个环比发展速度的平均值,用以说明事物在一定时期内逐年的平均发展速度;与平均增长速度是说明事物在一定时间内逐年的平均增长速度。

5.率的标准化需要注意那些问题?

①仅用于相互间的比较,实际水平应采用未标化率来反映。②样品的标化率是样品指标,存在抽样误差,若要比较其代表的总体标准化率是否相同,需作假设检验。③注意直接法和间接法的选用。④各年龄组若出现明显交叉,或呈非平行变化趋势时,不适合采用标准化法,宜分层比较各年龄组率。此外,对于因其他条件不同,而非内部构成不同引起的不可比性问题,标准化法难以解决。

第六章总体均数的估计

1、什么是均数的抽样误差?决定均数的抽样误差大小的因素有哪些?

抽样研究中,由于同质总体中的个体间存在差异,即个体变异,因而从同一总体中随机抽取若干样本,样本均数往往不等于总体均数,且各样本均数之间也存在差异。这种由个体变异产生的、随机抽样引起的样本均数与总体均数间的差异称均数的抽样误差。决定均数抽样误差大小的因素主要为样本含量和标准差。

2、样本均数的抽样分布有何特点?

样本均数的抽样分布特点有:1、各样本均数未必等于总体均数;2、样本均

数之间存在差异;3、样本均数服从正态分布;4、样本均数的变异范围较原变量的变异范围小;5、随着样本含量的增加,样本均数的变异范围逐渐缩小。

3、阐述标准差与标准误的区别与联系。

标准差与标准误的区别在于:1、计算公式不同;2、统计学意义:标准差越小,说明个体值相对越集中,均数对数据的代表性越好;而标准误越小,说明样本均数的分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大;3、用途:标准差用于描述个体值的变异程度,标准误用于描述均数的抽样误差大小。

标准差与标准误的联系:当样本量n一定时,标准误随标准差的增加而增加,公式为:看小抄。

4、如何运用抽样分布规律估计总体均数?

中心极限定理:从均数为u,标准差为σ的正态总体中进行独立随机抽样,其样本均数服从均数为u,标准差为σ/根号下u的正态分布;即使是从非正态总体中进行独立随机抽样,当样本含量逐渐增加时(n大于等于50),其样本均数的分布近似于均数为u,标准差为σ/根号下u的正态分布。σx越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之,σx越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。

5、阐述总体均数的置信区间与医学参考值范围的区别。

第七章假设检验

1、解释零假设与备择假设的含义。

零假设又称无效假设或无差异假设,记为H0,表示目前的差异是由抽样误差引起的;备择假设又称对立假设,记为H1,表示目前的差异是因为比较的对象之间存在本质不同造成的。

2、简述假设检验的基本步骤。

假设检验的基本步骤如下:(1)建立检验假设,确定检验水准。(2)计算检验统计量。(3)确定P值,作出统计推断。

3、比较单侧检验与双侧检验的区别。

选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。例如,在临床试验中,比较甲、乙两种治疗方法的疗效有无差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。若从专业角度无法确定的情况下,一般应采用双侧检验。

4、解释I型错误、II型错误和检验效能,并说明它们之间的关系。

拒绝实际成立的H0所犯的错误称为I型错误,记为α。不拒绝实际不成立的H0所犯的错误称为II型错误,记为β。如果两个总体参数间确实存在差异,即H1:μ≠μ0成立,按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝H0)的能力被称为检验效能,记为(1-β)。

三者的关系为:当样本量确定时,α与β成反比,与(1-β)成正比。如果把α设置得很小,势必增加犯II型错误的概率,从而降低检验效能;反之,如果把

重点放在减少β上,势必增加犯I型错误的概率,从而降低了置信度。要同时减小α和β,只有通过增加样本含量来实现。

5、简述假设检验与置信区间估计的联系。

假设检验与置信区间估计的联系是:二者都属于统计推断的范畴,且统计推断结论是等价的。此外,置信区间在回答差别有无统计学意义的同时,还能提供一些假设检验不能提供的信息,并可以提示差别是否具有实际意义。因此,置信区间与假设检验的作用是相辅相成的,将两者结合起来,可以提供更为全面的统计推断信息。

第八章t检验

1、在t检验中,一般当P〈0.05,则拒绝H0,其理论根据是什么?

理论根据是小概率时间和小概率反证法。P值表示H0成立时,出现等于及大于(或等于及小于)现有样本统计量的概率。P〈0.05则表示在H0成立的前提下,得到现有样本统计量概率为小概率事件,所以拒绝H0。

2、配对t检验的应用条件是什么?

配对t检验的应用条件是资料为配对设计,且数据差值服从正态分布。

3、正态性检验时,如何确定检验水准α?

理论上讲α应取得大一些,如0.10或0.20,目的是减少犯II型错误的概率;在实际应用中,常取α=0.10。

4、变量变换的目的是什么?

变量变换的目的在于使变换后的资料满足正态分布或方差齐性等条件,便于进一步的统计分析。

第九章方差分析

1、方差分析的基本思想及其应用条件是什么?

方差分析的基本思想是把全部观察值的总变异按设计类型分解成两个或多个组成部分,然后将各部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。应用条件:各样本是相互独立的随机样本,且服从正态分布,各样本的总体方差齐性。

2、在完全随机设计方差分析中SS总、SS组间、SS组内各表示什么含义?

SS总是各观察值与总均值之差的平方和,即总离均差平方和,表示总变异的大小;SS组间表示组间变异,指各处理组均值大小的不同,是由处理因素和随机误差造成的;SS组内表示组内变异,指同一处理组内部各观察值之间的变异,是由随机误差造成的。

3、什么是交互效应?请举例说明。

交互效应是指某一因素的效应随另一因素不同水平的变化而变化,称这两个因素之间存在交互效应。例如:某实验研究A、B两种药物在不同剂量情况下对某病的治疗效果,药物A在不同剂量时,B药的效应不同,或者药物B在不同剂量时,A药的效应不同,则A、B两药间存在交互效应。

4、重复测量资料具有何种特点?

重复测量资料中的处理因素在受试者间是随机分配的,受试者内的因素即时间因素是固定的,不能随机分配;重复测量资料各受试者内的数据彼此不独立,具有相关性,后一个时间点的数据可能受到前面数据的影响,而且时间点离的越近的数据相关性越高。

5、为什么总的方差分析的结果为拒绝零假设时,若想进一步了解两两之间的差别需要进行多重比较?

方差分析中备择假设是多个总体均数不等或不全相等,拒绝原假设只说明多个总体均数总的来说差别有统计学意义,并不能说明任意两总体均数之间均有差别。因此,若希望进一步了解两两的差别,需进行多重比较。

第十章、二项分布和Poisson分布

1.Bernoulli试验的适用条件

答:1.每次试验只会发生两种互斥结果之一,即两种互斥结果的概率之和恒等于1;2.在相同试验条件下,每次试验产生某种结果的概率固定不变;3.重复试验是互相独立的,即任何一次试验结果的出现不会影响其他试验结果出现的概率。2. Poisson分布的性质

答:1.总体均数μ与总体方差相等;2.当n很大,而π很小,且nπ=μ为常数时,Poisson分布可看作是二项分布的极限分布;3.当μ增大时,Poisson分布渐近正太分布,一般而言μ≥20时,Poisson分布资料可作为正态分布处理;4. Poisson 分布具备可加性;5.μ的大小决定了Poisson分布的图形特征。

3.二项分布与Poisson分布的区别

答:随机变量X服从二项分布,是指在n重Bernoulli试验中,发生某种结果的次数X=0,1,2…,n的一种概率分布,其恰好发生X个阳性的概率为P(X)=(公式),且总有概率总和=1.而随机变量X服从Poisson分布,是指X满足①取值范围为0,1,2…,n;②相应的概率为P(X)=e-μ·μx/X!,且总有概率总和=1。在总体率π很小,而样本含量n趋向于无穷大时,二项分布近似于Poisson 分布。因此Poisson分布可看作是二项分布的一种极限情况,可用来描述小概率事件的发生规律。

4.二项分布、Poisson分布和正态分布的联系

答:1.在n很大,而π很小,且nπ=μ为常数时,二项分布的极限分布为Poisson 分布;2.在n较大、π不接近0也不接近1时,二项分布B(n,π)近似正态分布,而相应的样本率p的分布也近似正态分布;3.当μ增大时,Poisson分布渐近正态分布,一般μ≥20时,Poisson分布资料可作为正态分布处理。

第十一章、x2检验

1. x2检验的基本思想是什么?可以用于解决哪些问题?

答:基本思想:在H0成立的条件下,推算出各个格子的理论频数T,然后利用理论频数T和实际频数A构造x2统计量,(公式),反映实际频数与理论频数的吻合程度。若无效假设H0成立,则各个格子的A与T相差不应该很大,即x2统计量不应该很大。A与T相差越大,x2值越大,相对应的P值越小,当P≤α,则越有理由认为无效假设不成立,继而拒绝H0,作出统计推断。由于格子越多,x2值也会越大,因而考虑x2值大小的意义时,应同时考虑格子数的多少,这样x2值才能更准确地反映A与T的吻合程度。

x2检验可用于:独立样本两个或多个率或构成比的比较,配对设计两样本率的比较,频数分布的拟合优度检验,线性趋势检验。

2.四格表的Z检验和x2检验有何联系

答:能用四格表Z检验进行两样本率比较的资料,都可以用x2检验。四格表的双侧Z检验与x2检验是完全等价的,两个统计量的关系为Z2= x2,相对应的界值关系为Z2(底数0.05/2)= x2(底数0.05,1)

3.拟合优度x2检验的基本思想及用途

答:基本思想是根据样本的频数分布检验其总体是否服从某特定的理论分布。按照该理论分布计算的频数称为理论频数;从样本观察到的频数称为实际频数。利用x2检验,推断实际频数与理论频数的吻合程度。

4.为什么有些四格表资料的假设检验必须用确切概率法

答:x2检验的理论是基于x2分布,但是只有在大样本时检验统计量才近似服从x2分布,才能使用x2检验公式。如四格表资料,若n≥40,且有1≤T<5时,尚可以校正检验统计量使其近似服从x2分布;当n<40时,这种近似性就很差,x2检验就不适用了,只能用确切概率法。

5. x2检验的应用条件有哪些?

答:1.①当n≥40,且≥5时,用非连续校正的x2检验(公式)

②当n≥40,且有1≤T<5时,用连续性校正的x2检验或用四格表的确切概率

法。(公式)

③当n<40或T<1时,用四格表确切概率法。

2.独立样本R×C列联表x2检验的专用公式为:。。。

①不宜有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1.

②结果为有序多分类变量的R×C列联表,在比较各处理组的平均效应有无差别时,应该用秩和检验或Ridit检验。

3.配对四格表的x2检验

①当b+c≥40时,(公式)

②当b+c<40时,作连续性校正,(公式)

第十二章、秩和检验

1.参数检验和非参数检验的区别

答:参数检验是以特定的总体分布为前提,对未知总体参数做推断的假设检验方法;非参数检验不以特定的总体分布为前提,也不针对决定总体分布的参数做推断,又称任意分布检验。非参数检验不要求总体的分布类型,适用性广泛;在非参数检验中,一般不直接用样本观测值做分析,统计量的计算基于原数据在样本中的秩次,因此对于符合参数检验的资料,或经变量变换后符合参数检验的资料应首选参数检验;对不满足参数检验条件的资料,应选用非参数检验。

2.非参数检验的适用范围

答:①总体分布不明或未知的资料;②一端或两端有不确实数值的资料;③等级资料;④极度偏态分布的资料。

3.同一资料,又出于同一研究目的,当参数检验和非参数检验所得结果不一致时,以何者为准?理由

答:应以资料满足的条件为准。若资料满足参数检验的条件,应以参数检验的结

果为准,此时非参数检验的检验效能低于参数检验。若资料不服从正态分布,或者分布情况未知,不能用参数法进行推断,宜采用非参数法对总体分布位置进行假设检验。

第十三章双变量关联性分析

1.两变量间的关联性是否可解释为因果关系?

双变量关联性分析的目的在于推断从某一总体中随机抽取的同一份样本观测出的两个关联间是否存在关联性,以及这种关联性的密切程度如何。关联性只反应变量间数量上的关系,但数量上的关联并不表示专业上的因果关系,是否确为因果关系还需结合专业知识、因果逻辑上的时间先后顺序等作进一步判定。

2.2X2列联表的关联性分析与两样本率的比较的x2检验有何不同?

2X2列联表的关联性分析与两样本率比较的x2检验是从两个检验的数据形式非常相似,x2检验的公式以及应用条件也完全不同。但区别在于:两样本率比较的x2检验是从两个总体中分别抽取样本,两样本有各自的频数分布,所检验的是两总体的率是否相同;而2X2列联表的关联性分析是从同一个总体中进行随机抽样,对样本中的每个个体考察其两个变量的关系,检验两个分类之间是否存在关联性或者说是否独立。

3、相关系数r经假设检验有统计学意义,且得到的P值很小,是否表示两变量间一定有很强的直线关系?

P值越小,说明越有理由拒绝H0,犯I型错误的概率越小。相关系数r经假设检验有统计学意义且得到非常小的P值,表示有足够的理由认为两变量总体相关系数ρ≠0,只能定性回答两变量是否存在直线相关,并非意味着其直线相关的强度。若要定量回答相关性的强弱,需结合样本相关系数r的大小和总体相关系数ρ的置信区间来说明。

4.Pearson积矩相关与Spearman秩相关的区别与联系

答:区别1. Pearson积矩相关适用于二元正态分布资料,Spearman秩相关适用于

不服从正态分布、总体分布未知、存在极端值或原始数据用等级表示的资料。②Pearson积矩相关是基于原始数据进行统计分析,而Spearman秩相关是将原始数据进行秩变换后进行统计分析。③Pearson积矩相关是参数检验方法,而Spearman 秩相关不以特定的总体分布为前提,为非参数检验的方法。

联系:1.两种相关系数的取值都介于—1和1之间,无单位,小于0为负相关,大于0为正相关。2.用原始数据的秩次来计算Pearson相关系数,得到的即为Spearman秩相关系数。

第十五章生存分析

1.简述生存分析中截尾数据的常见原因。

①失访:指失去联系。②退出:指死于非研究因素或非处理因素而退出研究。③终止:指设计时规定的研究时限已到而终止观察,但研究对象依然存活。

2.简述生存率和生存概率的区别与联系。

生存概率表示某单位时段开始时存活个体到该时段结束时仍存活的可能性大小;生存率是指观察对象活过某时刻的概率,实质上是累积生存概率。生存概率是单位时段的概率,生存率是多个时段的累计结果。

3.简述死亡率和死亡概率的区别与联系。

死亡概率是指在某个单位时段开始时存活的个体在该时段内死亡的可能性大小;死亡率表示所有观察对象在某时刻的平均死亡水平。二者分母不同,死亡率的分母常用其中人口数,而死亡概率则用期初人数。

4.生存时间资料能计算均数和标准差吗?

如果资料所包含的数据都是完全数据,可以计算均数和标准差;若资料中包含截尾数据,则不可以计算。

5.简述两样本比较的生存时间资料不宜采用t检验或x方检验进行分析的理由。因为随访资料具有特殊性,观察对象既有随访时间又有随访结果,随访期间可能

出现失访等,生存时间数据不完整,分布类型复杂,因而不能简单的应用t检验或x方检验。

第二十章检测手段的效度和信度评价

1.简述效度、信度的概念和目的。

效度用以反映测量结果与“真值”的接近程度。信度用以反映相同条件下重发测定结果的一致程度。评价效度、信度的目的是评价量表对真实情况反映的准确性、可靠性。

2.简述评价效度和信度的常用方法及其特点。

评价效度的常用方法有:标准效度分析、内容效度分析、结构效度分析、区分效度分析。

评价信度的常用方法有:重复测量法、分半信度法、Cronbach’s a系数法。特点:标准效度分析需要一个“金标准”作为参考;内容效度分析对概念的定义有依赖性;结构效度分析需借助因子分析来完成;区分效度分析通过t检验或方差分析可比较不同群组间的差别有无统计学意义。重复测量法需要重复两次或两次以上测量;分半信度法将调查的问题条目分成两半;Cronbac h’s a系数法适用于奇偶两半条目方差不等的情况。

3.简述分半信度法的优点和不足。

优点:分半信度法只在一个时间点上进行;不受记忆效应的影响;在重复测量法中容易出现的误差项之间的相关在分半信度法中不易出现;分半信度法比较经济和简便。

不足:将所有的问题条目分为两半的方法有些武断,不同的半分法可能会得到不同的结果。

4.简述如何考察测量手段和反应度。

①使用测量手段分别在治疗前后或施加干预措施前后对研究对象进行测量,记录

治疗前后或施加干预措施前后的测量结果。

②使用效应尺度统计量评价测量的反应度。效应尺度=(治疗后得分—治疗前得分)/治疗前后得分的标准差

第二十一章医学人口与疾病统计常用指标

1.疾病统计中的观察单位“病例”和“病人”有何区别?

疾病统计的观察单位可以是病人,也可以是病例。一个人每发生一次疾病就算是一个病例,一个病人可以先后数次患同一种疾病,也可以同时患数种不同的疾病。

2.发病率、时点患病率、期间患病率有何区别?

发病率表示在一定时期内,可能发生某病的一定人群中新病例出现的频率,其分子是一定期间内的新发病例数。患病率指在某特定时间内总人口中某病新旧病例所占比例,适用于病程较长的疾病或发病时间不易轻易明确的疾病的统计研究,按观察时间的不同可分为时点患病率和期间患病率。时点患病率用于反映在调查或检查时点一定人群中某病的现患情况(包含该病的新、旧病例);期间患病率可用于反映在观察期间内一定人群存在或流行某病的频度,包括观察期间内的新病例数和现患病例数,但资料收集较为困难。

3.年龄别死亡概率与年龄别死亡率有何区别?两者间有什么关系?

年龄别死亡概率(nqx)是表示一批人在x到x+n岁之间的死亡概率,即同时出生的人群中,刚满x岁的尚存者在今后n年内死亡的可能性。因此,死亡概率的公式定义为:nqx=(x岁到x+n岁之间死亡人数)/活满x岁的人口数

而年龄别死亡率(nmx)是表示某年龄别人口在n年内的平均死亡水平,其公式定义为:nmx=(x岁到x+n岁之间死亡人数)/(x岁到x+n岁之间的平均人口数)

可见,两者分母不同,当年龄分组为1岁时,即n=1时,qx比mx略小,当

年龄分组大于1岁时,即n〉1时,则nqx约比nmx大n倍。死亡率与死亡概率之间可以互相换算,现有许多种由nmx推算nqx的方法,目前常用的计算死亡概率的公式为:nqx=2*n*nmx/(2+n*nmx)

4.平均寿命与平均死亡年龄有何区别?

平均寿命实际上是同时出生的一批人,以各年龄组死亡人数作为权数计算出来的平均岁数,其大小取决于各年龄组死亡人数的相对水平。用寿命表方法计算的平均寿命的大小,仅取决于年龄别死亡率的高低,两地的平均寿命可以直接比较。但平均死亡年龄的大小,不仅取决于年龄别死亡率的高低,也取决于年龄别人口构成。如用甲、乙两地的平均死亡年龄作比较,即使两地的年龄组死亡率完全相同,若甲地人口中青壮年比重较大,而老年人比重较小,可导致甲地平均死亡年龄较低。显然,这种平均死亡年龄的差别,是由于人口年龄构成不同所致,并不反映两地人口的平均寿命不同。因此,一般情况下,两地的平均死亡年龄不能直接比较,不能把平均死亡年龄当作平均寿命应用。

5.某地的平均寿命高,则老年人口占总人口数的比例一定很高,这种说法对吗?

这种说法不正确。用寿命表法计算的平均寿命,其大小仅取决于年龄别死亡率的高低,某地的平均寿命高,并不表明老年人口所占的比例高。如果人群的年龄别死亡率降低,尤其是婴幼儿组死亡率降低,该地人群的平均寿命就会增高。

医学统计学课后习题答案解析

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%

(完整word版)医学统计学第二版高等教育出版社课后习题答案

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就

统计学第二版的课后答案

附录1:各章练习题答案第1章绪论(略) 第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%)

25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4

5~10 7 合计 60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 (2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分布比A 班分散, 且平均成绩较A 班低。 2.8 2.9 L U 。 (2)17.21=s (万元)。 2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企 业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。 2.11 x =426.67(万元);48.116=s (万元)。 2.12 (1)(2)两位调查人员所得到的平均身高和标准差应该差不多相同,因为均值和标准差 的大小基本上不受样本大小的影响。 (3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。 2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于男生体重的离散系数0.08。 (2) 男生:x =27.27(磅),27.2=s (磅); 女生:x =22.73(磅),27.2=s (磅); (3)68%;

(完整版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学课后习题答案解析

医学统计学课后习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是: (1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。

医学统计学第二版答案

医学统计学第二版答案 【篇一:医学统计学(第六版)课后答案】 ) 第一章绪论 一、单项选择题 1. d 2. e 3. d 4. b 5. a 6. d 7. a 8. c 9. e 10. d 二、简答题 1 更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2 能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。3 计算参数估计的可信区间、假设检验的p 值得出相互比较是否有差别的结论。 4 述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的 5 差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6 第二章定量数据的统计描述 一、单项选择题 1. a 2. b 3. e 4. b 5. a 6. e 7. e 8. d 9. b 10. e 二、计算与分析 2 第三章正态分布与医学参考值范围 一、单项选择题 1. a 2. b 3. b 4. c 5. d 6. d 7. c 8. e 9. b 10. a 二、计算与分析

1 2 [参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。又因血铅含量仅过大为异常,故应计算只 有上限的单侧范围,即95p 。 第四章定性数据的统计描述 一、单项选择题 1. a 2. c 3. d 4. d 5. e 6. e 7. e 8. a 9. d 10. e 二、计算与分析 1[参考答案] 不正确,因为此百分比是构成比,不 是率,要知道男女谁更易患病,需得到1290名职工中的男女比例, 然后分别计算男女患病率。 2[参考答案] 不正确,此为构成比替代 率来下结论,正确的计算是用各年龄段的死亡人数除各年龄段的调 查人数得到死亡率。 3[参考答案] 不正确,此为构成比替代率来下 结论,正确的计算是用各型肝炎的新病例数除以同时期内可能会发 生该病的人群人口数得到发病率。 第五章统计表与统计图 一、单项选择题 1. e 2. d 3. b 4. e 5. d 6. e 7. e 8. e 9. e 10. d 1.[参考答案] 本表的缺点有:12、横表目与纵标目分类不明确,标 目设计不 3、线条过多,比例数小数位不统一。 2..[参考答案] 本题应用直方图表示839例正常人发汞值分布情况, 由于最后一组的组距与其它组不等,需要变成等组距。为保持原始 数据的组距一致为0.2,把最后一组频数转换为36/(0.6/0.2)=12 3.[参考答案] 将表中数据绘制成普通线图可以看出:60岁之前,男 女食管癌年龄别发病率随年龄增长的变化趋势差异较小,60岁之后,男性随年龄变化食管癌发病率比女性增长较快,差异明显扩大。 将表中数据绘制成半对数线图可以看出, 不同性别食管癌年龄别发病率随年龄变化的快慢速 度相当,且女性的趋势和转折点更清楚。应用半对数线图能够更恰 当地表示指标的变化趋势 第六章参数估计与假设检验 一、单项选择题 1. e 2. d 3. e 4. c 5. b 6. e 7. c 8. d 9. d 10. d 1. [参考答案] 样本含量为450,属于大样本,可采用正态近似的方 法计算可信区间。 2. [参考答案] 1n=1022n=1041p=94.4%2p=91.26%

《医学统计学》第二版习题(五年制临床医学等本科生用)

《医学统计学》第二版习题(五年制临床医学等本科生 用) 习题 (一)单项选择题绪论部分 1.观察单位为研究中的()。 A.样本B.全部对象C.影响因素D.个体2.总体是由()。 A.个体组成B.研究对象组成C.同质个体组成D.研究指标组成3.抽样的目的是()。 A.研究样本统计量B.由样本统计量推断总体参数C.研究典型案例研究误差D.研究总体统计量4.参数是指()。 A.参与个体数B.总体的统计指标C.样本的统计指标D.样本的总和5.关于随机抽样,下列那一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取B.研究者在抽样时应精心挑选个体,以使样本更能代表总体C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好第二章 6.各观察值均加(或减)同一数后()。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变7.比较身高和体重两组数据变异度大小宜采用()。A.变异系数B.差C.极差D.标准差

9.偏态分布宜用()描述其分布的集中趋势。A.算术均数B.标准差C.中位数D.四分位数间距 C.右偏态 D.偏态12.对数正态分布是一种()分布。A.正态B.近似 正态C.左偏态D.右偏态 14.()小,表示用该样本均数估计总体均数的可靠性大。 A.变异系数 B.标准差 C.标准误 D.极差 A.算术平均数 B.中位数 C.几何均数 D.平均数16.变异系数CV的数值()。 A.一定大于1 B.一定小于1 C.可大于1,也可小于1 D.一定比标准差小17.数列8、-3、5、0、1、 4、-1的中位数是()。 A.2 B.1 C.2.5 D.0.519.关于标准差,那项是错误的()。 A.反映全部观察值的离散程度 B.度量了一组数据偏离平均数的大小 C.反映了均数代表性的好坏 D.不会小于算术均数20.中位数描述集中位置时,下面那项是错误的()。 的平均水平,用那种指标较好()。A.平均数B.几何均数C.算术均 数D.中位数22.一组变量的标准差将()。A.随变量值的个数n的增大而 增大B.随变量值的个数n的增加而减小C.随变量值之间的变异增大而增 大D.随系统误差的减小而减小23.频数表计算中位数要求()。 A.组距相等 B.原始数据分布对称 C.原始数据为正态分布或近似正态分布 D.没有条件限制24.一组数据中20%为3,60%为2,10%为1,10%为0,则平均数为()。A.1.5B.1.9

《统计学》课后答案(第二版-贾俊平版)

《统计学》课后答案(第二版-贾俊平版)

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 章节主要内容学习要点 1.1 统计及其应用领域什么是统计学 ④概念:统计学,描述 统计,推断统计。 统计的应用领 域 ④统计在工商管理中的 应用。 ④统计的其他应用领 域。 1.2 数据的类型分类数据、顺 序数据、数值 型数据 ④概念:分类数据,顺 序数据,数值型数据。 ④不同数据的特点。 观测数据和实 验数据 ④概念:观测数据,实 验数据。

截面数据和时间序列数据④概念:截面数据,时间序列数据。 1.3 数据来源数据的间接来 源 ④统计数据的间接来 源。 ④二手数据的特点。 数据的直接来 源 ④概念:抽样调查,普 查。 ④数据的间接来源。 ④数据的收集方法。 调查方案设计④调查方案的内容。 数据质量 ④概念。抽样误差,非 抽样误差。 ④统计数据的质量。 1.4 统计中的几个基本概念总体和样本④概念:总体,样本。参数和统计量④概念:参数,统计量。 变量 ④概念:变量,分类变 量,顺序变量,数值型 变量,连续型变量,离 散型变量。 二、主要术语 1. 统计学:收集、处理、分析、解释数据并从数

据中得出结论的科学。 2. 描述统计:研究数据收集、处理和描述的统计 学分支。 3. 推断统计:研究如何利用样本数据来推断总体 特征的统计学分支。 4. 分类数据:只能归于某一类别的非数字型数 据。 5. 顺序数据:只能归于某一有序类别的非数字型 数据。 6. 数值型数据:按数字尺度测量的观察值。 7. 观测数据:通过调查或观测而收集到的数据。 8. 实验数据:在实验中控制实验对象而收集到的 数据。 9. 截面数据:在相同或近似相同的时间点上收集 的数据。 10. 时间序列数据:在不同时间上收集到的数 据。 11. 抽样调查:从总体中随机抽取一部分单位作 为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。 12. 普查:为特定目的而专门组织的全面调查。 13. 总体:包含所研究的全部个体(数据)的集

医学统计学题库

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析 第二章 第二章统计描述习题

《统计学》课后答案(第二版,贾俊平版)

第1章统计与统计数据 一、学习指导 统计学是处理和分析数据的方法和技术,它几乎被应用到所有的学科检验领域。本章首先介绍统计学的含义和应用领域,然后介绍统计数据的类型及其来源,最后介绍统计中常用的一些基本概念。本章各节的主要内容和学习要点如下表所示。 1. 统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。 2. 描述统计:研究数据收集、处理和描述的统计学分支。 3. 推断统计:研究如何利用样本数据来推断总体特征的统计学分支。 4. 分类数据:只能归于某一类别的非数字型数据。 5. 顺序数据:只能归于某一有序类别的非数字型数据。 6. 数值型数据:按数字尺度测量的观察值。 7. 观测数据:通过调查或观测而收集到的数据。 8. 实验数据:在实验中控制实验对象而收集到的数据。 9. 截面数据:在相同或近似相同的时间点上收集的数据。 10. 时间序列数据:在不同时间上收集到的数据。 11. 抽样调查:从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推 断总体特征的数据收集方法。 12. 普查:为特定目的而专门组织的全面调查。

13•总体:包含所研究的全部个体(数据)的集合。 14. 样本:从总体中抽取的一部分元素的集合。 15. 样本容量:也称样本量,是构成样本的元素数目。 16. 参数:用来描述总体特征的概括性数字度量。 17. 统计量:用来描述样本特征的概括性数字度量。 18. 变量:说明现象某种特征的概念。 19. 分类变量:说明事物类别的一个名称。 20. 顺序变量:说明事物有序类别的一个名称。 21. 数值型变量:说明事物数字特征的一个名称。 22. 离散型变量:只能取可数值的变量。 23. 连续型变量:可以在一个或多个区间中取任何值的变量。 第2章数据的图表展示 一、学习指导 数据的图表展示是应用统计的基本技能。本章首先介绍数据的预处理方法,然后介绍不同类型数据的整理与图示方法,最后介绍图表的合理使用问题。本章各节的主要内容和学习 要点如下表所示。

医学统计学练习题及答案

第一章医学统计中的基本概念 (1) 第二章集中趋势的统计描述 (3) 第三章离散程度的统计描述 (7) 第四章抽样误差与假设检验 (12) 第五章t检验 (14) 第六章方差分析 (20) 第七章相对数及其应用 (26) 第八章2 检验 (29) 第九章非参数检验 (35) 第十章线性相关与回归 (44) 第十一章多元线性回归与多元逐步回归 (50) 第十二章统计表与统计图 (56) 第十三章医学实验设计与诊断试验的评价 (60) 练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是

A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是: (1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。

医学统计学习题答案1

习题答案 第一章思考题答案 1.某医生收治200名患者,随机分成2组,每组100人。一组用A药,另一组用B药。经过2个月的治疗,A药组治愈了90人,B组治愈了85名患者,请根据现有结果评议下列说法是否正确,为什么? a)A药组的疗效高于B药组。(对,但不提倡这样说,原因是容易被误解) b)A药的疗效高于B药。(不对,这是针对总体而言的) 2.某校同一年级的A班和B班用同一试卷进行一次数学测验。经过盲态改卷后,公布成绩:A 班的平均成绩为80分,B班的平均成绩为81分,请评议下列说法是否正确,为什么? a)可以称A班的这次考试的平均成绩低于B班,不存在抽样误差。(对) b)通过这次考试的平均成绩,说明B班的数学平均水平高于A班.(不对,一次考试只是一次 抽样的结果) c)对于评价两个班级的数学平均水平而言,这次考试成绩只是一次抽样观察结果,所以存在 抽样误差,不能仅凭这次考试的平均分差异推断两个班级的平均水平的高低。(对) d)对于研究两个班级的这次考试成绩而言,A班所有学生的这次考试成绩构成了一个总体 A,B班所有学生的这次考试成绩构成了一个总体B.(对) 3. 请根据变量和资料分类的定义,评议下列说法是否正确,为什么? a)如果变量取值中含有小数点,则该变量为连续型变量。(不对,离散型变量取值也可以定义为取值含有小数点) b)如果资料为离散型变量的取值,则该资料一定为分类资料。(不对,如白细胞计数,这是离散型的资料,但不具有分类性质) c)某研究者观察某个患者的24小时的心电图,发现该患者在这24小时中共有90个早博,并记为90个早博/24小时,故该资料也有量纲。根据定义,应认为该资料为计量资料。(本质上这是个体计数资料,但因为不具有分类意义,所以通常按计数资料进行统计分析)

卫生统计学第二版习题册方积乾答案与解析

卫生统计学第二版习题册方积乾答案与解析 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤? 答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施;(2)不能随机分组;(3)很难控制干扰因素;(4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点? 答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便:缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。 (2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总

体中分布均匀,抽样误差较单纯随机抽样小:缺点是在某些情况下会出现偏性或周期性变化。(3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计:缺点是事先要进行分层,操作麻烦。(4)整群抽样:优点是易于组织和操作大规模抽样调查:缺点是抽样误差大。 3、调查设计包括那些基本内容? 答:(1)明确调查目的和指标;(2)确定调查对象和观察单位;(3)选释调查方法和技术;(4)估计样本大小;(5)编制调查表;(6)评价问卷的信度和效度;(7)制定资料的收集计划;(8)指定资料的整理与分析计划;(9)制定调查的组织措施。 4、调查表中包含那几种项目? 答:(1)分析项目直接整理计算的必须的内容;(2)备查项目保证分析项目填写得完整和准确的内容;(3)其他项目大型调查表的前言和表底附注。 第三章实验设计 1、简述实验设计的特点。 答:(1)研究者能人为设置处理因素(2)受试对象可以接受何种处理因素或水平是由随机分配而定的。 2、简述一般选择受试对象的原则 答:(1)受试对象能从临床试验中受益(2)受试对象具有代表性(3)受试对象具有依从性(4)受试对象可以是志愿者。 3、什么是混杂因素?设计时怎样控制混杂因素? 答:混杂因素是指影响实验效应并与处理因素同时存在的非处理因素。可以通过采取排除、平衡、或标准化的办法来控制混杂因素的影响。

第六版医学统计学答案

第六版医学统计学答案 【篇一:医学统计学第二版高等教育出版社课后习题答 案】 例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体 是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是 无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中 的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个 部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的 红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红 细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其 红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。 随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某 一个数值左右波动的误差;非随机误差中最常见的为系统误差,系 统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为 参数,如整个城市的高血压患病率。根据样本算得的某些数值特征 称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血 压患病。统计量是研究人员能够知道的,而参数是他们想知道的。 一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合 理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为 小概率事件,其含义是该事件发生的可能性很小,进而认为它在一 次抽样中不可能发生,这就 是所谓的小概率事件原理,它是进行统计推断的重要基础。 第二章调查研究设计 1.调查研究主要特点是什么?

医学统计学李晓松主编第2版高等教育出版社附录第3章思考与练习答案.doc

第三章实验研究设计 【思考与练习】 一、思考题 1. 实验设计根据对象的不同可分为哪几类? 2. 实验研究中,随机化的目的是什么? 3. 什么是配对设计?它有何优缺点? 4. 什么是交叉设计?它有何优缺点? 5. 临床试验中使用安慰剂的目的是什么? 二、案例辨析题 “三联药物治疗士兵消化性溃疡”一文中,对2000~2006年在某卫生所采用三联药物治疗的38例消化性溃疡患者进行分析。内镜检测结果显示,痊愈13人,显效14人,进步7人,无效4人,有效率达89.5%。据此认为该三联疗法的疗效较好,且由于其价格适中,可在部队卫生所中推广。该结论是否正确?如果不正确,请说明理由。 三、最佳选择题 1. 实验设计的三个基本要素是 A. 处理因素、实验效应、实验场所 B. 处理因素、实验效应、受试对象 C. 受试对象、研究人员、处理因素 D. 受试对象、干扰因素、处理因素 E. 处理因素、实验效应、研究人员 2. 实验设计的三个基本原则是 A. 随机化、对照、重复 B. 随机化、对照、盲法 C. 随机化、重复、盲法 D. 均衡、对照、重复 E. 盲法、对照、重复

3. 实验组与对照组主要不同之处在于 A. 处理因素 B. 观察指标 C. 抽样误差 D. 观察时间 E. 纳入、排除受试对象的标准 4. 为了解某疗法对急性肝功能衰竭的疗效,用12头健康雌性良种幼猪建立急性肝功能衰竭模型,再将其随机分为两组,仅实验组给予该疗法治疗,对照组不给予任何治疗。7天后观察两组幼猪的存活情况。该研究采用的是 A. 空白对照 B. 安慰剂对照 C. 实验对照 D. 标准对照 E. 自身对照 5. 观察指标应具有 A. 灵敏性、特异性、准确度、精密度、客观性 B. 灵敏性、变异性、准确度、精密度、客观性 C. 灵敏性、特异性、变异性、均衡性、稳定性 D. 特异性、准确度、稳定性、均衡性、客观性 E. 灵敏性、变异性、准确度、精密度、均衡性 6. 比较两种疗法对乳腺癌的疗效,若两组患者的乳腺癌分期构成不同可造成 A. 选择性偏倚 B. 测量性偏倚 C. 混杂性偏倚 D. 信息偏倚 E. 失访性偏倚 7. 将两个或多个处理因素的各水平进行组合,对各种可能的组合都进行实验,该实验设计方案是 A. 随机区组设计 B. 完全随机设计

医学统计学练习题及答案

一、单向选择题 1。医学统计学研究的对象是 E。有变异的医学事件 2。用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3。下列观测结果属于等级资料的是 D.病情程度 4。随机误差指的是 E。由偶然因素引起的误差 5. 收集资料不可避免的误差是 A。随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A。中位数 2。算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4。将一组计量资料整理成频数表的主要目的是E。提供数据和描述数据的分布特征 1. 变异系数主要用于 A.比较不同计量指标的变异程度 2。对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3。某项指标95%医学参考值范围表示的是D。在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B.数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指标应使用 E.四分位数间距 1。样本均数的标准误越小说明 E。由样本均数估计总体均数的可靠性越大 2。抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C。正态分布4。假设检验的目的是 D.检验总体参数是否不同 5。根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~9。1×109/L,其含义是 E。该区间包含总体均数的可能性为95% 1。两样本均数比较,检验结果说明 D。不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别,其差别有统计学意义是指 E。有理由认为两总体均数有差别 3。两样本均数比较,差别具有统计学意义时,P值越小说明 D。越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E。增加样本含量

《医学统计学》习题与答案

一、最佳选择题 1.卫生统计工作的步骤为 c A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差 7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为

医学统计学课后习题答案(00002)

医学统计学课后习题答案

析。 抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。(1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。(3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生困难,所以应以“足够”为准。需要作“样本例数估计”。 什么是两个样本之间的可比性? [参考答案] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣) 第二章集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 B. 几何均数 P百分位数 C. 均数 D. 95 E. 频数分布 2. 算术均数与中位数相比,其特点是 A.不易受极端值的影响B.能充分利用数据的信息 C.抽样误差较大D.更适用于偏态分布资料 E.更适用于分布不明确资料 3. 一组原始数据呈正偏态分布,其数据的特点是***正的反而小! A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧 E. 数值分布不均匀 4. 将一组计量资料整理成频数表的主要目的是 A.化为计数资料 B. 便于计算 C. 形象描述数据的特点 D. 为了能够更精确地检验 E. 提供数据和描述数据的分布特征 5. 6人接种流感疫苗一个月后测定抗体滴度为1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是 A. 均数 B. 几何均数 C. 中位数 D. 百分位数 E. 倒数的均数 答案: A B D E B 二、计算与分析

相关文档
最新文档