医学研究结论的统计学推断_姚晨

医学研究结论的统计学推断_姚晨
医学研究结论的统计学推断_姚晨

讲座 医学研究结论的统计学推断

姚 晨

(北京大学第一医院医学统计室,北京 100034)

[关键词]统计学,医学;生物医学研究;数据说明,统计学

[中图分类号]R195 1 [文献标识码]A [文章编号]1671-167X(2007)02-0213-04

医学研究的任务在于从偶然的医学现象中发现必然的医学规律,为了研究医学总体属性变化的规律,常常采用抽样研究方法进行实验,所获研究数据也是样本研究结果。在上一讲中,重点介绍了实验研究样本数据的描述和结果表达方法。但医学研究的目的不是对所完成实验结果的解释,而是获得能适合于整个研究总体的医学结论。由于生物医学研究领域中的实验结果往往是不确定的,所以描述不确定现象、通过重复观察发现不确定现象背后隐藏的统计学规律是统计推断的显著特征。

1 统计推断的必要性

在医学研究报告中,常常要求所报告的医学研究结论需要有统计学处理(或分析)。统计学分析不仅要有前一讲所述的有关研究样本的统计描述,还需有通过样本信息获得的可能研究结论并进行必要的统计推断,这是因为在抽样研究中,抽样误差不可避免,误差产生的根本原因是生物个体的变异性,但数理统计已证明,当研究样本达到一定数量时,抽样误差的分布具有一定的统计规律性,这为通过一定样本信息来推断和估计总体的某些规律提供了理论依据和相应的统计方法。

现举一个临床试验的实例来阐明医学研究结论统计推断的必要性。某临床医生为评价某药物治疗骨关节疼痛的临床疗效,采用了随机双盲双模拟、阳性药平行对照设计,即从临床诊断为骨关节病的患者(研究总体),其骨关节疼痛视觉模拟评分(VA S)在60分以上者中,筛选出240名符合入选/排除标准的合格受试者(试验样本),受试者随机分入试验组和对照组中,接受不同的药物干预治疗,两组在8周治疗结束时,主要疗效指标VA S变化见表1。

从表1中两组VAS评分的基线水平来看,虽然在试验开始前所有受试者均来自同一研究总体,即符合入选标准的骨关节疼痛患者,但两组VA S平均得分不尽相同,由此可见抽样误差导致了来自同一总体的两个不同样本均数的不同,这就要求在通过样本研究结果下医学结论时,必须要考虑抽样误差的影响。在观察对两个研究样本的受试者分别采用两种不同药物的干预治疗8周后的研究终点的VA S变化时,不仅要考虑抽样误差的影响,还要考虑不同干预因素对VAS 评分的影响。因此,对来自同一总体的一个个体来说,VAS 的变化是不确定的,而对于一个具有较大样本含量的研究样本来说,观察指标的变化就有可能呈现出某一个方向发展或某属性有确定联系的趋势。如各组治疗前后VA S变化采用配对样本t检验,对于一个患者治疗前后VA S变化值(d)的取值有可能取正值,也有可能取负值,而对于足够的样本d 的变化规律就有可能比较明确。统计推断正是通过大量的偶然性去揭示总体发展的必然规律。

表1 两组患者治疗前后骨关节疼痛视觉模拟评分(VAS)变化

(I TT分析人群)

试验组(n=120)对照组(n=120)

基线水平

x s65.87 15.3167.38 13.28

95%C I(63.13,68.61)(65.00,69.76)

治疗终点(LOCF)

x s46.56 22.3447.43 24.85

95%C I(42.49,50.63)(42.98,51.88)

相对于基线的变化

x s-20.44 22.76-20.01 23.94

95%C I(-24.51,-16.37)(-24.29,-15.73) P值(a)<0.001<0.001

变化值之差(试验组-对照组)

x s x(b)-1.43 2.75

95%C I(-6.82, 3.96)

P值(c)0.599

LOCF:末次结果结转(一种对随访资料中缺失数据估计方法);

(a):采用配对t检验计算治疗组内差异检验的P值;(b):采用最小二乘均数估计的均数和标准误;(c):采用协方差分析模型计算治疗组间差异检验的P值,该模型调整了基线VAS评分和试验中心因素的影响。

2 统计推断的基本内容与方法

统计学上将描述样本特征值的指标称为统计量,如样本均数、样本率和样本相关系数等;而将描述总体特征值的指标称为总体参数,相应地有总体均数、总体率和总体相关系数等。统计推断是基于一定样本实验数据对总体特征值所做的推断,主要包括总体参数的估计和总体参数的假设检验两部分内容。

由于医学研究总体常常是无限总体,通常只能借助于从总体中抽取部分足够数量的有代表性的样本,通过观察和检测样本来了解研究总体的规律。这种从研究的目标总体中抽取部分有代表性的样本,用统计量(如样本均数 x,样本率

213

北京大学学报(医学版)

J OURNAL OF PEK I NG UN I VERS I TY(HEALTH SC I ENCES) Vo.l39 No.2 Ap r.2007

P )来推断总体参数(如总体均数 ,总体率 )的方法称为抽样研究(samp li ng study)。抽样研究的目的是为了对研究总体进行统计推断。

在抽样研究中,统计学把样本统计量之间或样本与总体参数之间的差别称为抽样误差(samp li ng e rror),如 x 与 的差别,P 与 的差别等。产生抽样误差的根本原因是生物个体相应指标值存在的变异性。因此抽样误差具有客观性,只要抽样时样本数量小于总体规模,抽样误差必然出现。为了区别反映个体值变异的标准差与反映统计量变异的标准差,统计上称统计量(如样本均数 x 、样本率p 等)的标准差为标准误(standa rd erro r ,s x )。标准误是衡量统计量(如样本均数 x 、样本率P 等)抽样误差大小的指标。

在实际工作中,总体标准差 常常是不知道的,而是用样本标准差s 来估计之,故计算均数标准误的估计值(s x )的公式为:s x =s /n ,不同统计量的标准误计算也不尽相同,如计算率的标准误可用公式估计s x =p (1-p )/n ,上述举例

中的最小二乘均数的标准误计算是从协方差分析模型中估

计而来。

由于标准误是衡量抽样误差大小的一个定量指标,因此,常常被用于以下两种统计推断。2.1 总体参数的假设检验

假设检验是在决策论、概率论及极大似然性理论的基础上形成的,是根据资料的性质和所需回答的问题(假设检验要回答的基本问题是样本和总体之间、样本和样本之间是否存在实质性差异),建立统计假设,按照小概率事件在一次实验中不可能发生的原理和逻辑上的反证法思想,通过样本对总体所提供的信息,是否支持所作的假设,来推断该假设是应该拒绝或不应该拒绝。假设检验的具体步骤如下:2.1.1 根据研究目的对总体参数作出相应的检验假设 首先要明确假设检验中的两个检验假设:一种是原假设(亦称无效假设null hypo thes i s),记为H 0;另一种是备择假设(alter -nati ve hypothesis),记为H 1。二者都是根据研究目的提出的对总体参数或分布特征的假设,其基本原则是:在对总体参数进行假设检验前,最好将原假设H 0定义为预想结果的反面,将希望证明的命题(研究人员根据专业所提出的研究假设或者说希望得到的样本数据强有力支持的陈述)放在备择假设上。如果统计推断有足够的理由拒绝了H 0,则可接受H 1,这样就可达到统计推断的目的了。例如,在上述举例中,研究目的是评价药物干预治疗是否有减轻骨关节疼痛?这时,对试验组而言,由于抽样误差的存在,治疗前后VA S 评分的样本均数差异可以被假设是单纯由于抽样误差导致的,换言之,两个样本均数所代表的总体均数是相同的,那么可以建立如下检验假设,即H 0: 疗后= 疗前;H 1: 疗后 疗前,这就是均数差异性检验常用的检验假设。如果统计推断拒绝了H 0接受了H 1,则说明治疗前后VA S 评分样本均数所代表的总体均数不同,不能单纯从抽样误差原因解释,可能还有干预措施的作用使得总体均数发生了变化,从而也可以认为试验组的干预是有效的。同理也可证明对照组的干预也是有效的。在临床试验中,由于治疗干预不仅限于药物作用,

还有其他非实验因素的作用,如心理因素对疼痛评分的影响是显而易见的,因此,随机双盲、平行对照的研究设计保证了两组间的非实验因素的均衡,这时,分析比较两组治疗终点相对于基线的VAS 评分变化的均数,研究者可以有两种研究假设期望,一种是试验药的疗效能优于对照药,另一种是试验药的疗效与对照药相当或差不多,当然此时所选用的对照药必须是已被证明有效的。要证明优效的研究假设,可以采用上述的差异性检验假设,所不同的是备择假设H 1是 试验组> 对照组。如果要证明两组疗效相当或差不多,研究者首先要将研究目的转换为两个不同的概念,即疗效相当意味着两组VA S 评分的均数差异在临床认可的界限范围内,疗效差不多意味着试验组VA S 评分的均数不会高于临床认可的一个界值。这就是所谓的临床试验中常提及的等效或非劣效试验的研究目的。为达到以上两个不同的研究目的,其检验假设与差异性试验的检验假设就不同了,等效性试验的检验假设就有两个,即无效假设为H 01: 试验组- 对照组 - 和H 02: 试验组- 对照组 ,相应的备择假设为H 11: 试验组- 对照组>-

和H 12: 试验组- 对照组< ;而非劣效性试验的检验假设只有一个,即无效假设为H 0: 试验组- 对照组 - ,相应的备择假设为H 1: 试验组- 对照组>- 。在以上假设中 是预先规定的所谓临床认可的界值。

2.1.2 规定一个假设检验的水准 假设检验通常是在前面对总体参数作出的检验假设H 0和H 1中选择其一,表2总结了假设检验过程中四种可能的判断结果。由于抽样研究在客观上存在随机性,在假设检验中,两类错误的出现是客观存在、不可避免的。不过可以尽量缩小其发生的可能性,使得两类错误 和 只取一个很小的值,以至可以认为错误的发生是一个小概率事件,根据小概率事件在一次抽样检验中其几乎是不可能发生的原理,而甘愿在推断中冒这样一个 小 风险。所以在假设检验之前,预先规定一个检验水准 ,也就是规定发生第一类错误的大小,例如,规定检验水准 =0.05,当研究者根据检验假设H 0成立前提下,通过样本信息计算概率P 0.05,这时,作出拒绝H 0的推断结论时,即使犯第一类错误 也属小概率事件(通常情况下,认为概率小于0.05已是小概率事件),其判断正确的信心在95%以上。当然,为了提高判断正确的信心,可以规定更小的检验水准 ,如 =0.01,这时,会增大犯第二类错误 的概率,从而减小了检验的把握度(po w er o f test),即两总体确有差别,按 水准能发现它们差别的能力。

表2 假设检验的判断结果

判 断

总 体 参 数 情 况真H 0假H 1

假H 0真H 1

接受H 0,拒绝H 1

判断正确1- :可信度判断错误

:第二类错误拒绝H 0,接受H 1

判断错误 :检验水准,第一类错误判断正确

1- :检验效能或把握度

2.1.3 计算相应的检验统计量及P 值 进行假设检验必须满足其使用条件:(1)数据资料必须是经随机抽样设计所得;

214 北京大学学报(医学版)

J OURNAL OF PEK I NG UN I VERS I TY (HEALTH SC I ENCES) Vo.l 39 No .2 Ap r .2007

(2)除试验因素外,分组资料应均衡,各组间的其它条件具有可比性;(3)根据研究因素、设计方法、样本大小、资料类型及分布特征等选定合适的检验方法。由于现在统计分析软件已得到广泛使用,检验统计量和P 值的计算已不成为难题,但检验统计的计算方法的选择往往取决于研究设计中的检验假设。 计量资料的检验方法:数据服从正态分布,组间的总体方差相等时,一般采用t 检验,u 检验、F 检验等参数检验法。如数据分布类型不明确,或者不能满足参数检验的条件,可用符号检验、秩和检验、R idit 分析等非参数检验法。在使用参数检验法时若只有一个实验因素和两个水平时,可用t 检验(大样本可用u 检验代之)。在实验因素为l 而水平为( 3)或因素为2水平也为2时,应采用相应研究设计的方差分析(ANOVA )。并随之进一步作一个样本均数(对照组)与多个样本均数(各实验组)的比较及多样本均数间的两两比较,前者检验方法有Dunnet t 检验,后者的方法有q 检验、Dunncan 检验、Tukey 检验等。上述举例中采用了配对t 检验和协方差分析(AN COVA )两种检验方法。 分类资料的假设检验方法:分类资料是对受试者或观察对象的每个类别的计数,并用百分数或其他比值表示,通常也称为计数资料。如进行样本率与总体率的比较,可用u 检验或 2

检验;如配对计数资料的比较,可用M c N ema r 配对 2检验;两样本率的比较可用2 2的 2

检验及对数似然比检验;多个样本率的比较和两个或多个构成比的比较可用R C 列联表的 2检验;样本含量很小的两样本率的比较,可用F i sher 精确概率检验。在对有序变量作检验时,如资料为单向有序资料(如两组药物的疗效等级),除应用两组有序数据比较的 2检验外,也可用秩和检验和R i d i t 分析等非参数检验;如为双向有序资料(如人体晶状体的混浊程度与年龄关系),可用双向有序列联表的 2检验及K appa 检验,如同时分析的变量 3时,常用加权 2检验、M enta l-H eansze l 2检验等。2.1.4 根据P 值作出合理的统计推断 根据计算所得的P 值与检验水准 比较,若P ,就拒绝H 0,接受H 1。如在上述举例中,对试验组治疗前后VA S 变化值进行配对t 检验时,检验假设H 0是差值d 的总体均数等于0,H 1是差值d 的总体均数不等于0,现计算P <0.001,拒绝H 0,接受H 1,认为试验组治疗前后VA S 评分存在实质性差异,从而证明了治疗干预是有效的。由于上述举例中对两组治疗终点相对基线VA S 变化均数的比较采用了协方差分析,该分析的假设检验是基于差异性检验假设基础上的,所以,统计检验计算P =0.5995,说明不能拒绝两组均数无差异的原假设,还需进一步分析。

2.2 总体参数的估计

几乎所有的生物学研究都是建立在这样一个假设之上的,即对从总体中随机抽取的样本来说是正确的结论,则对于该总体来说结论大致也是正确的。因此,对样本特征的测量可以用来估计总体的特征。估计的准确度取决于和测量方法相关的变异大小(测量误差)、样本量大小以及样本的代表性(抽样误差)、以及生物学本身的变异(随机误差)。这些变异都可以通过可信区间得以体现。

总体参数估计是用样本统计量估计相应总体参数,如用样本均数 x 估计总体均数 、样本率P 估计总体率 等。参数估计有点估计(point esti m ation )和区间估计(i nterval est-i m ati on)两种形式。

点估计直接用样本统计量代替总体参数,如直接用样本均数( x )去估计相应的总体均数( )。在上述举例中,可分别用两组平均VA S 评分65.87和67.38代替总体均数的估计。数理统计学已经证明, x 是一种很好的参数点估计量。但点估计量 x 并不等于 ,因为在同一研究总体抽样的总体均数只有一个,用各样本 x 估计 时并没有考虑到抽样误差的影响,因此应将 x 的抽样误差即样本均数的标准误引入估计。这时所估计的总体均数( )已不是一个数值,而是一个区间范围的估计值。

总体均数的区间估计是利用样本 x 常常服从t 分布规律确定一个有概率意义的区间,以该区间具有较大的可信度1- (如95%或99%)包含总体均数来说明总体均数所在范围的一种估计方法,称这样的区间为总体均数的1- 可信区间(confidence i n terva ,l CI )。 值一般取0.05或0.01,故1- 为0.95或0.99。如总体均数 的95%可信区间(95%CI )计算公式常写成( x -t 0.05,v s x , x +t 0.05,v s x ),或缩写为 x t 0.05v s x ,其中t 0.05,v 为t 分布的双侧尾部概率为0.05时的界值。以0.01取代,可类似地获得总体均数 的99%可信区间。与总体均数的估计相似,样本率是总体率的点估计值,总体率的可信区间估计常根据样本量n 与样本率P 的大小,可以采用二项分布法或正态分布法估计。

在以上计算的95%可信区间,意味着作100次抽样,算得100个可信区间,平均有95个可信区间包括 (估计正确),只有5个可信区间不包括 (估计错误)。5%是小概率事件,在一次试验中出现的可能性很小。因此,在实际应用中就认为总体均数在算得的可信区间内,用这种方法进行估计,犯错误的概率为5%。

可信区间的两个要素:一是准确度(accuracy ),由可信度1- 的大小来反映,即区间包括 的概率大小,愈接近1愈好,如可信度99%比95%好;二是精密度(prec isi on),由区间的宽度来反映,区间愈窄愈好。在样本例数确定的情况下,二者是矛盾的,若仅考虑提高可信度(即减小 ,增大t a ,v ),把区间变得很宽,势必降低可信区间的应用价值。故不能笼统地认为99%可信区间比95%可信区间好,需要兼顾准确度与精密度。一般情况下,95%可信区间更常用。在可信度确定的情况下,增加样本例数,可减少区间宽度,提高精密度。

例如,在上述举例中,某试验药能使骨关节疼痛的VAS 平均降低20.44分(95%CI 为-24.51~-16.37分;P <0.001),而对照药能使骨关节疼痛的VA S 平均降低20.01分(95%CI 为-24.29~-15.73分;P <0.001),试验组与对照组变化值之间差值,在调整基线VAS 评分和试验中心影响后的最小二乘均数估计为-1.43分(95%CI 为-6.82~3.96分),在本研究中,试验组与对照组的VAS 评分之差值大于0表示对照组为优,小于0表示试验组为优,即与对照

215 姚 晨 医学研究结论的统计学推断

组相比最好不会超过6 82分,最差也不会超过约4分,如果该研究选择的对照药是公认有效的治疗骨关节疼痛的药物,并事先规定了判定非劣效界值,就可以判断结果是否具有临床意义。

3 统计推断时应注意的几个问题3.1 重视实验研究的随机抽样(或分组)

统计推断是通过来自样本的数据对总体参数进行推断。因此,样本的选择应能充分代表研究总体,随机抽样从理论上讲是能较好地代表总体的,由此样本统计量推断总体参数才能达到无偏的要求。这就要求在实验研究设计和实验过程中重视随机抽样(或分组)的要求,如实验分组要严格遵守随机化分配原则,以保证组间基线资料的均衡性。如果抽样(或分组)不随机,由于存在人为误差或系统误差对研究结果的影响。这时用样本统计量作为总体参数的估计就不再是无偏的,由此得出的结论往往存在偏倚。这也势必会影响研究者对事物发展的必然性认识。在医学研究中,抽样(或分组)不随机的现象时有发生,如采用的是不完善的历史性对照和不均衡性对照,有的实际上是采用选择性分组,这样,在许多非实验性因素的干扰下,组间就根本上缺乏可比性。例如,某临床医生为研究某药物的降压效果,试验组为住院患者,而对照组则是门诊患者,两者除治疗药物不同外,其他病情、生活环境等非实验因素都不具有可比性,那么研究结论就无法回答试验药物的有效性。另外,在一些 临床病例分析 之类文章中,在交待 资料来源与分组方法 时常称 经随机分试验组和对照组 ,既不说明用何种随机方法,也不对分组资料进行均衡性检验,而实际上或按入院先后,或按病情轻重,或按治疗进程,或按治疗结局等所形成的组别。这样的分组无论在时间、数量、性别、年龄、病情及病程等都缺乏可比性,这样的资料即使进行多种统计推断,其结论的价值是可想而知的。

3.2 正确理解假设检验中P 值的统计学意义

假设检验计算所得的P 值大小,仅仅是说明作出假设判断(是否拒绝检验假设H 0)的理由的充分程度,在学术论文中经常作为得出某一结论有统计学上的意义(Sta ti stica lall y si gnificance)。如在组间差异比较的假设检验中,P 值大小所能回答的问题是观察组间是否存在差异或者说差异是否源于抽样误差,经检验如P < (设检验水准为0 05),拒绝检验假设H 0,就认为差异由于抽样误差所致的可能性不大,即组间差异有统计学意义,从而为得出观察组间存在差异结论提供了统计学证据。显然,假设检验根本就不涉及差异的程度;也不涉及差异本身的显不显著;更不涉及药物效应或其它效应的差异程度 甲组疗效显著高于乙组 等专业性问题。可是,实际上有相当多论文作者,在表述假设检验结果时(如P <0 05或P <0 01),往往表述为:两组间 有显著差异 、 有非常显著差异 ,或者是 差异显著 、 差异非常显著 等等。这种表述实际潜含的意义是将P 值的大小与组间的差异程度等同起来了,或者直接理解为某一组的效应高于另一组效应的显著程度了。这种表述和理解当然符合作者

的 预期目标 ,但对假设检验结果的本来含义却大大地曲解了。

由于假设检验主要是控制犯第一类错误的概率( ),而对犯第二类错误的概率( )却无法直接控制。通常是通过限制犯第一类错误的概率大小,即选定 ,要求 尽可能小,但往往不知道犯第二类错误的概率( )大小,因此,在假设检验中,当根据样本信息作出不能拒绝H 0的推断时,并不意味着不必再作进一步分析就贸然接受H 0,还应考虑当H 0不真时,拒绝H 0的概率1- (即检验效能或把握度)的大小。通常将P >0.05的统计检验结果作为 阴性 结果,分析原因主要有两个:一是原检验假设客观成立,如两个总体均数本身的差别就小,另一可能是样本量过小,导致检验效能过低。通常组间差异假设检验的检验效能至少受四个因素的影响:组间总体差异大小、个体间变异的大小、样本量及第一类错误的大小,并且检验效能与它们存在定量关系,即客观事物差异越小,检验效能越低;个体间变异越大,检验效能越低;样本量n 越小,检验效能越低; 规定越小,检验效能越低。如果是由于检验效能过低,出现的阴性结果可能为假阴性结果,因此,可以得出差异无统计学意义的结论,但是不能据此判断结果是无差异的,即 差异证据的缺乏并不能解释为缺乏差异的证据 ,其结论有待于进一步验证。

3.3 注意 统计学意义 与 医学/临床/生物学意义 的关系

在医学研究结论表达中,不管研究结果的统计推断是否具有 统计学意义 ,医学结论是否有 医学/临床/生物学意义 是非常重要的。有 统计学意义 的研究结果不一定有 医学/临床/生物学意义 。因此,不能单靠P 值下结论,而是要综合考虑研究的各个方面:研究设计、研究的执行、效应的大小、可信区间的宽度、生物学合理性、其他的证据等。例如:大样本研究中即使没有临床意义的很小的差异也可以得出有统计学意义。在研究某降压药物的降压效果时,采用了随机双盲、安慰剂平行对照的多中心临床试验,每组分别有100名受试者,研究结果为两组舒张压治疗前后变化值之差的样本均数为0.83mm H g ,经两样本均数比较t 检验得,t =6.306,P <0.001,即两组均数差异有统计学意义,但该差异被认为是没有临床意义,因此,该研究最终结论是无法认可该药物的临床降压效果。小样本研究中有临床意义的大的差异也可能没有统计学意义。假定接受普通治疗的16人中有8人死亡,而新治疗方法16人中仅有4人死亡,尽管两组病死率的差异比较没有统计学意义,但试验组病死率下降了一半是有临床意义的,说明需要大样本研究进一步证实。

不管假设检验结果是否具有统计学意义,应给出由统计软件计算所得的精确P 值(保留小数点后3位),而不再简单写成P <0.05,但很小的P 值可以报告为P <0.001。当计算的P 值近似于在假设检验的水准 时,如P =0.051和P =0.049应当得到相似的解释,尽管前者是 没有统计学意义 ,而后者是 有统计学意义 ,给出确切P 值可以避免这种解释上的麻烦。而且确切的P 值在m eta 分析中也很有用处。另外,如果研究结果没有 统计学意义 ,不要说成 显

216 北京大学学报(医学版)

J OURNAL OF PEK I NG UN I VERS I TY (HEALTH SC I ENCES) Vo.l 39 No .2 Ap r .2007

示了有统计学意义的趋势 或 大致有统计学意义 ,而是根据P 值和 水平得出没有 统计学意义 的结论时,进一步讨论有无 医学/临床/生物学意义 。

3.4 结合两种统计推断结果讨论医学研究结论

假设检验用于推断总体参数 质 的不同。如判断两总体均数是否不等,可信区间用于说明总体参数 量 的大小,如推断总体均数的范围,而两者既相互联系,又有区别。一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H 0,则按 水准,不拒绝H 0;若不包含H 0,则按 水准,拒绝H 0,接受H 1。如上述举例中,试验组治疗终点相对基线VA S 评分总体均数95%CI 为(-24.51,-16.37)分,由于该可信区间不包含了H 0: 疗后= 疗前(或 疗后- 疗前=0分),其可信区间上限也低于0

。根据临床经验治疗后与治疗前VAS 评分之差越低越好,故可认为试验组的干预是有统计学意义,结论同经配对t 检验计算的P 值。另一方面,可信区间不但回答了治疗前后差别是否有统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无临床意义。因为,95%可信区间的上限提示治疗后VA S 评分最少也能下降16.37分,最多可以下降24.51分。如果其最低下降分能在事先规定的临床意义界值以上,则可以认为该下降分是有临床意义的。

虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味差可信区间能够完全代替假设检验。可信区间只能在预先规定的概率(检验水准 )的前提下进行计算,而假设检验能够获得一个较为确切的概率P 值。故将两者结合起来,才是完整的分析。如表达式所举例的主要研

究目的是为了证明试验药物治疗骨关节疼痛的有效性,所选用的对照药是目前公认有效的上市药品,如果能证明试验药的疗效(即治疗8周相对基线的变化值)不劣于对照药即可。如果在研究设计的试验方案中已明确规定了试验组与对照组疗效之差不超过5分。则在本临床试验的总结报告中,建议用以下表达方式解释研究结论。试验组治疗8周后,VAS 评分平均下降了20.44分(95%C I 为=-24.51~-16.37分;P <0.001);对照组的VA S 评分下降了20.01分(95%CI 为-24.29~-15.73;P <0.001),说明两组治疗干预均能降低VA S 评分。在调整基线VA S 评分和试验中心影响后的,试验组与对照组疗效相差的VA S 平均分为-1.43分(95%CI 为-6.82~3.96分),其上限值没有超过预先规定的非劣效界值,即可认为试验药疗效不劣于对照药的疗效,认为试验药治疗骨关节疼痛是有效的。

综上所述,统计推断是辩证思维的一种具体表现。它同时兼容了数学和归纳两种推断方式。统计推断中的肯定与否定不能简单地理解为数学中的对与错的绝对对立。统计推断中通过样本信息反映的量的变化来推断总体是否发生了质的变化。而总体的质是与研究目的和研究对象密切相关的,不同的研究目的或不同的研究对象对质的要求可能不同。因此,在医学研究中,研究者应当根据研究目的和研究对象具体问题具体分析,不能拘泥于统计检验结论来归纳医学研究结论。

(2007-03-01收稿)

(本文编辑:王 蕾)

消息

著名临床医学杂志 柳叶刀 执行总编来北京大学公共卫生学院作学术报告

柳叶刀 (Lancet )已经创刊180多年,是历史悠久的权威综合性理论医学刊物,为了加强和促进北京大学医学部师生的英文写作能力,提高在世界著名杂志上的论文发表率。2007年3月20日北京大学循证医学中心和北京大学公共卫生学院联合举办讲座,邀请 柳叶刀 执行总编威廉 萨玛斯克尔(W illi am Su mm ersk ill)博士做了 如何在柳叶刀杂志发表论文 、 撰写临床研究论文的国际标准 的学术报告。唐金陵教授主持并协助翻译。

威廉博士报告内容为三大部分:撰写英文科学论文的要

点; 柳叶刀 的文章录用原则和方法;撰写各种临床研究论文的国际标准。

威廉博士特别提示, 柳叶刀 不仅仅录用临床研究论文,也欢迎评价研究结果或评论已发表结果的 读者来信 及来自一线医生的 病案报告 和 新书介绍 等。

北京大学医学部,许多其他医院的临床医生、学生300余人参加了本次讲座。

(北京大学公共卫生学院周小平王燕玲)

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

医学统计学课后习题答案

医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体与样本:总体就是根据研究目的确定的同质观察单位的全体。样 本就是从总体中随机抽取的部分观察单位。 (3) 参数与统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量与总体参数的差别称为抽样误 差。 (5) 概率:就是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 就是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1、 平均数 就是描述数据分布集中趋势(中心位置)与平均水平的指标 2、 标准差 就是描述数据分布离散程度(或变量变化的变异程度)的指标 3、 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4、 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4、 σ± σ96.1± σ58.2± 68、27% 95% 99% 5、 47、5% 6、均数、标准差 7、 全距、方差、标准差、变异系数

医学统计学(本科)复习习题2018

医学统计学期末复习题 一、单项选择题 1 下面的变量中是分类变量的是 A.身高 B.体重 C.年龄 D.血型 2 下面的变量中是是数值变量的是 A.性别 B.年龄 C.血型 D.职业 3.随机事件的概率 P 为 A.P=0 B. P=1 C. P=-0.5 D. 0

医学统计学试题和答案解析

第一套试卷及参考答案 一、选择题 (40分) 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式B负偏态分布 C 正偏态分布D正态分布与近似正态分布 3、要评价某市一名5岁男孩得身高就是否偏高或偏矮,其统计方法就是( A ) A 用该市五岁男孩得身高得95%或99%正常值范围来评价 B用身高差别得假设检验来评价 C用身高均数得95%或99%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差得根本原因就是( A ) A、个体差异B、群体差异C、样本均数不同D、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为( A ) (A)相对比(B) 构成比(C)定基比 (D)率 7、统计推断得内容为( D ) A、用样本指标估计相应得总体指标B、检验统计上得“检验假设”C、A与B均不就是D、A与B均就是 8、两样本均数比较用t检验,其目得就是检验( C ) A两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本,样本含量分别为n1与n2,在进行成组设计资料得t检验时,自由度就是( D ) (A) n1+ n2 (B) n1+ n2–1(C) n1+ n2 +1 (D)n1+ n2-2 10、标准误反映( A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得(C) A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小D纵向距离最小 12、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为tr,对回归系数检验得t值为tb,二者之间具有什么关系?(C) A t r>t b B t r〈t b C t r= tb D二者大小关系不能肯定 13、设配对资料得变量值为x1与x2,则配对资料得秩与检验(D ) A分别按x1与x2从小到大编秩 B把x1与x2综合从小到大编秩 C把x1与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用得统计方法为( A ) A.四格表检验 B、四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3、08kg,标准差为0、53kg;南方n2=4896,均数为3、10kg,标准差为0、34kg,经统计学检验,p=0、0034〈0、01,这意味着( D )

医学统计学题库

1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0

医学统计学课后答案.

第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或

研究生医学统计学试题

试卷编号:卷课程名称:医学统计学适用专业:科学学位专业:班级 姓名:学号:学院 (系 ):考试日期:题号一二三四五六七八九十总分统分题分30152530100签名得分 考生注意事项: 1、本试卷共6 页,请查看试卷中是否有缺页或破损。如有立即举手报告以 便更换。 2、考试结束后,考生不得将试卷、答题纸和草稿纸带出考场。 一、最佳选择题(每题 2 分,共 30 分) 得评阅 把每题的答案填入下表中: 123456789101112131415 A B C D B B A C C C B B C D B 1、描述一组正态分布资料的集中趋势,以指标为好。 A. 算术平均数; B. 几何平均数; C. 中位数; D. 变异系数 2、比较成人身高和儿童身高的离散趋势,宜用。 A. 标准差; B. 变异系数; C. 方差; D. 离均差平方和 3、对于正态分布资料,X +1.96S,所对应的面积占总面积的。 A. 95% ; B. 99% ; C. 47.5%; D. 49.5% 4、下列说法哪个是错误的?中位数适用于描述资料。 A. 最小组段无下限; B. 最大组段无上限; C. 偏态分布; D. 正态分布 5、大,表示用该样本均数估计总体均数的可靠性小。 A. S X; B. S; C.CV; D. Q U—Q L 6、某地 1992年随机抽取 100名健康女性,算得其血清总蛋白含量的均数为74g/L ,标准差为 4g/L ,则其 95%的可信区间为。

7、两样本均数比较的t 检验,分别取以下检验水准,以所取第二类错误最大。 A. α =0.01; B. α=0.05; C. α =0.10; D.α=0.20 8、两样本均数比较的t 检验结果, P<0.05 ,可认为。 A. 两样本均数不等; B. 两样本均数相等; C. 两总体均数不等; D. 两总体均数相等 9、完全随机设计的方差分析结果,P≤ 0.05,可认为。 A. 各样本均数不等或不全等; B. 各样本均数都不相等; C. 各总体均数不等或不全等; D. 各总体均数都不相等 10、某地某年肝炎发病人数占总人数的5%,这是该地该年肝炎的。 A. 年发病率; B. 年患病率; C. 患病构成比; D. 患者平均数 11、已知甲县人口较乙县年青,今欲比较两县死亡率的高低,适当的比较方法是。 A.将两县的总死亡率直接比较; B.对年龄进行标准化后,再比较两县总死亡率; C.将两县的总死亡率进行 t 检验后再比较; D.将两县的总死亡率进行χ2检验后再比较 12、下面哪一点不是Poisson 分布的性质。 A. λ =σ2; B. 当λ≥ 20 时,近似正态分布; C. 可加性; D. 相互影响性 13、χ2检验中理论数T 的计算式为。 A. n r (1 n c ) ; B. (1 n r ) n c; C. n r n c; D. n r n c N N N N 14、已知两组计量资料方差不齐,可用检验。 A. t 检验; B. U 检验; C. F 检验; D. 秩和检验 15、对一组既做相关分析又做回归分析的资料,有。 A. b=r ; B. t b=t r; C. b=a; D. r=1

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学课后答案解析

第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用:? 特点:?1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;? 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;?

4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; ?5、u变换:为了便于描述和应用,常将正态变量作数据转换;?? 应用:?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 ?1.从意义来看?95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指?95%可信度估计的总体均数的所在范围? 2.从计算公式看?若指标服从正态分布,95%参考值范围的公式是:±1.96s。?总体均数95%可信区间的公式是:??前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能 7.线性回归的主要用途。

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A各总体率不同或不全相同 B各总体率均不相同C各样本率均不相同 D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为( A ) A.四格表检验 B. 四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

医学统计学(第六版马斌荣)课后答案 很全面

医学统计学(第六版) 课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2 第三章正态分布与医学参考值范围 一、单项选择题 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A 二、计算与分析 1 2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。又因血铅含量仅过大为异常,故应计算只有上限的单侧范围,即95P 。

医学统计学试题 (2)

医学统计学试题 一.选择题(每题2分,共20分) 1、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是() A、n1+n2 B、n1+n2-1 C、n1+n2+1 D、n1+n2-2 2、标准误反映() A、抽样误差的大小 B、总体参数的波动大小 C、重复实验准确度的高低 D、数据的离散程度 3、最小二乘法是指各实测点到回归直线的() A、垂直距离的平方和最小 B、垂直距离最小 C、纵向距离的平方和最小 D、纵向距离最小 4、用样本推论总体,具有代表性的样本指的是() A、总体中最容易获得的部分个体 B、在总体中随意抽取任意个体 C、依照随机原则抽取总体中的部分个体 D、用配对方法抽取的部分个体 5、随机误差指的是() A、测量不准引起的误差 B、由操作失误引起的误差 C、选择样本不当引起的误差 D、由偶然因素引起的误差 6、某项指标95%医学参考值范围表示的是() A、检测指标在此范围,判断“异常”正确的概率大于或等于95% B、检测指标在此范围,判断“正常”正确的概率大于或等于95% C、在“异常”总体中有95%的人在此范围之外 D、在“正常”总体中有95%的人在此范围 7、从甲、乙两文中,查到同类研究的两个率比较的χ2检验,甲文χ2χ20.01,1,乙文χ2χ20.05,1,可认为() A、两文结果完全相同

B、甲文结果更为可信 C、乙文结果更为可信 D、甲文说明总体的差异较大 8、两样本均数比较的t检验和u检验的主要差别是() A、t检验只能用于小样本资料 B、u检验要求大样本资料 C、t检验要求数据方差相同 D、u检验能用于两大样本均数比较 9、对医学计量资料成组比较,相对参数检验来说,非参数秩和检验的优点是() A、适用范围广 B、检验效能高 C、检验结果更准确 D、不易出现假阴性错误 10、两数值变量相关关系越强,表示() A、相关关系越大 B、相关系数越大 C、回归系数越大 D、相关系数检验统计量t值越大 [参考答案] 1-5:DACCD 6-10:DBBAB 二.名词解释(每题4分,共20分) 1、偏回归系数 2、Ⅱ型错误: 3、非参数检验: 4、残差平方和/剩余平方和: 5、率的标准误: [参考答案] 1.表示其他自变量保持不变时,X j增加或减少一个单位引起的Y的变化量。 2.指接受了实际上不成立的H0,即“存伪”的错误。Ⅱ型错误的概率用β表示。 3.不依赖于总体分布类型、不针对总体参数的检验方法,如假设两总体分布相 同检验统计量基于变量的秩等,这类检验方法称为非参数检验。 4.指除x对y的线性影响外,其它所有因素对y变异的影响,即在总平方和中 无法用x与y的线性关系所能解释的部分变异,用以表示考虑回归关系后,y 的随机误差。 5.指用以衡量由于抽样引起的样本率与总体率之间的误差的统计量。

医学统计学试题和答案.doc

医学统计学试题和答案

(一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

相关文档
最新文档