【孙振球第四版】医学统计学复习题

【孙振球第四版】医学统计学复习题
【孙振球第四版】医学统计学复习题

一、名词解释:

1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。

2、有限总体:是指空间、时间范围限制的总体。

3、无限总体:是指没有空间、时间限制的总体。

4、样本:从总体中随机抽取部分观察单位,其实测值的集合。

5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。

6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。

7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。

8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。

9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。

10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本

统计量之间的差异。

11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I型错误。检验水平,就是预先规定的允许犯I 型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。

12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。

13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。

14、率:强度相对数,说明某现象发生的频率或强度。

15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。

16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。

17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。

18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。

20、相关系数:又称Pearson积差相

关系数,以符号r来表示。说明两正态变量间相关关系的密切程度和方向的指标。无单位,其值为-1≤r≤1。相关系数的检验假设常用t检验。21、回归系数:即线性回归方程的斜率b,其统计意义是当X变化一个单位时Y的平均改变的估计值。在直线回归中对回归系数的t检验与F检验等价。

22、随机划原则:是指在实验分组时,每个受试对象均有相同的概率或机会被分陪配到实验组和对照组。23、分类变量资料:计数资料,又称定性资料或无序分类变量资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。

24、无序分类变量资料:计数资料,又称定性资料。是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。

(2)多分类:各类间互不相容。25、期望寿命:指同时出生的一代人活满x岁以后尚能生存的年数(即岁数)。

26、检验效能:表达式为1-β,以往称把握度。其意义为当两总体确有差异,按规定检验水准所能发现该差异的能力。

27、观察单位:亦称个体,是统计研究中的基本单位。它可以是一个人、一只动物,也可以是特指的一群人;可以是一个器官,甚至一个细胞。

28、样本含量:样本中包含观察单位数称为该样本的样本含量。

29、变量:确定总体之后,研究者应对每个观察单位的某项特征进行观

察或测量,这种特征能表现观察单位的变异性,成为变量。

30、变量值:对变量的观测值称为变量值或观察值。

31、误差:泛指实测值与真实值之差,按产生原因和性质可粗分为(1)随机误差;(2)非随机误差①系统误差

②非系统误差。

32、系统误差:实验过程中产生的误差,它的值或恒不变,或遵循一定的变化规律,其产生的原因往往是可知的或可能掌握的。应尽可能设法预见到各种系统误差的具体来源,力求通过周密的研究设计和严格的技术措施施加以消除或控制。

33、非系统误差:在实验过程中由于研究者偶然失误造成的误差。这类误差应当通过认真检查核对予以清除,否则将影响研究结果的准确性。34、频率:一个随机试验有几种可能,在结果重复进行试验时,个别结果看来是偶然发生,但当重复试验次数相当大时,总有规律出现。在重复多次后,出现结果的比例称之为频率。35、概率:概率是描述随机事件发生可能性大小的一个度量。

36、医学参考值:是直指包括绝大多数正常人的人体形态、功能和代谢产物等个各种生理指标常数,也称正常值。由于存在个体差异,生物医学数据并非常数而是在一定范围内波动,故医学参考值范围作为判定正常和异常的参考标准。

37、正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。若指标X的频率分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。

38、偏态分布:指集中位置偏向一侧,频数分布不对称。(1)正偏态分布:集中位置偏向数值小的一侧。(2)负偏态分布:集中位置偏向数值大的一侧。

39抽样:在医学研究中,为节省人力、

物力、财礼和时间,一般都采取从总体中抽取样本,根据样本信息来推断总体特征的方法,即抽样研究的方法来实现,这种从总体种随机抽取部分观察单位的过程称为抽样。为保证样本的代表性,抽样时必须遵循随机化原则。

二、填空题

1、医学统计工作的基本步骤:设计、搜集资料、整理资料、分析资料。

2、医学统计资料的主要来源的四个方面:统计报表、经常性工作记录、专题调查、统计年鉴和数据库专集。

3、正态分布的规律的应用:估计频数分布情况、质量控制、统计处理方法的理论基础、估计医学参考值范围。

4、计量资料统计描述的方法:频数分布表、频数分布图、统计指标。

5、CV(变异系数):常用于度衡量单位不同和均数相悬殊的多组资料变异度的比较。

6、统计推断是从总体中随机抽样本,由样本信息推断总体特征的过程,包括参数估计和假设检验两方面内容。参数估计包括点估计和区间估计。

7、可信区见估计的优劣取决于两要素:(1)可信度1-α(准确度),即区间包含总体均数μ的理论概率大小,可信度愈接近1愈好。(2)区间宽度β(精密度),即区间的长度,区间愈窄愈好。

8、变量变换的方法有:对数变换、平方跟变换、倒数变换、平方根反正弦变换。

9、常用的相对数:率、构成比、相对比。

10、动态数列常用指标有:绝对增长量、发展速度与增长速度、平均发展速度、平均增长速度。

11、二项式分布的参数是n和π。n,n 次独立重复实验数目;π,每次实验的“阳性”概率。

12、二项式分布在n很大,而π很小,

且nπ=λ为常数时,二项式分布近似Poisson分布。

13、总体均数λ与总体方差σ2相等是Poisson分布的重要特征。

14、Poisson分布具备可加性。

15、当λ(总体率)增大时,Poisson 分布渐近正态分布。

16、四格表中四格子基本数值为两对实测的实际频数和理论频数。

17、R*C表的卡方检验,若表格中有一个方向按多个等级分类时,则称之为单向有序行列表,当等级数大于3时,如检验各处理组各等级下的构成比有无差别时采用Χ2检验,如检验各处理组各等级下的程度上有无差别时采用非参数检验。

18、配对比较秩和检验,以正秩或负秩的和(T)为检验统计量,其中T 越小则P的值小于相应的检验水平。

19、正态分布的两个参数μ和σ2,前者决定分布的位置,后者决定分布的形态(形状、变异度)。20、四格表Χ2的校正条件为n≥40而且1<T<5。

21、R*C表资料Χ2检验,如果有T<1,应该采取的措施有:(1)增加样本含量,使理论频数增大;(2)根据专业知识考虑能否删除理论频数太小的行或列,能否将理论频数太小的行或列与性质相近的行或列合并。(3)改用双向无序R*C表资料的Fisher确切概率法。

22、Poisson分布中,总体的方差与均数的关系是λ=σ2,当均数较大时,Poisson分布趋近于正态分布。

23、要分析某个资料是否属于二项分布,可用频数分布的拟合优度的Χ2检验。

24、r是相关系数,表示具有直线关系的两变量间相关密切程度和相关方向。

25、变异系数的应用条件是均数相差较大、观察指标单位不同。

26、Χ2表示理论频数与实际频数的符

合程度。

27、常用相对数的指标有强度相对数字(率)、结构相对数(构成比)、相对比(比)。

28、常用的描述构成比的统计图有圆图和百分比条图。

29、方差分析的应用条件为相互独立的随机样本、来自正态总体、方差齐性。

30、实验设计的基本原则随即机原则、对照原则、重复原则。

31、常用的几种统计图有直条图、圆图和百分比条图、线图、直方图、统计地图、其它特殊分析图。

32、写出四种变量变换的方法:倒数变换、平方根变换、平方反正弦变换、对数变换。

33、在F检验中如有各比较组方差不齐时应用变量变换、近似t检验、Wilcoxon秩和检验的方法。

34、四格表资料Χ2适用条件:(1)n ≥40且T≥5时用Χ2检验的基本公式,当P≈α时,改用四格资料表的Fisher的确切概率法;(2)n≥40且1<T<5时用,用四格资料表Χ2检验的校正公式,或改用四格资料表的Fisher的确切概率法;(3)n<40,或T<1时,改用四格资料表的Fisher 的确切概率法。

35、当总体率λ很小时,当n很大时,二项分布可用泊松分布来近似。

36、率的标准化的计算方法有直接标准化方法和间接标准化方法。

37、Χ2检验的用途:(1)推断两个总体率或构成比之间有无差别;(2)多个总体率或构成比之间有无差别;(3)两分类变量间有无关联性;(4)多个样本间的多重比较;(5)频数分布拟合优度的Χ2检验。

38、拟合优度检验常用判定实际分布是否符合正态分布、二项分布、Poisson分布和负二项分布。

39、实验设计的三个基本要素为:实验单位、处理因素、实验效应。

40、变异系数常用于观察单位指标不同和均数相差较大的多组资料变异度的比较。

41、所有检验统计量是在H0的条件下计算出来的。

42、标准化的目的是为了消除构成比不同对合计率的影响,使比较组间具有可比性。

43、统计推断包括:参数估计(区间估计、点值估计)、假设检验。

44、医学参考值的制定方法包括:正态分布法、百分位数法。

45、Poisson分布的性质:(1)可加性、(2)总体均数λ与总体方差α2相等、(3)当n很大而π很小且nπ=λ时二项分布近似Poisson分布、(4)当λ增大时,Poisson分布渐近正态分布。

46、集中趋势的描述指标:算术均数、集几何均数、中位数和百分位数。47、离散趋势的描述指标;极差、四分位数间距、方差与标准差、变异系数。第二章计量资料的统计描述

1、集中趋势、离散趋势的统计描述指标以及区别。

答:一、集中趋势的描述指标:统计学用平均数这一指标来描述一组变量值的集中位置或平均水平。(1)算术均数:简称均数字,可用于反映一组呈对称分布的位置在数量上的平均水平。(2)几何均数:可用于反映一组经对数转换后呈对称分布的变量在数量上的平均水平,在医学研究中常适用于免疫学的指标。(3)中位数:是将n个变量值从小到大排列,位置居中间的那个数。<分为奇偶两种情况。(4)百分位数:是一种位置指标,用P X来表示。

二、描述数据变异大小的常用指标有极差、四分位数间距、方差、标准差和变异系数。(1)级差:级差即是一组变量最大的值与最小值之差。(2)四分位数间距:四分位数间距是把全部变量值分为四部分的分位数,即第

1四分位数、第2四分位数、第3四分。四分位数间距,是由第三四分位数,和第1四分位数向减而得。(3)方差:也叫均方差,反映一组数据的平均离散水平。(4)标准差:是方差的正平方根,其量纲与原变量值相同(5)变异系数:记为CV,多用于观察指标单位不同时,或均数相差较大时的比较。它实质上是一个相对变异指标,无单位。

三、两者的区别。A、集中趋势的描述:(1)算数均数:适用于对称分布资料;(2)几何均数:适合于作对数变换后对称分布资料;(3)中位数和百分位数:①适用于任何分布的资料;②中位数和百分位数在样本含量较少时不稳定,越靠两端越不稳定;

③中位数在抗极端值的影响方面,比均数具有较好的稳定性,但不如均数精确。因此,当资料适合计算均数或几何均数时,不宜用中位数表示其平均水平。不同质的资料应考虑分别计算平均数。B、离散趋势的描述:(1)极差不稳定,不灵敏。(2)标准差的基本内容是离均差,它显示一组变量值与其均数的间距,故标准差直接地、平均地描述了变量值的离散程度。在同质的前提下,标准差大表示变量值的离散程度大,即变量值的分布分散、不整齐、波动较大;反之,标准差小表示变量值的离散程度小,即变量值的分布集中、整齐、波动较小。(3)变异系数派生于标准差,其应用价值在于排除了平均水平的影响,并消除了单位。

2、中位数和标准差的作用。

答:(1)标准差:是方差的正平方根,其量纲与原变量值相同。标准差是统计分析中最常用的变异指标,适用于近似正态分布的资料,大样本、小样本均可用。四份位数间距适用于偏态分布资料,四分位半间距相当于偏态分布资料的“标准差”。(2)中位数:是将n个变量值从小到大排列,位置

居中间的那个数。分为奇偶两种情况。中位数适用于任何分布资料,有不确定值的资料。常用于描述偏态分布资料的集中趋势,反映位次居中的观察值的平均水平。在对称分布的资料中,中位数和算术平均数在理论上是相同的。适用于当一组变量值呈偏态分布,或资料的分布情况不清楚,或变量值一端(或两端)无确定数值(开口型资料),均可用中位数表示其集中趋势。

3、正态分布、标准正态分布及对数正态分布的联系和区别。

答:(1)正态分布:原始值不需转换;属于对称分布类型;用μ表示集中趋势的指标;均数与中位数的关系是μ=M(中位数)。(2)标准正态分布:作u转换;属于对称分布类型;集中趋势μ=0;均数与中位数的关系是μ=M。(3)对数正态分布:作对数转换;属于正偏太分布;集中趋势用G (几何均数表示);均数与中位数的关系是μ>M。

第三章总体均数的估计与检验假设1、举例说明标准差与标准误的区别与联系。

答:标准差是描述个体值变异程度的指标,为方差算术平方根,该变变异不能通过统计方法来控制。而标准误则是指样本统计量的标准差,均数的标准误实质是样本均数的标准差,它反映了样本均数的离散程度,反映了样本均数与总体均数的差异,说明了均数的抽样误差。具体举例略。

2、u分布和t分布有何不同。

答:t分布为抽样分布;u分布为标准正态分布,为理论分布。t分布比标准正态分布的峰值低,且尾部翘得更高。随自由度的增大,t分布逐渐趋近标准正态分布。

3、均数的可心信区间与参考值范围有何不同。

答:(1)均数的可信区间按预先给定

的概率所确定的未知参数的可能范围。用于估计总体的均数。(2)参考值范围是“正常人”的解剖、生理、生化某项指标的波动范围。用于判断观察对象的某项指标正常于否。

4、t检验的应用条件。

答:(1)单样本的t检验要求资料服从正态分布。(2)配对t检验要求差值服从正态分布。(3)两样本的t检验要求两组数据服均从正态分布,切两样本的方差相等,尤其对小样本。

5、假设检验的结论不能绝对化。答:通过假设检验作出的检验推断具有概率性,有可能发生两类错误。拒绝H O时犯I型错误,接受H O时间犯II 型错误。

6、假设检验和区间估计的区别。答:假设检验用于推断质的不同的两个总体或多个总体参数是否不等。可信区间估计是用于说明量的大小,推断总体参数的范围。可信区间可以回答假设检验的问题。在判断两个或多个总体参数是否不相等时,假设检验与区间估计是完全等价的。

第四章多个样本均数比较的方差分析

1、方差分析的基本思想和应用条件。答:基本思想:是根据实验设计的类型,将全部测量值总的离均差平方和及自由度分解为两个或多个部分,除随机误差作用外。每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释。通过比较不同变异的来源的均方,借助F分布作出统计推断从而推论各种研究因素对实验结果的影响。

应用条件:①各样本是相互独立的随机样本,均服从正态分布。②相互比较的各样本的总体方差相等。具有方差齐性。

2、随机区组设计与完全随机设计在设计和变异分解上有何不同。

答:随机区组设计:随机分配的次数

越多,每次随机分配都对同一区组内的受试对象进行,且歌处理组受试对象数量相同,区组内均衡。四种变异处理组间变异、区组间变异、误差变异、总变异。完全随机设计:采用完全随机化分组方法,将全部试验对象分配到g个处理组(水平组),各组接受不同的处理。三种变异组间变异、组内变异、总变异。

第五章计数资料的统计描述

1、举例说明为什么不能以构成比代替率。

答:(1)率=某时期内发生某现象的观察单位数字/同时期可能发生某现象的观察单位总数。用来说明某现象发生的频率或强度。(2)构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位总数。用来说明各构成部分在总体中所占的比重或分布。举例略。

2、应用标准化率进行比较时的注意问题。

答:(1)只适用于两组内部构成不同,并有可能影响两组分组的情况。(2)比较几个标准化率时采用统一标准口。(3)标准化后的标准化率,已不再反映当时当地的实际水平,它只表示相互比较的资料的相对水平。(4)两样本标准化率是样本值,存在抽样误差。3、相对数的动态指标及作用。答:即动态数列的分析指标:绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。(1)绝对增长量:某相对数在一定时期的增长的绝对值;(2)发展速度与增长速度:某相对数在一定时期的速度变化;(3)平均发展速度:各环节比发展速度的几何均数。说明某相对数在一个较长时期中平均发展变化的程度。

第六章几种离散型变量的分布及其应用

1、二项分布的应用。

答:(1)每次试验之发生两种互斥可能结果,互斥结果的概率和等于1;(2)每次产生某种结果的概率固定不变;(3)重复试验是独立的。

2、Poisson分布的性质。

答:(1)总体均数λ与总体方差σ2相等;(2)当n很大时候,而π很小时候,πn=λ为常数,Poisson分布是二项分布的极限分布;(3)当λ增大,Poisson分布渐近正态分布。当λ≥20时,做正态分布资料处理。(4)具可加性质。

3、二项分布、Poisson分布和正态分布的联系。

答:(1)当n很大时,而π很小的时,且πn=λ为常数,Poisson分布是二项分布的极限分布;(2)当n较大,而π不接近0也不接近1时候,二项分布近似正态分布。(3)当λ增大时,Poisson分布渐进正态分布,一般λ≥20时,做正态分布资料处理。第七章Χ2检验

1、Χ2检验的用途。

答(1)用于推断个总体率或构成比之间有无差别;(2)推断多个总体或构成比之间有无差别;(3)多个样本率比较的Χ2分割;(4)两个分类变量间有无关联性;(5)频数分布的拟合优度检验。

2、两样本率的u检验和Χ2检验有何区别。

答:两样本率进行比较时,若对同一样本资料同时进行u检验和Χ2检验,在不教正的情况下,Χ2=u2;u检验通常用于大样本,Χ2检验用于小样本。3、R*C列联表资料的Χ2检验应注意的事项。

答:(1)R*C列联表中的理论频数不能小于1,或1<T<5的格子数不宜超过格子总数的1/5;(2)多个样本率比较,若所的到的统计推断为拒绝H0,接受H1时,只能认为各总体率之间总的来说有差别,但不能说任两

个总体率有差别,需进一步做多个样本率的比较,做多个样本率的多重比较。(3)对有序的R*C列联表资料不宜用Χ2检验。

4、R*C列联表资料的分类及其检验方法的选择。

答:(1)分类:双向无序、单向无序、双向有序属性相同、双向有序属性不同。(2)检验方法的选择:①双向无序R*C列联表资料。研究多个样本率或构成比的比较,用行*列表的Χ2检验;研究两分类变量间有无关联性以及关系密切程度,可用行*列表的Χ2检验以及Pearson列联表系数进行分析。②单向无序R*C列联表资料。若R*C表中的分组变量是有序的,而指标变量是无序的,用行*列表的Χ2检验分析其构成情况。若R*C表的分组变量是无序的,指标变量是有序的,用秩转换的非参数检验分析。③双向有序属性相同R*C列联表资料。用一致性检验分析两种检测两方法的一致性。④双向有序属性不同R*C列联表资料。若研究目的为分析两有序分类变量间是否存在相关关系,用宜等级相关分析或Pearson积矩相关分析;若研究目的为分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验;若研究目的为分析不同年龄组患者疗效间有无差别时,可视其为单向有序R*C 列联表资料,选用秩转换的非参数检验分析。

第八章秩转换的非参数检验

1、非参数检验,与参数检验的区别。答:非参数检验对总体分布不作严格的假定,不受总体分布的限制,又称任意分布检验。它直接对总体分布(或分布位置)作假设检验。总体分布为已知的数学形式,对其总体参数作假设检验则为参数检验。

2、秩转换的非参数检验,适用情况。答:秩转换的非参数检验是先将数值

变量从小到大,或等级从弱到强转换成秩后,再计算检验统计量。其特点是假设检验的结果对总体的分布形状差别不敏感,只对总体的分布位置差别敏感。适用于:①不满足正态或(和)方差齐性的小样本资料;②分布不知是否正态的小样本资料;③一端或两端是不确切数值的资料;④等级资料。

3、两组或多组等级资料的比较,为何不用Χ2检验而用秩转换的非参数检验。

答:Χ2检验只能推断两个或多个总体的等级构成比的差别。选用秩转换的非参数检验,可推断两个或多个总体的等级强度差别。

第九章双变量回归与相关

1、何为“最小二乘”原则。

答:在直线回归方程中,将实际测量值与假定回归线上估计值的纵向距离称之为残差,通常情况下取各点残差的平方和的最小直线为所求得的回归直线。即所谓的“最小二乘原则”。

2直线回归分析中的注意问题(即直线回归的应用条件)。

答:(1)两变量的选择一定要有专业背景,直线回归要求至少对于每个X 相应的Y要服从正态分布,X可以是服从正态分布的随机变量也可以能精确测量和严格控制的非随机变量。(2)分析前应绘制散点图,检查数据是否满基本假设。(3)对结果应有正确的解释。

3、直线回一归与直线相关的区别与联系。

答:联系:(1)对于既可以做回归分析又可做相关的同一组数据,计算出的b与r的正负号一致;(2)相关系数与回归系数的假设检验等价。对同一样本t b=t r。(3)同一组数据的相关系数和回归系数可以相互换算。(4)用回归解释相关:由于决定系数

r2=SS回/SS总,当总平方和固定时,回归平方和的大小决定了相关的密切程度,回归平方和越接近总平方和,则r2越接近1,说明相关的效果越好。区别:(1)资料上:相关要求X、Y 服从双变量正态分布,这种资料进行回归称II型回归;回归要求Y在给定某个X值服从正态分布,X是可以精确测量和严格控制的变量,称I型回归。

(2)应用上:双变量间相互关系用用相关,此时两变量的关系是平等的;而说明两变量间依存变化的数量关系用回归,用以说明Y如何依赖于X而变化。

(3)意义上:说明具有直线关系的两变量间相互关系的方向与密切程度;b表示X每变化一个单位所导致的Y的平均变化量

(4)单位:r没单位,b有单位。(5)取值范围不同

(6)计算公式不同第十章统计图和统计表

1、统计表的制表原则与要求。

答:原则:(1)重点突出,一张表只表达一个中心内容;(2)统计表描述要完整,有起描述的对象(主语)和内容(宾语),通常主语放在表的左边作横标目,宾语放在右边作纵标目。(3)统计表应简单明了,文字数字、线条尽量从简。要求:(1)标题:概括表的主要内容,包括研究时间、地点、内容等放在在表的正上方。(2)标目:分别用横标目和纵标目说明表的每行和每列数字的意义。注单位。(3)线条:至少要用三线条,表格的顶线和底线将表格与文章的其它部分隔开来,纵标目下横线将标目的文字区与表格的数字区分隔开来。(4)数字:………..

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

《医学统计学》期末模拟考试题(四)

《医学统计学》期末模拟考试题(四)学号______________ 姓名______________ 班级______________ 成绩 ____________ 一、是非题(每题1分,共20分) 1. 预试验的样本标准差s越小,所需样本含量越大。() 2. 等级相关系数的大小不可以反映两个现象间关系的密切程度。() 3. 在配对资料秩和检验中,两组数据统一从小到大编秩次。() 4. 对3个地区居民的血型构成作抽样调查后研究其差别,若有一个理论数小于5大于1,其余都大于5,可直接作χ2检验。() 5. 总例数等于60,理论数都大于5的四格表,对两个比例的差别作统计检验,不可用确切概率法。() 6. 双变量正态分布资料,样本回归系数小于零,可认为两变量呈负相关。() 7. 随机区组方差分析中,只有当区组间差别的F检验结果P>0.05时,处理组间差别的F检验才是真正有 意义的。() 8. 完全随机设计资料方差分析中要求各组均数相差不大。() 9. 两次t检验都是对两样本均数的差别作统计检验,一次P<0.01,另一次P<0.05,就表明前者两样本均 数差别大,后者两样本均数相差小。() 10. 如果把随机区组设计资料用完全随机设计方差分析法作分析,前者的区组SS+误差SS等于后者的组内SS。()

11. 两分类Logistic回归模型的一般定义中,因变量(Y)是0~1变量。() 12. 作两样本均数差别的比较,当P<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。()<0.01时,统计上认为两总体均数不同,此时推断错误的可能性小于0.01。() 13. 方差分析的目的是分析各组总体方差是否不同。() 14. 在两组资料比较的秩和检验中,T值在界值范围内则P值小于相应的概率。()值在界值范围内则P值小于相应的概率。() 15. 无论什么资料,秩和检验的检验效率均低于t检验。()检验。() 16. 分类资料的相关分析中,检验的P值越小,说明两变量的关联性越强。() 17. 析因设计既可以研究各因素的主效应作用,又可以研究各因素间的交互作用。( ) 18. 当Logistic回归系数为正值时,说明该因素是保护因素;为负值时,说明该因素是危险因素。() 19. 常见病是指发病率高的疾病。( ) 20. 用某新药治疗高血压病,治疗前与治疗后病人的收缩压之差的平均数,经t检验,P<0.01。按a=0.05水准,可以认为该药治疗高血压病有效,可以推广应用。( ) 二、选择题(每题1分,共20分) 1.多重回归中要很好地考虑各因素的交互作用,最好选用________。 a. 最优子集法 b. 逐步法 c. 前进法 d. 后退法 e. 强制法 2.t r

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

医学统计学模拟试题

医学统计学模拟试题(A) 一、单选题:在A、B、C、D 和E 中选出一个最佳答案,将答案的字母填在相应下划线的空格里。 (每题1 分) 1. 卫生统计工作的基本步骤包括_____。 A 动物实验、临床试验、全面调查和抽样调查 B 资料整理、统计描述、参数估计和统计推断 C 实验设计、资料收集、资料整理和统计分析 D 资料收集、资料核对、资料整理和资料分析 E 统计设计、统计描述、统计估计和统计推断 2. 以下_____不属于定量资料。 A. 体块指数(体重/身高2) B. 白蛋白与球蛋白比值 C. 细胞突变率(%) D. 中性核细胞百分比(%) E. 中学生中吸烟人数 3. 关于频数表的制作, 以下_____论述是正确的。 A. 频数表的组数越多越好 B. 频数表的下限应该大于最小值 C. 频数表的上限应该小于最大值 D. 一般频数表采用等距分组 E. 频数表的极差是最小值与最大值之和 4. 比较身高与坐高两组单位相同数据变异度的大小,宜采用_____。 A. 变异系数(CV)B.标准差(s)C.方差(s2)D.极差(R)E.四分位间距 5. 从μ到μ+1.96s 范围外左右两则外正态曲线下的面积是_____ 。 A.2.5% B.95% C.5.0% D.99% E.52.5% 6. 关于假设检验的以下论述中,错误的是_____。 A. 在已知A药降血压疗效只会比B 药好或相等时, 可选单侧检验 B. 检验水准 定得越小, 犯I型错误的概率越小 C. 检验效能1- 定得越小, 犯II型错误的概率越小 D. P 值越小, 越有理由拒绝H0 E. 在其它条件相同时, 双侧检验的检验效能比单侧检验低 7. 两组数据中的每个变量值减同一常数后,做两个样本均数( X)差别的t 检验,____。 A. t 值不变B. t 值变小C. t 值变大 D. t 值变小或变大E. 不能判断 8. 将90 名高血压病人随机等分成三组后分别用A、B 和C 方法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是____ 。 A. 作三个样本两两间差值比较的t 检验 B. 作三个样本差值比较的方差分析 C. 作服药前后配对设计资料的t 检验方差分析 D. 作配伍组设计资料的方差分析 E. 以上都不对

(完整word版)医学统计学上机考试复习题及答案

“医学统计学”上机考试模拟题A卷 1.测得10例某指标值治疗前后情况如下: 例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1.用参数方法比较治疗前后该指标值的差异有无统计学意义,结果填入下表: 例数均数标准差治疗前 治疗后 差值(前-后) H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量t=2.512 P=0.0332 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即治疗前后该指标值有差异。 2.上题资料,用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量s=19.5 P=0.0547 统计结论:P>0.05,不拒绝H0,认为在α=0.05水平上差异无统计学意义,即治疗前后该指标值无差异。

3.测得10例正常儿童身高(cm)和体重(kg)如下: 例号 1 2 3 4 5 6 7 8 9 10 身高(X)120 133 126 130 121 122 131 128 110 124 体重(Y)20 27 23 25 25 18 22 25 15 22 (1)求身高和体重的相关系数,并作显著性检验。 相关系数r =0.81211 H0:p=0 H1:p≠0 P= 0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重存在正相关。 (2)求身高推算体重的直线回归方程,并作显著性检验。 直线回归方程:y=-32.964+0.443*x H0:β=0 H1:β≠0 P=0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重之间存在直线回归关系。 三.10名氟作业工人在工作前后测定尿氟(mg/L)排出量结果如下: 编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1.计算工后比工前尿氟排出量增加值的均数,标准差,标准误,变异系数和中位数。 均数0.91,标准差0.635,标准误 0.201,变异系数 69.78,中位数 0.900 2.检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0:氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1:氟作业工人在工作前后尿氟排出量的差异有有统计学意义 统计量t=4.532 P=0.0014

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学模拟试卷与答案

医学统计学历年常考总结试题3元第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制() A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是() A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用() A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是() A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为() (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为() A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验() A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,

自由度是() (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映() A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的( ) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系 数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?() A t r>t b B t rχ20.05,ν可认为() A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数 4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为() A.pearson卡方检验 B.校正卡方检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;

医学统计学试题及答案

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr

医学统计学模拟试卷及答案

(注:红色字体表示已经改正,多余表示删除的内容) 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A) A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小

医学统计学试题及答案1、2、3套

医学统计学试题及答案 1、2、3套 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图 B百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似 正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价 C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C标准差 D四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数 不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n 1和n 2 ,在进行成组设计资 料的t检验时,自由度是(D ) (A)n 1+ n 2 (B)n 1+ n 2 –1 (C)n 1+ n 2 +1 (D)n 1+ n 2 -2 10、标准误反映(A) A抽样误差的大小 B总体参数的波动大小 C重复实验准确度的高低 D数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关 分析。令对相关系数检验的t值为t r ,对回归系数检验的t值为t b , 二者之间具有什么关系?(C)

【孙振球第四版】医学统计学复习题

一、名词解释: 1、总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。 2、有限总体:是指空间、时间范围限制的总体。 3、无限总体:是指没有空间、时间限制的总体。 4、样本:从总体中随机抽取部分观察单位,其实测值的集合。 5、计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 6、计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 7、等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大小或属性程度。 8、随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 9、平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 10、抽样误差:由于个体差异和随机抽样造成的样本统计量和总体参数之间的差异,以及统一总体若干样本

统计量之间的差异。 11、I型错误:拒绝了实际上成立的H0,这类“弃真”错误称为I型错误。检验水平,就是预先规定的允许犯I 型错误概率的最大值。I型错误概率大小也用α表示,α可取单尾亦可取双尾。 12、II型错误:“接受”了实际上不成立的H0,这类“取伪”的错误称为II型错误。其概率大小用β表示,β只取单尾,β值的大小一般未知,,须在知道两总体差值δ、α及n时,才能算出。 13、相对数:两个有联系的指标之比,是分类变量常用的描述性统计指标,常用两个分类的绝对数之比表示相对数学的大小。如率、构成比、比等。 14、率:强度相对数,说明某现象发生的频率或强度。 15、构成比:结构相对数字,表示事物内部某一部分的个体与该事物各个部分个体数的和之比。用来说明各构成部分在总体所占的比重或分布。 16、相对比:简称比,是两个相关联指标之比,说明两指标间的比例关系。两指标可以性质相同,也可以性质不同,通常以倍数或百分数表示。两指标可以是绝对数、相对数或平均数。 17、标准化:采用某影响因素的统一标准构成以消除内部构成不同对总率的影响,使通过标化后的标准率具有可比性。 18、动态数列:是一系列按时间顺序排列起来的统计指标,用以观察和比较该事物在时间上的变化和发展趋势。常用指标有绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。 19、非参数检验:相对于参数检验而言,不依赖于总体分布类型,也不对总体参数进行统计推断的假设检验方法,称为参数检验。 20、相关系数:又称Pearson积差相

医学统计学模拟试题B

医学统计学模拟试题(B) 一、单选题:在A,B,C,D,E 中选一个最佳答案, 将答案字母填在下划线里(每题1 分) 1. 在医学统计学中样本与总体的关系是__________。 A样本是总体中有代表性的一部分 B 样本是总体中最有特点的一部分 C 样本是总体中典型的一部分 D 样本是总体中有意义的一部分 E 样本是总体中精心挑选出来的一部分 2. 以下关于概率的定义中,__________是错误的。 A. 当概率小于0.05, 则为不可能事件 B. 当概率等于1, 则为必然事件 C. 当概率在0 至1 之间时, 为随机事件 D. 当重复实验次数足够大时, 事件发生频率接近概率 E. 当概率等于零, 则为非随机事件 3. 频数表不能__________。 A. 反映频数分布的特征 B. 方便进一步统计分析计算 C. 便于发现异常值 D. 精确估计算术均数的值 E. 用于分类资料 4. 在描述定量资料的集中趋势时, 以下论述中错误的是__________。 A. 均数适宜于对称分布资料 B. 几何均数和中位数都适宜于正偏倚分布 C. 同一正偏倚分布资料, 估计的均数值小于中位数值 D. 对称分布资料的均数值等于中位数值 E. 几何均数特别适宜于细菌学和免疫学检测指标的描述 5. 用大量来自同一总体的独立样本对总体参数作估计时,关于95%可信区间(CI),正确的说法是__________。 A. 大约有95%样本的95%CI覆盖了总体参数 B. 对于每一个95%CI而言,总体参数约有95%的可能落在其内 C. 各个样本的95%CI是相同的 D. 对于每一个95%CI而言,有95%的可能性覆盖总体参数 E. 以上说法都不对 6. 在假设检验中,关于P值与 值,下列说法不正确的是__________。 A. α值是决策者事先确定的一个可以忽略的、小的概率值 B. P值是在H0 成立的条件下,出现当前值以及更极端状况的概率 C. α值并不一定要取0.05, 根据实际需要甚至可以取到0.15 D. 在同一次假设检验中,作单侧检验时所得P值比作双侧检验时所得P值小 E. α值越小,所得结论越可靠 7. 当组数等于2 时,对于同一资料,方差分析与t 检验的关系是____ 。 A.完全等价且F=t B.方差分析结果更准确C.t 检验结果更准确 D.完全等价且t=FE.以上都不对 8. 下列关于方差分析的陈述中正确的是____。 A. 方差分析用于比较各组的总体方差是否相等

《医学统计学》期末模拟考试题(三)

《医学统计学》期末模拟考试题(三)一.是非题(每题1分,共20分) 1.评价某人的某项指标是否正常,所用的范围是。() 2.配对资料若用成组t检验处理,就降低了统计效率。() 3.因为两类错误的存在,所以不能凭假设检验的结果下结论。() 4.随机区组设计的区组变异和误差两部分相当于完全随机设计方差分析的组内变异。() 5.抗体滴度资料经对数转换后可做方差分析,若方差分析得P<0.05,则可认为实测数据的各总体算术均数不全相等。() 6.五个百分率的差别的假设检验,>,可认为各组总体率都不相同。()4.在两样本均数比较的Z检验中,若Z≥Z0.05,则在α=0.05水平上可认为两总体均数不等。() ,P值越小,则说明两总体均数差别越大。()5.在t检验中,若拒绝H 6.对三个地区血型构成(A、B、O、AB型),作抽样调查后比较,若有一个理 论频数小于5大于1且n>40,必须作校正检验。() 7.如果两个变量的变动方向一致,同时呈上升或下降趋势,则二者是正相关关系。()

8.Ⅱ期临床试验是指采用随机盲法对照实验,评价新药的有效性及安全性,推荐临床给药剂量。() 9.临床试验中,为了避免人为主观因素的影响,保证结果的真实性,通常不让受试者及其家属知道他参与这项试验。() 10.假定变量X与Y的相关系数r1是0.8,P1<0.05;变量M与N的相关系数r2 为-0.9,P 2<0.05,则X与Y的相关密切程度较高。与Y的相关系数r 1 是0.8, P 1 <0.05;变量M与N的相关系数r2为-0.9,P2<0.05,则X与Y的相关密切程度较高。() 11.临床试验必须符合《赫尔辛基宣言》和国际医学科学组织委员会颁布的《人体生物医学研究国际道德指南》的道德原则。() 12.当直线相关系数r=0时,说明变量之间不存在任何相关关系。=0时,说明变量之间不存在任何相关关系。() 13.偏回归系数表示在除X i以外的自变量固定不变的条件下,X i每改变一个单位 的平均变化。以外的自变量固定不变的条件下,X i 每改变一个单位的平均变化。() 14.单盲法是让病人知道自己在实验组或对照组,但不知道用什么处理。()15.重复原则是指少选择样本例数。() 16.越小,所需样本含量越大。() 17.在相同条件下完全随机设计比随机区组设计更节约样本含量。()18.配对符号秩和检验中,有差值绝对值相等时,可不计算平均秩次。()

重点医学统计学试题及答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数

C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数

医学统计学模拟试题

考试成绩100分=70分卷面+30分平时成绩 卷面成绩100分,按70%折合,考试时间为2小时

一、 选择题 1. 调查某疫苗在儿童中接种后的预防效果,在某地全部 1000 名易感儿童中进行接种,经一定时间后从中随机抽取 300名儿童做效果测定,得阳性人数228 名。若要研究该疫苗在该地儿童中的接种效果,则 A. 该研究的样本是 1000 名易感儿童 B. 该研究的样本是 228 名阳性儿童 C. 该研究的总体是 300 名易感儿童 D. 该研究的总体是 1000 名易感儿童 E. 该研究的总体是 228 名阳性儿童 2. 各观察值均加(或减)同一数后: A 、均数不变,标准差改变 B 、均数改变,标准差不变 C 、两者均不变 D 、两者均改变 E 、以上均不对 3. 比较12岁男孩和18岁男子身高变异程度大小,宜采用的指标是: A 、全距 B. 标准差 C. 方差 D. 变异系数 E 、极差 4. 统计学中的小概率事件,下面说法正确的是: A .反复多次观察,绝对不发生的事件 B .在一次观察中,可以认为不会发生的事件 C .发生概率小于0.1的事件 D .发生概率小于0.001的事件 E .发生概率小于0.1的事件 5. 均数与标准差之间的关系是: A .标准差越大,均数代表性越大 B .标准差越小,均数代表性越小 C .均数越大,标准差越小 D .均数越大,标准差越大 E .标准差越小,均数代表性越大 6. 横轴上,标准正态曲线下从0到1.96的面积为: A.95% B.45% C.97.5% D.47.5% E.49.5% 7. 当第二类错误β由0.2变到0.3时,则第一类错误α是: A.增大 B.减小 C.不确定 D.不变化 E.以上都不对 8. 各种概率抽样方法按抽样误差按由大到小顺序排列,其顺序为 A. 整群抽样、单纯随机抽样、系统抽样、分层抽样 B. 整群抽样、系统抽样、单纯随机抽样、分层抽样 C. 分层抽样、单纯随机抽样、整群抽样、系统抽样 D. 系统抽样、单纯随机抽样、整群抽样、分层抽样 E. 系统抽样、整群抽样、分层抽样、单纯随机抽样 9. 假设检验中的第二类错误是指 A.拒绝了实际上成立的0H B.不拒绝实际上成立的0H C.拒绝了实际上不成立的1H D.不拒绝实际上不成立的0H E.拒绝0H 时所犯的错误 10. 两样本比较作t 检验,差别有显著性时,P 值越小说明 A.两样本均数差别越大 B.两总体均数差别越大 C.越有理由认为两总体均数不同 D.越有理由认为两样本均数不同 E. I 型错误越大 11. 经调查甲乙两地的冠心病粗死亡率均为 4/105,经统一年龄构成后,甲地标化率为 4.5/105,乙地为 3.8/105。因此可认为 A.甲地人群平均年龄较乙地大 B.甲地人群平均年龄较乙地小

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B ) A 条图 B 百分条图或圆图 C 线图 D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95% 或99% 正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99% 的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是(A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和B 均不是 D. A 和B 均是 8、两样本均数比较用t 检验,其目的是检验(C ) A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t 值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8 人。该资料宜选用的统计方法为(A ) A.四格表检验B. 四格表校正检验C t 检验D U 检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

《医学统计学》期末模拟考试题(一)

《医学统计学》期末模拟考试题(一) 学号_________姓名_______班级________成绩_________ 一.填空题(每空0.5分,共15分) 1.科研结果的好坏取决于___________的好坏,研究设计是统计工作的基础和关键,决定着整个统计工作的成败。 2.概率是________________________________________________。小概率事件是指__________的随机事件。 3.实验设计四大原则为___________、_________、____________、______________。 4.实验设计三要素是指_______________、______________、_____________。 5.假设检验的基本思想是_________________和____________________。 6.随机抽样是指_____________________________________________。 7.Ⅱ类错误的意思是________________________________________________。 8.作两样本均数的比较时,如P>0.05,则应_________无效假设,结论为__________________。 9.变异系数用于_______________,或_______________________________资料间变异程度的比较。 10.均衡性原则是指_________________________________________________。 11.正态分布N(μ,σ2)中有两个参数:____________和____________。 12.标准化死亡比(SMR)是_______________________________________之比。

相关文档
最新文档