医药数理统计习题及答案汇编
学习好资料
第一套试卷及参考答案
一、选择题 ( 40 分)
1、根据某医院对急性白血病患者构成调查所获得的资料应绘制 ( B ) A 条图B 百分
条图或圆图C 线图D 直方图
2、均数和标准差可全面描述D 资料的特征
A 所有分布形式E负偏态分布C正偏态分布D正态分布和近似正态分布
3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A )
A 用该市五岁男孩的身高的95%或99%正常值范围来评价
B 用身高差别的假设检
验来评价
C 用身高均数的95%或99%的可信区间来评价
D 不能作评价
4、比较身高与体重两组数据变异大小宜采用( A )
A 变异系数
B 方差
C 标准差
D 四分位间距
5、产生均数有抽样误差的根本原因是( A )
A. 个体差异
B. 群体差异
C. 样本均数不同
D. 总体均数不同
6、男性吸烟率是女性的10 倍,该指标为( A )
(A)相对比(B)构成比(C)定基比(D )率
7、统计推断的内容为( D )
A.用样本指标估计相应的总体指标
B.检验统计上的“检验假设”
C. A和B均不是
D. A和B均是
8、两样本均数比较用t 检验,其目的是检验( C )
A两样本均数是否不同B两总体均数是否不同
C 两个总体均数是否相同
D 两个样本均数是否相同
9、有两个独立随机的样本,样本含量分别为n i和住,在进行成组设计资料的t 检
验时,自由度是( D )
(A) n i+ n2 (B) n i+ n2 -
C) n1+ n2 +1 D) n1+ n2 -2
10、标准误反映( A )
A 抽样误差的大小
B 总体参数的波动大小
C 重复实验准确度的高低
D 数据的离散程度
11、最小二乘法是指各实测点到回归直线的(C)
A垂直距离的平方和最小E垂直距离最小
C纵向距离的平方和最小D纵向距离最小
12、对含有两个随机变量的同一批资料, 既作直线回归分析, 又作直线相关分析。
令对相关系数检验的t值为t r,对回归系数检验的t值为t b, 二者之间具有什么关系?( C)
A t r >t b
B t r C t r = t b D「者大小关系不能肯疋 13、设配对资料的变量值为x i和X2,则配对资料的秩和检验(D ) A分别按xi和x2从小到大编秩 B把xi和x2综合从小到大编秩 C把xi和x2综合按绝对值从小到大编秩 D把xi和x2的差数按绝对值从小到大编秩 14、四个样本率作比较,x 2>x 20.05, v可认为(A ) A各总体率不同或不全相同B各总体率均不相同 C各样本率均不相同D各样本率不同或 不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35 人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用的统计方法为(A ) A.四格表检验 B.四格表校正检验 C. t检 验D. U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为 0.53kg ;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验, p=0.0034<0.01,这意味着(D A南方和北方女婴出生体重的差别无统计学意义 B南方和北方女婴出生体重差别很大 C由于P值太小,南方和北方女婴出生体重差别无意义 D南方和北方女婴出生体重差别有统计学意义但无实际意义。 17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指 (A ) A两个样本率的差别标准误 C两个总体率的差别 B两个样本率的 D两个总体率的 标准差 18.下列指标不属于相对数的是( D ) A率B构成比C比D百分位数 19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验, 以西替利嗪 片组作为对照组,治疗28天后结果如下表,现要比较两种药物的疗效, 何种方法为优:(D ) 表1盐酸左西替利嗪片治疗慢性特发性荨麻疹临床疗效 20、下列哪种说法是错误的(B ) A计算相对数尤其是率时应有足够的观察单位或观察次数 B分析大样本数据时可以构成比代替率 C应分别将分子和分母合计求合计率或平均率 D样本率或构成比的比较应作假设检验 二、填空题(20分) 1、现有若干名儿童健康检查一览表的部分检测指标,见表 2 表2 某年某地儿童健康检查部分检测结果 编号性 别 年龄(周 岁) 身高(cm 坐高(cm)血型表面抗 原 肝 大 1 男7 116.7 66.3 A + ++ 2 女8 120.0 68. 3 AB - - 3 女10 126.8 71.5 O - + 4 男9 123.7 70.0 A . . 问:①上述变量中能形成计数资料的指标有性别、血型、表抗 ②计量资料的指标有年龄、身高、体重 ③等级资料的指标有肝大 ④对于身高或坐高指标,在进行统计描述时宜计算均数和标 准差表示其集中趋势和离散趋势。 ⑤对于血型指标宜计算构成比表示各种血型的构成 ⑥若要分析不同性别身高有无不同,宜选用的统计方法有两样本均数比较的 t检验 ⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有卡方 检验 2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人, 其中恶 性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10 万)为341.48/10 万 3、临床上安排试验设计时,应考虑的三个基本原则是对照随机重 三、简答题(20分) 1、描述集中趋势的指标有哪些?其适用范围有何异同?( 5 分) 均数:正态或近似正态分布 几何均数:等比数列或对数正态分布资料 中位数:资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料) 时。 2、何谓假设检验?可以举例说明。(5分) 首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及 其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。 3、请你谈谈对假设检验结论的认识。(5分) 由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。 4、请你谈谈标准差和标准误的异同点。(5 分) 四、计算分析题10分*2=20 1、请将下列数据编制成合格的统计分析表。 | 百分比| 3.3% | 10% | 16.7% | 26.7% 表1四种脐带消毒方法效果比较 组别总例数感染例数百分比,% 庆大霉素(8万单位/10毫30 1 3.3 升) 新洁尔灭(0.1%)30 3 10 生理盐水冲洗服四环素3 30 16.7 5 天 26.7 生理盐水冲洗30 8 2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40岁以后剧降,10岁以下儿童较50岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。 __________________ 某医院门诊沙眼病人年龄构成比____________ 年 50 60 70 0- 10- 20- 30- 40- 计 沙 47 198 330 198 128 80 38 8 1027 沙 4.19. 32. 19. 12. 7. 3. 0. 100. 问以上结论是否合理 ?说明理由。要达到作者的目的,应计算什么相对数 指标? 答:不合理。 沙眼百分比大小受该年龄段患病率与就诊对象年龄分布 (即 该地年龄结构)有关,因此百分比高并不意味患病率就高 即患者数与该年龄段总人口数之比。 第二套试卷及参考答案 一、 最佳选择题( 40 分) 1. 均数是表示变量值 A 水平的指标。 别大小 2.原始数据同乘以一个不等于 0 的常数后 _D_。 均不变 (C)均数变、标准差不变 均变 3.描述正态或近似正态分布资料特征的是 (C)中位数、标准差 5. 均数与标准差计算的数值 A o (A) 均数可以是负数,标准差不可以(B)均数不可以是负数,标准差可以 (C)两者都可以是负数 是负数 6、 比较身高和体重两组资料的变异度大小宜采用 ___C (A)极差 (B)标准差 (C)变异系数 (D) 四分位间距 应计算患病率, (A)平均 (B)变化范围 (C)频数分布 (D)相互间差 (A) 均数不变、标准差变 (B)均数、标准差 (D)均数、标准差 (A)中位数、四分位间距 (B)均数、标准差 (C)中位数、标准差 4.描述偏态分布资料特征的是 _A (D)几何均数、全距 (A)中位数、四分位间距 (B)均数、标准差 (D)几何均数、全距 (D)两者都不可以 7.说明某事物内部各组成部分所占比例应选_B___。 (A)率(B)构成比(C)相对 比(D)标准差 8 ?来自同一总体的两个样本中,_D_小的那个样本均数估计总体均数时更精确。 (A)S (B)R (C)CV (D ) 9.已知正常人某定量指标的总体均值卩0=5,今随机测得某地一组特殊人 群中的30人该指标的数值,为推断这组人群该指标的总体均值卩与卩0之间的差别是否有显著性意义,若用t检验,则自由度应该 是C (A)5 (B)28 (C)29 (D)4 10.正态分布曲线下,横轴上,从卩-1.96c到卩+1.96c的面积为A (A)95% (B)49.5% (C)99% (D)97% 11.两样本均数间的差别的假设检验时,查t 界值表的自由度为C (A)n-1 (B)(r-1)(c-1) (C)n1+n2-2 (D)1 12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A (A)总体中个体值存在差别(B)样本中个体值存在差 别 (C)样本只含总体的一部分(D)总体均数不等于0 13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误 最小B (A) a=0.05 (B) a=0.20 (C) a=0.01 (D) a =0.10 14.比较某地10 年间结核与白喉两病死亡率的下降速度,宜绘制C 。 (A)线图(B)条图(C)半对数线图(D )圆 图 15.构成比用来C (A)反映某现象发生的强度 (B)表示两个同类指标的比 (C)反映某事物内部各部分占全部的比重 (D)表示某一现象在时间顺序的排列 16.某医院的资料计算各种疾病所占的比例,该指标为 D (A)发病率(B)患病率(C)相对 比( D )构成比 17.等级资料的比较宜用C (A) t 检验(B) 检验(C) 秩和检验(D) 方差 分析 18.四格表中,当a=20,b=60,c=15,d=5 时,最小的理论频数等于C ( A) T11 ( B) T12 (C) T 21 ( D) T22 19.四格表校正x2检验公式适用于D ( A) n<40, T>5 ( B ) n<40, 1 (C) n>40, T<5 (D) n>40, 1 20.同一双变量资料,进行直线相关与回归分析,有 B (A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b 二、填空题12 分 1、统计资料按其性质不同,通常将资料分为(计量、计数、等级) 三 种类型。 2、统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步, 其中统计分析常分为( 统计描述)与(统计推断)两个阶段。 3、计量资料,随着样本例数的增大,S逐渐趋向于(c ),逐渐趋向于 (0 )。 4、变异系数常用于比较(单位不同)或(均数相差较大)情况下两组资料 的变异度。 5、(相关分析)侧重于考察变量之间相关关系密切程度,(回归分析)则 侧重于考察变量之间数量变化规律。 6、对某地一年级12名女大学生体重(x :单位kg)与肺活量(y:单位L) 的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回 归方程为:?=0.000419+0.058826X,这意味着体重每增加1kg ,肺活量 平均增加(0.058826L );且两者之间为(正)相关。 三、名词解释13分 1.参数和统计量 2.概率 3.计数资料 4.回归系数答案见书本相应的位置 四、简答题15分 1.抽样研究中如何才能控制或减小抽样误差?答:合理的抽样设计,增大 样本含量。 2.何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的? 答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的 差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此 这部分的结果与总体的结果存在差异彩是不可避免的 3.能否说假设检验的p值越小,比较的两个总体指标间差异越大?为什 么?答:不能,因为P值的大小与总体指标间差异大小不完全等同。 P值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的 总体差异,抽样误差大小不同,所得的P也会不一样,抽样误差大小实 际工作中主要反映在样本量大小上。 五、计算分析题 1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。 修改表:某年某地1964-1968年某病住院期与急性期病死率比较 年份病例数住院期急性期 死亡总 数 总病死率(% 死亡数病死率(% 1964 17 8 47.1 7 41.2 1965 13 5 38.5 4 30.8 1966 15 7 46.7 6 40.0 1967 15 6 40.0 6 40.0 1968 12 4 33.3 4 33.3 合计72 30 41.7 27 37.5 2、现有一临床试验数据,有5家医院参加,分为试验组(g=1 )和对照组 (g=0),见表1,请对该资料进行分析(只要写出具体的分析内容和统计 分析方法名称即可) 表1某新药临床试验部分指标 医院代 码性 别 身高体重 疗 效 组 别 1 1 175.00 63.00 3 0 1 2 157.00 54.00 2 0 1 1 178.00 67.00 2 1 1 2 165.00 50.00 3 0 2 162.00 51.00 4 0 2 156.00 48.00 2 1 1 176.00 62.00 2 1 1 184.00 72.00 2 0 5 1 168.00 65.00 2 0 5 2 166.00 46.00 2 1 分析:两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验; 两组入组的身高与体重是否可比可用两样本的t检验或u检验。两组疗效比较可用秩和检验。 第三套试卷及参考答案 一、选择题20分 1.7人血清滴度分别为 1:2,1:4,1:8,1:16,1:32, 1:64,1:128, 则平均滴 度为__C 6. 要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较 的卡方检验,构建一个4行2列的R*C 表后,其卡方值的自由度为__C_ D .跟样本含量有关 7. 假设检验中的第一类错误是指 _A__所犯的错误。 A.拒绝了实际上成立的H 0 B.不拒绝实际上成立的H 0 C ?拒绝了实际上不成立的H 0 D .不拒绝实际上不成立的H 0 8. 样本含量固定时,选择下列哪个检验水准得到的检验效能( 1- B )最 高__D___ A . B . C . D . 9.两样本均数的 t 检验对资料的要求是 _D___ A.正态性、独立性、方差齐性 B .资料具有代表性 C.为定量资料 D .以上均 对 10.四个率的比较的卡方检验,P 值小于0.01,则结论为_D__ A.四个总体率均不相等; B .四个样本 率均不相等; C.四个总体率之间肯定不等或不全相等; D.四个总体率之间不等或不 全相等。 A .1:12.4 B . 1:8 C .1:16 D .1:8 ~1:16 2.比较身高和体重两组数据变异度大小宜采用 ___A A.变异系数 B.方差 差 D.标准差 3.下列关于个体变异说法不正确的是 __C__ A.个体变异是生物体固有的。 有规律的。 C. 增加样本含量,可以减小个体变异。 D. 指标的分布类型反映的是个体的分布规 C.极 B .个体变异是 4. 实验设计的原则是 __C___ A.对照、随机、均衡 C ?对照、重复、随机 5. 说明某现象发生强度的指标为 A.平均数 B .率 B .随机、重复、均衡 D .随机、重复、齐同 __B ___ C .构成比 D .相对比 A . 8 B . 1 C . 3 、名词解释10 分 1 .相关系数;2.抽样误差;3.变异系数;4.总体参数;5.率; 答案:见书上相应的地方 三、填空题10 分 1、常用的四种概率抽样方法有:单纯随机抽样,机械抽样(系统抽样),分 层抽样,整群抽 样 2、统计推断的内容主要包括参数估计和假设检验。 3、临床观察7 名某病患者,其潜伏期(天)各为:3,7,9,5,6,9, 16,则其全距为13 天。 4、20 名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果 为:⑴有效⑵无效⑶有效(4)有效……如无效,这种资料属于何种类型资料计数资料。 5、实验研究的基本要素是:处理因素、受试对象、实验效应 四、简答题20 分 1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而 在同一组的相同数据不必计算平均秩次? 答:这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。 2 某医生用某药治疗10 例小儿支气管哮喘,治愈8 例,结论为“该药对 小儿支气管哮喘的治愈率为80%,值得推广”。 答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。 3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什 么意义?该地1 岁正常婴儿血红蛋白95%的参考值范围为 111.2~135.1(g/L) ,又说明了什么含义? 答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L) ,估计正 确的概率为95% 表示该地有95%1 岁正常婴儿的血红蛋白值在111.2~135.1(g/L) 4.对同一组资料,如果相关分析算出的r 越大,则回归分析算出的b 也 越大。为什么? 答:没有这个规律。相关分析r 值大小仅说明变量间联系紧密,而回归分 析b 的大小说明两者数量关系 五、分析计算题40分 1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童 健康与发展研究中心随机抽取了 12例白种男婴和 12例白种女婴的出生资 料 (单位: 磅) 。 男婴 7.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 8.4 6.7 7.5 x1 女婴 7.1 7.9 6.4 6.6 8.0 6.0 7.2 6.8 7.8 5.3 6.6 7.3 x2 (1)该资料是数值变量资料还是分类资料? 数值变量资料 (2)要比较白种人男性与女性的出生体重是否不同,应当选用成组 t 检 验还是配对t 检验?成组t 检验 (3)经过计算t 值为2.16,已知自由度22时,双侧面积0.05对应的t 界值为2.07,自由度11时,双侧面积0.05对应的t 界值为2.20。试写 出假设检验的全过程并下结论。 答:H0:白种人男婴与女婴的出生体重是相同的即 卩仁卩2 H1:卩 1 工卩2 a =0.05 t=2.16 v =22 t>t 0.05/2,22=2.07 p<0.05 在a =0.0水平上拒绝H0,认为白种人男婴与女婴的出生体重是不同的, 男婴重于女婴。 2.某医院用甲、乙两种疗法治疗单纯性消化不良,结果下表。 (1)请计算最小的理论数。T min =9*33/71=4.18 (2)若要比较两疗法治愈率是否相等,请问用何种检验方法? 四格表校正 卡方检验 (3) 已知检验统计量为2.92,请下结论。 因X=2.92<3.84, P>0.05 结论:在a =0.05水平上接受检验假设, 可认为两种治疗方法的治愈率差异无统计学意义。 3 比较缺氧条件下猫和兔的生存时间(时间:分) 猫兔 生存时间秩次生存时间秩次 25 5.5 14 1 34 10 15 2 38 11 16 3 40 12 18 4 41 13 25 5.5 42 14 26 7 45 15 28 8 30 9 (1)该资料属于什么试验设计方式?完全随机设计两样本资料的比较 (2)对资料进行编秩;见表 (3)该资料总秩和为多少?各组的实际秩和各为多少? 总秩和:120,猫组:80.5 兔组39.5 (4)写出对该资料进行假设检验的假设。 H0:两组生存时间的总体分布是相同的。