医学统计学试题及答案
第一套试卷及参考答案
一、选择题(40分)
1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B )
A 条图
B 百分条图或圆图
C 线图
D 直方图
2、均数和标准差可全面描述D 资料的特征
A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布
3、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是(A )
A 用该市五岁男孩的身高的95% 或99% 正常值范围来评价
B 用身高差别的假设检验来评价
C 用身高均数的95%或99% 的可信区间来评价
D 不能作评价
4、比较身高与体重两组数据变异大小宜采用(A )
A 变异系数
B 方差
C 标准差
D 四分位间距
5、产生均数有抽样误差的根本原因是(A )
A.个体差异
B. 群体差异
C. 样本均数不同
D. 总体均数不同
6.男性吸烟率是女性的10倍,该指标为(A )
(A)相对比(B)构成比(C)定基比(D)率
7、统计推断的内容为(D )
A.用样本指标估计相应的总体指标
B.检验统计上的“检验假设”
C. A 和B 均不是
D. A 和B 均是
8、两样本均数比较用t 检验,其目的是检验(C )
A 两样本均数是否不同
B 两总体均数是否不同
C 两个总体均数是否相同
D 两个样本均数是否相同
9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )
(A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2
10、标准误反映(A )
A 抽样误差的大小
B 总体参数的波动大小
C 重复实验准确度的高低
D 数据的离散程度
11、最小二乘法是指各实测点到回归直线的(C)
A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小
12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t 值为t b,二者之间具有什么关系?(C)
A t r>t b
B t r C t r= t b D二者大小关系不能肯定 13、设配对资料的变量值为x1和x2,则配对资料的秩和检验(D ) A 分别按x1 和x2 从小到大编秩 B 把x1 和x2 综合从小到大编秩 C 把x1 和x2 综合按绝对值从小到大编秩 D 把x1 和x2 的差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20.05,ν可认为(A ) A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8 人。该资料宜选用的统计方法为(A ) A.四格表检验B. 四格表校正检验C t 检验D U 检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大 C 由于P 值太小,南方和北方女婴出生体重差别无意义 D 南方和北方女婴出生体重差别有统计学意义但无实际意义。 17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指(A ) A 两个样本率的差别 B 两个样本率的标准误 C 两个总体率的差别 D 两个总体率的标准差 18.下列指标不属于相对数的是(D ) A 率 B 构成比 C 比 D 百分位数 19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗28 天后结果如下表,现要比较两种药物的疗效,何种方法为优:(D ) 表1床疗效 A. 检验B. 成组t 检验C. u 检验D. 秩和检验 20、下列哪种说法是错误的(B ) A 计算相对数尤其是率时应有足够的观察单位或观察次数 B 分析大样本数据时可以构成比代替率 C 应分别将分子和分母合计求合计率或平均率 D 样本率或构成比的比较应作假设检验 二、填空题(20分) 1、现有若干名儿童健康检查一览表的部分检测指标,见表2 表2 某年某地儿童健康检查部分检测结果 编号性别年龄(周岁)身高(cm)坐高(cm)血型表面抗原肝大 1男7116.766.3A+++ 2女8120.068.3AB-- 3女10126.871.5O-+ 4男9123.770.0A 问: ①上述变量中能形成计数资料的指标有性别、血型、表抗 ②计量资料的指标有年龄、身高、体重 ③等级资料的指标有肝大 ④对于身高或坐高指标,在进行统计描述时宜计算均数和标准差表示其集中趋势和离散趋势。⑤对于血型指标宜计算构成比表示各种血型的构成⑥若要分析不同性别身高有无不同,宜选用的统计方法有两样本均数比较的t 检验⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有卡方检验 2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342 人,其中恶性肿瘤死亡数为32人,则该地60岁及以上人口的恶性肿瘤死亡率(1/10 万)为341.48/10 万 3、临床上安排试验设计时,应考虑的三个基本原则是对照随机重复 三、简答题(20分) 1、描述集中趋势的指标有哪些?其适用范围有何异同?(5 分)均数:正态或近似正态分布 几何均数:等比数列或对数正态分布资料中位数:资料是偏态分布的;分布不规则;一端或两端有不确定数据(开口资料)时。 2、何谓假设检验?可以举例说明。(5 分)首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率,则接受该假设,这个过程称为假设检验。 3、请你谈谈对假设检验结论的认识。(5 分)由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的,因此当拒绝检验假设时可能犯I型错误,当接受检验假设时可能犯II型错误。 4、请你谈谈标准差和标准误的异同点。(5 分) 1、请将下列数据编制成合格的统计分析表。 组别总例数感染例数百分比,% 庆大霉素(8 万单位/10 毫升)301 3.3 新洁尔灭(0.1%)30310 生理盐水冲洗服四环素3天30516.7 生理盐水冲洗30826.7 2、某文章作者根据下表资料,认为沙眼在20-岁组患沙眼最多,10-岁组、30-岁组次之,40 岁以后剧降,10 岁以下儿童较50 岁以上老年人高,由此可见沙眼对幼年及成年人侵害最多。 某医院门诊沙眼病人年龄构成比 年龄组 (岁)0-10-20-30-40-50-60-70-计 沙眼人数47198330198128803881027 沙眼百分 4.619.332.119.312.47.8 3.70.8100.0 比(%) 问以上结论是否合理?说明理由。要达到作者的目的,应计算什么相对数指标? 答:不合理。沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。应计算患病率,即患者数与该年龄段总人口数之比。 第二套试卷及参考答案 一、最佳选择题(40分) 1.均数是表示变量值_A_水平的指标。 (A) 平均(B)变化范围(C)频数分布(D)相互间差别大小 2.原始数据同乘以一个不等于0 的常数后_D_。 (A) 均数不变、标准差变(B)均数、标准差均不变(C)均数变、标准差不变(D)均数、标准差均变 3.描述正态或近似正态分布资料特征的是__B __。 (A)中位数、四分位间距(B)均数、标准差(C)中位数、标准差(D)几何均数、全距 4.描述偏态分布资料特征的是_A__。 (A)中位数、四分位间距(B)均数、标准差(C)中位数、标准差(D)几何均数、全距 5.均数与标准差计算的数值A 。 (A)均数可以是负数,标准差不可以(B)均数不可以是负数,标准差可以(C)两者都可以是负数(D)两者都不可以是负数 6、比较身高和体重两组资料的变异度大小宜采用___C___。 (A) 极差(B)标准差(C)变异系数(D)四分位间距 7.说明某事物内部各组成部分所占比例应选_B___。 (A) 率(B)构成比(C)相对比(D)标准差 8.来自同一总体的两个样本中,_D_小的那个样本均数估计总体均数时更精确。 (A)S (B)R (C)CV (D) 9. 已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人群中的30人该指标的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义,若用t 检验,则自由度应该是C (A)5 (B)28 (C)29 (D)4 10.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为A (A)95% (B)49.5% (C)99% (D)97% 11.两样本均数间的差别的假设检验时,查t 界值表的自由度为C (A)n-1 (B)( r-1)( c-1) (C)n1+n2-2 (D)1 12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是A (A)总体中个体值存在差别(B)样本中个体值存在差别(C)样本只含总体的一部分(D)总体均数不等于0 13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小B (A)α=0.05 (B) α=0.20 (C) α=0.01 (D) α=0.10 14. 比较某地10年间结核与白喉两病死亡率的下降速度,宜绘制C 。 (A)线图 (B)条图 (C)半对数线图 (D)圆图 15.构成比用来C (A) 反映某现象发生的强度 (B)表示两个同类指标的比 (C)反映某事物内部各部分占全部的比重 (D)表示某一现象在时间顺序的排列16.某医院的资料计算各种疾病所占的比例,该指标为D (A)发病率(B) 患病率(C) 相对比(D)构成比 17.等级资料的比较宜用C (A) t 检验(B) 检验(C) 秩和检验(D) 方差分析 18.四格表中,当a=20,b=60,c=15,d=5 时,最小的理论频数等于C (A)T11 (B)T12 (C) T21 (D)T22 19.四格表校正x2检验公式适用于D (A)n<40, T>5 (B)n<40, 1 20.同一双变量资料,进行直线相关与回归分析,有B (A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b 二、填空题12 分 1、统计资料按其性质不同,通常将资料分为(计量、计数、等级)三种类型。 2、统计工作步骤通常为统计设计、搜集资料、整理资料和分析资料四步,其中统计分析常分为(统计描述)与(统计推断)两个阶段。 3、计量资料,随着样本例数的增大,S 逐渐趋向于(σ ),逐渐趋向于( 0 )。 4、变异系数常用于比较(单位不同)或(均数相差较大)情况下两组资料的变异度。 5、( 相关分析)侧重于考察变量之间相关关系密切程度,(回归分析 )则侧重于考察变量之间数量变化规律。 6、对某地一年级12名女大学生体重(x :单位kg )与肺活量(y :单位L )的数据作相关分析,经检验两者间有直线相关关 系,作回归分析得回归方程为:?=0.000419+0.058826X ,这意味着体重每增加 1kg ,肺活量平均增加(0.058826L );且两者 之间为( 正 )相关。 三、名词解释 13分 1. 参数和统计量 2.概率 3.计数资料 4.回归系数 答案见书本相应的位置 四、简答题 15分 1. 抽样研究中如何才能控制或减小抽样误差? 答:合理的抽样设计,增大样本含量。 2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的? 答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的差异 因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的 3. 能否说假设检验的p 值越小,比较的两个总体指标间差异越大?为什么? 答:不能,因为 P 值的大小与总体指标间差异大小不完全等同。P 值的大小除与总体差异大小有关,更与抽样误差大小 有关,同样的总体差异,抽样误差大小不同,所得的 P 也会不一样,抽样误差大小实际工作中主要反映在样本量大小上。 五、计算分析题 1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。 年份 病例数 住 院 期 急 性 期 死亡总数 总病死率(%) 死亡数 病死率(%) 1964 17 8 47.1 7 41.2 1965 13 5 38.5 4 30.8 1966 15 7 46.7 6 40.0 1967 15 6 40.0 6 40.0 1968 12 4 33.3 4 33.3 合计 72 30 41.7 27 37.5 2、现有一临床试验数据,有5 家医院参加,分为试验组(g=1)和对照组(g=0),见表1,请对该资料进行分析(只要写 出具体的分析内容和统计分析方法名称即可) 表 1 某新药临床试验部分指标 12157.0054.0020 11178.0067.0021 12165.0050.0030 2162.0051.0040 2156.0048.0021 1176.0062.0021 1184.0072.0020 51168.0065.0020 52166.0046.0021 分析:两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验;两组入组的身高与体重是否可比可用两样本的t 检验或u 检验。两组疗效比较可用秩和检验。 第三套试卷及参考答案 一、选择题20分 1.7 人血清滴度分别为1:2,1:4,1:8,1:16,1:32, 1:64,1:128,则平均滴度为__C__ A.1:12.4 B.1:8 C.1:16 D.1:8~1:16 2.比较身高和体重两组数据变异度大小宜采用___A___ A.变异系数B.方差C.极差D.标准差3.下列关于个体变异说法不正确的是__C__ A.个体变异是生物体固有的。B.个体变异是有规律的。 C.增加样本含量,可以减小个体变异。D.指标的分布类型反映的是个体的分布规律。 4.实验设计的原则是__C___ A.对照、随机、均衡B.随机、重复、均衡 C.对照、重复、随机D.随机、重复、齐同5.说明某现象发生强度的指标为__B A.平均数B.率C.构成比D.相对比 6.要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较的卡方检验,构建一个4行2 列的R*C表后,其卡方值的自由度为__C_ A.8 B.1 C.3 D.跟样本含量有关 7.假设检验中的第一类错误是指_A__所犯的错误。 A.拒绝了实际上成立的H0 B.不拒绝实际上成立的H0 C.拒绝了实际上不成立的H0 D.不拒绝实际上不成立的H0 8.样本含量固定时,选择下列哪个检验水准得到的检验效能(1-β)最高__D___ A.B.C.D. 9.两样本均数的t 检验对资料的要求是_D___ A.正态性、独立性、方差齐性B.资料具有代表性C.为定量资料D.以上均对 10.四个率的比较的卡方检验,P 值小于0.01,则结论为_D__ A.四个总体率均不相等;B.四个样本率均不相等; C.四个总体率之间肯定不等或不全相等;D.四个总体率之间不等或不全相等。 二、名词解释10 分 1.相关系数;2.抽样误差;3.变异系数;4.总体参数;5.率;答案:见书上相应的地方 三、填空题10分 1、常用的四种概率抽样方法有:单纯随机抽样,机械抽样 ( 系统抽样 ),分层抽样,整群抽样 2、统计推断的内容主要包括参数估计和假设检验。 3、临床观察7 名某病患者,其潜伏期(天)各为:3,7,9,5,6,9,16,则其全距为13天。 4、20 名观察对象皮下注射某菌苗,一段时间后进行抗体滴度测定,其结果为:⑴有效⑵无效⑶有效(4)有效……⒇无 效,这种资料属于何种类型资料计数资料。 5、实验研究的基本要素是:处理因素、受试对象、实验效应 四、简答题20 分 1.在秩和检验中,为什么在不同组间出现相同数据要给予“平均秩次”,而在同一组的相同数据不必计算平均秩次?答:这样编秩不影响两组秩和的计算,或对两组秩和的计算不产生偏性。 2某医生用某药治疗10 例小儿支气管哮喘,治愈8 例,结论为“该药对小儿支气管哮喘的治愈率为80% ,值得推广”。答:一是没有对照组,二是样本例数太少,抽样误差大,可信区间宽。 3.某地1岁婴儿平均血红蛋白95%可信区间为116.2~130.1(g/L),表示什么意义?该地1 岁正常婴儿血红蛋白95%的参考值范围为111.2~135.1(g/L),又说明了什么含义? 答:表示该地1岁婴儿血红蛋白总体平均数在116.2~130.1(g/L),估计正确的概率为95% 表示该地有95%1 岁正常婴儿的血红蛋白值在111.2~135.1(g/L) 4.对同一组资料,如果相关分析算出的r越大,则回归分析算出的b也越大。为什么?答:没有这个规律。相关分析r 值大小仅说明变量间联系紧密,而回归分析b的大小说明两者数量关系。 五、分析计算题40分 1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童健康与发展研究中心随机抽取了12例白种男婴和12 例白种女婴的出生资料(单位:磅)。 男婴x17.37.97.98.09.37.8 6.57.6 6.68.4 6.77.5 女婴x27.17.9 6.4 6.68.0 6.07.2 6.87.8 5.3 6.67.3 (1)该资料是数值变量资料还是分类资料?数值变量资料 (2)要比较白种人男性与女性的出生体重是否不同,应当选用成组t检验还是配对t检验?成组t 检验 (3)经过计算t值为2.16,已知自由度22时,双侧面积0.05对应的t界值为2.07,自由度11时,双侧面积0.05对应的t 界值为2.20。试写出假设检验的全过程并下结论。 答:H0:白种人男婴与女婴的出生体重是相同的即μ1=μ2 H1:μ1≠μ2 α=0.05 t=2.16 ν=22 t>t0.05/2,22=2.07 p<0.05 在α=0.05 水平上拒绝H0,认为白种人男婴与女婴的出生体重是不同的,男婴重于女婴。 2. (1)请计算最小的理论数。T min=9*33/71=4.18 (2)若要比较两疗法治愈率是否相等,请问用何种检验方法?四格表校正卡方检验 (3)已知检验统计量为2.92,请下结论。 因χ2=2.92<3.84, P>0.05 结论:在α=0.05 水平上接受检验假设,可认为两种治疗方法的治愈率差异无统计学意义。 医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY- 医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2 第一套试卷及参考答案 一、选择题 (40分) 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式B负偏态分布 C 正偏态分布D正态分布与近似正态分布 3、要评价某市一名5岁男孩得身高就是否偏高或偏矮,其统计方法就是( A ) A 用该市五岁男孩得身高得95%或99%正常值范围来评价 B用身高差别得假设检验来评价 C用身高均数得95%或99%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差得根本原因就是( A ) A、个体差异B、群体差异C、样本均数不同D、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为( A ) (A)相对比(B) 构成比(C)定基比 (D)率 7、统计推断得内容为( D ) A、用样本指标估计相应得总体指标B、检验统计上得“检验假设”C、A与B均不就是D、A与B均就是 8、两样本均数比较用t检验,其目得就是检验( C ) A两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本,样本含量分别为n1与n2,在进行成组设计资料得t检验时,自由度就是( D ) (A) n1+ n2 (B) n1+ n2–1(C) n1+ n2 +1 (D)n1+ n2-2 10、标准误反映( A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得(C) A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小D纵向距离最小 12、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为tr,对回归系数检验得t值为tb,二者之间具有什么关系?(C) A t r>t b B t r〈t b C t r= tb D二者大小关系不能肯定 13、设配对资料得变量值为x1与x2,则配对资料得秩与检验(D ) A分别按x1与x2从小到大编秩 B把x1与x2综合从小到大编秩 C把x1与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用得统计方法为( A ) A.四格表检验 B、四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3、08kg,标准差为0、53kg;南方n2=4896,均数为3、10kg,标准差为0、34kg,经统计学检验,p=0、0034〈0、01,这意味着( D ) 1 医学统计学题库 一、最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __。 A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __。 A.变异系数 B. 几何均数 C. 中位数 D. 均数 3. 下述_ ___种资料为计数资料。 A. 血红蛋白( g/L ) B. 红细胞计数( 31012 /L ) C. 抗体滴度 D. 血型 4. 表示事物内部各个组成部分所占比重的相对数是___ ____。 A. 相对比 B. 率 C. 构成比 D. 率的标准误 5. 说明样本均数抽样误差大小的指标是___ _____。 A. 变异系数 B. 标准差 C. 标准误 D. 全距 6. 正态分布曲线下中间面积为99% 的变量值范围为___ _____。 A. μσ±196 . B. μσ±258. C. μσ±1 D. μσ±125. 7. 8名新生儿的身长(cm )依次为:50, 53, 58, 54, 55, 52, 54, 52。 中位数M 为__ __。 A. 53.5 B. 54.5 C. 54 D. 53 8. 表示两个变量之间的直线相关关系的密切程度和方向的统计指标是_ _。 A. 变异系数 B. 相关系数 C. 均数 D. 回归系数 9. 某市1955年和2015年的三种死因别死亡率,若用统计图表示宜 选用____ _______。 A. 直条图 B. 直方图 C. 百分直条图 D. 统计地图 10. 下述___ ____为第一类错误的定义。 A.拒绝了实际上是不成立的H 0 B.接受了实际上是不成立的H 0 C.拒绝了实际上是成立的H 0 医学统计学试题及答案 The latest revision on November 22, 2020 医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小 《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关 7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描 第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或 医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr 第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t r 一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料 第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或 医学统计学试题和答案 (一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数 第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必 医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就 l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2 医学统计学试题 姓名____________分数_________ 选择题(每个2分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差D四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A )A相对比 B 构成比C定基比D率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )A n1+ n2 B n1+ n2–1 C n1+ n2 +1 D n1+ n2 -2 10、标准误反映(A)A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?(C) A tr>tb B tr (一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数医学统计学试题及答案
(完整版)医学统计学第六版课后答案
医学统计学试题和答案解析
医学统计学题库
医学统计学试题及答案
医学统计学试题及答案
医学统计学课后答案.
医学统计学试题及答案
医学统计学部分试题及答案解析
医学统计学试题及答案
医学统计学练习题与答案
医学统计学课后答案解析
医学统计学试题和答案.doc
医学统计学题库完整
医学统计学试题及答案
医学统计学第二版高等教育出版社课后习题答案剖析
医学统计学试题及其答案
医学统计学选择题及答案个
(完整word版)医学统计学试题和答案