医学统计学课后习题答案
医学统计学
第一章 绪论
答案
名词解释:
(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基
础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本
是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称
为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为
样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误
差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示
(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称
为计数资料。。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为
等级资料。
是非题:
1. ×
2. ×
3. ×
4. ×
5. √
6. √
7. ×
单选题:
1. C
2. E
3. D
4. C
5. D
6. B
第二章 计量资料统计描述及正态分布
答案
名词解释:
1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标
2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标
3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布
称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指
标范围称为指标的正常值范围。
填空题:
1. 计量,计数,等级
2. 设计,收集资料,分析资料,整理资料。
3. σ
μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99%
5. %
6.均数、标准差
7. 全距、方差、标准差、变异系数
8. σμ96.1± σμ58.2±
9. 全距 R
10. 检验水准、显著性水准、、 ()
11. 80% 90% 95% 99% 95%
12. 95% 99%
13. 集中趋势、离散趋势
14. 中位数
15. 同质基础,合理分组
16. 均数,均数,μ,σ,规律性
17. 标准差
18. 单位不同,均数相差较大
是非题:
1. ×
2. √
3. ×
4. ×
5. ×
6. √
7. √
8. √
9. √ 10. √
11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √
21. √
单选题:
1. B
2. D
3. C
4. A
5. C
6. D
7. E
8. A
9. C 10. D
11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C
21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D
31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B
41. C 42. B 43. D 44. C 45. B
问答题:
1.均数﹑几何均数和中位数的适用范围有何异同
答:相同点,均表示计量资料集中趋势的指标。
不同点:表2-5.
表2-5 均数,几何均数和中位数的相异点
平 均 数 意 义 应用场合
均 数 平均数量水平 应用甚广,最适用于对称分布,特别是正态分布
几何均数 平均增减倍数 ①等比资料;②对数正态分布资料
中位数 位次居中的观 ①偏态资料;②分布不明资料;③分布一端或两
察值水平 端出现不确定值
2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系
答:
1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,
反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某
百分位置的水平,最常用的百分位是P 50即中位数。多个百分位数结合使用,可
更全面地描述总体或样本的分布特征。
(2)计算:中位数和百分位数均可用同一公式计算,即
Px=L+(i/f x )(n ·x%-Σf L )
可根据研究目的选择不同的百分位数代入公式进行计算分析。
(3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考
值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中
更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。
3.同一资料的标准差是否一定小于均数
答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。
变异大,标准差就大,有时比均数大;变异小,标准差小。
4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些
(1)样本含量的大小,样本含量越大,标准差越稳定。
(2)分组的多少
(3)分布形状的影响,偏态分布的标准差较近似正态分布大
(4)随机测量误差大小的影响
(5)研究总体中观察值之间变异程度大小
5.正态分布﹑标准正态分布与对数正态分布在概念上和应用上有何异同
(1) 概念上:①相同点:正态分布、标准正态分布与对数正态分布都是变量的 连续型分布。其特征是:分布曲线在横轴上方,略呈钟型,以均数为中心,两边
对称,均数处最高,两边逐渐减小,向外延伸,不与横轴相交。②相异点:表示
方法不同,正态分布用N (μ,σ2)表示,标准正态分布用N (0,1)表示,对数
正态分布N (μlgX ,σ2lgX )表示。
(2) 应用上:①相同点:正态分布、对数正态分布都可以转换为标准正态分布。
②相异点:标准正态分布是标准正态变量u 的分布,标准正态曲线下的面积唯一
的由u 决定,给应用带来极大方便。对医学资料呈偏态分布的数据,有的经对数
变换后服从正态分布。正态分布、对数正态分布可描述变量值的分布特征,可用
于正常值范围估计和质量控制等。正态分布是很多统计方法的理论基础。
6.医学中参考值范围的含义是什么确定的原则和方法是什么
含义:参考值范围亦称正常值范围,它是指特定健康状况人群(排除了有关
疾病和因素对所研究指标有影响的所谓“正常人”不同于“健康人”概念)的解
剖、生理、生化等数据绝大多数人的波动范围。
(2)原则:
① 抽取有代表性的足够例数的正常人群样本,样本分布越接近总体,所得结
果越可靠。一般认为样本含量最好在100例以上,以能得到一个分布较为
稳定的样本为原则。
② 对选定的正常人进行准确而统一的测定,保证测定数据可靠是确定正常值
范围的前提。
③ 判定是否要分组(如男女、年龄、地区等) 确定正常值范围。
④ 决定取双侧范围值还是单侧范围值。
⑤ 选择适当的百分范围
⑥ 确定可疑范围
⑦ 估计界值
(3)方法:
① 百分位数法:P x =L+(i/f x )(n ·x%-Σf L )
② 正态分布法(对数正态分布): ()X lg X lg 1S u X lg S
u X α-α±±双侧
百分位数法用于各种分布型(或分布不明)资料;正态分布法用于服从或近
似正态分布(服从对数正态分布)的资料。
7.对称分布资料在“均数±倍标准差”的范围内,也包括95%的观察值吗
答:不一定。均数±倍标准差是正态分布的分布规律,对称分布不一定是正态分
布。
计算题:
1. 某地101例30~49岁健康男子血清总胆固醇值(mmol/L)测定结果如下:
4074 (1)编制频数分布表,简述其分布特征。
①找出最大值、最小值求全距(R):
全距=最大值-最小值=(mmol/L)
②求组距:I=全距/组数=10=≈(mmol/L)
③分组段,划记(表1-1)
表2-6 某地101例30~49岁健康男子血清总胆固醇值划记表
组段(mmol/L) 划记频数
~ 1
~ 8
~ 9
~ 23
~ 25
~ 17
~ 9
~ 6
~ 2
~ 1
合计 101
由表2-6可知,本例频数分布中间局多,两侧逐渐减少,左右基本对称。
表2-7 某地101例30~49岁健康男子血清总胆固醇值(mmol/L )X 、s 计算表
血清总胆 组中值 频数 fX fX 2
累计 累计频数
固醇值 X f 频数 (实际)
~ 1 1
~ 8 9
~ 9 18
~ 23 41
~ 25 66
~ 17 83
~ 9 92
~ 6 98
~ 2 100
~ 1 101
注:Xu 为组段上限值 (2)计算均数X 、标准s 、变异系数CV 。
由上计算表1-2可见:=∑∑=f fX X /101=(mmol/L )
1f f
/)fX (fX s 22-∑∑∑-∑=
1101101
/)25.478(313.23422--==(mmol/L ) CV=x s /?100%=?%=%
(3)计算中位数M ,并与均数X 比较,利用前表计算中位数M
M = L+(i/f 50)(n ?50%-Σf L )
=+(25)(101?50%-41)=(mmol/L )
本题算术均数为(mmol/L ),与中位数(mmol/L )很接近,这也是资料服从正
态分布的特征之一。
(4)计算及并与X ±的范围比较。
P 2。5=+(8)?(?%-1)=(mmol/L )
=+(2)?(?%-98)=(mmol/L ) ±X =±?(mmol/L )
用百分位数法求得101例30~49岁健康男子血清总胆固醇值95%分布范围~
(mmol/L),与正态分布法求得的95%分布范围~(mmol/L)基本一致。
(5)分别考察±
X范围内的实际频数与理论分布是否基本一致(表
X、±
X1S、±
1-3)
表2-8 某地101例30~49岁健康男子血清总胆固醇值理论分布与实际分布比较
X±血清总胆固醇实际分布理论分布
us
人数 % %
±~ 72
X1
s
±~ 97
.1
X96
s
±~ 100
.2
X58
s
由上表,s
±、
.1
X1
X96
±范围内,实际分布与理论分布略有不同,而s ±范围内,实际分布与理论分布基本一致。
.2
s
X58
(6)现测得一40岁男子的血清总胆固醇值为(mmol/L),若按95%正常值范围估计,其血清总胆固醇值是否正常估计该地30~49岁健康男子中,还有百分
之几的人血清总胆固醇值比他高
前计算得95%正常值为~(mmol/L)现测得一40岁男子的血清总胆固醇值为
(mmol/L),在95%范围以外,故属于异常
u=(X-μ)/σ=()/=
因ф()=ф(),查表1得ф()=
估计该地30~49健康男子中约有%的人血清总胆固醇值比他高。
2.某地卫生防疫站,对30名麻疹易感儿童经气溶胶免疫一个月后,测得其得血凝抑制抗体滴度资料如表2-9第(1)(2)栏。
表2-9 平均滴度计算表
抗体滴度人数f 滴度倒数X1 lgX1 flgX1
(1)(2)(3)(4)(5)=(2)×(4) 1:8 2 8
1:16 6 16
1:32 5 32
1:64 10 64
1:128 4 128
1:256 2 256
1:512 1 512
合计 30
(1)试计算其平均滴度。
由表1-4得,G=lg-1(30)==
该站30名麻疹易感儿童经气溶胶免疫一个月后,测得血凝抑制抗体平均滴度为1:
表2-10 平均滴度计算表
抗体滴度人数f 滴度倒数X
1 lgX
1
flgX
1
(1) (2) (3) (4) (5) = (2) (4)
1﹕8 2 8
1﹕16 6 16
1﹕32 5 32
1﹕64 10 64
1﹕128 4 128
1﹕256 2 256
1﹕512 1 512
合计 30 (2)有人发现本例用抗体滴度稀释倍数和直接用滴度(原书误为倒数)算得对数值的标准差相同,为什么
表2-11 滴度对数值计算表
抗体滴度X
2人数f lgX
2
flgX
2
1﹕8 2
1﹕16 6
1﹕32 5
1﹕64 10
1﹕128 4
1﹕256 2
1﹕512 1
合计 30 1)由表1-4中数据计算标准差为:slgx
1
==
2) 由表1-5中数据计算标准差为:slgx
2
==
直接用抗体滴度的对数lgx
2与稀释倍数的对数lgx
1
计算标准差是相等的,因
为由上表可见lgx
2=lg1-lgX
1
=-lgx
1
,而lgx
1
与-lgx
1
的离散程度是相同的,所以用
抗体滴度稀释倍数和直接用滴度算得对数值的标准差是相同的。
3. 50例链球菌咽峡炎患者的潜伏期如表2-12,说明用均数、中位数或几何均数,何者的代表性较好并作计算。
表2-12 50例链球菌咽峡炎患者的潜伏期的中位数计算表
潜伏期(小时) 病例数f 累计频数
12~ 1 1
24~ 7 8
36~ 11 19
48~ 11 30
60~ 7
72~ 5
84~ 4
96~ 2
108~120 2
合计 50
本例目测频数分布为偏态分布,长尾拖向右侧,故为正偏态,宜用中位数及几 何均数表示其平均水平。
如上表,经计算中位数,几何均数、算术均数分别为:
M=(小时),G=(小时),X =(小时)显然,算术均数受长潜伏期的影响使其偏大,中位数M 与几何均数G 接近,故描述链球菌咽峡炎患者潜伏期的集中趋势指
标使用中位数M 或几何均数G 均可。
4.某市1974年为了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查 了留住该市一年以上,无明显肝、肾疾病,无汞作业接触史的居民238人,发汞含量 如表2-13:
表2-13 238人发汞含量频数计算表
发汞值 人数f 组中值X fX fX 2 累计频数 累计频率
(μmol/kg )
~ 20 20
~ 66 86
~ 60 146
~ 48 194
~ 18 212
~ 16 228
~ 6 234
~ 1 235
~ 0 235
~ 3 238
合计 238
(1).说明此频数分布的特征:可见发汞值的频数分布高峰位于第2个组段。前
4个组段的频数占总频数的%,长尾拖向右侧,呈极度正偏态。
(2). 计算均数 和中位数M ,何者较大为什么何者用语说明本资料的集中位置
较合适 f fX X ∑∑=/=1699/238=(μmol/kg )
M =L+(i/f 50)(n ?50%-Σf L )
=+2/60(238?50%-86)=(μmol/kg )
由计算结果得知,M X >其原因因为本例呈正态分布,均数计算结果受到少
数较大发汞值的影响,使得X 偏向大发汞值一边.本例用中位数描述偏态资
料的集中趋势较好,它不受两端较大值和极小值的影响.
(3). 选用何种指标描述其离散程度较好
选用四分位数间距描述其离散程度较好.
(4). 估计该地居民发汞值的95%参考值范围
本资料应选用单侧95%上界值,本例是正偏态分布.而且样本含量较大, n=238,保证获得一个较为稳定的分布,故采用百分位数法计算的参考值范
围较为合适.
P 95=L+(i/f 95)(n ?95%-Σf L )
=+(2/16)(238?95%-212)=(μmol/kg )
第三章 均数的抽样误差与t 检验
答案
填空题:
1. 标准误
2. ,
3. 假设检验,(显著性检验)
4. 两总体均数不同(越有理由说明有统计学意义)
5. 自由度大小
6. 一是准确度、二是精度
7. 抽样误差、样本均数、总体均数
8. 总体均数估计、假设检验
9. 第二类错误(Ⅱ型错误) β
是非题:
1. √
2. ×
3. ×
4. ×
5. √
6. √
7. ×
8. √
9. × 10. √
11. √ 12. × 13. √ 14. √ 15. √ 16. √ 17. √ 18. √ 19. × 20. ×
21. × 22. ×
单选题:
1. A
2. E
3. D
4. E
5. E
6. E
7. D
8. A
9. D 10. D
11. D 12. B 13. E 14. D 15. D 16. E 17. B 18. C 19. C 20. D
21. C
问答题:
1.标准差和标准误有何区别和联系
表3-6 标准差与标准误的区别
标准差(α或s ) 标准误(x s x a 或)
意义上 描述一组变量值之间的离散趋势 描述样本均数间的离散趋势
应用上 ① s 越小,表示变量值围绕 ① x s 越小,表示样本均数与
均值分布越密集,说明均数 总体均数越接近,说明样本
的代表性越好。 均数推断总体均数可靠性越大。
② 可用s u X a ±估计变量值分 ② 可用x s t X v a ,±估计总体
布范围 均数可信区间
与n 的关系 n 越大,s 越趋于稳定 n 越大,x s 越小
(2)联系
① 二者均是表示变异度大小的统计指标。
② 标准误n /x σ=σ与标准差大小成正比,与抽样例数n 的平方根成反
比。
③ 当n 一定时,同一份资料,标准差越大,标准误也越大。
2.可信区间和参考值范围有何不同
参考值范围是指同质总体中个体变量值的分布范围,如X ±说明有95%的变
量值分布在此范围内,它与标准差的大小有关,若个体变异越大,该范围
越宽,分布也就越散。而可信区间是指在可信度为(1-α)时,估计总体
参数可能存在的范围。即从同一总体中随机抽样,当n 一定时,每抽一次即可得一个样本均值,以x s t X v a ,±计算可信区间,如95%可信区间,类似
的随机抽样进行一百次,平均有95次,即有95个可信区间包括了总体均
数,有5次没有包括括总体均数,5%是小概率事件,实际发生的可能性很
小,因此实际应用中就认为总体均数在求得的可信区间。这种估计方法犯
错误的可能性最大不超过5%。可信区间与标准误大小有关,标准误越大,
可信区间则越大。
3.假设检验和区间估计有何联系
假设检验和区间估计都属于统计推断的内容。假设检验用以推断总体参数间
是否有质的区别,并可获得样本统计量,以得到相对精确的概率值。而可信
区间用于推断总体参数的大小,它不仅可用以回答假设检验的问题,尚可比
假设检验提供更多的信息。但这并不意味着用可信区间代替假设检验,因为
假设检验可得到P 值,比较精确地说明结论的概率保证,而可信区间只能告
诉我们在某α水准上有无统计意义,却不能像P 那样提供精确的概率。因此,
只有将二者有机地结合起来,相互补充,才是完整的分析。
4.假设检验时,一般当P <时,则拒绝H 0,理论依据是什么
假设检验时,当P <,则拒绝Ho ,其理论依据是在Ho 成立的条件下,
出现大于等于现有检验统计量的概率P <,它是小概率事件,即在一次
抽样中得到这么小概率是事件是不大可能发生的,因而拒绝它。由此可见, 假设检验的结论是具有概率性的,它存在犯错误的可能性小于等于。
5.t 检验和方差分析的应用条件有何异同
(1)相同点:在均数比较中,t 检验和方差分析均要求各样本来自正态总体;各处理 组总体方差齐且各随机样本间相互独立,尤在小样本时更需注意。
(1) 不同点:t 检验仅用于两组资料的比较,除双侧检验外,尚可
进行单侧检验,亦可计算一定可信度的可信区间,提示差别有无实际意义。而方
差分析用于两组及两组以上均数的比较,亦可用于两组资料的方差齐性检验。
6. 怎样正确使用单侧检验和双侧检验
根据专业知识推断两个总体是否有差别时,是甲高于乙,还是乙高于甲,两种可 能都存在时,一般选双侧;若根据专业知识,如果甲不会低于乙,或研究者仅关心 其中一种可能时,可选用单侧。一般来讲,双侧检验较稳妥故较多用,在预实验有 探索性质时,应以专业知识为依据,它充分利用了另一侧的不可能性,故检出效率 高,但应慎用。
7. 第一类错误与第二类错误的区别及联系何在了解这两类错误有何实际意义
(1)假设检验中Ⅰ、Ⅱ型错误的区别。
Ⅰ型错误是拒绝了实际上成立的Ho ,也称为“弃真”错误,用α表
示。统计推断时,根据研究者的要求来确定。
Ⅱ型错误是不拒绝实际上不成立的Ho ,也称为“存伪”错误,用β
表示。它只能与特定的H 1结合起来才有意义,一般难以确切估计。
(2)Ⅰ、Ⅱ型错误的联系。
① 当抽样例数一定时,α越大,β越小;反之,α越小,β越大。 ② 统计推断中,Ⅰ、Ⅱ型错误均有可能发生,若要使两者都减小,
可适当增加样本含量。
③ 根据研究者要求,n 一定时,可通过确定α水平来控制β大小。
(3)了解两类错误的实际意义。
① 可用于样本含量的估计。
② 可用来计算可信度(1-α),表明统计推断可靠性的大小。
③ 可用于计算把握度(1-β),来评价检验方法的效能等。
④ 有助于研究者选择适当的检验水准。
⑤ 可以说明统计结论的概率保证。
计算题:
1. 某地抽样调查了部分成人的红细胞数和血红蛋白量,结果如表:
表3-7: 健康成人的红细胞和血红蛋白测得值及标准误与变异系数的计算
性别 例数 均数 标准差 标准值 变异系数(%) 标准误
红细胞数 男 360
(×1012/L ) 女 225
血红蛋白 男 360 (1)说明女性的红细胞数与血红蛋白量的变异程度何者为大
女性 CV RBC =S/x ×100%=×100%=%
CV HB =S/x ×100%=×100%=%
由上计算可知该地女性血红蛋白量比红细胞数变异度大
(2)分别计算男﹑女两项指标的抽样误差。
见上表最后一栏,标准误计算公式n s s x /=。
(3)试估计该地健康成年男﹑女红细胞数的均数。
健康成年男子红细胞数总体均数95%可信区间为:
X ±=±×=~(1012/L )
其中n=360 故近似按υ=∞。同理健康成年女子红细胞数总体均数95%可信区
间为~(1012/L )
(4)该地健康成年男﹑女间血红蛋白含量有无差别
Ho :μ男=μ女
H 1:μ男≠μ女
α=
u=255/2.10360/2.7/)6.1175.134()/()(222121+-=--x x s X X =
按υ=∞,查附表2,得P <,按α=水准,拒绝Ho ,接受H 1,可
以认为男女间血红蛋白含量不同,男高于女。
2. 将20名某病患者随机分为两组,分别用甲、乙两药治疗,测得治疗前及治疗后一个月
的血沉(mm/小时)如下表,问:
(1)甲,乙两药是否均有效
(2)甲,乙两药的疗效有无差别
表3-8 甲,乙两药治疗前后的血沉
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
病人号 1 2 3 4 5 6 7 8 9 10
甲 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
药 治疗前 10 13 6 11 10 7 8 8 5 9
治疗后 6 9 3 10 10 4 2 5 3 3
差 值 4 4 3 1 0 3 6 3 2 6
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
病人号 1 2 3 4 5 6 7 8 9 10
乙 ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
药 治疗前 9 10 9 13 8 6 10 11 10 10
治疗后 6 3 5 3 3 5 8 2 7 4
差 值 3 7 4 10 5 1 2 9 3 6
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
(1)甲,乙两药是否均有效
经计算得:
甲药 d =(mm/h ) 乙药 d =(mm/h )
S d =(mm/h ) S d =(mm/h ) S d =(mm/h ) S d =(mm/h )
n=10 n=10
Ho :μd =0 Ho :μd =0
H 1:μd ≠0 H 1:μd ≠0
α= α=
t (甲药)=d / S d ==
t (乙药)=d / S d ==
ν=9,查t 界值表,得P <,按α=水准,拒绝Ho ,接受H 1,故可认为
甲、乙两药均有效。
(2)甲,乙两药的疗效有无差别
由表中资料分别求得治疗前后差值(见表3-8),再作两组比较。
H 0 :甲乙两药疗效相同
H 1 :甲乙两药疗效不同 α=
3110.62
10109814.299322.192)1()1(22212222112=-+?+?=-+-+-=n n s n s n S C 1235
.12622.1)10/110/1(3110.6)/1/1(21221==+=+=-n n s S c d d
6022.11235
.10.52.32121-=-=-=-d d S d d t ν=18,查t 界值表,得>P >,按α=水准,不拒绝Ho ,尚不 能认为甲乙两药
疗效有差别。
3. 将钩端螺旋体病人的血清分别用标准株和水生株作凝溶试验,测得稀释倍数如 下,问两组的平均效价有无差别
标准株(11人)100 200 400 400 400 400 800 1600 1600 1600 3200 水生株(9人) 100 100 100 200 200 200 200 400 400
由题知:该资料服从对数正态分布,故得:
标准株 水生株
n=11 n=9 1lg x X = 2lg x X =
1lg x S = 2lg x S =
(1)两组方差齐性检验:
H 0:22
21σσ= H 1:22
21σσ≠ α =
F=684.32355.0/4520.0/2222==小大S S
V 1 =10 V 2 =8 (10,8)=
查附表3,得P >,按α=水准,不拒绝Ho ,可以认为两总体方差齐。
(2)两组均数比较;
H 0 两总体几何均数相等
H 1 两总体几何均数不等
α=
149
.3)9/111/1()]2911/()2355.0)19(4520.0)111[((2676
.27936.2)/1/1)(2/(])1()1[()/1/1(22212122221121212212121=+?-+-+--=+-+-+--=+-=-=
-n n n n s n s n X X n n S X X S X X t C X X 查t 界值表,得>P >,按α=水准,拒绝Ho ,接受H 1,故可认为钩端螺旋体病人的
血清用标准株和水生株作凝溶试验,前者平均抗体效价高于后者
4. 表3-9为抽样调查资料,可做那些统计分析
表3-9 某地健康成人的第一秒肺通气量(FEV1)(L )
FEV
人数
1
男女
~ 1 4
~ 3 8
~ 11 23
~ 27 33
~ 36 20
~ 26 10
~ 10 2
~ 3 0
~ 1 0
合计 118 100
(1)统计描述。
由上表可见,男性调查118人,第1秒肺通气量分布为~,高峰位于~组段内,以中间频数分布最多,两侧逐渐减少,左右基本对称,其频数分布可见上表和下图。
女性调查100人,第1秒肺通气量分布为~,高峰位于~组段内,以中间频数分布最多,两侧逐渐减少,且左右大体对称,频数分布可见表3-9和图3-1。
)(L)分布
图3-1 某地健康成人第一秒肺通气量(FEV
1
由上表和图可见,男性分布范围较宽,右侧尾部面积向外延伸两个组段,高峰
位置高于女性,向右推移一个组段。
(2)计算集中与离散趋势指标,并对两组进行比较。
Ho:男女间第1秒肺通气量总体均数相同
:男女间第1秒肺通气量总体均数不同
H
1
α=
男性: n=118 1X = s 1=
女性: n=100 2X = s 2= u=222121212121///)(/)(n s n S X X x x s X X +-=-- =100/6258.0118/6902.022+ =
查t 界值表,v=∞,得P <,按α=水准,拒绝Ho ,接受H 1,故可认为
男女间第1秒肺通气量均数不同,男高于女。
(3)根据上述分析结果,分别确定95%参考值范围。
男性第1秒肺通气量单侧95%参考范围下限为: s u X 05.0-=? (L)
即可认为有95%的男性第1秒肺通气量不低于(L )
女性第1秒肺通气量单侧95%参考范围下限为:
s u X 05.0-=? (L)
即可认为有95%的女性第1秒肺通气量不低于(L )
5. 某医师就表3-10资料,对比用胎盘浸液钩端螺旋体菌苗对328名农民接种前, 后
(接 种后两月)血清抗体(黄疸出血型)的变化。
表3-10 328例血清抗体滴度及统计量
抗体滴度的倒数 0 20 40 80 160 320 640 1280 X s x s
免疫前人数 211 27 19 24 25 19 3
免疫后人数 2 16 57 76 75 54 25 23
t=2217.69.25+查t 界值故P <,说明接种后血清抗体有增长。 试问:
(2) 本例属于何种类型设计
本例属于自身配对设计。
(3) 统计处理上是否妥当
统计处理上不妥当,因为:① 在整理资料过程中,未按配对设计整理,而是拆开 对子按成组设计整理,失去原设计的意义。② 统计描述指标使用不当,血清浓度 是按倍比稀释,不适合计算算术均数、标准差、因为有零值,也不宜计算几何均数。 对现已整理好的资料,可计算中位数表示平均水平,用四分位数间距表示离散趋势。 ③ 假设检验因本资料不宜计算均数,故对均数进行t 检验当然是不妥当的。
6.152例麻疹患儿病后血清抗体滴度倒数的分布如下,试作总体几何均数的点值估计 和95%区间估计。
滴度倒数 1 2 4 8 16 32 64 128 256 512 1024 合计
人 数 0 0 1 7 10 31 33 42 24 3 1 152
以滴度倒数X 的对数值求得X1gx = ,Slgx=, n=152, 则点值估计G=lg -1 =
患儿病后血清抗体滴度倒数总体均数95%可信区间为
lg-1(Xlgx+√n)
= lg-1+×√152)
= lg-1(1.~1.)
=~
7.某医院对9例慢性苯中毒患者用中草药抗苯1号治疗:
(1)得表白细胞总数(×109/L),问该药是否对患者的白细胞总数有影响
表3-11 9例慢性苯中毒患者治疗前后的白细胞总数
病人号治疗前治疗后 d1
1
2
3
4
5
6
7
8
9
H 0 该药对患者的白细胞总数无影响,即μ
d
=0
H
1 该药对患者的白细胞总数有影响,即μ
d
≠0α=
求得(前—后)差值d
i
经计算得:
d = S d = n=9
t=534
.0
)9
/
9551
.1
/(
3556
.0
)
/
/(
0=
-
=
-n
s
d
d
ν=8查附表2,t界值表,得P>,按α=水准,不拒绝Ho,尚不能认为该药对患者的白细胞总数有影响。
(2)同样得治疗后血小板比治疗前每人平均增加×109/L,并算得t=,问该药是否对患者的血小板有影响
H 0 该药对患者的血小板无影响,即μ
d
=0
H
1 该药对患者的血小板有影响,即μ
d
≠0
α=
d= t= =8
,故可认查附表2,t界值表,得>P>,按α=水准,拒绝Ho,接受H
1
为该药对患者的血小板有影响,可增加患者血小板。
(3)综合上述结果能否提出进一步研究意见/综合上述结果,提出以下建议:
①在此项研究中,从t检验结果来看,血小板治疗前后变化有意义,
而白细胞则无意义,可补充计算两项指标的95%可信区间,结合专
业知识,分析治疗前后指标差数有无实际意义。
②如有可能扩大样本,追踪观察该药对苯中毒患者的远期疗效
第四章方差分析
答案
填空题
1. 各样本是相互独立的随机样本,各样本来自正态总体,
处理组总体方差相等(方差齐性)
2. 总变异、组内变异、组间变异 SS总=SS组间+SS组内
3. q检验(又称Newman-Keuls法)
4. V总=SS组间+SS组内
是非题:
1.×
2.√
3.×
4.√
5.×
单选题:
1.B
2.D
3.E
4.B
5.C
6.A
7.C
8.C
计算题:
1.某湖水不同季节氯化物含量测定值如表2-4所示,问不同季节氯化物含量有无差
别
表4-1:某湖水不同季节氯化物含量(mg/L)
春夏秋冬
∑
∑Х
ij
n
i
8 8 8 8 32
X
∑Х2
ij
S2
i
.5298
(1)多组均数间比较:
表1: 方差分析表
变异来源 SS v MS F
总变异 31
组间变异 3
组内变异 28
查F界值表,得P<,按水准,拒绝H0,接受H1,故可认为不同季节湖水中氯化物含量不同或不全相同。
(2)各组均数间两两比较
H0 :μ
A =μ
B
H1 :μ
A ≠μ
B
α=
表2 四个样本均数顺序排例组别春夏秋冬X 1
位次 1 2 3 4
表3 四组均数两两比较q检验对比组两均数之差组数 q值 P值 1与4 4 <
1与3 3 <
1与2 2 >
2与4 3 < 2与3 2 <
3与4 2 >
春与夏、秋与冬湖水中氯化物含量P >,按α=水准不拒绝Ho ,即尚不能
认为春与夏、秋与冬季湖水中氯化物含量有差别。除这两对比组外,其它4组均P <,按α=水准,拒绝Ho ,接受H1,即可认为春夏两季湖水中氯化物含
量高于秋冬两季。
2.试就表4-2资料说明大白鼠感染脊髓灰质炎病毒后,再作伤寒或白日咳预防接种是 否会影响生存日数
表4-2 各组大鼠接种后生存日数
伤寒 百日咳 对照
5 6 8
7 6 9
8 7 10
9 8 10
10 9 11
10 9 12
11 10 12
11 10 14
12 11 16 ∑
∑Хij 92 84 112 288
ni 10 10 10 30
i X
∑2ij X 886 732 1306 2924
2i s
解Ⅰ:假定生存日数服从正态分布
(1)方差齐性检验:
Ho :三总体方差齐即2322
21σσσ== H 1:三总体方差不等或不全相等。
α=
=--∑=)/()1(22k N n s s i i c 9(++)/(30-3)=
[])k N /(1)1n /(1)]1k (3/[11)s /s ln()1n (x i 2i 2c i 2
---∑?-+-∑= [][][]
)330/(19/13)13(3/11)733.5/3553.4ln()933.2/3553.4ln()4.4/3353.4ln(9--??-+++?= =
v=2,查附表9,X 2界值表,得>P >,按α=水准,不拒绝Ho ,故可认为三
组资料总体方差齐。
(2)三组均数比较(表4-5)
Ho :大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数相等。
H 1:大白鼠感染脊髓灰质炎病毒后,再接种伤寒或百日咳菌苗生存日数不等或不全
相等
α=
C=(∑∑Χij )2/n=2882/30=
SS 总=∑∑Χij 2-C=2924-=
SS 组间=∑(∑Χij )2/ni-C
= [ 922+842+1122 ]/10-
=
SS 组内= SS 总-SS 组间=-= 表4-5 方差分析表 变异来源 SS v MS F
总变异 29
组间变异 2 组内变异 27
查附表4,得>P >,在α=水准上,拒绝Ho ,接受H 1,故可以认为大白鼠
感染脊髓灰质炎病毒后,在接种伤寒或百日咳菌苗对生存日数有影响。
(3)均数间多重比较:
Ho :任一组与对照组总体均数相同
H 1:任一组与对照组总体均数不同
α=
伤寒与对照组比较 [])/1/1()2/())1()1((21212222
112
1n n n n s n s n X X t +-+-+--=伤、对
=(-9.2)/)10/110/1(3556.4+
=2/
=
v=27,得>P >,按α=水准,拒绝Ho ,接受H 1,故可认为接种伤寒菌苗组较
对照组生存日数减少。
百日咳与对照组比较
99998.2)10/110/1(3556.4/)4.82.11(=+-=百、对t
医学统计学课后习题答案
医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体与样本:总体就是根据研究目的确定的同质观察单位的全体。样 本就是从总体中随机抽取的部分观察单位。 (3) 参数与统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量与总体参数的差别称为抽样误 差。 (5) 概率:就是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 就是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1、 平均数 就是描述数据分布集中趋势(中心位置)与平均水平的指标 2、 标准差 就是描述数据分布离散程度(或变量变化的变异程度)的指标 3、 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4、 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4、 σ± σ96.1± σ58.2± 68、27% 95% 99% 5、 47、5% 6、均数、标准差 7、 全距、方差、标准差、变异系数
医学统计学试题和答案解析
第一套试卷及参考答案 一、选择题 (40分) 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式B负偏态分布 C 正偏态分布D正态分布与近似正态分布 3、要评价某市一名5岁男孩得身高就是否偏高或偏矮,其统计方法就是( A ) A 用该市五岁男孩得身高得95%或99%正常值范围来评价 B用身高差别得假设检验来评价 C用身高均数得95%或99%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差得根本原因就是( A ) A、个体差异B、群体差异C、样本均数不同D、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为( A ) (A)相对比(B) 构成比(C)定基比 (D)率 7、统计推断得内容为( D ) A、用样本指标估计相应得总体指标B、检验统计上得“检验假设”C、A与B均不就是D、A与B均就是 8、两样本均数比较用t检验,其目得就是检验( C ) A两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本,样本含量分别为n1与n2,在进行成组设计资料得t检验时,自由度就是( D ) (A) n1+ n2 (B) n1+ n2–1(C) n1+ n2 +1 (D)n1+ n2-2 10、标准误反映( A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得(C) A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小D纵向距离最小 12、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为tr,对回归系数检验得t值为tb,二者之间具有什么关系?(C) A t r>t b B t r〈t b C t r= tb D二者大小关系不能肯定 13、设配对资料得变量值为x1与x2,则配对资料得秩与检验(D ) A分别按x1与x2从小到大编秩 B把x1与x2综合从小到大编秩 C把x1与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用得统计方法为( A ) A.四格表检验 B、四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3、08kg,标准差为0、53kg;南方n2=4896,均数为3、10kg,标准差为0、34kg,经统计学检验,p=0、0034〈0、01,这意味着( D )
医学统计学课后答案.
第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean )。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median )就是将一组观察值按升序或降序排列,位次居中的数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile )是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %的观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P 50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range ,记为R ),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range )就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance )和标准差(standard deviation )由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance ,CV )亦称离散系数(coefficient of dispersion ),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio ),又称相对比,是A 、B 两个有关指标之比,说明A 为B 的若干倍或百 分之几,它是对比的最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占的比重或
医学统计学试题及答案
医学统计学试题及答案 The latest revision on November 22, 2020
医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同
6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小
医学统计学试题及答案
《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关
7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描
医学统计学课后答案解析
第二章 1?答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表 示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓开口”资料, 是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。 即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2?答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1?不灵敏;2?不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q= Q u —Q L ,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反 映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance , CV)亦称离散系数(coefficient of dispersion ), 为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3?答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百 分之几,它是对比的最简单形式。其计算公式为比二A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千分 率(%。)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: 率.= 实际发生某现象的观察单位数迸比例基数(K) 可能发生某现象的观察单位总数 构成比(proportion)又称构成指标,它说明一种事物内部各组成部分所占的比重或
医学统计学试题及答案
医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 < D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 ' 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是( D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 , C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系(C) A tr>tb B tr 医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体 [参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007 医学统计学(第六版) 课后答案 第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2 第三章正态分布与医学参考值范围 一、单项选择题 答案 1. A 2. B 3. B 4. C 5. D 6. D 7. C 8. E 9. B 10. A 二、计算与分析 1 2[参考答案] 题中所给资料属于正偏态分布资料,所以宜用百分位数法计算其参考值范围。又因血铅含量仅过大为异常,故应计算只有上限的单侧范围,即95P 。 一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。 2.简述调查设计的基本内容。 ①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3.试比较常用的四种概率抽样方法的优缺点。 (1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。 (2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。 (3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用不同的抽样方法,有利于调查组织工作的实施③还可对不同层进行独立分析。缺点是:当需要确定的分层数较多时,操作比较麻烦,实际工作中实施难度较大。 (4)整群抽样优点是:便于组织,节省经费,容易控制调查质量;缺点是:当样本含量一定时,其抽样误差一般大于单纯随机 医学统计学试题和答案 (一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数 医学统计学试题及答案 习题 《医学统计学》第二版(五年制临床医学等本科生用) (一)单项选择题 1.观察单位为研究中的( d )。 A.样本 B. 全部对象 C.影响因素 D. 个体 2.总体是由( c )。 A.个体组成 B. 研究对象组成 C.同质个体组成 D. 研究指标组成 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 医学统计学 第一章绪论 答案 名词解释: (1)同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。 (2)总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。 (3)参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4)抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。 (5)概率:是描述随机事件发生的可能性大小的数值,用p表示 (6)计量资料:由一群个体的变量值构成的资料称为计量资料。 (7)计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。。 (8)等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。 是非题: 1.× 2.× 3.× 4.× 5.√ 6.√ 7.× 单选题: 1.C 2.E 3.D 4.C 5.D 6.B 第二章计量资料统计描述及正态分布 答案 名词解释: 1. 平均数是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围,医学上常把把绝大多数的某指 标范围称为指标的正常值范围。 填空题: 1.计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 5. 47.5% 6.均数、标准差 7. 全距、方差、标准差、变异系数 8. σμ96.1± σμ58.2± 9. 全距 R 10. 检验水准、显著性水准、0.05、 0.01 (0.1) 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础,合理分组 16. 均数,均数,μ,σ,规律性 17. 标准差 18. 单位不同,均数相差较大 是非题: 1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √ 单选题: 1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B 问答题: 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 医学统计学课后习题答案 Revised by Jack on December 14,2020 医学统计学 第一章 绪论 答案 名词解释: (1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基 础上各观察单位(或个体)之间的差异。 (2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。样本 是从总体中随机抽取的部分观察单位。 (3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称 为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为 样本统计量。 (4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误 差。 (5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示 (6) 计量资料:由一群个体的变量值构成的资料称为计量资料。 (7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称 为计数资料。。 (8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为 等级资料。 是非题: 1. × 2. × 3. × 4. × 5. √ 6. √ 7. × 单选题: 1. C 2. E 3. D 4. C 5. D 6. B 第二章 计量资料统计描述及正态分布 答案 名词解释: 1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标 2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标 3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布 称为标准状态分布。 4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝 大多数的某指 标范围称为指标的正常值范围。 填空题: 1. 计量,计数,等级 2. 设计,收集资料,分析资料,整理资料。 3. σ μχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± % 95% 99% 医学统计学试题 姓名____________分数_________ 选择题(每个2分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A条图B百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A) A用该市五岁男孩的身高的95%或99%正常值范围来评价 B用身高差别的假设检验来评价C用身高均数的95%或99%的可信区间来评价 D不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差C标准差D四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B.群体差异 C.样本均数不同 D.总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A )A相对比 B 构成比C定基比D率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验(C) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D )A n1+ n2 B n1+ n2–1 C n1+ n2 +1 D n1+ n2 -2 10、标准误反映(A)A抽样误差的大小B总体参数的波动大小 C重复实验准确度的高低D数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为tr,对回归系数检验的t值为tb,二者之间具有什么关系?(C) A tr>tb B tr 第二章 1、答:在统计学中用来描述集中趋势得指标体系就是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值得平均水平,适用于单峰对称或近似单峰对称分布资料得平均水平得描述。 几何均数:有些医学资料,如抗体得滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G 表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布得资料。 中位数与百分位数: 中位数(median)就就是将一组观察值按升序或降序排列,位次居中得数,常用M 表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置得描述,也适用于开口资料得描述。所谓“开口”资料,就是指数据得一端或者两端有不确定值。 百分位数(percentile)就是一种位置指标,以P X 表示,一个百分位数P X 将全部观察值分为两个部分,理论上有X %得观察值比P X 小,有(100-X )%观察值比P X 大。故百分位数就是一个界值,也就是分布数列得一百等份分割值。显然,中位数即就是P 50分位数。即中位数就是一特定得百分位数。常用于制定偏态分布资料得正常值范围。 2、答:常用来描述数据离散程度得指标有:极差、四分位数间距、标准差、方差、及变异系数,尤以方差与标准差最为常用。 极差(range,记为R ),又称全距,就是指一组数据中最大值与最小值之差。极差大,说明资料得离散程度大。用极差反映离散程度得大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等得最短、最长潜伏期等。其缺点就是:1、不灵敏; 2、不稳定。 四分位数间距(inter-quartile range)就就是上四分位数与下四分位数之差,即:Q =Q U -Q L ,其间包含了全部观察值得一半。所以四分位数间距又可瞧成中间一半观察值得极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料得离散程度。 极差与四分位数间距均没有利用所研究资料得全部信息,因此仍然不足以完整地反映资料得离散程度。 方差(variance)与标准差(standard deviation)由于利用了所有得信息,而得到了广泛应用,常用于描述正态分布资料得离散程度。 变异系数(coefficient of variance,CV )亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊得两组或多组资料得离散程度。 3、答:常用得相对数指标有:比,构成比与率。 比(ratio),又称相对比,就是A 、B 两个有关指标之比,说明A 为B 得若干倍或百分之 几,它就是对比得最简单形式。其计算公式为 比=A /B 率(rate)又称频率指标,用以说明某现象发生得频率或强度。常以百分率(%)、千分率(‰)、万分率(1/万)、十万分率(1/10万)等表示。计算公式为: ) 比例基数(单位总数 可能发生某现象的观察单位数 实际发生某现象的观察率K ?= 构成比(proportion) 又称构成指标,它说明一种事物内部各组成部分所占得比重或分布,常以百分数表示,其计算公式为:医学统计学课后习题答案
医学统计学部分试题及答案解析
医学统计学(第六版马斌荣)课后答案 很全面
医学统计学练习题与答案
医学统计学课后思考题答案(李晓松版)
医学统计学试题和答案.doc
医学统计学试题及答案
医学统计学课后习题与答案
医学统计学课后习题答案
医学统计学选择题及答案个
医学统计学课后答案解析