医学统计4

医学统计4
医学统计4

《医学统计学》模拟测试题

一、单项选择题

(1) 某医师采用复方铁制剂治疗贫血,选用治疗前后血清铁蛋白含量作为疗效观察指标,这种对照属于() A. 实验对照 B. 自身对照 C. 相互对照 D. 标准对照 E. 历史对照

(2) 同一双变量资料,进行相关与回归分析时,下列正确的是()。 A. r 与b 的符号毫无关系 B. 00<>b r , C. 00>>b r , D. 00>

(3) 某医院收治了80例肺癌患者,记录了他们从诊断进入研究的时间x 1(月)、年龄x 2(岁)、以前是否接受过治疗x 3(0表示未接受过治疗;1表示接受过治疗)、治疗方法x 4(0表示标准方法;1表示新疗法)、半年是否仍生存y (0表示生存不足半年;1表示生存时间≥半年)。若希望用x 1~x 4来预测y ,应该选择的分析方法是()。

A. 多重线性回归

B. 多元方差分析

C. logistic 回归

D. Cox 回归

E. 以上均不可

(4) 某医师用A 、B 、C 三种方案分别治疗7例、6例和8例婴幼儿贫血患者。治疗1月后,记录Hb 的增加量(g/L ),求得其均数分别为26.0、18.0和6.0。若用方差分析推断3种治疗方案对婴幼儿贫血的治疗效果是否不同,其检验假设H 0为() A. 3个样本均数不同 B. 3个样本均数全相同 C. 3个总体均数全相同 D. 3个总体方差全相同 E. 3个总体方差不全相同

(5) 作两样本率的假设检验,其检验假设是()。

A. 21ππ=

B. 21μμ=

C. P 1 =P 2

D. 12x x =

E. 以上都不对 (6) 三个样本频率比较,

2

)

2(01.02χχ>,可以认为()。

A .各总体频率不等或不全相等

B .各总体频率均不相等

C .各样本频率均不相等

D .各样本频率不等或不全相等

E .各总体频率相等

(7) 为研究两种方法的检测效果,将24名患者配成12对,采用配对t 检验进行统计分析,则其自由度为()

A .24

B .12

C .11

D .23

E .2

(8) 个体为研究中的()

A. 观察单位

B. 研究对象

C. 全体

D. 影响因素

E. 总体

(9) 直线回归系数的假设检验,其自由度为()。 A. n B. 1-n C. 2-n D. 12-n E. 以上均不正确

(10) A 地恶性肿瘤粗死亡率比B 地高,经标准化后A 地恶性肿瘤标化死亡率比B 地低,其原因最有可能是() A . A 地的诊断水平高 B . B 地的诊断水平高

C . A 地的老年人口在总人口中所占比例比B 地小

D . A 地的老年人口在总人口中所占比例比B 地大

E . A 地的肿瘤防治工作比B 地好

(11) 比较两药疗效时,下列哪种情况可做单侧检验() A .已知A 药与B 药均有效 B .已知A 药与B 药均无效 C .已知A 药不会优于B 药 D .已知A 药与B 要差不多好 E .以上都不对

(12) 完全随机设计资料的方差分析,若处理无作用,则F 值理论上应等于() A. -1 B. 0 C. 1 D. <1

E. >1

(13) 构成比是() A .反映事物发生的强度

B .反映了某一事物内部各部分与全部构成的比重

C .既反映A 也反映B

D .表示两个同类指标的比

E .表示某一事物在时间顺序上的排列 (14) 有关检验统计量t 的说法正确的是()

A .t 越大,说明总体参数差别越大。

B .t 越大,说明总体参数差别越小。

C .t 越大,说明样本统计量差别越大。

D .t 越大,说明样本统计量差别越小。

E .t 越大,越有理由认为两总体参数不等。 (15) 各观察值均加(或减)同一数后()

A .均数不变,标准差改变

B .均数改变,标准差不变

C .两者均不变

D .两者均改变

E .条件不够,无法算出

(16) 下面关于“死亡事件”的叙述,正确的是()。 A. 反映处理措施失败或失效的特征事件 B. 特指引起生物体死亡的事件

C. 一般是研究者在资料分析阶段确定的事件

D. 导致观察对象中途退出的事件

E. 导致观察对象意外死亡的事件

(17) 两样本均数比较时,按照05.0=α检验水准,认为两总体均数有差异,此时若推断有错,其犯错误的概率为()

A .大于0.05

B .小于0.05

C .等于0.05

D .β,β未知

E .β-1,且β未知

(18) 关于统计资料的列表原则,错误的是()。

A .标题在表的上方,简要说明表的内容

B .横标目是研究对象,列在表的左侧;纵标目是分析指标,列在表的右侧

C .线条有顶线、底线以及分隔标的斜线和竖线

D .数字右对齐,同一指标小数点位数一致,表格内不宜有空格

E .备注用“*”标出,写在表的下方 (19) 相关系数检验的无效假设是()。 A. 0=ρ B. 0≠ρ C. 0>ρ D. 0<ρ E. 以上均不正确

(20) 对相关分析而言,下列正确的是()。 A. 两个变量来自双变量正态总体,地位不分主次

B. 两个变量来自双变量正态总体,一个是因变量,一个是自变量

C. 对两个变量无特殊要求

D. 因变量来自正态总体,自变量特殊要求

E. 以上都不正确

(21) 四个样本率比较时,若有一个理论频数大于1小于5,则()。

A. 必须先作合理的并组

B. 直接作2

χ检验 C. 不能作2χ检验

D. 必须作校正2

χ检验

E. 不能确定是否需要校正

(22) 下列变量的观测结果属于等级资料的是()

A 红细胞计数

B 住院天数

C 门诊就诊人次

D 患者的病情分级

E 血红蛋白值

(23) 对多重线性回归方程的假设检验,其零假设0H 的正确表达形式是()。 A. k b b b === 21 B. k βββ=== 21 C. 021====k βββ D. 各j β不等或不会等于0 E. 各

j

β不等或不全等于0

(24) 下列()不是logistic 回归方程的形式。

A .m

m x x p p βββ+++=????

??- 1101ln

B .

()()m m m m x x x x p ββββββ+++++++=

110110exp 1exp

C .

()

p m x x p βββ++++=- 110exp 11

1

D .()m m x x p it βββ+++= 110log

E .m m x x p βββ+++= 110

(25) 测得200名正常成年男子的血清胆固醇(mmol/L ),为进行统计描述,下列说法不正确的是()

A .可用频率表法计算均数

B .可用直接法计算均数

C .可用直接法计算标准差

D.可用加权法计算标准差

E.可用直条图表示频率分布图

(26)根据下述资料,则()

A.乙疗法优于甲疗法

B.甲疗法优于乙疗法

C.甲疗法与乙疗法疗效相等

D.此资料应先求标化率再做假设检验

E.甲疗法与乙疗法疗效不相等

(27)描述某社区居民2011年慢性非传染性疾病的病种构成时,宜绘制()。

A.直条图

B.圆图

C.线图

D.散点图

E.直方图

(28)两样本均数比较的t检验,差别有统计学意义时,P值越小,则()A.两样本均数差异越大

B.两总体均数差异越大

C.越有理由认为两总体均数不同

D.越有理由认为两样本均数不同

E.两样本均数差异越小

(29)下列关于单侧检验和双侧检验的说法正确的是()

A. 采用单侧检验好

B. 采用双侧检验好

C. 采用单双侧检验都无所谓

D. 根据专业知识确定采用单侧检验还是双侧检验

E. 以上都不对

(30)多重线性回归分析中,反映回归平方和在因变量Y的总离均差平方和中所占比重的统计量是()。

A. 偏回归系数

B. 标准化偏回归系数

C. 决定系数

D. 复相关系数

E. 偏相关系数

(31)关于样本量的估算,以下哪个表述是正确的()

A.个体变异越大,需要的样本量越大

B.总体均数越大,需要的样本量越大

C.相对误差越大,需要的样本量越大

D.置信程度越大,需要的样本量越大

E.以上都正确

(32)可信区间估计时可信度是指()

A. α

B. β

-

C. 1α

-

D. 1β

E. 以上均不是

(33)对于等级资料,在比较各处理组的效应有无差别时宜采用()。

A. t检验

B. 2χ检验

C. 秩和检验

D. 方差分析

E. z检验

(34)实现实验组和对照组均衡性的手段是()

A. 随机化

B. 精心试验

C. 观察效应

D. 齐同对比

E. 设置对照组

(35)直方图适用于描述()。

A.某现象的发展速度

B.某现象的内部构成

C.某现象的变动趋势

D.某现象的地域分布

E.某现象的频数分布

(36)实验设计的基本原则是()

A. 随机、对照、重复、盲法

B. 对照、齐同、重复、样本大小

C. 随机、均衡、重复、齐同

D. 随机、对照、均衡、盲法

E. 随机、对照、重复、均衡

(37)总体是由()

A. 个体组成

B. 研究对象组成

C. 同质个体组成

D. 研究指标组成

E. 样本组成

(38)某医生用A药治疗12例病人,治愈9例,用B药治疗12例病人,治愈2例,比较疗效时宜用()。

A. 2χ检验

B. 校正2χ检验

C. Fisher确切概率法

D. t检验

E. F 检验

(39) 下列哪项不是非参数检验的适用条件()。

A. 不受总体分布类型的限制

B. 适用于等级资料

C. 适用于分布类型未知的资料

D. 适用于正态分布资料

E. 适用于呈明显偏态分布的资料

(40) 欲比较两地死亡率,计算标准化率可以() A .消除两地总人口数不同的影响 B .消除两地各年龄组死亡人数不同的影响 C .消除两地各年龄组人口数不同的影响 D .消除两地抽样误差不同的影响 E .以上都不是

(41) 下列对总体相关系数ρ描述不正确的是()。 A. 11≤≤-ρ B. ρ是有单位的量

C. ρ可用于描述两变量间的线性关系的程度

D.

ρ

越大说明两变量间线性关系的程度越强

E. ρ=0说明两变量间无相关关系 (42) Cox 回归的效应变量是()。 A. 正态的和方差齐性的 B. 生存时间和结局变量 C. 生存时间 D. 结局变量

E. 完全数据(未截尾)

(43) 某医院将100名乙型肝炎患者随机分为甲、乙两组,各50人。甲组患者用常规治疗,乙组患者用常规治疗加心理治疗,对两组患者的疗效进行评价,该设

计属于()

A. 配对设计

B. 随机区组设计

C. 完全随机设计

D. 析因设计

E. 交叉设计

(44)检验水准降低可使()

A. 检验效能增大

B. II型错误增大

C. I和II型错误都减少

D. II型错误减少

E. I型错误不变

(45)完全随机设计方差分析的无效假设H0是()

A. 各对比组样本均数相等

B. 各对比组总体均数相等

C. 各对比组样本均数不相等

D. 各对比组总体均数不相等

E. 各对比组总体均数不全相等

(46)把P25,P50,P75标在一个数轴上,则()

A.P50一定在P25和P75的中点

B.P50一定不在P25和P75的中点

C.P50一定靠近P25一些

D.P50一定靠近P75一些

E.以上都不是

(47)某部队夏季拉练,发生中暑21例,其中北方籍战士为南方籍战士的2.5倍,则结论为()

A.北方籍战士容易发生中暑

B.南方籍战士容易发生中暑

C.北方、南方籍战士都容易发生中暑

D.北方、南方籍战士都不容易发生中暑

E.尚不能得出结论

(48)方差分析是通过(),来实现多个组间均数差异的分析

A. 比较自由度

B. 比较均方

C. 比较标准差

D. 比较离均差平方和

E. 比较变异系数

(49)实验效应指标的精确性是指()

A. 客观性和主观性

B. 准确度和精密度

C. 灵敏度和特异度

D. 随机误差和系统误差

E. 以上均不是

(50)实验设计的基本要素是()

A. 受试对象、实验效应、观察指标

B. 随机化、重复、设置对照

C. 齐同对比、均衡性、随机化

D. 处理因素、实验效应、均衡性

E. 处理因素、受试对象、实验效应

(51)关于医学统计学几个基本概念下列说法错误的是()

A.某些观察对象具有相同的特征或属性称为同质性

B.总体是根据研究目的确定的同质观察单位的集合

C.小概率事件是指某事件发生概率P ≤0.05的随机事件

D.样本是指依照研究者的要求选取总体中有意义的一部分

E.根据每个观察单位某项特征或属性进行观察或测量,这种特征或属性称为变量

(52)欲比较A、B两市近三年冠心病的发病率,宜绘制()。

A.半对数线图

B.直条图

C.百分条图

D.直方图

E.圆图

(53)在下列关系研究中,可用直线相关分析研究两变量数量协同变化关系的是()。

A. 性别与血型

B. 父亲职业与子女智商

C. 体重与体表面积

D. 工龄与患病率

E. 身高与血压

(54)用触诊和X光片检查对80名妇女作乳癌检查,触诊有30名阳性,X光片有50名阴性,两种方法均阳性者10名,两种方法检查均为阴性的人数是()。

A. 20

B. 30

C. 50

D. 40

E. 60

(55)下列资料不能用2

χ检验的是()。

A. 完全随机设计的两样本率的比较

B. 配对设计的两样本率的比较

C. 多个样本率的比较

D. 两个(或多个)构成比间的比较

E. 等级资料实验效应间的比较

(56)两个2×2表一个

22

0.01,1

χχ

>

,另一个

22

0.05,1

χχ

>

,可认为()。

A. 前者两个的百分数相差大

B. 后者两个的百分数相差大

C. 前者更有理由认为两总体率不同

D. 后者更有理由认为两总体率不同

E. 尚不能下结论

(57) 如果相关系数r = 0,则一定有()。 A. 简单线行回归的截距等于0 B. 简单线行回归的截距等于Y 或X C. 简单线性回归的残SS 等于0 D. 简单线性回归的残SS 等于总SS E. 以上均不正确

(58) 为了研究粪管措施的效果,比较已经实行无害化处理的甲乡和尚未实行的乙乡的居民钩虫感染率,已知男性的钩虫感染率高于女性,甲乡人口女多于男,而乙乡男多于女,其正确比较的方法是() A .两个率比较的u 检验 B .两个率比较的2

检验 C .不具可比性,不能比较 D .对性别进行标准化后再做比较 E .可以直接进行比较

(59) 描述某地300名儿童的血铅含量的分布,宜选择()。

A .直条图

B .散点图

C .直方图

D .半对数线图

E .圆图

(60) 某地调查20岁男大学生100名,身高标准差为4.09cm ,体重标准差为4.10kg ,比较两者的变异程度,结果()

A .体重变异度大

B .身高变异度较大

C .两者变异度相同

D .因单位不同,两者标准差不能直接比较

E .身高的变异程度与体重的变异程度之比为1:1

二、计算题

(1)一药厂为了解其生产的某药物(同一批次)之有效成分含量是否符合国家规定的标准,随机抽取了该药10片,得其样本均数为103.0mg,标准差为2.22mg。试估计该批药剂有效成分的平均含量。

(2)某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表1:某年某地健康成年人的红细胞数和血红蛋白含量

请就上表资料:

(1) 分别计算男、女两项指标的抽样误差。

(2) 试估计该地健康成年男、女红细胞数的均数。

(3)为了解高寒地区小学生血红蛋白含量的平均水平,某人于1993年6月随机抽取了该地小学生708名,算得其血红蛋白均数为103.5g/L,标准差为1.59g/L。试求该地小学生血红蛋白均数的95%可信区间。

(4)采用某新药治疗高血压病人200例,服药一月后160人有效,试估计该药的有效率及其双侧95%可信区间。

三、简答题

(1)实验研究设计的类型有哪些?

(2)简要回答非参数检验适用哪些条件?

(3) 生存分析中出现截尾数据常见的原因有哪些? (4) 何谓参数检验与非参数检验?各有何优缺点? (5) 应用标准化法的应注意哪些事项? (6) 简要介绍几种常用的两两比较方法?

(7) 描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同? (8) t 检验中,一般根据05.0 P ,拒绝原假设,其理论依据是什么?

【参考答案】:

一、单项选择题

(1) B (2) C (3) C (4) C (5) A (6) A (7) C (8) A (9) C

(10) D (11) C (12) C (13) B (14) E (15) B (16) A (17) C (18) C (19) B (20) A (21) B (22) D (23) C (24) E (25) E (26) C

(27) B (28) C (29) D (30) C (31) C (32) C (33) C (34) A (35) E (36) A (37) C (38) C (39) D (40) C (41) B (42) B (43) C (44) B

(45) B (46) E (47) E (48) B (49) B (50) E (51) D (52) B (53) C (54) B (55) E (56) C (57) D (58) D (59) C (60) D

二、计算题

(1) 该批药剂有效成分的平均含量的点值估计为103.0 mg 。

σ未知且n 很小时,总体均数的区间估计可用

()/2,/2,X X X t S X t S αναν-+ , 估计。查t 界值表得t 0.05/2,9=2.262,该批药剂有效成分(mg)的平均含量的95%可信区

间为:

(103.0 2.262103.0 2.262-+, ,即(101.41 , 104.59)。

(2) (1) 抽样误差的大小用标准误X S 来表示,由表1计算各项指标的标准误。

男性红细胞数的标准误20.031 (10/L)

X S =

==

男性血红蛋白含量的标准误

0.374 (g/L)

X S ==

=

女性红细胞数的标准误20.018 (10/L)

X S =

=

=

女性血红蛋白含量的标准误

0.639 (g/L)

X S =

=

=

(2) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大,故总体均数的区间估计按

(/2/2X X X u S X u S αα-+

, )计算。 该地男性红细胞数(12

10/L)总体均数的95%可信区间为:

(4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)。 该地女性红细胞数(12

10/L)总体均数的95%可信区间为:

(4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)。

(3) σ未知,n 足够大时,总体均数的区间估计可用(/2/2X X X u S X u S αα-+

, )。 该地小学生血红蛋白含量(g/L)均数的95%可信区间为:

(完整版)医学统计学第六版课后答案

第一章绪论 一、单项选择题 答案 1. D 2. E 3. D 4. B 5. A 6. D 7. A 8. C 9. E 10. D 二、简答题 1答由样本数据获得的结果,需要对其进行统计描述和统计推断,统计描述可以使数据更容易理解,统计推断则可以使用概率的方式给出结论,两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律,使研究结论具有科学性。 2答医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率,并使结果更加准确和可靠,数据整理主要是对数据进行归类,检查数据质量,以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征,统计推断指由样本数据的特征推断总体特征的方法,包括参数估计和假设检验。 3答统计描述结果的表达方式主要是通过统计指标、统计表和统计图,统计推断主要是计算参数估计的可信区间、假设检验的P 值得出相互比较是否有差别的结论。 4答统计量是描述样本特征的指标,由样本数据计算得到,参数是描述总体分布特征的指标可由“全体”数据算出。 5答系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生,随机测量误差是生物体的自然变异和各种不可预知因素产生的误差,抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。 6答三个总体一是“心肌梗死患者”所属的总体二是接受尿激酶原治疗患者所属的总体三是接受瑞替普酶治疗患者所在的总体。 第二章定量数据的统计描述 一、单项选择题 答案 1. A 2. B 3. E 4. B 5. A 6. E 7. E 8. D 9. B 10. E 二、计算与分析 2

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

(完整版)医学统计学实习册第7版武汉大学答案

实习一 1 总体:根据研究目的所确定的同质观察单位的全体。 2 样本:从总体中随机抽取的部分个体。 3 参数:总体的统计指标或特征值。 4 统计量:由样本所算出的统计指标或特征值。 5 概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p, 这个常数p就称为事件A出现的概率,记作P(A)或P。 6 频率:在n次随机试验中,事件A发生了m次,则比值f=m/n=A发生的试验次数/试验的 总次数称为A在n次试验中出现的频率。 7 变异:同质事物间的差别。 8 指标:说明总体综合数量特征和数量关系的数字资料。 简答与思考题 1 什么叫医学统计学?医学统计学与统计学、卫生统计学、生物统计学有何联系与区别?医学统计学:是应用统计学原理和方法研究生物医学资料的搜索、整理、分析和推断的一门学科。 统计学:是研究数据的收集、整理、分析与推断的科学 卫生统计学:是把统计理论、方法应用于居民健康状况研究、医疗卫生实践、卫生事业管理和医学科研的一门应用学科。 生物统计学:是一门探讨如何从不完整的信息中获取科学可靠的结论从而进一步进行生物学实验研究的设计、取样、分析、资料整理与推论的科学。 2 医学统计资料主要来源于哪些方面?有何要求? 医学统计资料主要有实验数据和现场调查资料、医疗卫生工作记录、报表和报告卡等。实验数据是指在试验过程中活的数据;现场调查资料主要来源于大规模的流行病调查获取的资料;医疗卫生工作记录有门诊病历卡、住院病历卡、化验报告等;报表有卫生工作基本情况年报表、传染年(月、日)报表、疫情旬(年、月、日)报表等;报表卡有传染病发病报告卡、出生报告卡、死亡报告卡等等。 这些资料的收集过程中,必须进行治疗控制,包括它的统一性、确切性、可重复性。这些原始数据的精度和偏差应用明确的范围。

医学统计学试题:第4题【15分】__回归分析

四、回归分析 15分 可能涉及范围:多元线性回归、logistic 回归。要求: 1、提供某一资料,选择统计分析方法 2、偏回归系数、标准偏回归系数、决定系数、校正决定系数、OR 等常用指标的意义与应用 3、列回归方程 例 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值如下表: (1)欲分析影响空腹血糖浓度的有关因素,宜采用什么统计分析方法?多元线性回归分析 (2)已知甘油三酯(X2)、胰岛素(X3)和糖化血红蛋白(X4)是主要影响因素,现欲比较上述因素对血糖浓度的相对影响强度,应计算何种指标? 标准偏回归系数可用来比较各自变量Xj 对Y 的影响强度,有统计意义下,回归系数绝对值越大,对Y 的作用越大。 SPSS 输出的多元回归分析结果中给出的各变量的标准偏回归系数, 比较三个标准偏回归系数:甘油三脂0.354: 胰岛素0.360: 糖化血红蛋白0.413≈1:1.02:1.17(倍) 糖化血红蛋白对血糖的影响强度大小依次为:糖化血红蛋白X4、胰岛素X3、甘油三脂X2 (3)分析其回归模型的好坏宜选用何种指标?校正决定系数( R 2 a )作为评价标准 一般说决定系数(R 2)越大越优,但由于R 2是随自变量的增加而增大,因此,不能简单地以R 2 作为评价标准, 而是用校正决定系数( R 2a )作为评价标准。 R 2 a 不会随无意义的自变量增加而增大。 (4)根据给出SPSS 结果,做出正确的结论。 空腹血糖浓度与总胆固醇无关,与甘油三脂、空腹胰岛素、糖化血红蛋白线性相关。 (5)列出回归方程。最优回归方程为:432663.0287.0402.05.6?X X X y +-+= Model Summary(最终模型的拟合优度检验验表)相关分析

医学统计学第三版第四章课后习题答案

2. ANOVA 实验结果 Sum of Squares df Mean Square F Sig. Between Groups 43.194 3 14.398 13.697 .000 Within Groups 37.842 36 1.051 Total 81.036 39 Multiple Comparisons Dependent Variable: 实验结果 Dunnett t (2-sided)a (I) 分组(J) 分组Mean Difference (I-J) Std. Error Sig. 95% Confidence Interval Lower Bound Upper Bound 0.5 对照组-2.15000*.45851 .000 -3.2743 -1.0257 1.0 对照组- 2.27000*.45851 .000 - 3.3943 -1.1457 1.5 对照组-2.66000*.45851 .000 -3.7843 -1.5357 F=13.697 P=0.000004 P A=0.000113 P B=0.000051 P C=0.000004均小于0.001 根据完全随机资料的方差分析,按α=0.05水准,拒绝H0,接受H1,认为四组治疗组小白鼠的肿瘤重量总体均数不全相等,即不同剂量药物注射液的抑癌作用有差别。 3. Tests of Between-Subjects Effects Dependent Variable: 重量 Source Type III Sum of Squares df Mean Square F Sig. Hypothesis 99736.333 1 99736.333 58.489 .005 Error 5115.667 3 1705.222a 治疗 Hypothesis 6503.167 2 3251.583 44.867 .000 Error 434.833 6 72.472b 分组 Hypothesis 5115.667 3 1705.222 23.529 .001 Error 434.833 6 72.472b F:44.867 23.529 P:0.000246 0.001020<0.01 根据随机区组资料的方差分析,按α=0.05水准,拒绝H0,接受H1,三组注射不同剂量雌激素的大白鼠子宫重量总体均数不全相等,即注射不同剂量的雌激素对大白鼠子宫重量有影响 5.

医学统计学第七版课后答案及解析

医学统计学第七版部分课后答案及解析 第二章 1.答:在统计学中用来描述集中趋势的指标体系是平均数,包括算术均数,几何均数,中位数。 均数反映了一组观察值的平均水平,适用于单峰对称或近似单峰对称分布资料的平均水平的描述。 几何均数:有些医学资料,如抗体的滴度,细菌计数等,其频数分布呈明显偏态,各观察值之间呈倍数变化(等比关系),此时不宜用算术均数描述其集中位置,而应该使用几何均数(geometric mean)。几何均数一般用G表示,适用于各变量值之间成倍数关系,分布呈偏态,但经过对数变换后成单峰对称分布的资料。 中位数和百分位数: 中位数(median)就是将一组观察值按升序或降序排列,位次居中的数,常用M表示。理论上数据集中有一半数比中位数小,另一半比中位数大。中位数既适用于资料呈偏态分布或不规则分布时集中位置的描述,也适用于开口资料的描述。所谓“开口”资料,是指数据的一端或者两端有不确定值。 百分位数(percentile)是一种位置指标,以P X表示,一个百分位数P X将全部观察值分为两个部分,理论上有X%的观察值比P X小,有(100-X)%观察值比P X大。故百分位数是一个界值,也是分布数列的一百等份分割值。显然,中位数即是P50分位数。即中位数是一特定的百分位数。常用于制定偏态分布资料的正常值范围。 2.答:常用来描述数据离散程度的指标有:极差、四分位数间距、标准差、方差、 及变异系数,尤以方差和标准差最为常用。 极差(range,记为R),又称全距,是指一组数据中最大值与最小值之差。极差大,说明资料的离散程度大。用极差反映离散程度的大小,简单明了,故得到广泛采用,如用以说明传染病、食物中毒等的最短、最长潜伏期等。其缺点是:1.不灵敏; 2.不稳定。 四分位数间距(inter-quartile range)就是上四分位数与下四分位数之差,即:Q=Q U-Q L,其间包含了全部观察值的一半。所以四分位数间距又可看成中间一半观察值的极差。其意义与极差相似,数值大,说明变异度大;反之,说明变异度小。常用于描述偏态分布资料的离散程度。 极差和四分位数间距均没有利用所研究资料的全部信息,因此仍然不足以完整地反映资料的离散程度。 方差(variance)和标准差(standard deviation)由于利用了所有的信息,而得到了广泛应用,常用于描述正态分布资料的离散程度。 变异系数(coefficient of variance,CV)亦称离散系数(coefficient of dispersion),为标准差与均数之比,常用百分数表示。变异系数没有度量衡单位,常用于比较度量单位不同或均数相差悬殊的两组或多组资料的离散程度。 3.答:常用的相对数指标有:比,构成比和率。 比(ratio),又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。其计算公式为比=A/B 率(rate)又称频率指标,用以说明某现象发生的频率或强度。常以百分率(%)、千

医学统计学第七版课后答案及解析

练习题答案 第一章医学统计中的基本概念 练习题 一、单向选择题 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 二、简答题 1.常见的三类误差是什么?应采取什么措施和方法加以控制? [参考答案] 常见的三类误差是:

(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校 正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。要尽量查明其原因,必须克服。 (2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正, 但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素 造成测量结果的误差。对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳 压器、恒温装置等措施,从而达到控制的目的。 (3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本 均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。这种差异是由抽样引 起的,故这种误差叫做抽样误差,要用统计方法进行正确分析。 2.抽样中要求每一个样本应该具有哪三性? [参考答案] 从总体中抽取样本,其样本应具有“代表性”、“随机性”和“可靠性”。 (1)代表性: 就是要求样本中的每一个个体必须符合总体的规定。 (2)随机性: 就是要保证总体中的每个个体均有相同的几率被抽作样本。 (3)可靠性: 即实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测 总体的结论有较大的可信度。由于个体之间存在差异, 只有观察一定数量的个体方能体现出 其客观规律性。每个样本的含量越多,可靠性会越大,但是例数增加,人力、物力都会发生 困难,所以应以“足够”为准。需要作“样本例数估计”。 3.什么是两个样本之间的可比性? [参考答案] 可比性是指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。 (马斌荣) 第二章集中趋势的统计描述 练习题 一、单项选择题 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是

医学统计学第四版 课文例04-05

例4-5 某研究者为了比较甲、乙、丙、丁、戊、己6种药物给家兔注射后产生的皮肤疱疹大小(mm2),采用拉丁方设计,选用6只家兔、并在每只家兔的6个不同部位进行注射。实验结果见表4-11,试作方差分析。其设计步骤如下: (1)本研究药物是处理因素,家兔和部位是减少实验误差的控制因素,这三个因素的水平数都为6。从专业上判断因素间相互作用的影响可忽略,故可选择拉丁方设计。 (2)g=6,选定6×6基本拉丁方。 (3)行区组代表不同的家兔,列区组代表不同的注射部位,拉丁字母代表不同的药物。 (4)为了达到随机化的目的,即获得随机排列的拉丁方,需对6×6基本拉丁方(见本章最后)做行列变换。先做行变换,如读取6个两位数的随机数,22,06,34,72,52,82,再按照大小得秩次R=2,1,3,5,4,6,先1,2行对调,再3,5行对调,后4,6行对调。再做列变换,如读取6个两位数的随机数,27,29,99,72,68,53,则R=1,2,6,5,4,3,先1,2列对调,再5,6列对调,后3,4列对调。最后随机分配处理,如读取6个两位随机数,35,56,27,09,24,86,则R=4,5,3,1,2,6,于是有D(甲)、E(乙)、C(丙)、A(丁)、B(戊)、F(己)。具体过程如下:

由此得到本例的拉丁方设计,该研究者依此安排实验,其实验结果(皮肤疱疹大小,mm 2)见表4-11。 表4-11 例4-5的拉丁方设计与实验结果(皮肤疱疹大小,mm 2) 家兔编号 (行区组) 注射部位编号(列区组) 行区组 合计(R j ) j X 1 2 3 4 5 6 1 C (87) B (75) E (81) D (75) A (84) F (66) 468.0 78.0 1,2列 对调 5,6列对调 3,4列对调

常用医学统计学方法汇总

选择合适的统计学方法 1 连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t 检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t 检验;(2)采用非参数检验,如Wilcoxon 检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t '检验;(2)采用非参数检验,如Wilcoxon 检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t 检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon 的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果 为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe 法,SNK 法等。 1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal -Wallis 法。如 果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用成组的Wilcoxon 检验。 1.4 多组随机区组样本比较 1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。 1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman 检验法。如果 检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用符号配对的Wilcoxon 检验。 **** 需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。** 绝不能对其中的两 组直接采用t检验,这样即使得出结果也未必正确**

医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B ) A 条图 B 百分条图或圆图 C 线图 D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95% 或99% 正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99% 的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是(A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6.男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为(D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A 和B 均不是 D. A 和B 均是 8、两样本均数比较用t 检验,其目的是检验(C ) A 两样本均数是否不同 B 两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2 –1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t 值为t b,二者之间具有什么关系?(C) A t r>t b B t rχ20.05,ν可认为(A ) A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8 人。该资料宜选用的统计方法为(A ) A.四格表检验B. 四格表校正检验C t 检验D U 检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3.08kg,标准差为0.53kg;南方n2=4896,均数为3.10kg,标准差为0.34kg,经统计学检验,p=0.0034<0.01,这意味着(D ) A 南方和北方女婴出生体重的差别无统计学意义 B 南方和北方女婴出生体重差别很大

常用医学统计学方法的选择

常用医学统计学方法的选择 1. 多组率的比较用卡方检验(χ2检验,chi-square test) 直接用几个率的数值比较,与直接用原始数据录入比较,结果会有什么不同?卡方值会受样本量的影响,样本越多,卡方值越大。 2.多组计量资料比较采用方差分析(F检验) ,不能用t检验。当方差分析结果为P<0.05时,只能说明k组总体均数之间不完全相同。若想进一步了解哪两组的差别有统计学意义,需进行多个均数间的多重比较,即SNK-q检验(多个均数两两之间的全面比较)、LSD-t检验(适用于一对或几对在专业上有特殊意义的均数间差别的比较)和Dunnett检验(适用于k-1个实验组与一个对比组均数差别的多重比较)。 3.非正态分布多组数据之间比较选用非参数检验、单样本中位数检验(符号检验和Wilcoxon 检验)、双样本中位数检验(Mann-Whitney 检验)、方差分析(Kruskal-Wallis、Mood 中位数和Friedman 检验) 4.按血糖水平从低到高分成多组,进行多组之间死亡率的比较,由于死亡率同样受年龄、性别、病史、您身边的论文好秘书:您的原始资料与构思,我按您的意思整理成优秀论文论著,并安排出版发表,扣1550116010 、766085044自信我会是您人生路上不可或缺的论文好秘书血脂等因素的影响,所以需选取合适统计方法实现“调整年龄、性别等危险因素后,按血糖分组进行死亡率的比较(由血糖从低到高分成的4组)”。 ①年龄是定量变量(是数值),调整年龄的方法可在Logistic回归中运用,连续性变量年龄加入covariate中,当成协变量,就可以调整年龄,age-adjusted odds ratio就能得到了。 ②性别性别是二分类变量,不是定量变量,不可在LOGISTIC回归里比较。调整性别可在卡方检验中采取分层的方法比较。 如果为多分类LOGISTIC回归,在选择用multinomianl LOGISTIC回归中,可选入年龄等进入covariate,观察年龄的配比情况。可把性别选入factors(自变量)。这样可以实现调整年龄、性别等危险因素。 5.回顾性研究(1)临床妊娠率和女性年龄的关系+(2)男性影响临床妊娠的精子参数比较: 数据类型及变量的说明:y:计量 拟采用的分析方法:卡方检验 拟采用的分析软件:spss 原始数据附件及格式:word表 能否用其他方法统计分析:可用卡方分割,调整检验水准(根据比较的次数N,校正后的检验水准为0.05/N)。 6.重复t检验:多个样本均数间的两两比较(又称多重比较)不宜用t检验,因为重复数次,t 检验将增加第一类错误的概率,使检验效率降低。此时宜用方差分析,并在此基础上用两两比较方法(如.SNK、LSD、Duncan法等)。 对于同一对均数间的差异,用t检验无显著性,而两两比较可能有显著性,可见错误选用统计方法将推出错误结论。 统计方法的选择: 分计量、计数、等级资料三

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

《医学统计学》第5版单选题

《医学统计学》单项选择题 摘自:马斌荣主编.医学统计学.第5版.北京:人民卫生出版社,2008 第一章医学统计中的基本概念 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. 各种类型的数据 C. 动物和人的本质 D. 疾病的预防与治疗 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A.总体中最容易获得的部分个体 B.在总体中随意抽取任意个体 C.挑选总体中的有代表性的部分个体 D.用配对方法抽取的部分个体 E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A.收缩压测量值 B.脉搏数 C.住院天数 D.病情程度 E.四种血型 4. 随机误差指的是 A. 测量不准引起的误差 B. 由操作失误引起的误差 C. 选择样本不当引起的误差 D. 选择总体不当引起的误差 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. 系统误差 C. 过失误差 D. 记录误差 E.仪器故障误差 答案: E E D E A 第二章集中趋势的统计描述 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 B. 几何均数 P百分位数 C. 均数 D. 95 E. 频数分布

2. 算术均数与中位数相比,其特点是 A.不易受极端值的影响 B.能充分利用数据的信息 C.抽样误差较大 D.更适用于偏态分布资料 E.更适用于分布不明确资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. 数值离散度较大 C. 数值分布偏向较大一侧 D. 数值分布偏向较小一侧 E. 数值分布不均匀 4. 将一组计量资料整理成频数表的主要目的是 A.化为计数资料 B. 便于计算 C. 形象描述数据的特点 D. 为了能够更精确地检验 E. 提供数据和描述数据的分布特征 5. 6人接种流感疫苗一个月后测定抗体滴度为 1:20、1:40、1:80、1:80、1:160、1:320,求平均滴度应选用的指标是 A. 均数 B. 几何均数 C. 中位数 D. 百分位数 E. 倒数的均数 答案: A B D E B 第三章离散程度的统计描述 1. 变异系数主要用于 A.比较不同计量指标的变异程度 B. 衡量正态分布的变异程度 C. 衡量测量的准确度 D. 衡量偏态分布的变异程度 E. 衡量样本抽样误差的大小 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是 A. 变异系数 B. 离均差平方和 C. 极差 D. 四分位数间距 E. 标准差 3. 某项指标95%医学参考值范围表示的是 A. 检测指标在此范围,判断“异常”正确的概率大于或等于95% B. 检测指标在此范围,判断“正常”正确的概率大于或等于95% C. 在“异常”总体中有95%的人在此范围之外 D. 在“正常”总体中有95%的人在此范围 E. 检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”

医学统计学重点图表总结

定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平 均值 正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均 数的程度 对称分布,特别是正态分布资料 四分位数间距居中半数观察值的 全距 ①非对称分布;②半定量资料;③末端开口资料; ④分布不明 变异系数标准差与均数的相 对比 ①不同量纲的变量间比较;②量纲相同但数量级相 差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 条图组间数量对比用直条高度表示数量大小 直方图定量资料的分布用直条的面积表示各组段的频数或频率 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 线图定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 1

1 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97 .5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99 .5 P 1 P 99 1.标准差与标准误的区别与联系?

《医学统计学》第5版单选题

医学统计学》单项选择题 摘自:马斌荣主编 . 医学统计学 . 第5版. 北京:人民卫生出 版社, 2008 第一章 医学统计中的基本概念 1. 医学统计学研究的对象是 A. 医学中的小概率事件 B. C. 动物和人的本质 D. E 有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是 A 总体中最容易获得的部分个体 B ?在总体中随意抽取任意个体 C. 挑选总体中的有代表性的部分个体 D ?用配对方法抽取的部分个体 E 依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 A 收缩压测量值 B 脉搏数 C 住院天数 D 病 情程度 E 四种血型 4. 随机误差指的是 A. 测量不准引起的误差 C. 选择样本不当引起的误差 E. 由偶然因素引起的误差 B. 由操作失误引起的误差 D. 选择总体不当引起的误差 5. 收集资料不可避免的误差是 A. 随机误差 B. C. 过失误差 D. 系统误差 记录误差 E 仪器故障误差 答案: E E D E A 第二章 集中趋势的统计描述 1. 某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 B. 几何均数 C. 均数 D. P 95 百分位数 E. 频数分布 各种类型的数据 疾病的预防与治疗

2. 算术均数与中位数相比,其特点是 A不易受极端值的影响B C.抽样误差较大D E更适用于分布不明确资料.能充分利用数据的信息.更适用于偏态分布资料 3. 一组原始数据呈正偏态分布,其数据的特点是 A. 数值离散度较小 B. C. 数值分布偏向较大一侧 D. E. 数值分布不均匀数值离散度较大数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是 A化为计数资料 B. C. 形象描述数据的特点 D. E. 提供数据和描述数据的分布特征便于计算 为了能够更精确地检验 5. 6人接种流感疫苗一个月后测定抗体滴度为1:320,求平均滴度应选用的指标是 A. 均数 B. C. 中位数 D. 1 :20、1:40、1:80、1:80、1 几何均数 百分位数 160、 E. 倒数的均数 答案: A B D E B 第三章离散程度的统计描述 1. 变异系数主要用于 A比较不同计量指标的变异程度 B. 衡量正态分布的变异程度 C. 衡量测量的准确度 D. 衡量偏态分布的变异程度 E. 衡量样本抽样误差的大小 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是 A. 变异系数 B. 离均差平方和 C. 极差 D. 四分位数间距 E. 标准差 3. 某项指标95%医学参考值范围表示的是 A. 检测指标在此范围,判断“异常”正确的概率大于或等于95% B. 检测指标在此范围,判断“正常”正确的概率大于或等于95% C. 在“异常”总体中有95%的人在此范围之外 D. 在“正常”总体中有95%的人在此范围 E. 检测指标若超出此范围,则有95%的把握说明诊断对象为“异常”

医学统计学选择(全部答案,仅供参考)

习题 《医学统计学》第二版(七年制临床医学用)(一)最佳选择题 1.描述一组偏态分布资料的变异度,以()指标较好。 A. 全距 B. 标准差 C. 变异系数 D. 四分位数间距 E.方差 2.用均数和标准差可以全面描述()资料的特征。 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. 对称分布 E.对数正态分布 3.各观察值均加(或减)同一数后()。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 E.以上都不对 4.比较身高和体重两组数据变异度大小宜采用()。 A. 变异系数 B. 方差 C. 极差 D. 标准差 E.四分位数间距 5.偏态分布宜用()描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 E.方差

6.各观察值同乘以一个不等于0的常数后,()不变。 A.算术均数 B. 标准差 C. 几何均数 D. 中位数 E.变异系数 7.()分布的资料,均数等于中位数。 A. 对数正态 B. 正偏态 C. 负偏态 D. 偏态 E.正态 8.对数正态分布是一种()分布。(说明:设X变量经Y=lg X变换后服从正态分布,问X变量属何种分布?) A. 正态 B. 近似正态 C. 左偏态 D. 右偏态 E.对称 9.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D. 四分位数间距 E.几何均数 10.血清学滴度资料最常用来表示其平均水平的指标是()。 A.算术平均数 B.中位数 C.几何均数 D.变异系数 E.标准差

医学统计学-高级统计学课后部分习题答案第四版孙振球主编

11-多因素实验资料的方差分析 11-3 (1)本题为4个处理组的2×2析因涉及,因分成3天进行,若将每天的实验结果设为一个区组,先进行随机区组的方差分析: 方差分析表1 变异来源df SS MS F Sig. 总变异11 818.369 区组间 2 3.762 1.881 .230 .801 处理组间 3 765.529 255.176 31.196 .000 误差 6 49.078 8.180 从上表可以看出,各区组间差异无统计学意义,即各天的实验结果间无差异。 (3)依据完全随机设计析因试验方法进行方差分析 方差齐性检验表 F df1 df2 Sig. 1.429 3 8 0.304 P值大于0.05,尚不能认为方差不齐。 方差分析表2 变异来源df SS MS F Sig. 总变异11 818.37 试样处理方式(A) 1 716.11 716.11 108.42 0.000 试样重量(B) 1 36.40 36.40 5.51 0.047

AB 1 13.02 13.02 1.97 0.198 误差8 52.84 6.605 结局:可以认为高锰酸盐处理及试样重量均会对甘蓝叶核黄素浓度测定产生影响,尚不能认为高猛酸盐及试样重量的交互作用会对甘蓝叶核黄素浓度测量有影响。 11-4 假定不存在高阶交互作用,仅对A、B、C、D、E5个因素的主效应进行分析,采用正交设计的方差分析法: 正交设计的方差分析 变异来源df SS MS F Sig. 总变异15 3495.366 A 1 540.911 540.911 21.714 .001 B 1 1743.689 1743.689 69.998 .000 C 1 787.223 787.223 31.602 .000 D 1 82.038 82.038 3.293 .100 E 1 92.400 92.400 3.709 .083 误差10 249.104 24.910 从上表可以看出,A、B、C三个因素的主效应有统计学意义(P<0.05),即A、B、C三个参数对高频呼吸机的通气量有影响。 11-5 随机区组的裂区设计,一级实验单位的变异来自于A因素主效应、区组变异及个体间误差,二级实验单位的变异来自于B因素的主效

医学统计学第四版 课文例38-04

例31-4 为了解妇女健康和用药情况,1975年2月在美国洛杉矶San Fernando 随机抽取了465名妇女进行调查,调查对象年龄在20-59岁,调查内容包括一般人口学资料,健康状况和相关态度。表31-9列出了研究中的7个变量,资料见例31-4.sav,试进行数据预处理。 表31-9 例31-4研究变量 变量名类型说明 SUBNO 数值编号 TIMEDRS 数值研究期内求医次数 ATTDRUG 等级对用药态度评分(取值范围:5-10) ATTHOUSE 等级对家务的态度(取值范围:0-35) INCOME 等级税前家庭收入(取值范围:1-10) MSTATUS 二分类婚姻状况:1=未婚,2=已婚 RACE 二分类种族:1=白种,2=非白种 数据预处理具体步骤及主要结果见表31-10,表31-11,和表31-12。 1

表31-10 例31-4数据预处理具体步骤及主要结果 数据核查与数据筛选内容主要指标或图表SPSS过程主要结果处理措施 1、数据分布,资料准确、真实性,缺失值,和单变量离群值n, min X, max X, X, S, 偏度系数,峰度系数等 (见表31-11),直方图(略) descriptive statistics →frequencies ①按3 X S ±标准,ATTHOUSE发现2例单变量极小值, TIMEDRS发现12例单变量极大值; ②缺失值:ATTHOUSE1例(0.2%),INCOME 26例(6%); ③正态性:ATTDRUG最接近,TIMEDRS偏离最远; ④RACE两分类个体数相差悬殊,>10:1。 ①删除ATTHOUSE 2例单变量极 小值,X变为23.63,以此作为其 1例缺失值的估计值;n=463; ②INCOME不是分析的主要变 量,且缺失值>5%,删除; ③TIMEDRS考虑变量变换,对单 变量离群值暂不处理; ④保留RACE,分析中该变量与 其他变量的相关可能被低估。 2、线性和方差齐性双变量散点图Scatterplot 偏离椭圆最远(见图31-3a);ATTDRUG分布较对称, TIMEDRS分布不对称,在取值较小处较集中;ATTDRUG 在TIMEDRS取值较小处似乎有更大变异。 考虑对TIMEDRS进行变量变换。 3、变量变换因 min 0 X=,对TIMEDRS 进行lg(X+1)的转换,转换后变量命名为LTIMEDRS Compute variable ①LTIMEDRS偏度系数为0.22,峰度系数为-0.18; ②LTIMEDRS:0.74 X=,0.42 S=, min X=, max 1.91 X=, 单变量离群值消除; ③ATTDRUG与LTIMEDRS构成的散点图(见图31-3b) 较转换前改善。 4_1、识别多变量离群值马氏距离Regression→linear→ save 以SUBNO为应变量, 其他变量为自变量进 行回归按2 0.001,5 20.515 χ=,发现2例多变量离群值:SUBNO分别 为137(马氏距离为21.837),262(马氏距离为20.650)。 本研究样本含量较大,对于2例 多变量离群值可考虑删除。 4_2、查找引起多变量离群值的主要变量进入回归方程的变量Regression→linear 以是否某一离群个体 主要影响变量为①SUBNO=137:LTIMEDRS, ATTDRUG,RACE;②SUBNO=262:LTIMEDRS,RACE。 2

相关文档
最新文档