医学统计学分析计算题-答案 (1)

第二单元计量资料的统计推断

分析计算题

2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表４：

表4 某年某地健康成年人的红细胞数和血红蛋白含量

指标

性别例数均数标准差标准值* 红细胞数/101２

·Ｌ-1 男３６0 4.66 0.58 4.８4

女 25５ 4.18 0.２9 ４.3３血红蛋白/g ·L -1 男 360 134.5 7．1 １40．2

女

２5５

11７．6

１0．2

12４.7

请就上表资料：

（1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？（2）分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。（４) 该地健康成年男、女血红蛋白含量有无差别?

(５) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解:

(1）红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV ）比较二者的变异程度。

女性红细胞数的变异系数0.29

100%100% 6.94%4.18

S CV X =

?=?= 女性血红蛋白含量的变异系数10.2

100%100%8.67%117.6

S CV X =?=?=

由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。（2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。

男性红细胞数的标准误0.031

X S =

==(1210/L ）男性血红蛋白含量的标准误0.374

X S =

==(g/L )

女性红细胞数的标准误0.018X S =

==(1210/Ｌ)

女性血红蛋白含量的标准误0.639X S =

==(ｇ/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过１00，可视为大样本。σ未知，但n 足够大，故总体均数的区间估计按

(/2/2X X X u S X u S αα-+

, )计算。该地男性红细胞数总体均数的95%可信区间为：

(4.66-1.９６×０.０31 ，４.66+1.9６×0.031)，即(4.６０ , 4.72)1210/L 。该地女性红细胞数总体均数的95%可信区间为：

(4.18-１.96×0.0１8 , 4.18＋１.96×０.０１8),即（４.14 ， 4.２2)1210/L 。 (4）两成组大样本均数的比较，用u 检验。 1) 建立检验假设，确定检验水准

H 0：12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠，即该地健康成年男、女血红蛋白含量均数有差别

0.05α=

2) 计算检验统计量

22.829X X u ===

３) 确定P 值,作出统计推断

查t 界值表(ν＝∞时)得P <0.00１，按0.05α=水准,拒绝H 0，接受H 1,差别有统计学意义，可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。

(5) 样本均数与已知总体均数的比较，因样本含量较大，均作近似u 检验。 1）男性红细胞数与标准值的比较 ①建立检验假设，确定检验水准

Ｈ0:0μμ=，即该地男性红细胞数的均数等于标准值

H 1:0μμ<，即该地男性红细胞数的均数低于标准值单侧0.05α= ②计算检验统计量

0 4.66 4.84

5.8060.031

X X t S μ--=

==- ③确定Ｐ值，作出统计推断

查ｔ界值表(ν＝∞时）得P <0.000５，按0.05α=水准，拒绝H 0,接受H １,差别有统计学意义，可以认为该地男性红细胞数的均数低于标准值。

２) 男性血红蛋白含量与标准值的比较 ①建立检验假设,确定检验水准

Ｈ0：0μμ=,即该地男性血红蛋白含量的均数等于标准值Ｈ１：0μμ<,即该地男性血红蛋白含量的均数低于标准值单侧0.05α= ②计算检验统计量

0134.5140.2

15.2410.374

X X t S μ--=

==- ③确定P 值，作出统计推断

查t 界值表(ν＝∞时）得Ｐ<0．0005,按0.05α=水准,拒绝H 0，接受H 1，差别有统计学意义，可以认为该地男性血红蛋白含量的均数低于标准值。

３）女性红细胞数与标准值的比较 ①建立检验假设,确定检验水准

H 0：0μμ=,即该地女性红细胞数的均数等于标准值

Ｈ１：0μμ<,即该地女性红细胞数的均数低于标准值单侧0.05α= ②计算检验统计量

0 4.18 4.33

8.3330.018

X X t S μ--=

==-

③确定P 值，作出统计推断

查t 界值表(ν=∞时)得P <0.000５,按0.05α=水准，拒绝Ｈ0,接受H 1,差别有统计学意义，可以认为该地女性红细胞数的均数低于标准值。

4）女性血红蛋白含量与标准值的比较 ①建立检验假设，确定检验水准

H ０：0μμ=,即该地女性血红蛋白含量的均数等于标准值 H 1:0μμ<,即该地女性血红蛋白含量的均数低于标准值单侧0.05α= ②计算检验统计量

0117.6124.7

11.1110.639

X X t S μ--=

==- ③确定Ｐ值,作出统计推断

查ｔ界值表(ν=∞时)得P <0．000５，按0.05α=水准,拒绝H 0，接受H 1,差别有统计学意义,可以认为该地女性血红蛋白含量的均数低于标准值。

2．２为了解某高寒地区小学生血红蛋白含量的平均水平，某人于1993年6月随机抽取了该地小学生70８名,算得其血红蛋白均数为103.５g/L ，标准差为１.59g/L 。试求该地小学生血红蛋白均数的９5%可信区间。

2.2解:σ未知，n 足够大时，

总体均数的区间估计可用（/2/2X X X u S X u S αα-+ , ）。该地小学生血红蛋白含量均数的９5%可信区间为：

(103.5 1.96103.5 1.96-+, )，即(103.３８ , 1０3.62）g ／L 。

2.3 一药厂为了解其生产的某药物（同一批次）之有效成分含量是否符合国家规定的标准,随机抽取了该药10片，得其样本均数为１0３.０ｍg ，标准差为2.22ｍg 。试估计该批药剂有效成分的平均含量。

2.3解:该批药剂有效成分的平均含量的点值估计为１03．0 mg 。

σ未知且n 很小时，总体均数的区间估计可用()/2,/2,X X X t S X t S αναν-+ , 估

医学统计学分析计算题_与解析

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012 ·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示，由表4计算各项指标的标准误。男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100，可视为大样本。σ未知，但n 足够大，故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。该地男性红细胞数总体均数的95%可信区间为： (4.66－1.96×0.031 , 4.66＋1.96×0.031)，即(4.60 , 4.72)1210/L 。该地女性红细胞数总体均数的95%可信区间为： (4.18－1.96×0.018 , 4.18＋1.96×0.018)，即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较，用u 检验。 1) 建立检验假设，确定检验水准 H 0：12μμ=，即该地健康成年男、女血红蛋白含量均数无差别 H 1：12μμ≠，即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值，作出统计推断查t 界值表(ν＝∞时)得P <0.001，按0.05α=水准，拒绝H 0，接受H 1，差别有统计学意义，可以认为该地健康成年男、女的血红蛋白含量均数不同，男性高于女性。 (5) 样本均数与已知总体均数的比较，因样本含量较大，均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设，确定检验水准 H 0：0μμ=，即该地男性红细胞数的均数等于标准值

卫生统计学线性回归练习题

一、是非题 1．单个自变量的线性回归就是直线回归。 2．直线回归就是指自变量和应变量的观察值落在在一条直线上。 3．直线回归中预测值Y 是固定某个X 值，Y 的总体均数估计值。 4．用逐步回归的方法评价自变量与应变量之间的关联性，只能推断某个自变量与应变量有关联性，不能推断无它们之间无关联性。二、选择题 1．用最小二乘法确定直线回归方程的原则是各观察点（） A ．距直线的纵向距离相等 B ．距直线的纵向距离的平方和最小 C ．与直线的垂直距离相等 D ．与直线的垂直距离的平方和最小 2．直线回归的系数假设检验（） E ．只能利用相关系数r 的检验方法进行检验 F ．只能用t 检验 G ．只能用F 检验 H ．三者均可 3．Y ?=7+2X 是1~7岁儿童以年龄(岁)估计体重(公斤)的回归方程，若把体重的单位换成市斤，则此方程（） A ．截矩改变 B ．回归系数改变 C ．截矩与回归系数都改变 D ．回归系数不变 E ．截矩不变 4．直线回归系数的假设检验，其自由度为（） A ．n B ．n-1 C ．n-2 D ．2n-1 E ．2n-2 5．对应变量Y 的离均差平方和，下列哪个分解是正确的？（） A ．SS 剩=SS 回 B ．SS 总=SS 剩 C ．SS 总=SS 回 D ．SS 总＋SS 剩=SS 回 E ．SS 总＋SS 回=SS 剩三、计算分析题

1．15名儿童的身高与肺死腔容积的观察值如表15-3所示。表15-3 儿童身高与肺死腔容积的观测数据对象号身高(cm) X 肺死腔容积(ml) Y 对象号身高(cm) X 肺死腔容积(ml) Y 1 110 45 9 175 102 2 116 32 10 167 111 3 123 41 11 165 88 4 130 45 12 160 65 5 129 43 13 157 79 6 142 67 14 156 92 7 147 58 15 149 58 8 153 57 试用该资料进行回归分析：（1）计算样本回归方程的截矩与回归系数；（2）进行回归系数等于0的假设检验；（3）验证是否存在F t b =的关系；（4）估计回归系数β的95%置信区间。 2．一名产科医生收集的12名产妇24h 的尿，测量其中雌三醇的含量，同时记录了产儿的体重，见表15-4。表15-4 待产妇尿中雌三醇含量与新生儿体重编号尿雌三醇(mg/24h) X 新生儿体重(kg) Y 编号尿雌三醇(mg/24h) X 新生儿体重(kg) Y 1 7 2.5 7 19 3.1 2 9 2.5 8 21 3.0 3 12 2.7 9 22 3.5 4 14 2.7 10 24 3.4 5 16 3.7 11 25 3.9 6 17 3.0 12 27 3.4 （1）试用该数据进行回归分析；（2）求回归系数的95%置信区间；（3）试求当待产妇尿中雌三醇含量为18(mg/24h)时，新生儿体重个体值的95%预测区间。

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法，错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中，概率是难以获得的 E. 某事件发生的概率很小，在单次研究或观察中时，称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中，属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标，其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法，不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言，参数难以测定，仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中，总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。答：当某事件发生的概率很小，习惯上认为小于或等于0.05时，统计学上称该事件为小概率事件，其含义是该事件发生的可能性很小，进而认为它在一次抽样中不可能发生，这就是所谓小概率事件原理，它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答：某项研究通常想知道关于总体的某些数值特征，这些数值特征称为参数，如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量，如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的，而参数是他们想知道的。一般情况下，这些参数是难以测定的，仅能根据样本估计。显然，只有当样本代表了总体时，根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念答：研究人员通常需要了解和研究某一类个体，这个类就是总体。总体是根据研究目的所确定的观察单位的集合，通常有无限总体和有限总体之分，前者指总体中的个体数是无限的，如研究药物疗效，某病患者就是无限总体，后者指总体中的个体数是有限的，它是指特定时间、空间中有限个研究个体。但是，研究整个总体一般并不实际，通常能研究的只是它的一部分，这个部分就是样本。例如在一项关于2007

医学统计学试题及答案

《医学统计学》课程考试试题（A卷）（评卷总分：100分，考试时间：120分钟，考核方式：□开卷 V 闭卷）一、选择题（每题1分，共62分，只选一个正确答案） 1、医学科研设计包括（ D ） A．物力和财力设计 B．数据与方法设计 C．理论和资料设计 D．专业与统计设计 2、医学统计资料的分析包括（ D ） A．数据分析与结果分析 B．资料分析与统计分析 C．变量分析与变量值分析 D．统计描述与统计推断 3、医学资料的同质性指的是（ D ） A．个体之间没有差异 B．对比组间没有差异 C．变量值之间没有差异 D．研究事物存在的共性 4、离散型定量变量的测量值指的是（ D ） A．可取某区间内的任何值 B、可取某区间内的个别值 C．测量值只取小数的情况 D．测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是（ A ） A．无序二分类变量 B、定量变量． C．等级变量 D．无序多分类变量 6、计量资料编制频数表时，组距的选择（ D ） A．越大越好 B．越小越好 C．与变量值的个数无关 D．与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选（ D ）A．极差 B．方差 C．标准差 D．变异系数 8、若要用方差描述一组资料的离散趋势，对资料的要求是（ D ）A．未知分布类型的资料 B．等级资料 C．呈倍数关系的资料 D．正态分布资料 9、频数分布两端没有超限值时，描述其集中趋势的指标也可用（ D ） A．标准差 B．几何均数 C．相关系数 D．中位数 10、医学统计工作的步骤是（ A ） A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析，统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法，其正确的是（ A ） A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间（小时）分别为3, 4，5，3，2，5.5，2.5，6，6.5, 7,其中位数是（ B ） A．4 B．4.5 C．3 D．2 13、调查一组正常成年女性的血红蛋白，如果资料属于正态分布，描

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体，具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值，描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比，其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布，其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A ．比较不同计量指标的变异程度 2. 对于近似正态分布的资料，描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4．应用百分位数法估计参考值范围的条件是B ．数据服从偏态分布 5．已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布，描述其个体差异的统计指标应使用 E ．四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109 /L ～9.1×109 /L ，其含义是 E.该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差，应该使用的方法是 E.增加样本含量 5．两样本均数比较的t 检验和u 检验的主要差别是B.u 检验要求大样本资料

医学统计学分析计算题-答案

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示，由表4计算各项指标的标准误。男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

复旦大学医学统计学练习

姓名学号一、是非题：（答错倒扣１分） 1.配对t检验是否要求方差齐性？ 2.随机区组方差分析要求观察指标服从正态分布还是残差正态分布？ 3.随机区组设计的资料能否用完全随机设计的方差分析进行检验啊? 二、选择题 1．对3个均数作方差分析，结果有统计学意义，可认为。 A. 3个总体均数完全不同 B. 3个样本均数完全不同 C. 其中2个总体均数不同 D. 其中2个样本均数不同 E. 2个或3个总体均数不同 2．方差分析中，离均差平方和为SS，方差为MS；下标T, B, W分别表示总的、组间和组内，则必有。 A. SS W

医学统计学分析计算题_答案与解析

WORD 文档下载可编辑第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L -1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L -1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1 解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV )比较二者的变异程度。女性红细胞数的变异系数CV S 100% X S 0.29 4.18 100% 6.94% 10.2 女性血红蛋白含量的变异系数CV 100% 100% 8.67% X 117.6

由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误S X 来表示，由表 4 计算各项指标的标准误。男性红细胞数的标准误S X S 0.58 0.031 ( 1012 /L ) n 360 S 男性血红蛋白含量的标准误S X n 7.1 360 0.374 (g/L ) 女性红细胞数的标准误S X S 0.29 0.018 ( 1012 /L) n 255 女性血红蛋白含量的标准误S X S 10.2 0.639 (g/L ) n 255 (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100 ，可视为大样本。未知，但n 足够大，故总体均数的区间估计按( X u / 2S X, X u / 2 S X)计算。该地男性红细胞数总体均数的95% 可信区间为： (4.66 －1.96 ×0.031 , 4.66 ＋1.96 ×0.031) ，即(4.60 , 4.72) 1012 /L。该地女性红细胞数总体均数的95% 可信区间为： (4.18 －1.96 ×0.018 , 4.18 ＋1.96 ×0.018) ，即(4.14 , 4.22) 1012 /L。 (4) 两成组大样本均数的比较，用u 检验。 1) 建立检验假设，确定检验水准 H0： 1 2 ，即该地健康成年男、女血红蛋白含量均数无差别 H1： 1 2 ，即该地健康成年男、女血红蛋白含量均数有差别 0.05 2) 计算检验统计量

卫生统计学试题1

卫生统计学试题1 注：因原件较模糊，所以试题中可能有错字或答案错漏，有的请指出，仅供参考；复习主要看书本。一、选择题（每题只有一个正确答案，共40分） 1、随机事件的概率p 等于（） A p=0 B p=1 C p= D 040 B T<1或n<40 C T>5且n>40 D 以上都不是 10、（）表示某一事物内部各部分所占比重。 A 频率指标 B 构成比 C 相对比 D 定比 11、t 检验的前提条件是（） A n 较大 B 小样本来自正态总体且总体方差具有齐性 C 总体标准差已知 D 以上都不是 12、同一资料相关回归分析中，求得r t 与b t 值，其关系（）

医学统计学分析计算题答案

第二单元计量资料的统计推断分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量，结果见表4：表4 某年某地健康成年人的红细胞数和血红蛋白含量指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料： (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大？ (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别？ (5) 该地男、女两项血液指标是否均低于上表的标准值（若测定方法相同）？ 2.1解： (1) 红细胞数和血红蛋白含量的分布一般为正态分布，但二者的单位不一致，应采用变异系数(CV)比较二者的变异程度。女性红细胞数的变异系数女性血红蛋白含量的变异系数由此可见，女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示，由表4计算各项指标的标准误。男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100，可视为大样本。未知，但足够大，故总体均数的区间估计按()计算。该地男性红细胞数总体均数的95%可信区间为： (4.66－1.96×0.031 , 4.66＋1.96×0.031)，即(4.60 , 4.72)/L。该地女性红细胞数总体均数的95%可信区间为： (4.18－1.96×0.018 , 4.18＋1.96×0.018)，即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较，用u检验。 1) 建立检验假设，确定检验水准 H0：，即该地健康成年男、女血红蛋白含量均数无差别 H1：，即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值，作出统计推断查t界值表(ν＝∞时)得P<0.001，按水准，拒绝H0，接受H1，差别有统计学意义，可以认为该地健康成年男、女的血红蛋白含量均数不同，男性高于女性。 (5) 样本均数与已知总体均数的比较，因样本含量较大，均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设，确定检验水准 H0：，即该地男性红细胞数的均数等于标准值

医学统计学校园网精品课程习题

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 医学统计学校园网精品课程习题绪论习题一、最佳选择题 1、抽样研究中的样本是： A、研究对象的全体 B、总体中特定的一部分 C、总体中随机抽取的一部分 D、随意搜集的一些观察对象 2、总体是由： A、个体组成 B、研究对象组成 C、同质个体组成 D、研究指标组成 3、检验结果分为阴性和阳性资料，属于： A、等级资料 B、计数资料 C、计量资料 D、等级或计量均可 4、概率等于 0 的事件称为： A、小概率事件 B、必然事件 C、不可能事件 D、偶然事件 5、实验设计的三个基本要素是： A、对照、重复、随机化 B、重复、随机化、设置对照 C、处理因素、试验单位、设置对照 D、均衡、重复、随机化二、简答题： 1、什么是变异 2、什么是随机化 3、简述对照组常用的干预方式 4、简述随机化的意义及主要作用 5、简述医学测量结果的分类（数据类型）三、是非题 1、实验设计的基本原则是重复、对照、随机化 2、等级资料较计量资料和计数资料精确 3、搜集资料时常采用的方法有实验 4、某医生欲研究加锌牛奶对儿童生长发育的影响，将某小学校 10 岁儿童随机分为两组，一组喝加锌牛 1 / 21

奶，另一组喝普通牛奶，此属于标准对照 5、概率为 1 的事件称为必然事件调查设计习题（一）单项选择题 1. 实验设计和调查设计的根本区别是（）。 A. 实验设计以动物为对象 B. 调查设计以人为对象 C. 实验设计可随机分组 D. 实验设计可人为设置处理因素 2． A．整群Ｂ．系统C．分层 D．简单随机 3．所得到的样本量最小的为（）。 A．简单随机抽样 B．系统抽样 C．整群抽样 D．分层随机抽样 4．调查用的问卷中，下面的四个问题中，（）是较好的一个问题。 A．你和你的妈妈认为女孩几岁结婚比较好____。 B．如果只生 1 个孩子，你希望孩子的性别是： 1．女； 2．男； 3．随便 C．你 1 个月工资多少_____。 D．你一个月吃盐____克。 5. 在（）中，研究者可以人为设置各种处理因素；而在（）中则不能人为设置处理因素。 A. 调查研究 B. 社区干预试验 C. 临床试验 D. 实验研究（二）名词解释1．抽样调查2．简单随机抽样 3．系统抽样 4．分层抽样5．整群抽样 6．概率抽样 7．非概率抽样（三）是非题 1. 系统抽样的优点是操作简单，均数、率及相应的标准误计算简单。

医学统计学复习习题2018

医学统计学期末复习题一、单项选择题 1 下面的变量中是分类变量的是 A.身高 B.体重 C.年龄 D.血型 2 下面的变量中是是数值变量的是 A.性别 B.年龄 C.血型 D.职业 3.随机事件的概率 P 为 =0 B. P=1 C. P= D. 0

卫生统计学题库(6版)

第一章绪论第二章（一）A1型：1.下面的变量中，属于分类变量的是_____。 A.脉搏 B.血型 C.肺活量 D.红细胞计数 E.血压 2.下面的变量中，属于定量变量的是_____。A.性别 B.体重 C.血型 D.职业 E.民族 3.某人记录了50名病人体重的测定结果：小于50kg的13人，介于50kg和70kg间的20人，大于70kg的17人，此种资料属于_____。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义变量资料 4.上述资料可以进一步转换为_____。 A.定量资料 B.分类资料 C.有序资料 D.二分类资料 E.名义变量资料 5.若要通过样本作统计推断，样本应是_____。 A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 6.统计量_____。A.是统计总体数据得到的量 B.反映总体统计特征的量 C.是根据总体中的全部数据计算出的统计指标 D.是用参数估计出来的 E.是由样本数据计算出的统计指标 7.因果关系_____。A.就是变量间数量上的联系 B.可以用统计方法证明 C.必定表现为数量间的联系 D.可以通过单独考察两个变量间关系得出 E.可以通过变量间数量上的联系来证明（二）A2型：1.教材中提及美国人1954年实施了旨在评价索尔克（Salk）疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。有180万儿童参与，约有1/4参与者得到了随机化。这180万儿童是_____。 A.目标总体 B.研究总体 C.1份样本 D.1份随机样本 E.180万份样本 2.上述试验最终肯定了索尔克疫苗的效果。请问此结论是针对_____而言。 A.180万儿童 B.每个儿童 C.所有使用索尔克疫苗的儿童 D.所有儿童 E.180万儿童中随机化的1/4 二、是非题 1.定量变量、分类变量和有序变量可以相互转换。 2.假变量可以参与计算，所以假变量是定量变量。 3.离散变量在数值很大时，单位为“千”或“万”时可以取小数值，此时可近似地视为连续型变量。 4.同质的个体间不存在变异。 5.如果个体间有变异，则它们一定不是来自同一总体。第二章定量资料的统计描述（一）A1型：1.用频率表计算平均数时，各组的组中值应为_______。 A.本组段变量值的平均数 B. 本组段变量值的中位数 C. 本组段的上限值 D. 本组段的下限值 E. （本组段上限值+本组段下限值）/2 2.离散型定量变量的频率分布图可以用_______表达。 A. 直方图 B. 直条图 C.百分条图 D.箱式图 E.复式条图 3. 变异系数越大说明_______。A.标准差越大 B.平均数越大 C.标准差、平均数都大

医学统计学课后习题与答案

医学统计学第一章绪论答案名词解释：（1）同质与变异：同质指被研究指标的影响因素相同，变异指在同质的基础上各观察单位（或个体）之间的差异。（2）总体和样本：总体是根据研究目的确定的同质观察单位的全体。样本是从总体中随机抽取的部分观察单位。（3）参数和统计量：根据总体个体值统计算出来的描述总体的特征量，称为总体参数，根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。（4）抽样误差：由抽样造成的样本统计量和总体参数的差别称为抽样误差。（5）概率：是描述随机事件发生的可能性大小的数值，用p表示（6）计量资料：由一群个体的变量值构成的资料称为计量资料。（7）计数资料：由一群个体按定性因数或类别清点每类有多少个个体，称为计数资料。。（8）等级资料：由一群个体按等级因数的级别清点每类有多少个体，称为等级资料。是非题： 1.× 2.× 3.× 4.× 5.√ 6.√ 7.× 单选题： 1.C 2.E 3.D 4.C 5.D 6.B 第二章计量资料统计描述及正态分布答案名词解释： 1. 平均数是描述数据分布集中趋势（中心位置）和平均水平的指标 2. 标准差是描述数据分布离散程度（或变量变化的变异程度）的指标 3. 标准正态分布以μ服从均数为0、标准差为1的正态分布，这种正态分布称为标准状态分布。 4. 参考值范围参考值范围也称正常值范围，医学上常把把绝大多数的某指标范围称为指标的正常值范围。填空题： 1.计量，计数，等级

2. 设计，收集资料，分析资料，整理资料。 3. σ μχ-=u （变量变换）标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99% 5. 47.5% 6.均数、标准差 7. 全距、方差、标准差、变异系数 8. σμ96.1± σμ58.2± 9. 全距 R 10. 检验水准、显著性水准、0.05、 0.01 （0.1） 11. 80% 90% 95% 99% 95% 12. 95% 99% 13. 集中趋势、离散趋势 14. 中位数 15. 同质基础，合理分组 16. 均数，均数，μ，σ，规律性 17. 标准差 18. 单位不同，均数相差较大是非题： 1. × 2. √ 3. × 4. × 5. × 6. √ 7. √ 8. √ 9. √ 10. √ 11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √ 21. √ 单选题： 1. B 2. D 3. C 4. A 5. C 6. D 7. E 8. A 9. C 10. D 11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C 21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D 31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B 41. C 42. B 43. D 44. C 45. B 问答题： 1．均数﹑几何均数和中位数的适用范围有何异同？答:相同点,均表示计量资料集中趋势的指标。不同点:表2-5.

《医学统计学》复习题

医学统计学复习题一、名词解释 1．总体：根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。 2.样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。 3．随机抽样：随机抽样（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 4．变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。 5.计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等。 6.计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O四种血型的人数等。 7．等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量。 8．概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。 9.频率：在相同的条件下，独立重复做n次试验，事件A出现了m次，则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P（A）= m/n。 10. 随机误差：随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的误差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 11．系统误差：是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因，使观察值不是分散在真值的两侧，而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 12．参数：指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统

医学统计学分析题

五、分析应用题（4题，共40分） 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何？请说出理由（6分） 1、答：结论不可信（2分）；因为在设计分组上不科学，两组间不具有可比性（4分）。 2、24名志愿者完全随机地分成两组，接受降胆固醇试验。甲组为特殊饮食组，乙组为药物处理组，受试者在试验前后各测量一次血清胆固醇（mmol/L），数据如下表，甲组乙组受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 （1）欲分析两种治疗方法是否有效，采用何种统计分析方法？（6分）（2）欲判断两种降血清胆固醇措施效果是否相当，又采用何种统计分析方法？（6分） 2、答：（1）欲分析两种治疗方法是否有效，可用治疗前后比较，属配对设计（2分），应用配对t检验（3分）。（2）如判断两种方法的效果有无差别，则属成组设计（2分），应用两样本均数比较的t检验（3分）。 3、检验血磷含量有甲、乙两种方法，其中，乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品，所得结果如下表。样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问：⑴若要判断能否用乙法推算甲法，又用何统计方法？（6分） ⑵欲比较甲乙两法检出血磷是否相同，用何统计方法？（6分） 3、答：（1）根据题意，应用回归分析（6分）（2）这是配对设计计量资料（2分），应用配对t检验（4分） 4、某单位对常住本市5年以上，从未接触过铅作业，也未服过含铅药物或其它重金属，饮用自来水，无肝、肾疾患及贫血，近日未使用利尿剂的健康成年，用乙酸乙酰法测24小时尿δ-ALA的结果如下，欲制定其95％正常值范围。请问：用何种估计方法？说出理由并给出计算公式。（10分） δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计