医学统计学分析

医学统计学分析
医学统计学分析

湖北医药学院《医学统计学》(2504B)课程教学大纲

一、课程基本信息

学时分配:47学时。

考核方式:采用综合考评法。成绩由理论考试(闭卷)、平时作业与SPSS统计软件应用三部分组成。

三、教学内容

(一)理论课

第一章绪论

教学目标:掌握医学统计中的基本概念、统计资料的类型。熟悉统计工作的基本内容和步骤、抽样方法。了解抽样误差、医学统计学在临床医学与医院管理中的重要作用。

教学内容:

第一节医学统计学的作用

第二节医学统计工作的基本内容

第三节医学统计学中的基本概念

一、同质与变异二、变量与数据类型三、总体和样本四、误差五、概率

第二章定量数据的统计描述

教学目标:掌握描述定量数据集中趋势和变异程度的统计指标计算及适用条件。熟悉频数分布表的用途。了解频数分布表的编制方法。

教学内容:

第一节频数分布

一、频数表二、直方图三、频数分布表的用途

第二节集中趋势的统计指标

一、算术均数二、几何均数三、中位数和百分位数

第三节变异程度的统计指标

一、极差二、四分位数间距三、方差四、标准差五、变异系数

第三章正态分布与医学参考值范围

教学目标:掌握正态分布特征及曲线下面积分布规律。熟悉正态分布概念及其应用;医学参考值范围的制定方法。了解正态分布函数;医学参考值范围的概念。

教学内容:

第一节正态分布

一、正态曲线二、正态分布的特征三、标准正态分布

第二节医学参考值范围

一、医学参考值范围的概念二、制订医学参考值范围的注意事项

三、医学参考值范围的计算方法

第四章定性数据的统计描述

教学目标:掌握常用相对数的概念、计算和应用,相对数使用应注意的问题。熟悉率的标准化计算方法。了解率的标准化意义。

教学内容:

第一节常用相对数

一、率二、构成比三、相对比四、标准化率

第二节医学中常用的相对数指标

一、死亡统计指标二、疾病统计指标

第三节相对数使用的注意问题

第五章统计表与统计图

教学目标:掌握统计表的编制原则和结构、统计图制图原则和医学常用统计图的选择。熟悉统计表的种类、统计图的绘制方法。了解普通线图和半对数线图的区别。

教学内容:

第一节统计表

一、统计表的编制原则和结构二、统计表的种类三、编制统计表的注意事项

第二节统计图

一、统计图的制作二、描述定量数据的统计图三、描述定性数据的统计图

第六章参数估计与假设检验

教学目标:掌握标准误的基本概念;总体均数和总体率的区间估计。熟悉t分布的特点、假设检验的基本概念和检验步骤。了解假设检验的基本思想。

教学内容:

第一节参数估计

一、抽样误差二、可信区间的概念三、总体均数的区间估计

四、两总体均数差值的区间估计五、总体率的区间估计六、两总体率差值的区间估计

第二节假设检验

一、基本原理二、基本步骤

第七章t检验

教学目标:掌握t检验的应用条件、注意事项。熟悉t检验计算方法、假设检验中的两类错误。了解t 检验的基本思想、近似t检验、方差齐性检验方法与用途。

教学内容:

第一节t检验

一、单样本t检验二、配对样本均数t检验三、两独立样本均数t检验

第二节方差不齐时两样本均数的近似t检验

一、方差齐性检验二、近似t检验

第三节t检验中的注意事项

第四节假设检验中两类错误

第八章方差分析

教学目标:掌握方差分析的基本概念、用途和应用条件。熟悉方差分析的计算、多个样本均数的两两比较。了解方差分析的基本思想。

教学内容:

第一节完全随机设计的方差分析

第二节随机区组设计的方差分析

第三节多个样本均数的两两比较

第四节方差齐性检验

第五节其他设计类型的方差分析

一、析因设计二、重复测量设计

第九章X2检验

教学目标:掌握X2检验的应用范围及适用条件。熟悉行×列表X2检验的注意事项。了解四格表的确切概率法、多个样本率间多重比较、X2检验的基本思想。

教学内容:

第一节四格表资料的X2检验

一、X2检验的通用公式二、四格表资料X2检验的专用公式三、四格表资料X2检验的校正公式四、四格表资料的Fisher确切概率法

第二节配对四格表资料的X2检验

第三节行×列表资料的X2检验

一、行×列表X2检验的专用公式二、多个样本率间多重比较三、行×列表X2检验的注意事项

第十章非参数秩和检验

教学目标:掌握非参数检验的概念和应用条件。熟悉常用秩和检验的计算。了解参数统计和非参数统计的区别。

教学内容:

第一节配对资料的符号秩和检验

第二节两样本比较的秩和检验

一、查表法二、正态近似法

第三节多个独立样本比较的秩和检验

第十一章线性回归与相关

教学目标:掌握线性相关和线性回归分析的意义、相关与回归分析中应注意的问题。熟悉线性相关和线性回归分析方法和用途、相关系数和回归方程的假设检验。了解相关与回归分析的区别和联系。

教学内容:

第一节线性相关

一、线性相关的概念二、相关系数及其计算三、相关系数的假设检验

第二节线性回归

一、线性回归的概念二、回归方程的估计三、回归方程的假设检验

第三节线性相关与回归分析的注意事项

一、回归分析的应用二、线性相关分析的应用

三、线性相关与回归的区别四、线性相关与回归的联系

第十二章多元线性回归

教学目标:掌握多元线性回归与多元逐步回归分析的意义及注意事项。熟悉多元线性回归分析方法的应用条件及结果解释;偏回归系数、标准偏回归系数、复相关系数和决定系数的意义;多元线性回归的假设检验方法。了解不同逐步回归分析方法的意义。

教学内容:

第一节多元线性回归

一、多元线性回归方程二、多元线性回归方程的假设检验三、实例

第二节多元逐步回归

第三节多元线性回归的注意事项

第十五章实验设计与临床试验设计

教学目标:掌握医学实验设计的基本要素和基本原则。熟悉临床试验设计及统计分析问题。了解样本含量估算方法。

教学内容:

第一节医学实验设计的三要素

一、研究对象二、处理因素三、实验效应

第二节实验设计的三原则

一、对照原则二、随机化原则三、重复原则

第三节临床试验设计及统计分析问题

一、临床试验的特点及注意事项二、临床试验的设计类型三、临床试验的比较类型

第四节样本含量估算

一、影响样本量的条件二、常用的样本含量估算方法

第九章医学统计学的基本内容

一、单选题

1.以下有关小概率事件的描述,正确的是

A、在一次抽样中就会发生的事件

B、在一次抽样中发生的概率≤0.05

C、在一次抽样中不可能发生的事件

D、即使多次抽样也不可能发生的事件

E、在多次抽样中发生的概率≤0.05

2.医学统计学的研究内容是

A、样本

B、个体

C、变量之间的相关关系

D、总体

E、资料或信息的收集、整理和分析

3.医学统计工作的基本步骤是

A、搜集资料、整理资料、描述资料、设计

B、搜集资料、整理资料、推断资料、设计

C、设计、搜集资料、整理资料、分析资料

D、统计描述、统计推断、统计设计

E、搜集资料、描述资料、推断资料

4.用某种新药治疗白血病患者50名,治疗的结果如下

治疗结果死亡恶化好转显效治愈

治疗人数369284

该资料的类型是

A、计量资料

B、计数资料

C、等级资料

D、分层资料

E、定量资料

5.随机样本的特点是

A、能消除系统误差

B、能消除随机测量误差

C、能减少抽样误差

D、能消除研究者有意无意带来的样本偏性

E、能消除过失误差

6.统计学中的总体是指

A、任意想象的研究对象的全体

B、根据研究目的确定的研究对象的全体

C、根据地区划分的研究对象的全体

D、根据时间划分的研究对象的全体

E、根据人群划分的研究对象的全体

7.为了由样本推断总体,样本应该是

A、总体中任意的一部分

B、总体中的典型部分

C、总体中有意义的部分

D、总体中有价值的一部分

E、总体中有代表性的一部分

8.抽样误差是指

A、不同样本指标之间的差别

B、样本指标与总体指标之间由于抽样产生的差别

C、样本中每个个体之间的差别

D、由于抽样产生的观测值之间的差别

E、系统误差与过失误差之间的差别

9.可以通过增加例数的方法减少的误差是

A、系统误差

B、随机测量误差

C、抽样误差

D、过失误差

E、以上均无法减少

10.关于统计学中的过失误差、系统误差、随机测量误差和抽样误差,正确的是

A、4种误差均不可避免

B、系统误差和随机测量误差不可避免

C、系统误差和抽样误差不可避免

D、随机测量误差和抽样误差不可避免

E、过失误差和抽样误差不可避免

11.P(A)=0时,表示事件

A、很可能发生

B、极可能发生

C、不可能发生

D、在一次抽样中不会发生

E、已经发生

二、判断题

1.概率是描述随机事件发生的可能性大小的一种度量,用P表示,其值介于0.01~100之间。( )

2.计数资料是指按照一定的要求,将研究对象分组后,清点各组研究对象个数而得到的数据,计数资料必须有度量衡单位。( )

3.抽样研究必然存在抽样误差,抽样误差取决于总体中个体差异的大小和抽样样本含量的大小,其变动具有一定的规律性。( )

三、名词解释

1.总体

2.抽样误差

3.概率

医学统计学的基本内容—参考答案

一、单选题

1.C 2.E 3.C 4.C 5.D 6.B 7.E 8.B 9.C 10.D 11.D

二、判断题

1.错2.错3.对

三、名词解释

1.研究对象的全体称为总体,它指符合研究目的所指定的范围内的全部观察对象,是所有同质个体所组成的集合。总体有时是有限的,总体有时是设想的或是抽象的,是无限的。

2.由于个体差异的存在,使抽样过程中样本指标值与总体指标值不相同,这种误差称为抽样误差。抽样研究必然存在抽样误差,抽样误差取决于总体中个体差异的大小和抽样样本含量的大小,其变动具有一定的规律性,其数值可以采用数学的方法加以估计。

3.概率又称机率、机会、可能性,是描述随机事件发生的可能性大小的一种度量,用P表示,其值介于0~1之间。

第十章数值变量资料的统计分析

一、单选题

1.比较均数相差很大的两组数据变异度大小宜采用

A、全距

B、方差

C、标准差

D、变异系数

E、四分位间距

2.描述疾病的平均潜伏期一般用

A、算术均数

B、几何均数

C、中位数

D、均数

E、方差

3.某人群的某个生化指标或生理指标的正常值范围一般指

A、该指标在所有人中的波动范围

B、该指标在所有正常人中的波动范围

C、该指标在绝大部分正常人中的波动范围

D、该指标在少部分正常人中的波动范围

E、该指标在一个人不同时间的波动范围

4.要评价某市一个5岁的男孩的身高是否偏高或偏矮,其统计方法是

A、作身高差别的显著性检验

B、用该市5岁男孩身高的95%或99%正常值范围来评价

C、用该市5岁男孩身高的均数来评价

D、用该市5岁男孩身高的95%或99%可信区间来评价

E、用该市5岁男孩身高的极差来评价

5.正态分布的特点是

A、=M

B、<M

C、>M

D、=S

E、=M=S

6.正态曲线下从到+1.96的面积为总面积的

A、95%

B、45%

C、97.5%

D、47.5%

E、49.5%

7.正态分布曲线下从-1.64到+1.96的面积占总面积的

A、95%

B、97.5%

C、92.5%

D、47.5%

E、49.5%

8.正态分布曲线下大于-1.96的面积为总面积的

A、95%

B、45%

C、97.5%

D、47.5%

E、49.5%

9. 2.58S包含变量值的

A、95%

B、45%

C、99%

D、47.5%

E、49.5%

10.某指标以过低为异常,可用正态分布法求95%正常值范围,应按以下哪项计算

A、-1.64S

B、+1.64S

C、-1.96S

D、+1.96S

E、 1.96S

11.在配对资料的t检验中,观察值前减后与后减前所得的结果,求出的t值应是A、一样B、不一样C、差不多D、不一定E、方法错误12.抽样的目的在于由样本推断总体,因此,样本应该是

A、总体中的任意一部分

B、总体中的典型部分

C、总体中有价值的部分

D、总体中有代表性的部分

E、总体中有意义的部分

13.在单因素方差分析中,必然有

A、B、

C、D、

E、

14.表示的是

A、各观察值的离散情况

B、样本内实测值与总体均数之差

C、样本均数与总体均数之差

D、表示某随机样本的抽样误差

E、以上都错误

15.关于标准差与标准误的关系,描述正确的是

A、两者均反映抽样误差的大小

B、总体标准差增大时,总体标准误也增大

C、样本例数增大时,样本标准差与标准误均减少

D、可信区间大小与标准差有关,而正常值范围与标准误有关

E、总体标准差一定时,增大样本例数会减少标准误

16.从同一正态总体中随机抽取多个样本,用样本均数来估计总体均数的可信区间,下列哪个样本得到的估计精度高

A、均数大的样本

B、均数小的样本

C、标准差大的样本

D、标准误小的样本

E、标准误大的样本

17.两样本均数比较的显著性检验,已知P<0.05,你认为

A、两样本均数不同

B、两样本均数差别有显著性意义

C、两总体均数不同

D、两总体均数差别有显著性意义

E、两总体均数差别很大

二、名词解释

1.正态分布

2.医学参考值范围

3.标准差

4.标准误

5.可信区间

三、简答题

1.标准差和标准误有何区别和联系?

2.怎样正确使用单侧检验和双侧检验?

3.检验假设中,和P有何区别?

四、计算题

1.有12 名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如下表所示,,请对此资料作统计分析。

12 名志愿受试者服用某减肥药前后体重(kg)

照组则用标准药物治疗,测得治疗前后舒张压(mmHg)的差值(前-后)如下表。问新药和标准药的疗效是否不同?

两种药物治疗前后的舒张压(mmHg)之差

平均效价是否不同?

钩端螺旋体病患者血清作凝溶试验测得的稀释倍数

4.为比较治疗组和对照组的肺表面活性物质在治疗新生儿呼吸窘迫综合征患儿过程中的作用是否不同,某

医生在治疗30名患儿后48小时得到如下表资料,问治疗后48小时,两组的

是否不同?

两组患儿比较 数值变量资料的统计分析—参考答案一、单选题

1.D 2.C 3.C 4.B 5.A 6.D 7.C 8.C 9.C 10.A 11.A 12.D 13.D 14.D 15.B 16.D 17.C 二、名词解释

1.正态分布是指若以计量值为横轴、观察例数为纵轴绘制一条频数分布曲线,这条曲线呈现对称的、中间高、两侧逐渐下降的钟形。在正态分布的图形中,从曲线最高点向横轴作垂线,相交点即为均数值;而钟形曲线的高低、宽窄取决于标准差,标准差越大,曲线显得越低、越宽,标准差越小,曲线显得越高、越窄。

2.也称正常值范围,是指正常人的各种生理数值。由于个体差异的存在,正常值不可能是一个点值,而应该有一定的波动范围,这就是医学参考值范围。

3.是描述一组数值变量资料离散趋势和分布状态特征的指标。

4.表示抽样误差大小的指标,是样本均数或样本率等样本统计量的标准差。 5.是指在可信度为(1-)时,估计总体均数可能存在的范围。

三、简答题

1. 联系:都是描述离散趋势的指标。

区别:标准差描述原始观察值的离散趋势;标准误描述样本均数的离散趋势。

2. 根据研究目的和专业知识判断。根据专业知识推断两个总体是否有差别时,有可能存在两种情况:甲高于乙或乙高于甲,当两种情况同时存在时,一般选双侧;若根据专业知识,甲不可能比乙低,或研究者只关心其中的一种情况时,则选单侧。

3.

值,即检验水准,是指在统计推断时,预先设定的一个小概率值,是如果无效假设

是真的(成立的),允许它错误地被拒绝的概率;P 值是由实际样本确定的,它给人的概念是实际资料怎样与无效假设()相矛盾,P 值是指

成立的前提下,出现等于或大于现有检验统计量的概率。 四、计算题 1.(1)

95%的可信区间为 3.69~6.36,认为该减肥药药效为零。

(2)

t=0.584,υ=11,p>0.05,差异无统计学意义,还不能认为该减肥药有药效。

2.方差齐性检验略

查t界值表,得0.002

3. 将原始数据取对数再作t检验:(方差齐性检验略)

H0:两总体几何均数相等

H1:两总体几何均数不等

查表得0.005

4. 方差齐性检验略

按水准,拒绝,接受,有统计学意义,可以认为治疗后48小时,两组的不同。

第十一章分类变量资料的统计分析

一、单选题

1.用某药治疗某病患者,5例中有4例治愈,宜写作4/5,而不计算治愈率为4/5×00%=80%,这是由于

A、总体治愈率的可信区间太窄

B、样本治愈率的可信区间太宽

C、样本治愈率的可信区间太窄

D、总体治愈率的可信区间太宽

E、计算治愈率的方法不正确

2.在医学科研中率的标准化经常要采用全国人口的性别年龄构成,其理由是

A、这样便于进行比较

B、这样计算标准化率比较容易

C、这样算得的标准化率比较合理

D、这样算得的标准化率比较准确

E、这样更容易计算

3.在两个及两个以上总率进行对比时应先进行率的标准化,其目的是

A、控制处理因素的影响

B、平衡混杂因素构成不同的影响

C、反映患病人数的影响

D、消除治愈人数的影响.

E、平衡处理因素的作用

4.在某传染病医院210名住院病人中,有26位乙肝病人,据此可计算

A、患病率

B、发病率

C、构成比

D、相对比

E、标化发病率

5.欲反映某种疾病对人群的威胁程度,应该计算该病的哪项指标

A、病死率

B、死亡率

C、发病率

D、患病率

E、构成比

6.用两种方法检测住院患者痰中的抗乳酸杆菌,甲法检查痰标本234份,阳性率30%,乙法检查108份,阳性率20%,两法合并阳性率等于

A、30%+20%

B、(30%+20%)÷2

C、(30%-20%)÷2×200

D、(234×30%+108×20%)÷(234+108)

E、(30%+20%)÷(234+108)

7.要比较甲乙两厂某工种工人某种职业病患病率的高低,对工龄进行标化,其标准构成的选择是

A、甲厂工人的年龄构成

B、乙厂工人的年龄构成

C、甲乙两厂合并的工人的年龄构成

D、当地较稳定人口的年龄构成

E、甲乙两厂合并的工人的工龄构成

8.经4组率比较的检验,得P<0.05,可认为

A、各总体率均不相同

B、各总体率间相差较大

C、各样本率间均有差别

D、最多有两总体率间存在差别

E、至少有两总体率间存在差别

9.四格表资料的检验如果需要校正,而未进行校正,则

A、P值不变

B、P值减小

C、P值增大

D、P值可能增大,也可能减小

E、P值等于零

10.关于分布的形状,正确的是

A、同正态分布

B、同t分布

C、为对称分布

D、与自由度有关

E、与样本含量n有关

11.值的取值范围为

A、B、C、

D、E、

12.当四格表的周边合计数不变时,如果某格子的实际频数有变化,则其理论频数如何变化

A、增大

B、减小

C、不变

D、不确定

E、随该格子实际频数的增减而增减

13.关于四格表的自由度,正确的是

A、不一定等于1

B、一定等于1

C、等于行数×列数

D、等于样本含量-1

E、等于格子数-1

14.某四格表资料用检验的基本公式算得,用专用公式算得,则有

A、B、C、

D、比准确

E、比准确

15.R C表必须用公式求理论数的格子个数(其他可由减法求出),公式为

A、 B、 C、

D、 E、

二、名词解释

1.构成比

2.率

3.相对比

4.标准化法

三、计算题

1.用两种方法检查已确诊的乳腺癌患者120 例,甲法检出率为60%,乙法检出率为50%,甲乙两法一致的检出率为35%,请对此资料作统计分析。

2.(12分)某院康复科用共鸣火花治疗癔症患者56例,有效者42例;心理辅导法治疗癔症患者40例,有效者21例。问两种疗法治疗癔症的有效率有无差别?

3.(18分)某研究者将腰椎间盘突出症患者1184例随机分为三组,分别用快速牵引法、物理疗法和骶裂孔药物注射法治疗,结果如下表。问三种疗法的有效率有无不同?

三种疗法治疗腰椎间盘突出有效率的比较

分类变量资料的统计分析—参考答案

一、单选题

1.D 2.A 3.B 4.C 5.B 6.D 7.E 8.E 9.C 10.D 11.C 12.C

13.B 14.B 15.E

二、名词解释

1.是指事物内部某一组成部分的观察单位数与该事物各组成部分观察单位总数之比,常用来说明事物内部各组成部分所占的比重或分布情况。

2.表示一定时间内,实际发生某现象的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率和强度。

3.指两个有联系的指标之比。

4.在两个及两个以上总率(总均数)进行对比时,为了消除内部构成不同造成的影响,采用统一标准,分别计算标准化率后再作对比的方法。

三、计算题

1. 配对四格表检验。

⑴ p=0.503;

⑵实际推论:两种方法无显著差别。

2.本题为两样本率的比较,n>40且所有的T>5,用四格表资料专用公式。

,即两疗法治疗癔症的有效率相等

,即两疗法治疗癔症的有效率不等

以=1查界值表得。按水准,拒绝,接受,可以认为两疗法治疗癔症的有效率不等。

3. 本题为三个样本率的比较,所有格子的,用行列表资料的专用公式。

三种疗法治疗腰椎间盘突出有效率的比较

,即三种疗法治疗腰椎间盘突出症的有效率相等

:三种疗法治疗腰椎间盘突出症的有效率不全相等

=0.05

查界值表得。按=0.05水准,拒绝,接受。可以认为三种疗法治疗腰椎间盘突出症的有效率有差别。

一、单选题

1.对于配对资料的秩和检验,其检验假设为

A、两样本的差值应来自均数为0的正态总体

B、两样本的差值应来自均数为0的非正态总体

C、两样本的差值应来自中位数为0的总体

D、两样本的差值应来自方差齐性的总体

E、两样本的差值应来自正态分布的总体

2.按等级分组资料的秩和检验中,各等级平均秩次为

A、该等级秩次范围的上界

B、该等级秩次范围的下界

C、该等级秩次范围的上界与下界的均数

D、该等级秩次范围的上界与下界之和

E、该等级秩次范围的上界与下界之差

3.配对比较的秩和检验的基本思想是:如果假设成立,则对样本来说

A、正秩和与负秩和的绝对值不会相差很大

B、负秩和的绝对值大于正秩和的绝对值

C、正秩和与负秩和的绝对值相等

D、正秩和的绝对值大于负秩和的绝对值

E、正秩和与负秩和的绝对值相差很大

4.配对样本差值的Wilcoxon符号秩检验确定P值的方法为

A、绝对值小的T越大,P越大

B、绝对值小的T越大,P越小

C、绝对值小的T值在界值范围内,P小于相应的

D、绝对值小的T值在界值范围内,P大于相应的

E、T值即u值,查u界值表

5.秩和检验中,如果统计量T值恰好等于界值时,则有

A、B、C、

D、E、无法进行判断

6.对于多样本计量资料的比较,当分布类型不清时选择

A、t检验

B、检验

C、u检验

D、H检验

E、F检验7.对符合t检验条件的数值型变量资料进行比较,如果采用秩和检验,则A、第1类错误概率增大B、第2类错误概率增大

C、第1类错误概率减小

D、第2类错误概率减小

E、第1类和第2类错误概率同时增大

8.关于成组设计两样本比较的秩和检验,正确的是

A、以秩和较小者为T

B、以秩和较大者为T

C、以例数较小秩和为T

D、以例数较大秩和为T

E、当两样本例数不等时,可任意选取一样本的秩和为T

二、名词解释

1. 非参数检验

秩和检验—参考答案

一、单选题

1.C 2.C 3.A 4.D 5.B 6.D 7.B 8.C

二、名词解释

1. 是一种不依赖总体分布的具体形式,也不考虑研究变量服从何种分布,以及分布是否已知,不是对参数,而只是对分布进行比较的方法

第十三章直线相关与回归

一、单选题

1.在直线回归分析中,Sy . x(直线回归的剩余标准差)反映

A、y变量的变异度

B、x 变量的变异程度

C、扣除x 影响后y 的变异程度

D、扣除y的影响后x 的变异程度

E、回归系数b 变异程度

2.从样本得到变量X 与Y 的相关系数r=0.92, 则

A、X 与Y 之间一定存在因果关系

B、若对此份资料作回归分析, 其回归系数是正值

C、若对此份资料作回归分析, 其回归系数是负值

D、表明总体相关系数

E、表明总体相关系数

3.根据样本算得两个随机变量X 与Y 的相关系数r, 经t 检验, P<0.01, 可认为

A、X 与Y 间密切相关

B、总体相关系数很大

C、总体相关系数

D、总体相关系数

E、总体相关系数

4.直线回归中,如果散点分布呈直线趋势,X 增加时Y 减少,则可初步判断为

A、两变量呈正相关关系

B、两变量呈负相关关系

C、两变量呈无相关关系

D、b>0

E、b<0

5.两组资料,回归系数b 大的那一组

A、相关系数r 也较大

B、相关系数r 较小

C、两变量相关较密切

D、两组相关系数大小无一定关系

E、以上都不对

6.在相关分析中,得到相关系数为0.83,不可能的解释是。

A、X 与Y 有因果关系

B、X 与Y 有伴随关系

C、X 与Y 有函数关系

D、X 与Y 的总体相关系数为零

E、X 与Y 的总体相关系数不等于零

7.对于相关系数和线性回归系数,下列有几句论断是正确的:

相关系数越大回归系数也越大。

两总体回归系数相等两总体相关系数也相等。

相关系数与回归系数的符号一致。

相关描述关联关系;回归描述因果关系。

A、0句

B、1 句

C、2 句

D、3 句

8.已知r=1,则一定有()。

A、b=1

B、a=1

C、SY.X=0

D、SY.X≠0

9.两变量(x 和y)作相关分析时, 算得r=0.95, 可以说

A、x 和y有关,因r 值较大

B、x 和y相关, 可认为x 和y有因果关系

C、x 和y相关不很密切, 因r 值不到1

D、不能确定x 和y的相关程度, 因不知n的大小

E、可以认为x 和y存在直线相关关系

10.求得r 值后可推论为

A、两变量间有相关关系

B、两变量间无相关关系

C、|r|大时就有意义

D、n大时就有意义

E、对r 值作假设检验后才能推论

11.利用直线回归估计X值所对应Y值的均数可信区间时,( )可以减小区间长度。

A、增加样本含量

B、令X值接近其均数

C、减小剩余标准差

D、减小可信度

E、以上都可以

12.直线回归中X与Y的标准差相等时,以下叙述( )正确。

A、b=a

B、b=r

C、b=1

D、r=1

E、以上都不正确

13.如果直线相关系数r=1,则一定有

A、B、

C、D、

E、以上都不正确

二、简答题

1. 两变量直线相关与回归分析的注意事项。

2. 简述直线回归与直线相关的区别与联系。

直线相关与回归—参考答案

一、单选题

1.C 2.B 3.D 4.E 5.D 6.C 7.D 8.C 9.D 10.C 11.E 12.B 13.C

二、简答题

1. 两变量直线相关与回归分析的注意事项。

①分析前先绘制散点图;

②分析要有实际意义;

③相关关系不一定是因果关系;

④直线相关与回归的意义仅限于变量的实测范围;

⑤判断总体是否存在直线关系,必须作假设检验。

2. 简述线性相关与回归分析的区别与联系。

区别:对资料要求不同;

分析内容侧重点不同;

联系:同一组资料r与b符号相同;

同一组资料对r与b假设检验结果一致;

回归与相关能通过决定系数r2相互解释。

第十四章统计表与统计图

一、单选题

1.根据某地6 至16 岁学生近视情况的调查资料,反映患者的年龄分布可用

A、普通线图

B、半对数线图

C、直方图

D、直条图

E、复式直条图

2.表达某地两年几种疾病的患病率可用

A、直方图

B、单式直条图

C、复式直条图

D、线图

E、百分直条图

3.统计表中不应当出现的项目为

A、备注

B、横标目

C、纵标目

D、线条

E、数字

4.关于统计表的制作,不正确的叙述是

A、统计表不用竖线和斜线分隔表、标目和数据

B、统计表的标题放在表的上方

C、统计表包含的内容越多越好

D、统计表中的数字按小数点位对齐

E、统计表一般用纵标目和横标目说明数字的意义和单位

5.关于统计图的制作,正确的叙述是

A、统计图的标题放在图的上方

B、线图中的线条越多越好

C、直条图的纵轴必须从零开始

D、直方图的组距不必相等

E、以上都不对

6.图示7岁男孩体重与胸围的关系,宜绘制

A、条图B百分条图C、散点图D、线图E、直方图7.表示某地区某年各种死因的构成比,可绘制

A、条图

B、圆图

C、直方图

D、统计地图

E、线图8.欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用

A、普通线图

B、半对数线图

C、条图

D、直方图

E、圆图9.调查某地6至16岁学生近视情况,需描述近视学生的年龄分布可用

A、普通线图

B、半对数线图

C、条图

D、直方图

E、圆图10.欲比较甲乙两地20年来心脏病和恶性肿瘤死亡率的变化速度,宜选用。

A、直方图

B、圆图

C、条图

D、半对数线图

E、普通线图

11.为比较甲乙两地不同性别人群的艾滋病患病情况,宜选用。

A、单式条图

B、圆图

C、百分条图

D、半对数线图

E、复式条图

二、判断题

1.直方图用于描述分类变量的各类别所占的构成比。()

2.条图、线图、直方图均可用于连续型变量的描述。()

3.散点图可用于分类资料的统计描述。()

4.统计表的数据区不能有文字或备注。()

三、分析题1.请按绘制统计表的要求对下表进行修改。

两个治疗组治疗心肌梗死疗效的对比

某地1985、1995年不同传染病的病死率(%)

统计表与统计图—参考答案

一、单选题1.C 2.C 3.A 4.C 5.C 6.C 7.B 8.B 9.D 10.D 11.E

二、判断题1.错2.错3.错4.对

三、分析题.

不同方法治疗心肌梗死并发休克病人的疗效比较

第十五章医学科研设计

一、单选题

1.为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效,在某医院选择40例胃炎

和胃溃疡病人,随机分成实验组和对照组,实验组用胃灵丹治疗,对照组用公认有效

的“胃苏冲剂”。这种对照在实验设计中称为。

A、实验对照

B、空白对照

C、安慰剂对照

D、标准对照

E、历史对照

2.进行配对设计的目的是

A、实验的方便

B、收集资料的方便

C、分析资料的方便

D、减少实验误差提高效率

E、设计简便

3.实验设计的基本原则是。

A、随机化、盲法、设置对照B.重复、随机化、配对C、随机化、盲法、配对D.齐同、均衡、随机化E、随机化、重复、设置对照

4.实验设计和调查设计的根本区别是

A、实验设计以动物为对象

B、调查设计以人为对象

C、实验设计可随机分组

D、实验设计可人为设置处理因素

E、两者无区别

5.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组用无任何作用的糖丸,这种对照属于A、实验对照B、空白对照C、相互对照D、标准对照E、安慰剂对照

6.实验研究与观察性研究的根本区别在于

A、设立对照组

B、盲法

C、是否人为控制实验条件

D、随机抽样

E、假设检验

7.下列哪种情况适合于抽样调查

A、为发现某病的全部病例并提供治疗

B、欲调查人群数量不大

C、要了解各种疾病的常年发病情况

D、欲知道某地一定时期内某病的患病情况

E、为早期发现癌症患者以减少死亡率

8.相对而言,下列哪种抽样方法的抽样误差最大

A、单纯随机抽样

B、系统抽样

C、整群抽样

D、分层抽样

E、分层整群抽样

9.在设计病例对照研究时,对照组的选择最好是

A、从该地区未患该病的全人群中选择对照

B、从医院的其他患者中选择对照

C、从患者的同事中选择对照

D、从患者的亲戚中选择对照

E、从其他患病人群中选择对照

10.队列研究的最大优点是

A、对较多的人群进行较长时间的随访

B、发生偏倚的机会较少

C、控制混杂作用易实现

D、较直接地验证病因与疾病的因果关系

E、研究结果通常代表全人群

11.以下抽样调查方法中不属于概率抽样的是。

A、简单随机抽样

B、多阶段抽样

C、雪球抽样

D、整群抽样

E、分层抽样

12.整群抽样的优点是

A、易于理解,简便易行

B、减少抽样误差

C、节省经费,容易控制调查质量

D、均数及标准误计算简便

E、抽样误差大

13.双盲法的主要目的是

A、避免抽样误差

B、节省试验开支

C、避免人为主观因素的影响

D、减小I类错误

E、以上都不对

二、简答题

1.样本含量估计的要素有哪些?

2.简述调查设计与实验设计的区别与联系。

3.医学研究设计的作用是什么?

医学科研设计—参考答案

一、单选题

1.D 2.D 3.E 4.D 5.E 6.C 7.D 8.C 9.A 10.D 11.C 12.C 13.C

二、简答题

1.(1)根据研究目的,建立检验假设

(2)定出检验水准,常取

(3)提出所期望的检验效能() ,常取

(4)必须知道由样本推断总体的一些信息

2.调查设计与实验设计的基本内容是相似的,如确定研究目的、方法、对象选择、研究指标、资料收集整理和统计分析等,均涉及专业设计和统计设计的内容。

调查设计与实验设计的根本区别在于是否人为控制研究条件,实验研究中可人为控制实验条件,但调查设计的研究因素是客观存在的,不是人为施加的。同时,实验设计还需要考虑对照原则、随机化原则和重复原则。

3.(1)合理安排研究因素,提高研究质量。

(2)严格控制非处理误差,使研究结果保持较好的稳定性。

(3)正确估计样本含量,通过较少的观察例数,获取尽可能丰富的信息。

医学统计学总复习练习题(含答案)

医学统计学总复习练习题(含答案)

一、最佳选择题 1.卫生统计工作的步骤为 C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 B A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

医学统计学-应用题模板

统计学个人整理 (仅针对昆明医科大学劳动与社会保障专业2010级学生) 【t检验】 一.完全随机设计的两样本均数的t检验 Copd患者。。。 正常人。。。 问:运用配对t检验的方法是否正确? 答:不正确。对完全随机设计的资料不宜使用配对t检验。本资料应用完全随机设计的两样本均数比较的t检验,目的是判断两样本均数分别代表的两总体均数是否相同。 步骤: 1.建立假设检验,确定检验水准 Ho: Copd患者与正常人的C-FPWV的总体均数相同; H1: Copd患者与正常人的C-FPWV的总体均数不同。α=0.05 2.运用完全随机设计的两样本均数的t检验计算检验统计量t值和P值。 3.如果P≤0.05,拒绝Ho,接受H1,差异有统计学意义,可认为Copd患者与正常人的 C-FPWV的总体均数不同;如果P>0.05,不拒绝Ho,差异无统计学意义,尚不可认为Copd患者与正常人的C-FPWV的总体均数相同。 二.对数转换后的t检验:白喉抗体效价 男生320 20 320 640 80 320 160 40 女生20 20 160 40 160 80 20 40 20 问:经完全随机设计两样本均数比较的t检验,方差齐,比较得出结论的方法是否正确?答:不正确。由于抗体效价是等比资料,服从对数正态分布,各组的平均效价应用几何均数G描述,其假设检验不能直接用完全随机设计两样本均数比较的t检验,而应将观察值进行对数转换后再用t检验。 三.配对t检验 答①: 1.建立假设检验,确定检验水准。 Ho: 病人治疗前和治疗后血红素总体均数相同; H1: 病人治疗前和治疗后血红素总体均数不同。α=0.05 2.运用配对t检验得到t值和P值。 3.如果P≤0.05,拒绝Ho,接受H1,差异有统计学意义,可认为病人治疗前和治疗后血 红素总体均数不同;如果P>0.05,不拒绝Ho,差异无统计学意义,尚不可认为病人治

医学统计学分析计算题-答案

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

医学统计学论文

医学统计学论文 【摘要】大学生是当今社会中的新鲜血液,是新生代的力量。当代大学生的道德素质的层次会直接左右我们的身心健康水平,同时也影响到社会的前进发展。对于当代大学生道德现状的分析调查可以直接的反映出当今社会所存在的问题。大学生的道德取向则是一个社会道德的风向标。所以,提高当代大学生道德素质是当今社会刻不容缓的问题,同时对于社会主义现代化建设也有很重要的意义。本文基于调查问卷所得出的严谨数据,对学校内的大学生道德现状进行客观分析,并得出相应数据。 一、调查目的 1了解现在大学生的社会道德水平。 2关注大学生的发展,以总结现大学生存在的问题。 3分析原因,找到相关的原因。 二、调查设计 1调查对象:郑州大学继续教育学院 2调查时间:2016年9月—2016年10月 3调查方法:采用问卷调查(问卷共30题) 4问卷:发放出书面问卷200份,回收问卷179份 三、数据分析 数据经整理后,采用SPSS17.0统计软件包录入数据并运用独立样本t检验、方差分析和卡方检验进行数据分析。 四、影响因素的分析 为了能更好的来参照男女性别以及年级的不同,从而对调查问卷涉及的问题所给出的不同回答,我们做了诸多的关于性别差异,年纪差异的数据分析。其中也包括了T检验,交叉表等形式,当然,对于道德素质的选材,我们也没有一个硬性的指标来衡量乃至划分层次的高低。一方面,这给我们的调查统计造成了难以精准的障碍,另一方面,在我们的论文阐述中也不易找到相似的文献资料供以参考。尽管有这些不可避免的问题存在,我们小组还是尽量在数据统计分析出的结果中找到相关性。 1,年级差异对道德水平的影响 针对我们调查问卷主要涉及大学生群体的三个年级、大一、大二、大三,我们采用了不同的交叉表等形式来进行分析。

医学统计学总复习练习题(含答案)培训资料.doc

一、最佳选择题 1.卫生统计工作的步骤为 C A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 D A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括E A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 B A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 B A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 D A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 C A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 C A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 B A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有

医学统计学分析计算题答案

第二单元计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指标性别例数均数标准差标准值* 红细胞数/1012·L-1男360 4.66 0.58 4.84 女255 4.18 0.29 4.33 血红蛋白/g·L-1男360 134.5 7.1 140.2 女255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV)比较二者的变异程度。 女性红细胞数的变异系数 女性血红蛋白含量的变异系数 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误(/L) 男性血红蛋白含量的标准误(g/L)

女性红细胞数的标准误(/L) 女性血红蛋白含量的标准误(g/L) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。未知,但足够大,故总体均数的区间估计按()计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)/L。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)/L。 (4) 两成组大样本均数的比较,用u检验。 1) 建立检验假设,确定检验水准 H0:,即该地健康成年男、女血红蛋白含量均数无差别 H1:,即该地健康成年男、女血红蛋白含量均数有差别 2) 计算检验统计量 3) 确定P值,作出统计推断 查t界值表(ν=∞时)得P<0.001,按水准,拒绝H0,接受H1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u检验。 1) 男性红细胞数与标准值的比较 ①建立检验假设,确定检验水准 H0:,即该地男性红细胞数的均数等于标准值

(完整word版)医学统计学分析应用题

2008习题集(分析应用题) 1、某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下:请问:要反映其平均滴度,用何指标?为什么? 抗体滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计 例数 2 6 5 10 4 2 1 30 答:本资料为抗体滴度资料,符合对数正态分布,应用几何均数。 2、测得某地300名正常人尿汞值,其频数表如下。请问:要反映其平均尿汞值,用何指标代表性较好?为什么? 300例正常人尿汞值(ug/L)频数表

尿汞值例数尿汞值例数尿汞值例数 0- 49 24- 16 48- 3 4- 47 28- 9 52- - 8- 58 32- 9 56- 2 12- 40 36- 4 60- - 16- 35 40- 5 64- - 20- 22 44- - 68-72 1 答:从频数分布看,该组正常人的尿汞值的分布为偏态分布,用百分位数法估计,由于尿汞仅过高为异常,应制定单侧上限值,即计算P95。 3、某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与Ⅱ型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。拟比较两组Ⅱ型糖尿病患者的ACE基因

型分布有无差别,用何统计分析方法? 表7-9 DN组与无DN组2型糖尿病患者ACE基因型分布的比较组别DD ID II 合计 DN组 42 (37.8) 48 (43.3) 21 (18.9) 111 无DN组 30 (21.7) 72 (52.2) 36 (26.1) 138 合计 72 (28.9) 120 (48.2) 57 (22.9) 249 答:这是两组构成比资料。比较两组Ⅱ型糖尿病患者的ACE基因型分布有无差别,应用行列表2 检验。 4、某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见表7-6。欲分析胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别,用何统计分析方法?

医学统计学历年考题及答案

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计 简答 1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等 2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对为什么如果是你,用什么 3 假设检验的基本思想和原则 4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么 5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么你的设计是什么 6一型错误和二型错误的区别和联系 7什么是抽样误差举例说明分类资料和数量资料的抽样误差 计算 1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值 (1)比较白天晚上血压有无差别(配对t检验计算) (2)白天和晚上血压有无相关(相关分析) (3)如何用白天血压估计晚上血压(回归分析) 2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)

3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析) 2008 1. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等) 2. 医学统计中,将正态分布视为近似正态分布有哪几种情况列出应用条件和公式 3. 数值资料的统计描述指标公式 4. 多元回归模型的基本形式参数含义回归效果的评价 5. 什么叫截尾值产生原因举例说明 6. 一同学两样本率的比较用了卡方检验,你有什么建议若不符合卡方检验的应用条件,你又有什么建议他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议 7. 一个三因素的2X2X2的析因设计的实验设计及分析思路 8. 给了一个数值资料: 小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值 小鼠的体重增加量也有十个值 (1)对体重增加量资料进行统计描述 (2)求饮食量和体重增加量的关系 (3)由体重增加量的样本估计其代表总体均数的可信区间 (4)求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间 (5)(3)和(4)中的可信区间有什么差别

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学SPSS生存分析实例

将生存时间按从小到大顺序排列如下: 表1 BCG治疗组生存情况 *死亡=1;删失=0

*死亡=1;删失=0 按上述二表将数据输入SPSS软件,其中数据编号为i,列(1)即时间为t,列(3)即生存结局为status,表1为group1,表2为group2。 选择Analyze中的Survival里的Kaplan-Meier分析,将Time,Status,Factor依次选定,option 和Compare Factor依次设定完成后,得到输出结果,结果分析如下: Survival Table中: 1为BCG治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。2为药物与BCG结合治疗组患者生存率(Estimate)及其标准误(Std. Error)的计算结果。 Overall Comparisons

Log Rank (Mantel-Cox) .057 1 .811 Breslow (Generalized Wilcoxon) .658 1 .417 Tarone-Ware .336 1 .562 Test of equality of survival distributions for the different levels of group. 两组生存率的log-rank 检验 H 0:两种疗法患者生存率相同 H 1:两种疗法患者的生存率不同 α =0.05 采用SPSS 软件对两组生存率进行检验,得到上面Overall Comparisons 表,其中第一行为LogRank 检验结果。即X 2=0.057,P=0.811。按α=0.05水准,不拒绝H 0,还不能认为用BCG 疗法和用药物与BCG 结合疗法治疗黑色素瘤患者的生存率有差别。 生存曲线如上图所示,其中生存时间为横轴,生存率为纵轴。

医学统计学题库完整

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A. 调查、录入数据、分析资料、撰写论文 B. 实验、录入数据、分析资料、撰写论文 C. 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计

医学统计学练习题与答案

一、单向选择题 1. 医学统计学研究的对象是 E.有变异的医学事件 2. 用样本推论总体,具有代表性的样本指的是E.依照随机原则抽取总体中的部分个体 3. 下列观测结果属于等级资料的是 D.病情程度 4. 随机误差指的是 E. 由偶然因素引起的误差 5. 收集资料不可避免的误差是 A.随机误差 1.某医学资料数据大的一端没有确定数值,描述其集中趋势适用的统计指标是 A. 中位数 2. 算术均数与中位数相比,其特点是 B.能充分利用数据的信息 3. 一组原始数据呈正偏态分布,其数据的特点是 D.数值分布偏向较小一侧 4. 将一组计量资料整理成频数表的主要目的是E.提供数据和描述数据的分布特征 1. 变异系数主要用于 A .比较不同计量指标的变异程度 2. 对于近似正态分布的资料,描述其变异程度应选用的指标是E. 标准差 3.某项指标95%医学参考值范围表示的是D.在“正常”总体中有95%的人在此范围 4.应用百分位数法估计参考值范围的条件是B .数据服从偏态分布 5.已知动脉硬化患者载脂蛋白B 的含量(mg/dl)呈明显偏态分布,描述其个体差异的统计指 标应使用 E .四分位数间距 1.样本均数的标准误越小说明 E.由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是D.个体差异 3.对于正偏态分布的的总体,当样本含量足够大时,样本均数的分布近似为C.正态分布 4. 假设检验的目的是 D.检验总体参数是否不同 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为×109/L ~×109/L ,其含义是 E. 该区间包含总体均数的可能性为95% 1. 两样本均数比较,检验结果05.0 P 说明 D.不支持两总体有差别的结论 2. 由两样本均数的差别推断两总体均数的差别, 其差别有统计学意义是指 E. 有理由认为两总体均数有差别 3. 两样本均数比较,差别具有统计学意义时,P 值越小说明 D.越有理由认为两总体均数不同 4. 减少假设检验的Ⅱ类误差,应该使用的方法是 E.增加样本含量 5.两样本均数比较的t 检验和u 检验的主要差别是检验要求大样本资料

医学统计学题库完整

第一章绪论习题 一、选择题 1.统计工作与统计研究得全过程可分为以下步骤:(D) A、调查、录入数据、分析资料、撰写论文 B、实验、录入数据、分析资料、撰写论文 C、调查或实验、整理资料、分析资料 D、设计、收集资料、整理资料、分析资料 E、收集资料、整理资料、分析资料 2、在统计学中,习惯上把(B )得事件称为小概率事件。 A、B、或C、 D、E、 3~8 A、计数资料 B、等级资料 C、计量资料 D、名义资料 E、角度资料 3、某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料得类型就是( A)。 4、分别用两种不同成分得培养基(A与B)培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长得活菌数如下,A:48、84、90、123、171;B:90、116、124、22 5、84。该资料得类型就是(C )。 5、空腹血糖测量值,属于( C)资料。 6、用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料得类型就是(B )。 7、某血库提供6094例ABO血型分布资料如下:O型1823、A型1598、B型2032、AB型641。该资料得类型就是(D )。 8、100名18岁男生得身高数据属于(C )。 二、问答题 1.举例说明总体与样本得概念、 答:统计学家用总体这个术语表示大同小异得对象全体,通常称为目标总体,而资料常来源于目标总体得一个较小总体,称为研究总体。实际中由于研究总体得个体众多,甚至无限多,因此科学得办法就是从中抽取一部分具有代表性得个体,称为样本。例如,关于吸烟与肺癌得研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取得一定量得个体则组成了研究得样本。 2.举例说明同质与变异得概念 答:同质与变异就是两个相对得概念。对于总体来说,同质就是指该总体得共同特征,即该总体区别于其她总体得特征;变异就是指该总体内部得差异,即个体得特异性。例如,某地同性别同年龄得小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析得关系 答:统计设计与统计分析就是科学研究中两个不可分割得重要方面。一般得,统计设计在前,然而一定得统计设计必

医学统计学重点和习题

医学统计学习题集 上海中医药大学预防医学教研室

医学统计学绪论习题 一、名词解释 1.同质和变异 2.总体和样本 3.抽样误差和误差 4.概率和频率 5.计量资料、计数资料和等级资料 二、最佳选择题 1.统计工作的前提与基础是: A.设计 B.收集资料 C.整理资料 D.校对资料 E.分析资料 2.统计工作四个基本步骤是: A.设计,收集资料、整理资料和分析资料 B.收集日常生活资料,报告卡片,分析资料,总结 C.收集统计报表,日常医疗工作资料,分析资料,描述资料 D.收集专门内容报告卡片,进行整理,分析资料,核对资料 E.收集病历,日常医疗工作资料,分析资料,归组 3.统计中所说的样本是指: A.随意从总体中抽取出的部分个体 B.依照研究者要求从总体中抽取出有意义的部分个体 C.按照随机原则抽取总体中有代表性的部分个体 D.依照研究者要求从总体中抽取的部分个体 E.按分布的顺序抽取部分个体 4.统计中所说的总体是指: A.随意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据时间来划分的研究对象的全体 D.根据地区来划分的研究对象的全体 E.根据人群来划分的研究对象的全体 5.总体的要求是: A.大量的 B.同质的 C.随机的 D.固定的 E.对称的 6.对观察单位按某项指标等级顺序分组,再清点各组观察单位的个数所得资料称作: A.计量资料 B.计数资料 C.配对资料 D.相关资料 E.等级资料 7.对观察单位用定量的方法测量某项指标所得的资料是: A.计量资料 B.计数资料 C.配对资料 D.相关资料 E.等级资料 8.样本指标值与总体指标值之差主要是指: A.随机测量误差 B.过失误差 C.容许误差 D.抽样误差 E.系统误差

医学统计学试题及其答案

l.统计中所说的总体是指: A A根据研究目的确定的同质的研究对象的全体B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示 B A某事件必然发生 B某事件必然不发生 C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对3.抽签的方法属于 D A分层抽样B系统抽样 C整群抽样 D单纯随机抽样 E二级抽样4.测量身高、体重等指标的原始资料叫: B A计数资料B计量资料 C等级资料 D分类资料 E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡

治疗人数82363 1 该资料的类型是: D A计数资料 B计量资料 C无序分类资料 D有序分类资料 E数值变量资料6.样本是总体的 C A有价值的部分B有意义的部分C有代表性的部分D任意一部分E典型部分7.将计量资料制作成频数表的过程,属于统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料 B收集资料、整理资料、设计、统计推断C设计、收集资料、整理资料、分析资料 D收集资料、整理资料、核对、分析资料E搜集资料、整理资料、分析资料、进行推断9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少: B

A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则 D A对照的原则B随机原则C重复原则D交叉的原则E以上都不对 第八章数值变量资料的统计描述11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择 C A X B G C M D S E C V 13.各观察值均加(或减)同一数后: B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、l O、2、24+(小时),问该食物中毒的平均潜伏期为多少小时 C A5B5.5C6D10E1 2

医学统计学练习题

1. 要反映某市连续5年甲肝发病率的变化情况,宜选用 A.直条图B.直方图C.线图D.百分直条图 2. 下列哪种统计图纵坐标必须从0开始, A. 普通线图 B.散点图 C.百分分直条图 D.直条图 3. 关于统计表的列表要求,下列哪项是错误的? A.横标目是研究对象,列在表的右侧;纵标目是分析指标,列在表的左侧 B.线条主要有顶线、底线及纵标目下面的横线,不宜有斜线和竖线 C.数字右对齐,同一指标小数位数一致,表内不宜有空格 D.备注用“*”标出,写在表的下面 4. 医学统计工作的基本步骤是 A.统计资料收集、整理资料、统计描述、统计推断 B.调查、搜集资料、整理资料、分折资料 C.设计、搜集资料、整理资料、分析资料 D.设计、统计描述、统计推断、统计图表 5. 统计分析的主要内容有 A. 描述性统计和统计学检验 B.统计描述和统计推断 C.统计图表和统计报告 D.描述性统计和分析性统计 6 制作统计图时要求 A.纵横两轴应有标目。一般不注明单位 B. 纵轴尺度必须从0开始 C.标题应注明图的主要内容,一般应写在图的上方 D. 在制作直条图和线图时,纵横两轴长度的比例一般取5:7 7. 痊愈、显效、好转、无效属于 A. 计数资料 B. 计量资料 C. 等级资料 D.以上均不是 8. 均数和标准差的关系是 A.x愈大,s愈大B.x愈大,s愈小 C.s愈大,x对各变量值的代表性愈好D.s愈小,x对各变量值的代表性愈好 9. 对于均数为μ,标准差为σ的正态分布,95%的变量值分布范围为 A. μ-σ ~ μ+σ B. μ-1.96σ ~ μ+1.96σ C. μ-2.58σ ~ μ+2.58σ D. 0 ~ μ+1.96σ 10. 从一个数值变量资料的总体中抽样,产生抽样误差的原因是 A.总体中的个体值存在差别B.样本中的个体值存在差别 C.总体均数不等于0 D.样本均数不等于0 11 从偏态总体抽样,当n足够大时(比如n > 60),样本均数的分布。 A. 仍为偏态分布 B. 近似对称分布 C. 近似正态分布 D. 近似对数正态分布 12 某市250名8岁男孩体重有95%的人在18~30kg范围内,由此可推知此250名男孩体重的标准差大 约为 A.2.0kg B.2.3kg C.3.1kg D.6.0kg 13. 单因素方差分析中,造成各组均数不等的原因是 A.个体差异B.测量误差C.各处理组可能存在的差异D.以上都有 14. 医学中确定参考值范围是应注意 A.正态分布资料不能用均数标准差法B.正态分布资料不能用百分位数法 C.偏态分布资料不能用均数标准差法D.偏态分布资料不能用百分位数法 15. 方差分析中,当P<0.05时,则 A.可认为各总体均数都不相等B.可认为各样本均数都不相等 C.可认为各总体均数不等或不全相等D.以上都不对 16. 两样本中的每个数据减同一常数后,再作其t检验,则

医学统计学-理论笔试及上机应用分析应用题答题规范

理论笔试分析应该题答题规范 五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗70 50 74.29 中西医治疗60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分)

医学统计学分析计算题-答案 (1)要点

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?= ?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

相关文档
最新文档