医学统计学

医学统计学
医学统计学

湖北医药学院《医学统计学》(2504B)课程教学大纲

一、课程基本信息

学时分配:47学时。

考核方式:采用综合考评法。成绩由理论考试(闭卷)、平时作业与SPSS统计软件应用三部分组成。

三、教学内容

(一)理论课

第一章绪论

教学目标:掌握医学统计中的基本概念、统计资料的类型。熟悉统计工作的基本内容和步骤、抽样方法。了解抽样误差、医学统计学在临床医学与医院管理中的重要作用。

教学内容:

第一节医学统计学的作用

第二节医学统计工作的基本内容

第三节医学统计学中的基本概念

一、同质与变异二、变量与数据类型三、总体和样本四、误差五、概率

第二章定量数据的统计描述

教学目标:掌握描述定量数据集中趋势和变异程度的统计指标计算及适用条件。熟悉频数分布表的用途。了解频数分布表的编制方法。

教学内容:

第一节频数分布

一、频数表二、直方图三、频数分布表的用途

第二节集中趋势的统计指标

一、算术均数二、几何均数三、中位数和百分位数

第三节变异程度的统计指标

一、极差二、四分位数间距三、方差四、标准差五、变异系数

第三章正态分布与医学参考值范围

教学目标:掌握正态分布特征及曲线下面积分布规律。熟悉正态分布概念及其应用;医学参考值范围的制定方法。了解正态分布函数;医学参考值范围的概念。

教学内容:

第一节正态分布

一、正态曲线二、正态分布的特征三、标准正态分布

第二节医学参考值范围

一、医学参考值范围的概念二、制订医学参考值范围的注意事项

三、医学参考值范围的计算方法

第四章定性数据的统计描述

教学目标:掌握常用相对数的概念、计算和应用,相对数使用应注意的问题。熟悉率的标准化计算方法。了解率的标准化意义。

教学内容:

第一节常用相对数

一、率二、构成比三、相对比四、标准化率

第二节医学中常用的相对数指标

一、死亡统计指标二、疾病统计指标

第三节相对数使用的注意问题

第五章统计表与统计图

教学目标:掌握统计表的编制原则和结构、统计图制图原则和医学常用统计图的选择。熟悉统计表的种类、统计图的绘制方法。了解普通线图和半对数线图的区别。

教学内容:

第一节统计表

一、统计表的编制原则和结构二、统计表的种类三、编制统计表的注意事项

第二节统计图

一、统计图的制作二、描述定量数据的统计图三、描述定性数据的统计图

第六章参数估计与假设检验

教学目标:掌握标准误的基本概念;总体均数和总体率的区间估计。熟悉t分布的特点、假设检验的基本概念和检验步骤。了解假设检验的基本思想。

教学内容:

第一节参数估计

一、抽样误差二、可信区间的概念三、总体均数的区间估计

四、两总体均数差值的区间估计五、总体率的区间估计六、两总体率差值的区间估计

第二节假设检验

一、基本原理二、基本步骤

第七章t检验

教学目标:掌握t检验的应用条件、注意事项。熟悉t检验计算方法、假设检验中的两类错误。了解t 检验的基本思想、近似t检验、方差齐性检验方法与用途。

教学内容:

第一节t检验

一、单样本t检验二、配对样本均数t检验三、两独立样本均数t检验

第二节方差不齐时两样本均数的近似t检验

一、方差齐性检验二、近似t检验

第三节t检验中的注意事项

第四节假设检验中两类错误

第八章方差分析

教学目标:掌握方差分析的基本概念、用途和应用条件。熟悉方差分析的计算、多个样本均数的两两比较。了解方差分析的基本思想。

教学内容:

第一节完全随机设计的方差分析

第二节随机区组设计的方差分析

第三节多个样本均数的两两比较

第四节方差齐性检验

第五节其他设计类型的方差分析

一、析因设计二、重复测量设计

第九章X2检验

教学目标:掌握X2检验的应用范围及适用条件。熟悉行×列表X2检验的注意事项。了解四格表的确切概率法、多个样本率间多重比较、X2检验的基本思想。

教学内容:

第一节四格表资料的X2检验

一、X2检验的通用公式二、四格表资料X2检验的专用公式三、四格表资料X2检验的校正公式四、四格表资料的Fisher确切概率法

第二节配对四格表资料的X2检验

第三节行×列表资料的X2检验

一、行×列表X2检验的专用公式二、多个样本率间多重比较三、行×列表X2检验的注意事项

第十章非参数秩和检验

教学目标:掌握非参数检验的概念和应用条件。熟悉常用秩和检验的计算。了解参数统计和非参数统计的区别。

教学内容:

第一节配对资料的符号秩和检验

第二节两样本比较的秩和检验

一、查表法二、正态近似法

第三节多个独立样本比较的秩和检验

第十一章线性回归与相关

教学目标:掌握线性相关和线性回归分析的意义、相关与回归分析中应注意的问题。熟悉线性相关和线性回归分析方法和用途、相关系数和回归方程的假设检验。了解相关与回归分析的区别和联系。

教学内容:

第一节线性相关

一、线性相关的概念二、相关系数及其计算三、相关系数的假设检验

第二节线性回归

一、线性回归的概念二、回归方程的估计三、回归方程的假设检验

第三节线性相关与回归分析的注意事项

一、回归分析的应用二、线性相关分析的应用

三、线性相关与回归的区别四、线性相关与回归的联系

第十二章多元线性回归

教学目标:掌握多元线性回归与多元逐步回归分析的意义及注意事项。熟悉多元线性回归分析方法的应用条件及结果解释;偏回归系数、标准偏回归系数、复相关系数和决定系数的意义;多元线性回归的假设检验方法。了解不同逐步回归分析方法的意义。

教学内容:

第一节多元线性回归

一、多元线性回归方程二、多元线性回归方程的假设检验三、实例

第二节多元逐步回归

第三节多元线性回归的注意事项

第十五章实验设计与临床试验设计

教学目标:掌握医学实验设计的基本要素和基本原则。熟悉临床试验设计及统计分析问题。了解样本含量估算方法。

教学内容:

第一节医学实验设计的三要素

一、研究对象二、处理因素三、实验效应

第二节实验设计的三原则

一、对照原则二、随机化原则三、重复原则

第三节临床试验设计及统计分析问题

一、临床试验的特点及注意事项二、临床试验的设计类型三、临床试验的比较类型

第四节样本含量估算

一、影响样本量的条件二、常用的样本含量估算方法

第九章医学统计学的基本内容

一、单选题

1.以下有关小概率事件的描述,正确的是

A、在一次抽样中就会发生的事件

B、在一次抽样中发生的概率≤0.05

C、在一次抽样中不可能发生的事件

D、即使多次抽样也不可能发生的事件

E、在多次抽样中发生的概率≤0.05

2.医学统计学的研究内容是

A、样本

B、个体

C、变量之间的相关关系

D、总体

E、资料或信息的收集、整理和分析

3.医学统计工作的基本步骤是

A、搜集资料、整理资料、描述资料、设计

B、搜集资料、整理资料、推断资料、设计

C、设计、搜集资料、整理资料、分析资料

D、统计描述、统计推断、统计设计

E、搜集资料、描述资料、推断资料

4.用某种新药治疗白血病患者50名,治疗的结果如下

治疗结果死亡恶化好转显效治愈

治疗人数369284

该资料的类型是

A、计量资料

B、计数资料

C、等级资料

D、分层资料

E、定量资料

5.随机样本的特点是

A、能消除系统误差

B、能消除随机测量误差

C、能减少抽样误差

D、能消除研究者有意无意带来的样本偏性

E、能消除过失误差

6.统计学中的总体是指

A、任意想象的研究对象的全体

B、根据研究目的确定的研究对象的全体

C、根据地区划分的研究对象的全体

D、根据时间划分的研究对象的全体

E、根据人群划分的研究对象的全体

7.为了由样本推断总体,样本应该是

A、总体中任意的一部分

B、总体中的典型部分

C、总体中有意义的部分

D、总体中有价值的一部分

E、总体中有代表性的一部分

8.抽样误差是指

A、不同样本指标之间的差别

B、样本指标与总体指标之间由于抽样产生的差别

C、样本中每个个体之间的差别

D、由于抽样产生的观测值之间的差别

E、系统误差与过失误差之间的差别

9.可以通过增加例数的方法减少的误差是

A、系统误差

B、随机测量误差

C、抽样误差

D、过失误差

E、以上均无法减少

10.关于统计学中的过失误差、系统误差、随机测量误差和抽样误差,正确的是

A、4种误差均不可避免

B、系统误差和随机测量误差不可避免

C、系统误差和抽样误差不可避免

D、随机测量误差和抽样误差不可避免

E、过失误差和抽样误差不可避免

11.P(A)=0时,表示事件

A、很可能发生

B、极可能发生

C、不可能发生

D、在一次抽样中不会发生

E、已经发生

二、判断题

1.概率是描述随机事件发生的可能性大小的一种度量,用P表示,其值介于0.01~100之间。( )

2.计数资料是指按照一定的要求,将研究对象分组后,清点各组研究对象个数而得到的数据,计数资料必须有度量衡单位。( )

3.抽样研究必然存在抽样误差,抽样误差取决于总体中个体差异的大小和抽样样本含量的大小,其变动具有一定的规律性。( )

三、名词解释

1.总体

2.抽样误差

3.概率

医学统计学的基本内容—参考答案

一、单选题

1.C 2.E 3.C 4.C 5.D 6.B 7.E 8.B 9.C 10.D 11.D

二、判断题

1.错2.错3.对

三、名词解释

1.研究对象的全体称为总体,它指符合研究目的所指定的范围内的全部观察对象,是所有同质个体所组成的集合。总体有时是有限的,总体有时是设想的或是抽象的,是无限的。

2.由于个体差异的存在,使抽样过程中样本指标值与总体指标值不相同,这种误差称为抽样误差。抽样研究必然存在抽样误差,抽样误差取决于总体中个体差异的大小和抽样样本含量的大小,其变动具有一定的规律性,其数值可以采用数学的方法加以估计。

3.概率又称机率、机会、可能性,是描述随机事件发生的可能性大小的一种度量,用P表示,其值介于0~1之间。

第十章数值变量资料的统计分析

一、单选题

1.比较均数相差很大的两组数据变异度大小宜采用

A、全距

B、方差

C、标准差

D、变异系数

E、四分位间距

2.描述疾病的平均潜伏期一般用

A、算术均数

B、几何均数

C、中位数

D、均数

E、方差

3.某人群的某个生化指标或生理指标的正常值范围一般指

A、该指标在所有人中的波动范围

B、该指标在所有正常人中的波动范围

C、该指标在绝大部分正常人中的波动范围

D、该指标在少部分正常人中的波动范围

E、该指标在一个人不同时间的波动范围

4.要评价某市一个5岁的男孩的身高是否偏高或偏矮,其统计方法是

A、作身高差别的显著性检验

B、用该市5岁男孩身高的95%或99%正常值范围来评价

C、用该市5岁男孩身高的均数来评价

D、用该市5岁男孩身高的95%或99%可信区间来评价

E、用该市5岁男孩身高的极差来评价

5.正态分布的特点是

A、=M

B、<M

C、>M

D、=S

E、=M=S

6.正态曲线下从到+1.96的面积为总面积的

A、95%

B、45%

C、97.5%

D、47.5%

E、49.5%

7.正态分布曲线下从-1.64到+1.96的面积占总面积的

A、95%

B、97.5%

C、92.5%

D、47.5%

E、49.5%

8.正态分布曲线下大于-1.96的面积为总面积的

A、95%

B、45%

C、97.5%

D、47.5%

E、49.5%

9. 2.58S包含变量值的

A、95%

B、45%

C、99%

D、47.5%

E、49.5%

10.某指标以过低为异常,可用正态分布法求95%正常值范围,应按以下哪项计算A、-1.64S B、+1.64S C、-1.96S

D、+1.96S

E、 1.96S

11.在配对资料的t检验中,观察值前减后与后减前所得的结果,求出的t值应是A、一样B、不一样C、差不多D、不一定E、方法错误12.抽样的目的在于由样本推断总体,因此,样本应该是

A、总体中的任意一部分

B、总体中的典型部分

C、总体中有价值的部分

D、总体中有代表性的部分

E、总体中有意义的部分

13.在单因素方差分析中,必然有

A、B、

C、D、

E、

14.表示的是

A、各观察值的离散情况

B、样本内实测值与总体均数之差

C、样本均数与总体均数之差

D、表示某随机样本的抽样误差

E、以上都错误

15.关于标准差与标准误的关系,描述正确的是

A、两者均反映抽样误差的大小

B、总体标准差增大时,总体标准误也增大

C、样本例数增大时,样本标准差与标准误均减少

D、可信区间大小与标准差有关,而正常值范围与标准误有关

E、总体标准差一定时,增大样本例数会减少标准误

16.从同一正态总体中随机抽取多个样本,用样本均数来估计总体均数的可信区间,下列哪个样本得到的估计精度高

A、均数大的样本

B、均数小的样本

C、标准差大的样本

D、标准误小的样本

E、标准误大的样本

17.两样本均数比较的显著性检验,已知P<0.05,你认为

A、两样本均数不同

B、两样本均数差别有显著性意义

C、两总体均数不同

D、两总体均数差别有显著性意义

E、两总体均数差别很大

二、名词解释

1.正态分布

2.医学参考值范围

3.标准差

4.标准误

5.可信区间

三、简答题

1.标准差和标准误有何区别和联系?

2.怎样正确使用单侧检验和双侧检验?

3.检验假设中,和P有何区别?

四、计算题

1.有12 名志愿受试者服用某减肥药,服药前和服药一个疗程后各测量一次体重(kg),数据如下表所示,,请对此资料作统计分析。

12 名志愿受试者服用某减肥药前后体重(kg)

个体号 1 2 3 4 5 6 7 8 9 10 11 12

服药前服药后101 131 131 143 124 137 126 95 90 67 84 101 100 136 126 150 128 126 116 105 87 57 74 109

照组则用标准药物治疗,测得治疗前后舒张压(mmHg)的差值(前-后)如下表。问新药和标准药的疗效是否不同?

两种药物治疗前后的舒张压(mmHg)之差

1210784516321113481414

准药

-291050-210-8412-345平均效价是否不同?

钩端螺旋体病患者血清作凝溶试验测得的稀释倍数

1002004004004004008001600160016003200标

准株(11

人)

100100100200200200200400400水

生株(9

人)

4.为比较治疗组和对照组的肺表面活性物质在治疗新生儿呼吸窘迫综合征患儿过程中的作用是否不同,某医生在治疗30名患儿后48小时得到如下表资料,问治疗后48小时,两组的是否不同?

两组患儿比较

分组例数均数标准差

治疗组1512.550.33

对照组159.72 2.03

数值变量资料的统计分析—参考答案

一、单选题

1.D 2.C 3.C 4.B 5.A 6.D 7.C 8.C 9.C 10.A 11.A 12.D

13.D 14.D 15.B 16.D 17.C

二、名词解释

1.正态分布是指若以计量值为横轴、观察例数为纵轴绘制一条频数分布曲线,这条曲线呈现对称的、中间高、两侧逐渐下降的钟形。在正态分布的图形中,从曲线最高点向横轴作垂线,相交点即为均数值;而钟形曲线的高低、宽窄取决于标准差,标准差越大,曲线显得越低、越宽,标准差越小,曲线显得越高、越窄。

2.也称正常值范围,是指正常人的各种生理数值。由于个体差异的存在,正常值不可能是一个点值,而应该有一定的波动范围,这就是医学参考值范围。

3.是描述一组数值变量资料离散趋势和分布状态特征的指标。

4.表示抽样误差大小的指标,是样本均数或样本率等样本统计量的标准差。

5.是指在可信度为(1-)时,估计总体均数可能存在的范围。

三、简答题

1. 联系:都是描述离散趋势的指标。

区别:标准差描述原始观察值的离散趋势;标准误描述样本均数的离散趋势。

2. 根据研究目的和专业知识判断。根据专业知识推断两个总体是否有差别时,有可能存在两种情况:甲高于乙或乙高于甲,当两种情况同时存在时,一般选双侧;若根据专业知识,甲不可能比乙低,或研究者只关心其中的一种情况时,则选单侧。

3. 值,即检验水准,是指在统计推断时,预先设定的一个小概率值,是如果无效假设是真的(成立的),允许它错误地被拒绝的概率;P值是由实际样本确定的,它给人的概念是实际资料怎样与无效假设()相矛盾,P值是指在成立的前提下,出现等于或大于现有检验统计量的概率。

四、计算题

1.(1)、、

95%的可信区间为 3.69~6.36,认为该减肥药药效为零。

(2)

t=0.584,υ=11,p>0.05,差异无统计学意义,还不能认为该减肥药有药效。

2.方差齐性检验略

查t界值表,得0.002

3. 将原始数据取对数再作t检验:(方差齐性检验略)

H0:两总体几何均数相等

H1:两总体几何均数不等

查表得0.005

4. 方差齐性检验略

按水准,拒绝,接受,有统计学意义,可以认为治疗后48小时,两组的不同。

第十一章分类变量资料的统计分析

一、单选题

1.用某药治疗某病患者,5例中有4例治愈,宜写作4/5,而不计算治愈率为4/5×00%=80%,这是由于

A、总体治愈率的可信区间太窄

B、样本治愈率的可信区间太宽

C、样本治愈率的可信区间太窄

D、总体治愈率的可信区间太宽

E、计算治愈率的方法不正确

2.在医学科研中率的标准化经常要采用全国人口的性别年龄构成,其理由是

A、这样便于进行比较

B、这样计算标准化率比较容易

C、这样算得的标准化率比较合理

D、这样算得的标准化率比较准确

E、这样更容易计算

3.在两个及两个以上总率进行对比时应先进行率的标准化,其目的是

A、控制处理因素的影响

B、平衡混杂因素构成不同的影响

C、反映患病人数的影响

D、消除治愈人数的影响.

E、平衡处理因素的作用

4.在某传染病医院210名住院病人中,有26位乙肝病人,据此可计算

A、患病率

B、发病率

C、构成比

D、相对比

E、标化发病率

5.欲反映某种疾病对人群的威胁程度,应该计算该病的哪项指标

A、病死率

B、死亡率

C、发病率

D、患病率

E、构成比

6.用两种方法检测住院患者痰中的抗乳酸杆菌,甲法检查痰标本234份,阳性率30%,乙法检查108份,阳性率20%,两法合并阳性率等于

A、30%+20%

B、(30%+20%)÷2

C、(30%-20%)÷2×200

D、(234×30%+108×20%)÷(234+108)

E、(30%+20%)÷(234+108)

7.要比较甲乙两厂某工种工人某种职业病患病率的高低,对工龄进行标化,其标准构成的选择是

A、甲厂工人的年龄构成

B、乙厂工人的年龄构成

C、甲乙两厂合并的工人的年龄构成

D、当地较稳定人口的年龄构成

E、甲乙两厂合并的工人的工龄构成

8.经4组率比较的检验,得P<0.05,可认为

A、各总体率均不相同

B、各总体率间相差较大

C、各样本率间均有差别

D、最多有两总体率间存在差别

E、至少有两总体率间存在差别

9.四格表资料的检验如果需要校正,而未进行校正,则

A、P值不变

B、P值减小

C、P值增大

D、P值可能增大,也可能减小

E、P值等于零

10.关于分布的形状,正确的是

A、同正态分布

B、同t分布

C、为对称分布

D、与自由度有关

E、与样本含量n有关

11.值的取值范围为

A、B、C、

D、E、

12.当四格表的周边合计数不变时,如果某格子的实际频数有变化,则其理论频数如何变化

A、增大

B、减小

C、不变

D、不确定

E、随该格子实际频数的增减而增减

13.关于四格表的自由度,正确的是

A、不一定等于1

B、一定等于1

C、等于行数×列数

D、等于样本含量-1

E、等于格子数-1

14.某四格表资料用检验的基本公式算得,用专用公式算得,则有

A、B、C、

D、比准确

E、比准确

15.R C表必须用公式求理论数的格子个数(其他可由减法求出),公式为

A、 B、 C、

D、 E、

二、名词解释

1.构成比

2.率

3.相对比

4.标准化法

三、计算题

1.用两种方法检查已确诊的乳腺癌患者120 例,甲法检出率为60%,乙法检出率为50%,甲乙两法一致的检出率为35%,请对此资料作统计分析。

2.(12分)某院康复科用共鸣火花治疗癔症患者56例,有效者42例;心理辅导法治疗癔症患者40例,有效者21例。问两种疗法治疗癔症的有效率有无差别?

3.(18分)某研究者将腰椎间盘突出症患者1184例随机分为三组,分别用快速牵引法、物理疗法和骶裂孔药物注射法治疗,结果如下表。问三种疗法的有效率有无不同?

三种疗法治疗腰椎间盘突出有效率的比较

疗法有效无效合计

快速牵引法44430474

物理疗法32391414

骶裂孔药物注射法22274296

合计9891951184

分类变量资料的统计分析—参考答案

一、单选题

1.D 2.A 3.B 4.C 5.B 6.D 7.E 8.E 9.C 10.D 11.C 12.C

13.B 14.B 15.E

二、名词解释

1.是指事物内部某一组成部分的观察单位数与该事物各组成部分观察单位总数之比,常用来说明事物内部各组成部分所占的比重或分布情况。

2.表示一定时间内,实际发生某现象的观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率和强度。

3.指两个有联系的指标之比。

4.在两个及两个以上总率(总均数)进行对比时,为了消除内部构成不同造成的影响,采用统一标准,分别计算标准化率后再作对比的方法。

三、计算题

1. 配对四格表检验。

⑴ p=0.503;

⑵实际推论:两种方法无显著差别。

2.本题为两样本率的比较,n>40且所有的T>5,用四格表资料专用公式。

组别有效无效合计有效率(%)

共鸣火花治疗组42145675.00

心理辅导法治疗组21194052.50

合计63339665.63

,即两疗法治疗癔症的有效率相等

,即两疗法治疗癔症的有效率不等

以=1查界值表得。按水准,拒绝,接受,可以认为两疗法治疗癔症的有效率不等。

3. 本题为三个样本率的比较,所有格子的,用行列表资料的专用公式。

三种疗法治疗腰椎间盘突出有效率的比较

疗法有效无效合计

快速牵引法44430474

物理疗法32391414

骶裂孔药物注射法22274296

合计9891951184

,即三种疗法治疗腰椎间盘突出症的有效率相等

:三种疗法治疗腰椎间盘突出症的有效率不全相等

=0.05

查界值表得。按=0.05水准,拒绝,接受。可以认为三种疗法治疗腰椎间盘突出症的有效率有差别。

一、单选题

1.对于配对资料的秩和检验,其检验假设为

A、两样本的差值应来自均数为0的正态总体

B、两样本的差值应来自均数为0的非正态总体

C、两样本的差值应来自中位数为0的总体

D、两样本的差值应来自方差齐性的总体

E、两样本的差值应来自正态分布的总体

2.按等级分组资料的秩和检验中,各等级平均秩次为

A、该等级秩次范围的上界

B、该等级秩次范围的下界

C、该等级秩次范围的上界与下界的均数

D、该等级秩次范围的上界与下界之和

E、该等级秩次范围的上界与下界之差

3.配对比较的秩和检验的基本思想是:如果假设成立,则对样本来说

A、正秩和与负秩和的绝对值不会相差很大

B、负秩和的绝对值大于正秩和的绝对值

C、正秩和与负秩和的绝对值相等

D、正秩和的绝对值大于负秩和的绝对值

E、正秩和与负秩和的绝对值相差很大

4.配对样本差值的Wilcoxon符号秩检验确定P值的方法为

A、绝对值小的T越大,P越大

B、绝对值小的T越大,P越小

C、绝对值小的T值在界值范围内,P小于相应的

D、绝对值小的T值在界值范围内,P大于相应的

E、T值即u值,查u界值表

5.秩和检验中,如果统计量T值恰好等于界值时,则有

A、B、C、

D、E、无法进行判断

6.对于多样本计量资料的比较,当分布类型不清时选择

A、t检验

B、检验

C、u检验

D、H检验

E、F检验7.对符合t检验条件的数值型变量资料进行比较,如果采用秩和检验,则A、第1类错误概率增大B、第2类错误概率增大

C、第1类错误概率减小

D、第2类错误概率减小

E、第1类和第2类错误概率同时增大

8.关于成组设计两样本比较的秩和检验,正确的是

A、以秩和较小者为T

B、以秩和较大者为T

C、以例数较小秩和为T

D、以例数较大秩和为T

E、当两样本例数不等时,可任意选取一样本的秩和为T

二、名词解释

1. 非参数检验

秩和检验—参考答案

一、单选题

1.C 2.C 3.A 4.D 5.B 6.D 7.B 8.C

二、名词解释

1. 是一种不依赖总体分布的具体形式,也不考虑研究变量服从何种分布,以及分布是否已知,不是对参数,而只是对分布进行比较的方法

第十三章直线相关与回归

一、单选题

1.在直线回归分析中,Sy . x(直线回归的剩余标准差)反映

A、y变量的变异度

B、x 变量的变异程度

C、扣除x 影响后y 的变异程度

D、扣除y的影响后x 的变异程度

E、回归系数b 变异程度

2.从样本得到变量X 与Y 的相关系数r=0.92, 则

A、X 与Y 之间一定存在因果关系

B、若对此份资料作回归分析, 其回归系数是正值

C、若对此份资料作回归分析, 其回归系数是负值

D、表明总体相关系数

E、表明总体相关系数

3.根据样本算得两个随机变量X 与Y 的相关系数r, 经t 检验, P<0.01, 可认为

A、X 与Y 间密切相关

B、总体相关系数很大

C、总体相关系数

D、总体相关系数

E、总体相关系数

4.直线回归中,如果散点分布呈直线趋势,X 增加时Y 减少,则可初步判断为

A、两变量呈正相关关系

B、两变量呈负相关关系

C、两变量呈无相关关系

D、b>0

E、b<0

5.两组资料,回归系数b 大的那一组

A、相关系数r 也较大

B、相关系数r 较小

C、两变量相关较密切

D、两组相关系数大小无一定关系

E、以上都不对

6.在相关分析中,得到相关系数为0.83,不可能的解释是。

A、X 与Y 有因果关系

B、X 与Y 有伴随关系

C、X 与Y 有函数关系

D、X 与Y 的总体相关系数为零

E、X 与Y 的总体相关系数不等于零

7.对于相关系数和线性回归系数,下列有几句论断是正确的:

相关系数越大回归系数也越大。

两总体回归系数相等两总体相关系数也相等。

相关系数与回归系数的符号一致。

相关描述关联关系;回归描述因果关系。

A、0句

B、1 句

C、2 句

D、3 句

8.已知r=1,则一定有()。

A、b=1

B、a=1

C、SY.X=0

D、SY.X≠0

9.两变量(x 和y)作相关分析时, 算得r=0.95, 可以说

A、x 和y有关,因r 值较大

B、x 和y相关, 可认为x 和y有因果关系

C、x 和y相关不很密切, 因r 值不到1

D、不能确定x 和y的相关程度, 因不知n的大小

E、可以认为x 和y存在直线相关关系

10.求得r 值后可推论为

A、两变量间有相关关系

B、两变量间无相关关系

C、|r|大时就有意义

D、n大时就有意义

E、对r 值作假设检验后才能推论

11.利用直线回归估计X值所对应Y值的均数可信区间时,( )可以减小区间长度。

A、增加样本含量

B、令X值接近其均数

C、减小剩余标准差

D、减小可信度

E、以上都可以

12.直线回归中X与Y的标准差相等时,以下叙述( )正确。

A、b=a

B、b=r

C、b=1

D、r=1

E、以上都不正确

13.如果直线相关系数r=1,则一定有

A、B、

C、D、

E、以上都不正确

二、简答题

1. 两变量直线相关与回归分析的注意事项。

2. 简述直线回归与直线相关的区别与联系。

直线相关与回归—参考答案

一、单选题

1.C 2.B 3.D 4.E 5.D 6.C 7.D 8.C 9.D 10.C 11.E 12.B 13.C

二、简答题

1. 两变量直线相关与回归分析的注意事项。

①分析前先绘制散点图;

②分析要有实际意义;

③相关关系不一定是因果关系;

④直线相关与回归的意义仅限于变量的实测范围;

⑤判断总体是否存在直线关系,必须作假设检验。

2. 简述线性相关与回归分析的区别与联系。

区别:对资料要求不同;

分析内容侧重点不同;

联系:同一组资料r与b符号相同;

同一组资料对r与b假设检验结果一致;

回归与相关能通过决定系数r2相互解释。

第十四章统计表与统计图

一、单选题

1.根据某地6 至16 岁学生近视情况的调查资料,反映患者的年龄分布可用

A、普通线图

B、半对数线图

C、直方图

D、直条图

E、复式直条图

2.表达某地两年几种疾病的患病率可用

A、直方图

B、单式直条图

C、复式直条图

D、线图

E、百分直条图

3.统计表中不应当出现的项目为

A、备注

B、横标目

C、纵标目

D、线条

E、数字

4.关于统计表的制作,不正确的叙述是

A、统计表不用竖线和斜线分隔表、标目和数据

B、统计表的标题放在表的上方

C、统计表包含的内容越多越好

D、统计表中的数字按小数点位对齐

E、统计表一般用纵标目和横标目说明数字的意义和单位

5.关于统计图的制作,正确的叙述是

A、统计图的标题放在图的上方

B、线图中的线条越多越好

C、直条图的纵轴必须从零开始

D、直方图的组距不必相等

E、以上都不对

6.图示7岁男孩体重与胸围的关系,宜绘制

A、条图B百分条图C、散点图D、线图E、直方图7.表示某地区某年各种死因的构成比,可绘制

A、条图

B、圆图

C、直方图

D、统计地图

E、线图8.欲比较两地20年来冠心病和恶性肿瘤死亡率的上升速度,最好选用

A、普通线图

B、半对数线图

C、条图

D、直方图

E、圆图9.调查某地6至16岁学生近视情况,需描述近视学生的年龄分布可用

A、普通线图

B、半对数线图

C、条图

D、直方图

E、圆图10.欲比较甲乙两地20年来心脏病和恶性肿瘤死亡率的变化速度,宜选用。

A、直方图

B、圆图

C、条图

D、半对数线图

E、普通线图

11.为比较甲乙两地不同性别人群的艾滋病患病情况,宜选用。

A、单式条图

B、圆图

C、百分条图

D、半对数线图

E、复式条图

二、判断题

1.直方图用于描述分类变量的各类别所占的构成比。()

2.条图、线图、直方图均可用于连续型变量的描述。()

3.散点图可用于分类资料的统计描述。()

4.统计表的数据区不能有文字或备注。()

三、分析题1.请按绘制统计表的要求对下表进行修改。

两个治疗组治疗心肌梗死疗效的对比

某地1985、1995年不同传染病的病死率(%)

白喉10.97.6

统计表与统计图—参考答案

一、单选题1.C 2.C 3.A 4.C 5.C 6.C 7.B 8.B 9.D 10.D 11.E

二、判断题1.错2.错3.错4.对

三、分析题.

不同方法治疗心肌梗死并发休克病人的疗效比较

治疗组患者例数治疗结果

有效无效

西药组251510

中西药结合组30255

第十五章医学科研设计

一、单选题

1.为研究新药“胃灵丹”治疗胃病(胃炎、胃溃疡)疗效,在某医院选择40例胃炎

和胃溃疡病人,随机分成实验组和对照组,实验组用胃灵丹治疗,对照组用公认有效

的“胃苏冲剂”。这种对照在实验设计中称为。

A、实验对照

B、空白对照

C、安慰剂对照

D、标准对照

E、历史对照

2.进行配对设计的目的是

A、实验的方便

B、收集资料的方便

C、分析资料的方便

D、减少实验误差提高效率

E、设计简便

3.实验设计的基本原则是。

A、随机化、盲法、设置对照B.重复、随机化、配对C、随机化、盲法、配对D.齐同、均衡、随机化E、随机化、重复、设置对照

4.实验设计和调查设计的根本区别是

A、实验设计以动物为对象

B、调查设计以人为对象

C、实验设计可随机分组

D、实验设计可人为设置处理因素

E、两者无区别

5.某医师研究丹参预防冠心病的作用,实验组用丹参,对照组用无任何作用的糖丸,这种对照属于A、实验对照B、空白对照C、相互对照D、标准对照E、安慰剂对照

6.实验研究与观察性研究的根本区别在于

A、设立对照组

B、盲法

C、是否人为控制实验条件

D、随机抽样

E、假设检验

7.下列哪种情况适合于抽样调查

A、为发现某病的全部病例并提供治疗

B、欲调查人群数量不大

C、要了解各种疾病的常年发病情况

D、欲知道某地一定时期内某病的患病情况

E、为早期发现癌症患者以减少死亡率

8.相对而言,下列哪种抽样方法的抽样误差最大

A、单纯随机抽样

B、系统抽样

C、整群抽样

D、分层抽样

E、分层整群抽样

9.在设计病例对照研究时,对照组的选择最好是

A、从该地区未患该病的全人群中选择对照

B、从医院的其他患者中选择对照

C、从患者的同事中选择对照

D、从患者的亲戚中选择对照

E、从其他患病人群中选择对照

10.队列研究的最大优点是

A、对较多的人群进行较长时间的随访

B、发生偏倚的机会较少

C、控制混杂作用易实现

D、较直接地验证病因与疾病的因果关系

E、研究结果通常代表全人群

11.以下抽样调查方法中不属于概率抽样的是。

A、简单随机抽样

B、多阶段抽样

C、雪球抽样

D、整群抽样

E、分层抽样

12.整群抽样的优点是

A、易于理解,简便易行

B、减少抽样误差

C、节省经费,容易控制调查质量

D、均数及标准误计算简便

E、抽样误差大

13.双盲法的主要目的是

A、避免抽样误差

B、节省试验开支

C、避免人为主观因素的影响

D、减小I类错误

E、以上都不对

二、简答题

1.样本含量估计的要素有哪些?

2.简述调查设计与实验设计的区别与联系。

3.医学研究设计的作用是什么?

医学科研设计—参考答案

一、单选题

1.D 2.D 3.E 4.D 5.E 6.C 7.D 8.C 9.A 10.D 11.C 12.C 13.C

二、简答题

1.(1)根据研究目的,建立检验假设

(2)定出检验水准,常取

(3)提出所期望的检验效能() ,常取

(4)必须知道由样本推断总体的一些信息

2.调查设计与实验设计的基本内容是相似的,如确定研究目的、方法、对象选择、研究指标、资料收集整理和统计分析等,均涉及专业设计和统计设计的内容。

调查设计与实验设计的根本区别在于是否人为控制研究条件,实验研究中可人为控制实验条件,但调查设计的研究因素是客观存在的,不是人为施加的。同时,实验设计还需要考虑对照原则、随机化原则和重复原则。

3.(1)合理安排研究因素,提高研究质量。

(2)严格控制非处理误差,使研究结果保持较好的稳定性。

(3)正确估计样本含量,通过较少的观察例数,获取尽可能丰富的信息。

医学统计学课件:2统计描述

1、这150名正常成年男子红细胞数的平均水 平是多少,变异度有多大? 2、这150名正常成年男子红细胞数与当地成 年男子红细胞数总体相比是否有差别? 一、频数分布表 表4-3 某地150名正常成年男子红细胞数(10 3.98 5.39 4.54 4.74 5.13 4.43 4.81 4.98 3.79 5.49 4.66 5.26 4.90 4.90 4.17 4.28 4.63 4.94 4.33 4.84 4.75 4.01 4.49 4.57 5.16 5.69 4.84 5.03 5.32 4.54 4.68 4.60 4.39 4.80 4.97 4.80 4.85 5.21 4.45 4.62 5.05 4.13 5.07 4.40 5.08 4.73 5.10 4.73 4.42 4.81 4.98 3.89 5.46 4.53 4.74 4.10 4.90 4.91 4.27 4.29 4.66 5.23 5.31 4.86 4.67 4.43 4.57 5.00 5.16 5.69 4.83 5.04 4.46 4.61 5.00 4.36 4.75 4.96 5.04 5.37 4.95 4.70 4.83 4.42 4.13 4.78 4.86 4.78 5.23 4.78 5.20 4.80 4.55 4.82 4.98 3.94 4.54 4.74 5.10 4.43 4.58 4.99 4.31 4.64 4.66 5.26 5.28 4.83 4.15 4.35 4.93 5.17 5.61 4.87 5.04 3.98 4.48 4.57 4.77 4.11 4.95 5.00 5.36 5.06 4.68 4.63 4.40 5.30 4.97 5.29 4.85 5.88 4.49 4.62 4.53 4.10 4.53 4.70 4.80 5.23 5.67 4.67 4.67 5.40 5.29 4.77 5.38 5.15 4.64 5.19

医学统计学分析计算题_与解析

第二单元 计量资料的统计推断 分析计算题 2.1 某地随机抽样调查了部分健康成人的红细胞数和血红蛋白量,结果见表4: 表4 某年某地健康成年人的红细胞数和血红蛋白含量 指 标 性 别 例 数 均 数 标准差 标准值* 红细胞数/1012 ·L -1 男 360 4.66 0.58 4.84 女 255 4.18 0.29 4.33 血红蛋白/g ·L -1 男 360 134.5 7.1 140.2 女 255 117.6 10.2 124.7 请就上表资料: (1) 说明女性的红细胞数与血红蛋白的变异程度何者为大? (2) 分别计算男、女两项指标的抽样误差。 (3) 试估计该地健康成年男、女红细胞数的均数。 (4) 该地健康成年男、女血红蛋白含量有无差别? (5) 该地男、女两项血液指标是否均低于上表的标准值(若测定方法相同)? 2.1解: (1) 红细胞数和血红蛋白含量的分布一般为正态分布,但二者的单位不一致,应采用变异系数(CV )比较二者的变异程度。 女性红细胞数的变异系数0.29 100%100% 6.94%4.18 S CV X = ?=?= 女性血红蛋白含量的变异系数10.2 100%100%8.67%117.6 S CV X =?=?= 由此可见,女性血红蛋白含量的变异程度较红细胞数的变异程度大。 (2) 抽样误差的大小用标准误X S 来表示,由表4计算各项指标的标准误。 男性红细胞数的标准误0.031 X S = ==(1210/L ) 男性血红蛋白含量的标准误0.374 X S = ==(g/L )

女性红细胞数的标准误0.018X S = ==(1210/L ) 女性血红蛋白含量的标准误0.639X S = ==(g/L ) (3) 本题采用区间估计法估计男、女红细胞数的均数。样本含量均超过100,可视为大样本。σ未知,但n 足够大 ,故总体均数的区间估计按 (/2/2X X X u S X u S αα-+ , )计算。 该地男性红细胞数总体均数的95%可信区间为: (4.66-1.96×0.031 , 4.66+1.96×0.031),即(4.60 , 4.72)1210/L 。 该地女性红细胞数总体均数的95%可信区间为: (4.18-1.96×0.018 , 4.18+1.96×0.018),即(4.14 , 4.22)1210/L 。 (4) 两成组大样本均数的比较,用u 检验。 1) 建立检验假设,确定检验水准 H 0:12μμ=,即该地健康成年男、女血红蛋白含量均数无差别 H 1:12μμ≠,即该地健康成年男、女血红蛋白含量均数有差别 0.05α= 2) 计算检验统计量 22.829X X u === 3) 确定P 值,作出统计推断 查t 界值表(ν=∞时)得P <0.001,按0.05α=水准,拒绝H 0,接受H 1,差别有统计学意义,可以认为该地健康成年男、女的血红蛋白含量均数不同,男性高于女性。 (5) 样本均数与已知总体均数的比较,因样本含量较大,均作近似u 检验。 1) 男性红细胞数与标准值的比较 ① 建立检验假设,确定检验水准 H 0:0μμ=,即该地男性红细胞数的均数等于标准值

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

医学统计学教学大纲

医学统计学教学大纲 一、课程的性质、任务 《医学统计学》是开展医学研究的重要手段,是认识和揭示医学领域里各种数量特征的科学分析方法,是使医学科研得以成功的一种重要辅助工具。科技的迅速发展,大量信息的产生要求我们面对纷乱复杂的数据世界能够正确、科学地去认识和处理,医学统计分析是医学生教育培训必修课程,特别是中、高级医学人才的培养,应该使其懂得和掌握一些基本的医学科研设计原则或实验研究方法,能正确处理医学信息和数据,在未来的实践工作中发挥作用。医学统计是一种有力工具。它同科研的总体设计、资料采集、整理、分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。只有正确运用统计分析方法,才不致于造成不应有的缺陷或得出错误的结论。数据作为信息的主要载体广泛存在。我们就要借助统计学这个工具,在混沌中发现规律。统计学就是研究数据及其存在规律的科学。 (本大纲规定教学时数为62学时,理论讲授38学时,实习或讨论24学时) 二、课程教学目标 本教学大纲适用于大专检验专业学生。同学在具备一定医学基础知识后,再通过本课程的学习使学生理解和知道随着现代医学的发展,正确地运用统计学方法和理念,进行实验设计和实验数据处理,系统地学习统计学使学员对医学科研工作的认识和提高自身文化素质和业务水平,具有十分重要的实际意义。 大纲中应当体现理论联系实际的原则,教学过程中完全采用医学中的实例,讲述基本概念及基本原理,注意贯彻启发式教学原则,把统计思维方法的训练作为课堂教学的内容,对于统计公式着重讲解其意义、使用方法、应用条件和应用时注意事项,不必追究公式的数学原理和推导过程。本课程通过讲授、课堂实习、课堂讨论,使学生熟悉统计的基本理论、掌握统计方法的应用,通过课后复习、完成作业,加深对基本理论和基本概念的理解,进一步掌握基本方法。理论讲授38学时,实习或讨论24学时 【教学内容分作三级要求】 第一级是学生必须掌握的内容,教师应于理论课详细讲授,亦为实习课与考试的重点。 第二级是要求熟悉的内容,教师应选择性讲授,未讲授部分由学生自学。 第三级为一般了解内容,供学有余力的学生自学,教师亦可选择性讲授,但不在考试范围内。 三、教学内容和要求

医学统计学第二版高等教育出版社课后习题答案剖析

第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。 当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就

常用医学统计学方法汇总

选择合适的统计学方法 1 连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t 检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t 检验;(2)采用非参数检验,如Wilcoxon 检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t '检验;(2)采用非参数检验,如Wilcoxon 检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t 检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon 的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1 资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果 为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe 法,SNK 法等。 1.3.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal -Wallis 法。如 果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用成组的Wilcoxon 检验。 1.4 多组随机区组样本比较 1.4.1 资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。 1.4.2 资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman 检验法。如果 检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni 法校正P 值,然后用符号配对的Wilcoxon 检验。 **** 需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD 检验,Bonferroni 法,tukey 法,Scheffe 法,SNK 法等。** 绝不能对其中的两 组直接采用t检验,这样即使得出结果也未必正确**

医学统计学分析题

五、分析应用题(4题,共40分) 1、为观察某病西医治疗及中西医结合治疗的疗效, 单纯型用西医治疗, 疑难型用中西医结合治疗, 疗效如下: 某病西医治疗及中西医结合治疗疗效比较 疗法例数治愈数治愈率(%) 西医治疗 70 50 74.29 中西医治疗 60 22 36.67 X2 =5.29 0.05>P>0.01, 西医治疗的疗效较好。你认为如何?请说出理由(6分) 1、答:结论不可信(2分);因为在设计分组上不科学,两组间不具有可比性(4分)。 2、24名志愿者完全随机地分成两组,接受降胆固醇试验。甲组为特殊饮食组,乙组为药物处理组,受试者在试验前后各测量一次血清胆固醇(mmol/L),数据如下表, 甲组乙组 受试者试验前试验后受试者试验前试验后 1 6.11 6.00 1 6.90 6.93 2 6.81 6.8 3 2 6.40 6.35 3 6.48 6.49 3 6.48 6.41 4 7.59 7.28 4 7.00 7.10 5 6.42 6.30 5 6.53 6.41 6 6.94 6.64 6 6.70 6.68 7 9.17 8.42 7 9.10 9.05 8 7.33 7.00 8 7.31 6.83 9 6.94 6.58 9 6.96 6.91 10 7.67 7.22 10 6.81 6.73 11 8.15 6.57 11 8.16 7.65 12 6.60 6.17 12 6.98 6.52 (1)欲分析两种治疗方法是否有效,采用何种统计分析方法?(6分) (2)欲判断两种降血清胆固醇措施效果是否相当,又采用何种统计分析方法?(6分) 2、答:(1)欲分析两种治疗方法是否有效,可用治疗前后比较,属配对设计(2分),应用配对t检验(3分)。(2)如判断两种方法的效果有无差别,则属成组设计(2分),应用两样本均数比较的t检验(3分)。 3、检验血磷含量有甲、乙两种方法,其中,乙法具有快速、简便等优点。现用甲、乙两法检测相同的血液样品,所得结果如下表。 样本号 1 2 3 4 5 6 7 乙法 2.74 0.54 1.20 5.00 3.85 1.82 6.51 甲法 4.49 1.21 2.13 7.52 5.81 3.35 9.61 问:⑴若要判断能否用乙法推算甲法,又用何统计方法?(6分) ⑵欲比较甲乙两法检出血磷是否相同,用何统计方法?(6分) 3、答:(1)根据题意,应用回归分析(6分) (2)这是配对设计计量资料(2分),应用配对t检验(4分) 4、某单位对常住本市5年以上,从未接触过铅作业,也未服过含铅药物或其它重金属,饮用自来水,无肝、肾疾患及贫血,近日未使用利尿剂的健康成年,用乙酸乙酰法测24小时尿δ-ALA的结果如下,欲制定其95%正常值范围。请问:用何种估计方法?说出理由并给出计算公式。(10分) δ-ALA 0.5- 1.0- 1.5- 2.0- 2.5- 3.0- 3.5- 4.0 -4.5- 5.0-5.5 合计

医学统计学课后习题答案(第2版高等教育出版社)

医学统计学课后习题答案(第2版高等教育出版社) 第一章绪论 1.举例说明总体和样本的概念。 研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的所有同质观察单位某种观察值(即变量值)的集合,通常有无限总体和有限总体之分,前者指总体中的个体是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007年西藏自治区正常成年男子的红细胞平均水平的调查研究中,该地2007年全部正常成年男子的红细胞数就构成一个总体,从此总体中随即抽取2000人,分别测的其红细胞数,组成样本,其样本含量为2000人。 2.简述误差的概念。 误差泛指实测值与真实值之差,一般分为随机误差和非随机误差。随机误差是使重复观测获得的实际观测值往往无方向性地围绕着某一个数值左右波动的误差;非随机误差中最常见的为系统误差,系统误差也叫偏倚,是使实际观测值系统的偏离真实值的误差。 3.举例说明参数和统计量的概念。 某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能够根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的。 4.简述小概率事件原理。

当某事件发生的概率小于或等于0.05时,统计学上习惯称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓的小概率事件原理,它是进行统计推断的重要基础。 第二章调查研究设计 1.调查研究主要特点是什么? 调查研究的主要特点是:①研究的对象及其相关因素(包括研究因素和非研究因素)是客观存在的,不能人为给予干预措施②不能用随机化分组来平衡混杂因素对调查结果的影响。 2.简述调查设计的基本内容。 ①明确调查目的和指标②确定调查对象和观察单位③确定调查方法④确定调查方式⑤确定调查项目和调查表⑥制定资料整理分析计划⑦制定调查的组织计划。 3.试比较常用的四种概率抽样方法的优缺点。 (1)单纯随机抽样优点是:均数(或率)及标准误的计算简便。缺点是:当总体观察单位数较多时,要对观察单位一一编号,比较麻烦,实际工作中有时难以办到。 (2)系统抽样优点是:①易于理解,简便易行②容易得到一个按比例分配的样本,由于样本相应的顺序号在总体中是均匀散布的,其抽样误差小于单纯随机抽样。缺点是:①当总体的观察单位按顺序有周期趋势或单调递增(或递减)趋势,系统抽样将产生明显的偏性。但对于适合采用系统抽样的情形,一旦确定了抽样间隔,就必须严格遵守,不能随意更改,否则可能造成另外的系统误差②实际工作中一般按单纯随机抽样方法估计抽样误差,因此这样计算得到的抽样误差一般偏大。 (3)分层抽样优点是:①减少抽样误差:分层后增加了层内的同质性,因而观测值的变异度减小,各层的抽样误差减小,在样本含量先锋等的情况下其标准误一般小于单纯随机抽样、系统抽样和整群抽样的标准误②便于对不同的层采用

《医学统计学》复习题

医学统计学复习题 一、名词解释 1.总体:根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 2.样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 4.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 5.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。 6.计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O四种血型的人数等。 7.等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序资料。如患者的治疗结果可分为治愈、好转、有效、无效、死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量。 8.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 9.频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 10. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 11.系统误差:是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 12.参数:指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统

2医学统计学试题及答案

第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是(A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2 (B)n1+ n2–1 (C)n1+ n2 +1 (D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验的t值为t r,对回归系数检验的t值为t b,二者之间具有什么关系?(C) A t r>t b B t r

《医学统计学》教学大纲

《流行病学》教学大纲供临床医学专业使用 锦州医学院教务处 2003年5月

《流行病学》教学大纲 适用专业: 临床医学 总学时:24,其中理论学时:18、实验学时:6 一、课程的性质和任务 流行病学(Epidemiology)是研究特定人群中与健康相关的状态和事件的分布和决定因素并用以控制健康问题的学科。近数十年来,随着危害人类生命和健康疾病谱的变化,随着医学模式由单纯生物学向生物学、心理学、社会医学相结合模式的转变,流行病学的研究对象、研究方法、研究内容也在不断发展。到现在为止,比较一致认可的流行病学定义为:流行病学是研究人群中疾病与健康状态的分布及其影响因素,制定和评价预防、控制和消灭疾病的对策和措施,并评价这些对策和措施的效果。其研究对象已由仅研究传染病扩大到非传染性疾病,又从疾病扩大、引伸到健康和与健康有关的事件;研究内容既包括了描述“分布”,分析“决定因素”,又包括了研究、提出、评价预防、保健的对策与措施。由此可见流行病学既是一门方法学,又是一门应用性很强的学科。其研究范围已包括了与人类疾病和健康有关的一切问题。 通过本课程的教学使学生掌握流行病学的基本原理、方法和技能,拓宽学生的思路,开阔学生的视野,提高学生能够应用流行病学方法,在疾病的预防、健康促进、病因研究和预防效果评价等方面独立分析问题和解决问题的能力,为今后从事疾病预防和控制工作打下基础。 二、相关课程的衔接 本门课程的前继课程是:基础医学相关课程、计算机基础和医学统计学。 三、教学的基本要求 教学目的 培养学生掌握流行病学基本理论、基本知识、流行病学方法的选择与应用,并了解相应的扩展知识和新进展知识,为学习预防医学各类卫生专业课程奠定流行病学理论基础,也为今后在卫生防疫实际工作中或其他有关学科中运用流行病学的理论和方法奠定基础。 教学要求 1、基本理论理论课教学要根据教学大纲的要求,重点突出教授基本理论和基本知识,详细讲授和解释,同时注意教授一定比例的扩展知识、新进展知识和实际应用知识,加强学生创新能力的培养,开拓思路、启发思维,调动学生的学习积极性。内容精练,条理清楚,合理使用教学设备和教具。也可根据本章节的特点规定学生必要的自学内容。

医学统计学案例分析报告.doc

医学统计学案例分析评述 医学期刊论著:《口岸出入境人员预防接种统计分析》 【题目】口岸出入境人员预防接种统计分析 【研究目标】对口岸出入境人员的预防接种情况进行统计分析,为各种跨国传染性疾病的预防提供参考数据。 【研究人群】2010 年1 月--2012 年5 月口岸接受预防接种的出入境人员6870 位,其基本资料如下:男3678 人,女3021 人;年龄在3-79 岁之 间,平均年龄45.6 岁。经免疫前检查和询问,研究对象均无严重 的疾病,且无接种疫苗过敏史及禁忌症。 【资料类型】本资料是计数资料。 (1)原文:研究对象:选择我处2010 年1 月-2011 年4 月,2011 年5 月-2012 年5月两个时间段6870 位出入境人员,将其按公务人员、船员、劳 务人员、留学人员、旅游探亲及商务等进行分组。 (2)问题:①文献中未明确“我处”的具体含义,没有明确研究对象的来源。 ②文献中未提及“6870 位出入境人员”是如何产生的,即是普查, 还是抽样调查?如果是抽样调查,未明确抽样的方法,是如何应用 随机抽样的方法选择这6870 位研究对象的? 【统计方法】 (1)本论著未明确使用了何种统计学方法,我们组认为:首先应对资料进行正态性检验和方差齐性检验,若满足正态、方差齐,选择χ2检验,否则应选用秩和检验。 一篇论文结论的正确与否,需根据该篇论文所选用的检验方法和检验结果进行判断。如果没有检验方法或检验方法不合理,就无法知道检验结果是否出错,也就无法对结论进行准确判断。 (2)文献尽管在“1.4 统计学处理”中提及了“使用SPSSl5.2 软件进行统计学分析”,注明所采用的统计软件,但方法中未注明统计推断方法,没有明确

医学统计学分析基本思路指南

医学统计学分析基本思路指南 医学统计学的学习一定要以理解为主。对于初学者,不必强记一大堆的公式,也不要死钻牛角尖,非要弄明白为什么这种方法叫“t检验”、“F检验”,为什么这个残差叫做“学生化残差”等等。这些都是历史遗留问题,感兴趣的读者可以查阅统计学史。对于只想应用的人来讲,你只要了解在什么情况下应该用什么方法,什么指标应该用于什么情形。尽管多数统计教材都说了数据分析应该先做假设检验,然后选定统计量,然后怎么怎么。但实际中我们拿到一堆数据的时候,不会坐在桌上先列出零假设和备择假设,也不会满座子地计算统计量。更实际的分析思路是: (1)先确定研究目的,根据研究目的选择方法。不同研究目的采用的统计方法不同,常见的研究目的主要有三类:一是差异性研究,即比较组间均数、率等的差异,可用的方法有t 检验、方差分析、χ2检验、非参数检验等。二是相关性分析,即分析两个或多个变量之间的关系,可用的方法有相关分析。三是影响性分析,即分析某一结局发生的影响因素,可用的方法有线性回归、logistic回归、Cox回归等。 (2)明确数据类型,根据数据类型进一步确定方法。不同数据类型采用的统计方法也不同。定量资料可 用的方法有t检验、方差分析、非参数检验、线性相关、线性回归等。分类资料可用的方法有χ2检验、对数线性模型、logistic回归等。图1.6简要列出了不同研究目的、不同数据类型常用的统计分析方法。 (3)选定统计方法后,需要利用统计软件具体实现统计分析过程。SAS中,不同的统计方法对应不同的命令,只要方法选定,便可通过对应的命令辅之以相应的选项实现统计结果的输出。 (4)统计结果的输出并非数据分析的完成。一般统计软件都会输出很多结果,需要从中选择自己需要的部分,并做出统计学结论。但统计学结论不同于专业结论,最终还需要结合实际做出合理专业结论。 下面是本人简单总结的常用方法的选择,可供读者参考。如有引用本图者,请注明引自《医学案例统计分析与SAS应用》一书,谢谢。

【免费下载】医学统计学课程教学大纲

《医学统计学》课程教学大纲 课程编号:140087 学分:1.5 总学时:34 大纲执笔人:刘艺敏大纲审核人: 一、课程性质与目的 使学生掌握医学统计学的基本理论知识、方法和技能,为其运用到医学实践,进行科学研究,学习其它课程和阅读专业书刊打下必要的统计学基础。 二、面向专业 临床医学专业、口腔医学专业五年制 采用多媒体演示教学和学生每人一台计算机操作,要求学生通过实习课重点掌握统计学的基本概念和不同资料的统计分析思路,同时要求学生基本掌握国际流行统计软件SAS或SPSS的使用方法,能用软件来完成课后的习题。并通过接触真实的科研资料,逐步引导学生提出分析思路、分析方法,直至用计算机软件完成统计分析的全过程。使学生在掌握统计学基本理论知识的基础上,进一步培养他们综合分析问题、动手解决问题的能力,拓宽学生的知识面,有利于学生实践能力和创新精神的培养。 三、课程基本要求 学习医学统计学应着重理解基本概念、基本理论,掌握收集资料、整理资料和分析资料的基本知识、基本技能。培养科学的统计思维方法。 四、实验基本要求 采用多媒体演示教学和学生每人一台计算机操作,要求学生通过实习课重点掌握统计学的基本概念和不同资料的统计分析思路,同时要求学生基本掌握能用软件来完成课后的习题。并通过接触真实的科研资料,逐步引导学生提出分析思路、分析方法,直至用计算机软件完成统计分析的全过程。使学生在掌握统计学基本理论知识的基础上,进一步培养他们综合分析问题、动手解决问题的能力,拓宽学生的知识面,有利于学生实践能力和创新精神的培养。 五、课程基本内容 第一章绪论 第一节统计学与医学统计方法 了解统计学与医学统计学的定义、医学统计学在医学研究中的应用。 第二节统计学基本概念 重点掌握内容:随机变量的概念及其分类-离散型变量及连续型变量;误差的定义,系统误差与随机误的概念;三种数据类型-计数资料、计量资料、等级资料及三者间的转换;总体与样本的概念,总体参数与样本统计量的概念,抽样误差的概念;概率与频率的概念。

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

医学统计学重点总结教学提纲

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation ):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity ):对研究指标有影响的非实验因素相同。 4 总体(population ):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample ):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter ):总体的设计指标称为参数。 统计量(statistic ):样本的统计指标称为统计量。 6 变量(variable ):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean )简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G )适用于倍数关系变化,经对数转换后呈正态分布(如:抗 体滴度,血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -(n x f ∑lg ) 三 中位数(M )和百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距和频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距和频数,

医学统计学公式整理 简洁版

集中趋势的描述 算术均数: 频数表资料(X0为各组段组中值) n fX f fX x O O ∑∑∑== 几何均数: n n X X X G ...21= 或 ) log ( log 1 n X G ∑-= 频数表资料: ? ?????=????????=∑∑∑--n X f f X f G log lg log log 11 中位数:(1)* 2 1 +=n X M (2) ) (21* 12*2++= n n X X M 百分位数 ?? ? ??-?+ =L X X f n X f i L P 100其中:L 为欲求的百分位 数所在组段的下限 , i 为该组段的组距 , n 为总频数 , X f 为 该组段的的频数 , L f 为该组段之前的累计频数 方差: 总体方差为:式(1); 样本方差为 式(2) (1) N X 2 2 )(μσ-∑= (2) 1)(2 2--∑= n X X S 标准差: 1)(2--∑= n X X S 或 1/)(22-∑-∑= n n X X S 频数表资料计算标准差的公式为 1/)(22-∑∑∑-∑= f f fx fx S 变异系数:当两组资料单位不同或均数相差较大时,对变异 大小进行比较,应计算变异系数 %100?= X S CV 常用的相对数指标 (一)率 (二)相对比(三)构成比 1.直接法标准化 N p N p i i ∑= ' ∑=i i p N N p )(' 2.间接法标准化 预期人数实际人数= SMR ∑=i i P n r SMR S M R P P ?=' 正态分布:密度函数: )2/()(2221)(σμπ σ--= X e X f 分布函数: 小于X 值的概率,即该点正态曲线下左侧面积 )()(x X P x F <= 特征:(1)关于x=μ对称。(2)在x=μ处取得该概率密度函数的最大值,在σμ±=x 处有拐点,表现为钟形曲线。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,σ决定曲线的形状 。(5)曲线下面积分布有一定规律 标准正态分布:对任意一个服从正态分布的随机变量,作如下标准化变换 σ μ-= X u ,u 服从总体均数为0、总体标准 差为1的正态分布。 u 值左侧标准正态曲线下面积为标准正态分布函数,记作 )(u Φ 医学参考值的确定方法:(1)百分位法:双侧(P 25,P 975),单侧P 95以下或P 5以上,该法适用于任何分布型的资料。(2)正态分布法:若X 服从正态分布,双侧医学参考值范围为 S X 96.1± 样本均数标准误的估计值为 X s = t 分布的概念:小样本总体标准差未知时,服从自由度为n-1 的t 分布 X X X t s μ-= 总体均数可信区间的计算: 大样本或总体标准差已知:式(1); 小样本:式(2) (1)n S X ? ±96.1 (2)n S n t t ?±-)1(,05.0(前一个t 表示均数) 单样本t 检验: n S X t /0 μ-= 自由度为 n-1; 配对样本t 检验: 检验统计量: n S d t d /0-= 自由度为n-1(n 为对子数) 两样本t 检验:检验统计量: ) 11(2 12 1n n S X X t c +-= (错: Sc 的平方) 2 )()(2)1()1(21222211212 222112-+-+-= -+-+-= ∑∑n n X X X X n n S n S n S c 方差齐性检验:H 0:两总体方差齐,H 1:两总体方差不齐,α=0.1 检验统计量: (较小)(较大)2 2 2 1 S S F = 分子自由度为n 1-1,分母自由度为n 2-1 方差分析的基本思想: 1、总变异:总离均差平方和: 2() 1 T ij i j SS SS X X N νν=-==-∑∑总总= ∑∑-=N X X ij ij /)(22 ∑=N X C ij /)( 2 2. 组间变异:组间变异反映了处理因素的影响(如处理确实有作用),同时也包括了随机误差(含个体差异和测量误差)。 21() 1 B i i i SS SS n X X k νν-==-∑组间组间== = C n X i i ij -∑ ∑2 )( 3. 组内变异:组内变异仅反映随机误差(含个体差异和测量误差),故又称误差变异。 222()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 2()(1) W E ij i i i i j i SS SS SS X X n S N k νν===-=-==-∑∑∑组内组内 1(1)()N k N k ννν=-=-+-=+总组间组内 组间均方与组内均方比值一般地服从分子自由度为ν1,分母 自由度为ν2的F 分布 12 1 MS F k N k MS νννν= ==-==-组间 组间组内组内 , 二项分布的概率函数P (X ): X n X X n C X P --=)1()(ππ; )! (!!X n X n C X n -= 二项分布的均数和标准差:进行n 次独立重复试验,出现X 次阳性结果 X 的总体均数为πμn = 总体方差为)1(2ππσ-=n 总体标准差为)1(ππσ -=n 如果将阳性结果用频率表示 n X p = 率的总体均数 π μ=p 标准差 n p ) 1(ππσ-= n p p n p p S p )1(1 ) 1(-≈--= 又称率的标准误它反映率的抽样误差的大小。 单侧累积概率计算:出现阳性的次数至多为k 次的概率为 ∑∑ ==---==≤k X k X X n X X n X n X P k X P 0 0)1()! (!! )()(ππ 出现阳性的次数至少为k 次的概率 ∑∑ ==---==≥n k X n k X X n X X n X n X P k X P )1()! (!! )()(ππ 率的可信区间的估计 正态近似法:当)1(,p n np - 均大于等于5时 n p p p n p p P )1(96.1,)1(96.1-+-? - 样本率与总体率的比较: 检验假设H 0:π=π0,H 1:π≠π0 1 . 满足正态近似时,计算检验统计量 ) 1(000 πππ--= n n X Z 或 n p Z ) 1(000 πππ--= 2. 不满足正态近似时用直接概率计算法 两样本率的比较:H0:π1=π2,H1:π1≠π2, 检验统计量: ) 1 1)(1(| |2121n n p p p p Z c c +--= 2121n n X X p c ++= Poisson 分布的概率函数为 ! )(X e X P X λλ -= POISSON 分布的应用: 单侧累计概率计算:稀有事件发生次数至多为k 次的概率为 ∑∑==-==≤k X k X X X e X P k X P 0 ! )()(λλ 发生次数至少为k 次的概率为 )1(1)(-≤-=≥k X P k X P 总体均数的区间估计:正态近似法 95%总体均数的可信区间为X X X X 96.1,96.1+- 样本率和总体率的比较 正态近似法: 当满足正态近似条件时, 对检验假设 H0:λ=λ0,H1:λ≠λ0, 检验统计量为 λ λ-= X Z 两组独立样本资料的Z 检验 :当两总体均数都大于20时, 对检验假设H0:λ1=λ2, H1:λ1≠λ2,当两样本观测单

相关文档
最新文档