医学统计学_总结_重点_笔记_复习资料

医学统计学_总结_重点_笔记_复习资料
医学统计学_总结_重点_笔记_复习资料

第一章

2选1

总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。

总体population根据研究目的而确定的同质观察单位的全体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。

样本sample从总体中随机抽得的部分观察单位,其实测值的集合。

3选1

小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。

P值:P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义, P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。

P值是:

1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。

2) 拒绝原假设的最小显著性水平。

3) 观察到的(实例的) 显著性水平。

4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1)

(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等。

计量资料measurement data定量资料quantitative data数值变量资料numerical variable

为观测每个观察单位某项指标的大小,而获得的资料。

(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。

计量资料enumeration data定性资料qualitative data无序分类变量资料unordered categorical variable 名义变量资料nominal variable

为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。

(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。

等级资料ranked data半定量资料semi-quantitative data有序分类变量ordinal categorical variable资料

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位后而得到的资料。

等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。

等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。

两种误差(2选1)

抽样误差(sampling error )由于抽样而引起的总体指标(参数)与样本指标(统计数)之间的差异。抽样误差是由个体变异或其它随机因素造成的,是不可避免的,但误差分布有规律可循,可进行估计和分析。

系统误差(systematic error):由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。

统计的步骤(考填空题,四个空)

统计工作的步骤

1.设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研究中最关键的一环,是今后工作应遵循的依据。

2.收集资料:应采取措施使能取得准确可靠的原始数据。

3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。

4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分析资料包括统计描述和统计推断。

实验设计的基本原则(考填空题,三个空)

随机化原则、对照的原则、重复的原则。

2选1

参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数

是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样

本,用算得的样本统计量估计未知的总体参数。

统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本

统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机

变量。

第二章

频数表的制作步骤以及频数分布表的用途(问答题)

频数分布表的编制步骤:

例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。

114.4 117.2 122.7 124.0 114.0 110.8 118.2 116.7 118.9 118.1

123.5 118.3 120.3 116.2 114.7 119.7 114.8 119.6 113.2 120.0

119.8 116.8 119.8 122.5 119.7 120.7 114.3 122.0 117.0 122.5

119.7 124.9 126.1 120.0 124.6 120.0 121.5 114.3 124.1 117.2

120.2 120.8 126.6 121.5 126.1 117.7 124.1 128.3 121.8 118.7

1、找出观察值中的最大值(largest value)、最小值(smallest value),求极差(range)。

极差等于最大值减最小值。本例最大值=128.3,最小值=110.8,则极差

=128.3-110.8=17.5(cm )

2、确定分组数和组距(class interval)。

组数的多少是根据例数的多少来确定的,以能够反映出频数分布的特征为原则,一般分10—15组。组距为相邻两组的间隔,组距=极差/组数。本例拟分10组,则组距

=17.5/10=1.75≈2,为划记方便,可取稍大或稍小的数(当然本例组距也可取1.5)。

3、确定组段。

第一组段包括要最小值,取较最小值稍小且划分方便的数,本例取“110~”。最后组段包括最大值并写出其上限值。

4、划记。

将各观察值以划“正”字的方法,一笔代表一例,划在相应组段中。例如第一个数l14.4应在组段“114~”处划,第二个数117.2应在“116~”处划,以此类推。

5、统计各组段的频数。全部数据划记完后,清点各组段的人数。

根据编制出的频数表即可了解该数值变量资料的频数分布特征。

频数分布表的用途

1、描述资料的分布特征和分布类型。

频数分布有两个重要特征:集中趋势和离散趋势。大部分观察值向某一数值集中的趋势称为集中趋势,常用平均数指标来表示,各观察值之间大小参差不齐。频数由中央位置向两侧逐渐减少,称离散趋势,是个体差异所致,可用一系列的变异指标来反映。

2、便于进一步计算有关指标或进行统计分析。当数据较多且需手工计算时,常先编制频数表,再进行统计计算。

3、发现特大、特小的可疑值。

如果频数表的一端或两端出现连续几个组段的频数为零后,又出现少数几个特大值或特小值,使人怀疑其是否准确,需进一步检查和核对并做相应处理。

4、据此绘制频数分布图。

描述数据分布集中趋势的指标和描述数据分布离散程度的指标(考选择或者填空)2.描述数据分布集中趋势的指标

算术均数、几何均数、中位数。

3.描述数据分布离散程度的指标

极差、四分位数间距、方差、标准差、变异系数。

正态分布的特征(考选择题υ、σ对图形的影响)

服从正态分布的变量的频数分布由υ、σ完全决定。

(1) υ是正态分布的位置参数,描述正态分布的集中趋势位置。正态分布以 x =υ为对

称轴,左右完全对称。正态分布的均数、中位数、众数相同,均等于υ。

(2) σ描述正态分布资料数据分布的离散程度,σ越大,数据分布越分散,σ越小,数

据分布越集中。σ也称为是正态分布的形状参数,σ越大,曲线越扁平,反之,σ越小,曲

线越瘦高。

标准正态分布(填空)

1.标准正态分布是一种特殊的正态分布,标准正态分布的υ0,σ2 1 ,通常用u(或Z)表示服从标准正态分布的变量,记为υ~N(0,12)。

正态分布的应用(简答)

某些医学现象,如同质群体的身高、红细胞数、血红蛋白量,以及实验中的随机误差,呈现为正态或近似正态分布;有些指标(变量)虽服从偏态分布,但经数据转换后的新变量可服从正态或近似正态分布,可按正态分布规律处理。其中经对数转换后服从正态分布的指标,被称为服从对数正态分布。

1. 估计频数分布一个服从正态分布的变量只要知道其均数与标准差就可根据公式即可估计任意取值范围内频数比例。

2. 制定参考值范围

(1)正态分布法适用于服从正态(或近似正态)分布指标以及可以通过转换后服从正态分布的指标。

(2)百分位数法常用于偏态分布的指标。表3-1中两种方法的单双侧界值都应熟练掌握。

3. 质量控制:为了控制实验中的测量(或实验)误差,常以作为上、下警戒值,以作为上、下控制值。这样做的依据是:正常情况下测量(或实验)误差服从正态分布。

4. 正态分布是许多统计方法的理论基础。检验、方差分析、相关和回归分析等多种统计方法均要求分析的指标服从正态分布。许多统计方法虽然不要求分析指标服从正态分布,但相应的统计量在大样本时近似正态分布,因而大样本时这些统计推断方法也是以正态分布为理论基础的。

医学参考值范围的制定(计算题)

确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧。

确定百分位点:一般取95%或99%。

例题

某市 20 岁男学生 160 人的脉搏数(次/分钟),经正态性检验服从正态分布。求得= 76.10,S =9.32。试估计脉搏数的95%、99%参考值范围。

解:脉搏数的95%正常值范围为:±1.96 S=76.10 ± 1.96(9.32)=57.83~94.37

脉搏数的99%正常值范围为:±2.58 S =76.10 ± 2.58(9.32)=52.05~100.37

第三章

标准误的概念,计算公式。

标准误:抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error)。统计上用标准误(standard error,SE)来衡量抽样误差的大小,即样本均数的标准差,是描述均数抽样分布的离散程度及衡量均数抽样误差大小的尺度。

t分布的图形特征及其与正态分布的区别(简答)

t分布的图形特征

1.以0为中心,左右对称的单峰分布;

2.t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线。

t分布

对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。

t 分布与正态分布比较的区别

t 分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t 分布峰值较低,而尾部较高;③随自由度增大,t 分布趋近与标准正态分布;当ν趋向∞,t 分布的极限分布是标准正态分布。

置信区间和参数估计(名解2选1)

置信区间:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。给出的是被测量参数的测量值的可信程度。

1、对于具有特定的发生概率的随机变量,其特定的价值区间------一个确定的数值范围(“一个区间”)。

2、在一定置信水平时,以测量结果为中心,包括总体均值在内的可信范围。

3、该区间包含了参数θ真值的可信程度。

4、参数的置信区间可以通过点估计量构造,也可以通过假设检验构造。

参数估计:指用样本指标值(统计量)估计总体指标值(参数)。参数估计有两种方法:点估计和区间估计。

可信区间与参考值范围的不同点(简答)

应注意:可信区间与参考值范围的意义、计算公式和用途均不同。

1.从意义和用途来看

95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。

2.从计算公式看

若指标服从正态分布,95%参考值范围的公式是:±1.96s。

总体均数95%可信区间的公式是:。

前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。

t检验的应用条件和类型(填空)

t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。

t检验的类型:单样本t检验,独立t检验,配对t检验

配对设计和完全随机设计(名解2选1)

完全随机设计(completely random design):完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。

配对设计(paired design):是将受试对象按一定条件匹配成对,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。

假设检验的基本求解步骤或者注意事项。(简答2选1)

假设检验的基本步骤

1.建立假设,确定检验水准α

假设有零假设(H0)和备择假设(H1)两个,零假设又叫作无效假设或检验假设。H0和H1的关系是互相对立的,如果拒绝H0,就要接受H1.根据备择假设不同,假设检验有单、双侧检验两种。

检验水准用α表示,通常取0.05或0.10.检验水准说明了该检验犯第一类错误的概率。

2.根据研究目的和设计类型选择适合的检验方法

这里的检验方法,是指参数检验方法,有u检验、t检验和方差分析三种,对应于不同的检验公式。对双样本资料,要注意区分成组设计和配对设计的资料类型。如果资料里有"配成对子"字样,或者是对同一对象用两种方法来处理,一般就可以判定是配对设计资料。

3.确定P值并作出统计结论

u检验得到的是u统计量或称u值,t检验得到的是t统计量或称t值。方差分析得到的是F统计量或称F值。将求得的统计量绝对值与界值相比,可以确定P值。

当α=0.05时,u值要和u界值1.96相比较,确定P值。如果u<1.96,则P>0.05.反之,如u>1.96,则P<0.05.t值要和某自由度的t界值相比较,确定P值。如果t值<t界值,故P>0.05.反之,如t>t界值,则P<0.05.相同自由度的情况下,单侧检验的t界值要小于双侧检验的t界值,因此有可能出现算得的t值大于单侧t界值,而小于双侧t 界值的情况,即单侧检验显著,双侧检验未必就显著,反之,双侧检验显著,单侧检验必然会显著。即单侧检验更容易出现阳性结论。

当P>0.05时,接受零假设,认为差异无统计学意义,或者说二者不存在质的区别。当P

<0.05时,拒绝零假设,接受备择假设,认为差异有统计学意义,也可以理解为二者存在质的区别。但即使检验结果是P<0.01甚至P<0.001,都不说明差异相差很大,只表示更有把握认为二者存在差异。

假设检验时应注意的事项

(一)要有严密的抽样研究设计;样本必须是从同质总体中随机抽取的;要保证组间的均衡性和资料的可比性。

(二)根据现有的资料的性质、设计类型、样本含量大小正确选用检验方法。

(三)对差别有无统计学意义的判断不能绝对化,因检验水准只是人为规定的界限,是相对的。差别有统计学意义时,是指无效假设h0被接受的可能性只有5%或不到5%,甚至不到1%,根据小概率事件一次不可能拒h0,但尚不能排除有5%或1%出现的可能,所以可能产生第一类错误;同样,若不拒绝h0,可能产生第二类错误。

(四)统计学上差别显著与否,与实际意义是有区别的。如应用某药治疗高血压,平均降低舒张压0.5kpa,并得出差别有高度统计学意义的结论。从统计学角度,说明该药有降压作用,但实际上,降低0.5kpa是无临床意义。因此要结合专业作出恰如其分的结论。

第一类错误与第二类错误(名解 2选1)

Ⅰ型错误又称第一类错误(type Ⅰ error):拒绝了实际上成立的,为“弃真”的错误,其概率通常用表示。可取单尾也可取双尾,假设检验时研究者可以根据需要确定值大小,一般规定=0.05或=0.01,其意义为:假设检验中如果拒绝时,发生Ⅰ型错误的概率为5%或1%,即100次拒绝的结论中,平均有5次或1次是错误的。

Ⅱ型错误又称第二类错误(type Ⅱ error):不拒绝实际上不成立的,为“存伪”的错误,其概率通常用表示。只取单尾,假设检验时值一般不知道,在一定情况下可以测算出,如已知两总体的差值(如)、样本含量和检验水准。

以下图说明两类错误:

第四章

为什么等级资料不可用方差分析?资料不相互独立

方差分析的基本思想应用条件(简答)

方差分析(analysis of variance,ANOVA )的基本思想就是根据资料的设计类型,即变异的不同来源将全部观察值总的离均差平方和(sum of squares of deviations from mean,SS)和自由度分解为两个或多个部分,除随机误差外,其余每个部分的变异可由某个因素的作用(或某几个因素的交互作用)加以解释,如各组均数的变异SS 组间可由处理因素的作用加以解释。通过各变异来源的均方与误差均方比值的大小,借助F 分布作出统计推断,判断各因素对各组均数有无影响。

方差分析的应用条件

(1)各样本是相互独立的随机样本,且来自正态分布总体。

(2)各样本的总体方差相等,即方差齐性(homoscedasticity)。

第五章

分类资料的统计描述(几个常用相对数指标填空题)

率(强度相对数,频率相对数)、构成比、相对比

应用相对数时应注意的问题(简答题六条)

⑴计算相对数的分母一般不宜过小。

⑵分析时不能以构成比代替率。

⑶不能用构成比的动态分析代替率的动态分析。

⑷对观察单位数不等的几个率,不能直接相加求其总率。

⑸在比较相对数时应注意可比性。

⑹对样本率(或构成比)的比较应随机抽样,并做假设检验。

率的标准化的基本思想,应注意的问题(分析题)

率的标准化的基本思想:

要比较两个总率时,发现两组资料的内部构成(如年龄、性别构成等)存在明显不同,而且影响到了总率的结果,这时就不宜再直接比较总率,而应考虑采用标准化法。

标准化法的基本思想,就是采用统一的标准(统一的内部构成)计算出消除内部构成不同影响后的标准化率(调整率),然后再进行比较。

二、直接标准化法的计算方法

当已知所比较资料各组率Pi,可选用直接法计算标化率。

三、间接标准化死亡比的计算方法

当所比较的资料已知各自某现象总发生数r及各分组观察单位数时,宜采用间接法计算标化率。

第六章

二项分布,Piosson分布在什么条件下接近正态分布(选择或填空)

第七章(考计算题)

配对与完全随机设计下的四格表的计算

列四格表

公式选择

给个例题把

为研究静脉曲张是否与肥胖有关,观察 122 对同胞兄弟,每对同胞兄弟中有一个属肥胖,另一个属正常体重,记录得静脉曲张发生情况见表8-2,试分析之。

[评析]这是一个配对设计的资料,因此用配对检验公式计算。

第八章

参数统计与非参数统计(名解 2选1)

1.参数统计

样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对这些未知的参数进行估计或检验。此类方法称为参数统计。

2.非参数统计

样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。由于这类方法不受总体参数的限制,故称非参数统计法

(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。它检验的是分布,而不是参数。非参数统计不需对总体分布(总体参数)作出特殊假设。

非参数统计的特点和适用范围(简答)

1.特点

(1)样本所来自的总体的分布形式为任何形式,甚至是未知的,都能适用。

(2)收集资料方便,可用“等级”或“符号”来评定观察结果。

(3)多数非参数方法比较简便,易于理解和掌握。

(4)缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。

2.适用范围

(1)等级资料。

(2)偏态分布资料。当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。

(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。

(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。

(5)分布类型不明。

(6)初步分析。有些医学资料由于统计工作量大,可采用非参数统计方法进行初步分析,挑选其中有意义者再进一步分析(包括参数统计内容)。

(7)对于一些特殊情况,如从几个总体所获得的数据,往往难以对其原有总体分布作出估计,在这种情况下可用非参数统计方法。

非参数检验的优缺点:(简答)

非参数统计与传统的参数统计相比,有以下优点:

1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。

2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。

3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。

4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。

5、当推论多达3个以上时,非参数统计方法尤具优越性。

但非参数统计方法也有以下缺点:

1、由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误的概率β要大些。

2、对于大样本,如不采用适当的近似,计算可能变得十分复杂。

注意:

凡符合或经过变换后符合参数检验条件的资料,最好用参数检验。当资料不具备参数检验的条件时,非参数检验是一种有效的分析方法。

配对设计的符号秩和检验方法(简答)

(1)假设:H0:差值总体中位数Md=0

H1:Md≠0

α =0.05

(2)求差值

(3)编秩次:依差值的绝对值从小到大编秩次。编秩次时遇差数等于 0,舍去不计,同时样本例数减1;遇绝对值相等差数,符号相同顺次编秩次,符号相反取平均秩次,且符号相反。

(4)求秩和并确定检验统计量:分别求出正负秩次之和,正秩和以 T+表示,负秩和的绝对值以T-表示。T+及T-之和应等于 n(n+1)/2,任取T+(或 T-)作检验统计量T 。

(5)确定 P 值和作出推断结论:当 n≤50 时,查 T 界值表,得出 P值。若检验统计量T值在上、下界值范围内,其 P值大于表上方相应概率水平;若 T值在上、下界值上若范围外,其 P值小于表上方相应概率水平。

第九章

线性相关系数(名解)

线性相关系数:表示两个变数线性相关方向及程度的统计数或参数。又叫直线相关系数,简称相关系数。,|R|的极值为1,|R|越大(接近1),则直线关系越好。

线性相关系数取值范围(填空)

-1≤r≤1

样本相关系数 r的假设检验(填空题)

(1)r 界值表法;

(2)t检验法。

线性相关或回归应用应注意的问题(简答)

⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。

⑵在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。

⑶直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。

⑷双变量的小样本经 t 检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。

⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。

秩相关的应用适用范围(简答)

秩相关,又称等级相关(rank correlation),是用双变量等级数据作直线相关分析,适用于下列资料:

⒈不服从双变量正态分布而不宜作积差相关分析;

⒉总体分布型未知;

⒊用等级表示的原始数据。

相关与回归的区别与联系(简答)

1.意义:相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。

2.应用:研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。

3.研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。

4.相关系数r与回归系数b :r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。

联系:

1. r与b值可相互换算;

2. r与b正负号一致;

3. r与b的假设检验等价;

4. 回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。

回归系数的估计原则:最小二乘(least squares)原则(填空)

应用直线回归时的注意事项(简答)

应用直线回归时的注意事项:

1.作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种现象间的内在联系有所认识。

2.在进行直线回归分析之前,应绘制散点图,当观察点的分布有直线趋势时,才适宜作直线回归分析,散点图还能提示资料有无异常点。异常点的存在往往对方程中的系数(a、b)的估计产生较大影响。因此,需对异常点进行复查。

3.建立直线回归方程后,要对系数进行假设检验,以确定回归方程有无意义。

4.直线回归方程的适用范围一般以自变量的取值范围为限,避免外延。获得自变量值的手段也应与建立方程时相同。否则会产生较大偏差。

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学复习资料讲解学习

一、名词解释 1.概率:在重复试验中,事件A的频率,随着试验次数的不断增加将愈来愈接近一个常数p,这个常数p就称为事件A出现的概率(probability),记作P(A)或P。 2.抽样误差:由于抽样造成的统计量与参数之间的差别,特点是不能避免的,可用标准误描述其大小。 3.医学参考值范围:是指绝大多数正常人的某指标值都在一定的范围内,其中最常用的是95% 4.总体:是指根据研究目的确定的、同质的全部研究的观测值,即某个随机变量X可能取的值得全体。 4.总体:根据研究目的所确定的同质观察单位的全体。 5.线性回归系数:直线回归方程y=a+bX的系数b称为回归系数,也就是回归直线的斜率(slope),表示X 每增加一个单位,Y 平均改变 b 个单位。 二、填空题 1.统计资料的类型分:计量资料、计数资料、等级资料。 2.统计工作的步骤分为:统计设计、收集资料、整理资料、分析资料。 3.统计表的结构为:标题、标目、线条、数字。 4.可信区间的两个要素是:准确度、精密度。 5.方差分析的应用条件为:①各组样本是相互独立的随机样本 ②来自正态总体③各组总体方差相等,即方差齐性。 6.描述正态分布曲线形态的指标是σ,描述t分布曲线形态的指标是ν。 7.从集中趋势、离散趋势两个方面来描述计量资料的分布特 征。 三、单项选择题(请把正确答案写在下面的表格里,每题2分,共20分) 1.将90名高血压病人随机等分成三组后分别用 A、B 和 C 方 法治疗,以服药前后血压的差值为疗效,欲比较三种方法的效果是否相同,正确的是 C A 作三个差值样本比较的 t 检验 B 作三个差值样本比较的方差分析 C 作配伍组设计资料的方差分析 D 作两两比较的 t 检验 2.某地1952和1998年三种死因别死亡率绘制成统计图,宜用 B A 直条图 B 百分条图 C 圆图 D 直方图 3.下列哪个变量为标准正态变量 B A s xμ - B σ μ - x C x s xμ - D x x σ μ - 4.某医院对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度,最合适描述其集中趋势的指标是 B A 均数 B 几何均数 C 标准差 D中位数 5.配对设计的目的 D A 提高测量精度 B操作方便 C为了可以使用t检验D提高组间可比性 6.测定尿铅含量有甲乙两种方法。现用甲乙两法检测10份相同样品,要比较两法测得的结果有无差别,宜用 A A 配对设计t检验 B 成组设计的t检验 C均数的u检验 D 方差分析 7.应变量Y的离均差平方和划分,可出现 A A SS剩=SS回 B SS总=SS剩 C SS总=SS回 D 以上均可 8.相关系数r与决定系数2r在含义上是有区别的,下面表述中最正确的是 C A r值的大小反映了两个变量之间是否有密切的关系 B r值接近于零,表明两变量之间没有任何关系

生理学重点笔记

前言课前导入 一、考情分析:“鸡肋” 二、科目特点: 面宽、点多、机制多 多思、多练、重理解 三、课程特点和要求: 第一节细胞的基本功能 考纲: 一、细胞膜的物质转运功能 二、细胞的兴奋性和生物电现象 三、骨骼肌的收缩功能 一、细胞膜的物质转运功能 液态镶嵌模型学说——细胞膜是以液态的脂质双分子层为骨架,其中镶嵌着不同生理功能的蛋白质。 (一)单纯扩散 1.概念:脂溶性小分子物质由膜的高浓度区一侧向膜的低浓度区一侧顺浓度差跨膜的转运过程称为单纯扩散。 2.转运物质:除O2、CO2、NO、CO、N2等气体外,还有乙醇、类固醇类激素、尿素等。 3.特点: ①顺浓度差,不耗能; ②无需膜蛋白帮助; ③最终使转运物质在膜两侧的浓度差消失。 (二)易化扩散 是指某些非脂溶性或脂溶性较小的物质,在特殊蛋白的“帮助”下,由膜的高浓度一侧向低浓度一侧扩散的过程。 载体转运 通道转运 1.以载体蛋白为中介的易化扩散(载体转运): ◇例子“血液中的葡萄糖和氨基酸进入到组织细胞” ◇特点: (1)载体蛋白质有结构特异性; (2)饱和现象; (3)竞争性抑制。 2.以通道为中介的易化扩散(通道转运): 主要通过通道蛋白质(简称通道)进行的。其转运物质的能力受膜两侧电位差或化学物质的影响,故有电压门控通道和化学门控通道之分。 ◇特点:(1)相对特异性; (2)无饱和性; (3)有开放、失活、关闭不同状态。 ◇例子:Na+、K+、Ca2+等都经通道转运。 Na+通道阻断剂——河豚毒素 K+通道阻断剂——四乙铵 Ca2+通道阻断剂——异搏定 (三)主动转运 1.概念:主动转运是指细胞通过本身的耗能过程,在细胞膜上特殊蛋白质(泵)的协助下,将某些物质分子或离子经细胞膜逆浓度梯度或电位梯度转运的过程。 2.钠泵 钠泵就是镶嵌于细胞膜上的Na+-K+依赖式ATP酶。 Na+-K+依赖式ATP酶(钠泵) 3.钠泵活动的生理意义: ①由钠泵形成的细胞内高K+和细胞外的高Na+,这是许多代谢反应进行的必需条件。 ②维持细胞正常的渗透压与形态。 ③它能建立起一种势能贮备。这种势能贮备是 可兴奋组织具有兴奋性的基础,这也是营养物质(如葡萄糖、氨基酸)逆浓度差跨膜转运的能量来源。 4.主动转运的类型 (1)原发性主动转运是指直接利用ATP的能量逆浓度差和电位差对离子进行的主动转运过程。 原发性主动转运是人体最重要的物质转运形式,除钠泵外,还有Ca2+泵(或称Ca2+-Mg2+依赖式ATP酶)、H+泵(质子泵)和碘泵等。 (2)继发性主动转运指物质逆浓度梯度转运所需的能 .

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

医学统计学复习题65915

预防医学复习题(统计部分) 复习重点(及简答题) 1. 医学统计学的基本概念 如:总体与样本的联系区别 2. 资料的分类 如:请列举资料的类型并举例说明 3. 定量资料统计描述的指标(集中与离散趋势) 如:定量统计描述指标有哪些? 如:正态分布与偏态分布资料统计描述方法有何区别 4. 定性资料统计描述的指标 5. 正态分布、标准正态分布、t分布的概念、特征、曲线下面积规律 如:正态分布、标准正态分布与t分布的区别联系 6. 小概率事件在医学统计学的应用(P值的含义) 如:P值的含义是什么,对统计结论有何意义 7. 假设检验的基本原理与步骤 8. 四种主要统计假设检验方法及其应用场合 9. 统计表的绘制 选择题 1.样本是总体中: A、任意一部分 B、典型部分 C、有意义的部分 D、有代表性的部分 E、有价值的部分 2、参数是指: A、参与个体数 B、研究个体数 C、总体的统计指标 D、样本的总和 E、样本的统计指标 3、抽样的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 4、脉搏数(次/分)是: A、观察单位 B、数值变量 C、名义变量 D.等级变量 E.研究个体 5、疗效是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 6、统计学常将P≤0.05或P≤0.01的事件称 A、必然事件 B、不可能事件 C、随机事件 D、小概率事件 E、偶然事件7.统计中所说的总体是指:

A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体E根据人群划分的研究对象的全体 8.概率P=0,则表示 A某事件必然发生B某事件必然不发生C某事件发生的可能性很小 D某事件发生的可能性很大E以上均不对 9.总体应该由 A.研究对象组成B.研究变量组成C.研究目的而定D.同质个体组成E.个体组成 10. 在统计学中,参数的含义是 A.变量B.参与研究的数目C.研究样本的统计指标D.总体的统计指标E.与统计研究有关的变量 11.调查某单位科研人员论文发表的情况,统计每人每年的论文发表数应属于A.计数资料 B.计量资料 C.总体 D.个体 E.样本 12.统计学中的小概率事件,下面说法正确的是: A.反复多次观察,绝对不发生的事件 B.在一次观察中,可以认为不会发生的事件 C.发生概率小于0.1的事件 D.发生概率小于0.001的事件 E.发生概率小于0.1的事件 13、统计上所说的样本是指: A、按照研究者要求抽取总体中有意义的部分 B、随意抽取总体中任意部分 C、有意识的抽取总体中有典型部分 D、按照随机原则抽取总体中有代表性部分 E、总体中的每一个个体 14、以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属()资料。 A、计算 B、计数 C、计量 D、等级 E、都对 15、红细胞数是: A、观察单位 B、数值变量 C、名义变量 D、等级变量 E、研究个体 16、某次研究进行随机抽样,测量得到该市120名健康成年男子的血红蛋白数,则本次研究总体为: A.所有成年男子 B.该市所有成年男子 C.该市所有健康成年男子 D.120名该市成年男子 E.120名该市健康成年男子 17、某地区抽样调查1000名成年人的血压值,此资料属于: A、集中型资料 B、数值变量资料 C、无序分类资料 D、有序分类资料 E、离散型资料 18、抽样调查的目的是: A、研究样本统计量 B、研究总体统计量 C、研究典型案例 D、研究误差 E、样本推断总体参数 19、测量身高、体重等指标的原始资料叫: A计数资料 B计量资料 C等级资料 D分类资料E有序分类资料 20、某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗数8 23 6 3 1

生理学重点笔记92900

1内环境:围绕在多细胞机体中细胞周围的体液,即细胞外液。 2稳态:内环境中的各种理化因素保持相对稳定的状态,但现已扩展到泛指体内细胞核分支水平,器官和系统水平到整体水平的各种生理功能活动在神经核体液等因素调节下保持相对稳定的状态。P4 3内环境的稳态具有什么生理意义?机体如何保持内环境相对稳定? 在人和高等动物,内环境的稳态是细胞维持正常生理功能,乃至机体维持正常生命活动的必要条件。内环境的稳态是细胞各种代谢活动所必需,也是兴奋性细胞保持其正常兴奋性和生物电活动正常进行的必要条件。 内环境的稳态是一种动态平衡,稳态的维持是机体自我调节的结果,需要全身各系统和器官的共同参与及互相协调来完成。 4刺激:是指细胞所处的环境因素的变化,任何能量形式的理化因素的改变都可能构成对细胞的刺激。刺激量包括三个参数,刺激的强度,刺激的持续时间和刺激强度对时间的变化率。 5兴奋性:组织细胞具有的接受刺激产生动作电位的能力。 兴奋是动作电位产生的过程。 6去极化:静息电位减小的过程或状态。即在RP的基础上膜内朝着正电荷增加的方向变化。 7超极化:静息电位增大的过程或状态。即在RP的基础上膜内朝着正电荷减少的方向变化,其绝对值大于RP的绝对值。 8阈电位:细胞去极化达到刚刚引发动作电位的临界跨膜电位数值,称阈电位 9局部电位:给予细胞膜一定的去极化刺激时,会引起部分钠通道的激活和内向离子电流,使膜在电紧张电位的基础上进一步去极化,但此时如果外向K电流仍然大于Na内向电流,膜电位又复极到静息电位水平,如此形成的膜电位称之为局部电位。 10动作电位:在静息电位的基础上,给细胞一个适当的刺激,可触发其产生一可传播的膜电位迅速波动。 11复极化:质膜去极化后再向静息电位方向恢复的过程。 12静息电位:静息时,质膜两侧存在着外正内负的电位差。 13简述静息电位的影响因素。 ①,膜外K浓度与膜内K浓度的差值决定Ek,因而细胞外K浓度的改变会显著影响静息电位。②,膜对K和Na的相对通透性可影响静息电位的大小,如果膜对K的通透性相对增大,静息电位也就增大。③,钠-钾汞活动的水平对静息电位也有一定程度的影响。 14简述动作电位的特征 ①动作电位一经出现,其幅度就达到一定的数值,不因刺激的增强而随之增大,动作电位的这一特性称为全或无②动作电位的另一特性就是可传播性。③动作电位的脉冲性,即动作电位有不应期,不能总和。 15常见的物质跨膜转运有以下几种形式: 单纯扩散,是脂溶性小分子物质顺浓度梯度由高浓度向低浓度跨膜转运的过程。这是一种单纯的物理过程。并不消耗能量。是被动扩散。 易化扩散:是指水溶性的小分子物质或离子借助膜蛋白顺着电化学梯度跨膜移动的现象,并不消耗能量。课分为两种类型:①经载体介导的易化扩散,是指由载体蛋白携带,通过其构型改变实现跨膜物质转运。其特点是物质与载体的结合具有特异性,饱和性和竞争性抑制现象②由通道介导的易化扩散,是指由通道蛋白组成跨膜水相通道,介导离子顺浓度/电位梯度迅速跨膜移动。其结构功能状态可随细胞内外各种理化因素的影响而改变,具有开

健康管理师考试重点归纳总结

第一章健康管理概论 健康管理是以现代健康概念(生理、心理和社会适应能力)和新的医学模式(生理、心理、社会)以及中医治未病为指导,通过采用现代医学和现代管理学的理论、技术、方法和手段,对个体或群体整体健康状况及其影响健康的危险因素进行全面检测、评估、有效干预与连续跟踪服务的医学行为及过程。 其目的是以最小投入获取最大健康效益。 健康管理的八大目标: 1.完善健康和福利 2.减少健康危险因素 3.预防疾病高危人群患病 4.易化疾病的早期诊断 5.增加临床效用、效率 6.避免可预防的疾病相关并发症的发生 7.消除或减少无效或不必要的医疗服务 8.对疾病结局作出度量并提供持续的评估和改进 健康管理的特点: 标准化足量化个体化系统化 健康管理的三个基本步骤: 1.了解和掌握健康,开展健康信息收集和健康检查 2.关心和评价健康,开展健康风险评价和健康评估 3.干预和促进健康,开展健康风险干预和健康促进 健康风险评估是手段,健康干预是关键,健康促进是目的 健康管理的五个服务流程: 1.健康调查与健康体检 2.健康评估 3.个人健康咨询 4.个人健康管理后续服务 5.专项的健康和疾病管理服务 健康管理的六个基本策略: 1.生活方式管理 2.需求管理 3.疾病管理 4.灾难性病伤管理 5.残疾管理 6.综合群体健康管理 生活方式管理的特点: 1.以个体为中心,强调个体的健康责任和作用

2.以预防为主,有效整合三级预防 生活方式的四大干预技术: 教育激励训练营销 影响需求管理的四大主要因素: 1.患病率 2.感知到的需要 3.消费者选择偏好 4.健康因素以外的动机(残疾补贴、请病假的能力等) 需求管理的策略: 1.小时电话就诊和健康咨询 2.转诊服务 3.基于互联网的卫生信息数据库 4.健康课堂 5.服务预约 疾病管理的三个特点: 1.目标人群是患有特定疾病的个体 2.不以单个病例和(或)其单次就诊事件为中心,而关注个体或群体连续性的健康状况与 生活质量 3.医疗卫生服务以及干预措施的综合协调至关重要 灾难性病伤管理的五大特点: 1.转诊及时 2.综合考虑各方面因素,制订出适宜的医疗服务计划 3.具备一支包含多种医学专科及综合业务能力的服务队伍,能够有效应对可能出现的多种 医疗服务需要 4.最大程度地帮助病人进行自我管理 5.尽可能使患者及其家人满意 残疾管理的八大目标: 1.防止残疾恶化 2.注重功能性能力 3.设定实际康复和返工的期望值 4.详细说明限制事项和可行事项 5.评估医学和社会心理学因素 6.与病人和雇主进行有效沟通 7.有需要时要考虑复职情况 8.实行循环管理 《健康中国2030规划纲要》 1.强调预防为主,防患未然

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

医学统计学复习提纲

《医学统计学》复习提纲 第二章 统计描述 公式:几何均数 (1)直接法: n n X X X G ...21= 或 )lg (lg )lg ...lg lg ( lg 1211 n X n X X X G n ∑--=+++= (2)加权法: )lg (lg ....lg ...lg lg (lg 12122111 ∑ ∑--=++++++=f X f f f f X f X f X f G k k k 中位数(median ) (1) 直接法: n 为奇数 , 2 ) 1(+=n X M n 为偶数,)(21 12 2 ++= n n X X M (2)频数表法:用于频数表资料。 ∑-+ =)2 (L M f n f i L M 标准差(standard deviation ): n X ∑-= 2 ) (μσ 1 ) (2 --= ∑n X X S 离均差平方和 2 ) (∑-X X 常用SS 或l XX 表示。∑∑∑- =-= =N X X X X l SS XX 2 22 )() ( 直接法: 1 )(2 2 --= ∑∑n n X X S 加权法: 1 )(2 2 -- =∑∑ ∑∑f f fX fX S 1. 常用的相对数指标有哪些?它们的意义和计算上有何不同? 2. 为什么不能以构成比代率?请联系实际加以说明。 率和构成比所说明的问题不同,绝不能以构成比代率。构成比只能说明各组成部分的比重或分布,而不能说明某现象发生的频率或强度。例如:以男性各年龄组高血压分布为例,50~60岁年龄组的高血压病例占52.24%,所占比重最大,60~岁组则只占到6.74%。这是因为60~岁以上受检人数少,造成患病数低于50~60岁组,因而构成比相对较低。但不能认为年龄在50~60岁组的高血压患病率最严重,而60岁以上反而有所减轻。若要比较高血压的患病率,应该计算患病率指标。 3. 应用相对数时应注意哪些问题? 4.简述医学中参考值范围的涵义及制定参考值范围的一般步骤。 医学中常把绝大多数正常人的某指标范围称为该指标的参考值范围,也叫正常值范围。所谓“正常人”不是指完全健康的人,而是指排除了所研究指标的疾病和有关因素的同质人群。 制定参考值范围的一般步骤: (1)定义“正常人”,不同的指标“正常人”的定义也不同。 (2)选定足够数量的正常人作为研究对象。

生理学重点笔记

生理学重点笔记 一绪论 1.生命活动的基本特征: 新陈代谢,兴奋性,生殖。 2. 生命活动与环境的关系:对多细胞机体而言,整体所处的环境叫外环境,而构成机体的细胞所处的环境叫内环境。当机体受到刺激时,机体内部代谢和外部活动,将会发生相应的改变,这种变化称为反应.反应有兴奋和抑制两种形式。 3. 自身调节:心肌细胞的异长自身调节,肾血流量在一定范围内保持恒定的自身调节,小动脉灌注压力增高时血流量并不增高的调节都是自身调节。考生自己注意总结后面各章节学到自身调节。 4. 神经调节是机体功能调节的主要调节形式,特点是反应速度快、作用持续时间短、作用部位准确。 5. 体液调节的特点是作用缓慢、持续时间长、作用部位广泛。 6. 生理功能的反馈控制:负反馈调节的意义在于维持机体内环境的稳态。正反馈的意义在于使生理过程不断加强,直至最终完成生理功能,是一种破坏原先的平衡状态的过程。排便、排尿、射精、分娩、血液凝固、神经细胞产生动作电位时钠通道的开放和钠内流互相促进等生理活动都是正反馈。 考生自己注意总结后面各章节学到的正反馈和负反馈调节。 (二)细胞的基本功能 1. 细胞膜的基本结构-液体镶嵌模型.基本内容 ①基架:液态脂质双分子层; ②蛋白质:具有不同生理功能; ③寡糖和多链糖. 2. 细胞膜的物质转运 ⑴小分子脂溶性物质可以自由通过脂质双分子层,因此,可以在细胞两侧自由扩散,扩散的方向决定于两侧的浓度,它总是从浓度高一侧向浓度低一侧扩散,这种转运方式称单纯扩散。 正常体液因子中仅有O2、CO2、NH3以这种方式跨膜转运,另外,某些小分子药物可以通过单纯扩散转运。 ⑵非脂溶性小分子物质从浓度高向浓度低处转运时不需消耗能量,属于被动转运,但转运依赖细胞膜上特殊结构的"帮助",因此,可以把易化扩散理解成"帮助扩散"。什么结构发挥"帮助"作用呢?--细胞膜蛋白,它既可以作为载体将物质从浓度高处"背"向浓度低处,也可以作为通道,它开放时允许物质通过,它关闭时不允许物质通过。体液中的离子物质是通过通道转运的,而一些有机小分子物质,例如葡萄糖、氨基酸等则依赖载体转运。至于载体与通道转运各有何特点,只需掌握载体转运的特异性较高,存在竞争性抑制现象。 ⑶非脂溶性小分子物质从浓度低向浓度高处转运时需要消耗能量,称为主动转运。体液中的一些离子,如⑶、K+、Ca2+、H+的主动转运依靠细胞膜上相应的离子泵完成。离子泵是一类特殊的膜蛋白,它有相应离子的结合位点,又具有ATP酶的活性,可分解ATP释放能量,并利用能量供自身转运离子,所以离子泵完成的转运称为原发性主动转运。体液中某些小分子有机物,如葡萄糖、氨基酸的主动转运属于继发性主动转运,它依赖离子泵转运相应离子后形成细胞内外的离子浓度差,这时离子从高浓度向低浓度一侧易化扩散的同时将有机小分子从低浓度一侧耦联到高浓度一侧。肠上皮细胞、肾小管上皮细胞吸收葡萄糖属于这种继发性主动转运。⑷出胞和入胞作用是大分子物质或物质团块出入细胞的方式。内分泌细胞分泌激素、神经细胞分泌递质属于出胞作用;上皮细胞、免疫细胞吞噬异物属于入胞作用。

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

医学统计学复习资料

医学统计复习资料 一、名词解释 [1].总体:根据研究目的确定的同质观察单位的全体。是同质所有观察单位的某种变量值的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 [2].样本:从总体中随机抽取部分观察单位,其实测值的集合。 [3].计量资料:又称定量资料或数值变量资料。为观测每个观察单位的某项指标的大小,而获得的资料。其变量值是定量的,表现为数值大小,一般有度量衡单位。根据其观测值取值是否连续,又可分为连续型或离散型两类。 [4].计数资料:又称定性资料或者无序分类变量资料,亦称名义变量资料,是将观察单位按照某种属性或类别分组计数,分组汇总各组观察单位数后得到的资料。其变量值是定性的,表现为互不相容的性或类别。分两种情形:(1)二分类:两类间相互对立,互不相容。(2)多分类:各类间互不相容。 [5].等级资料:又称半定量资料或有序分类变量资料,是将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后而得到的资料。其变量值具有半定量性质,表现为等级大 小或属性程度。 [6].随机误差(偶然误差):是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起,观察值不按方向性和系统性变化,在大量重复测量中,它可呈现或大或小,或正或负的规律性变化。 [7].概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P (A),P (A)越大,说明A事件发生的可能性越大。0< P (A)< 1。频率:在相同的条件下,独 立重复做n次试验,事件A出现了 m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时 P (A) = m/n 。 [8].平均数:描述一组变量值的集中位置或水平。常用的平均数有算术平均数、几何平均数和中位数。 [9].算术均数(arithmetic mean )描述一组数据在数量上的平均水平。总体均数用卩表示,样本均数用X表示。 [10].几何均数(geometric mean )用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 [11].中位数(median ) Md将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 [12].方差(varianee ):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。 [13].标准差(standard deviation )是方差的正平方根,使用的量纲与原量纲相同,适用于近似正 态分布的资料,大样本、小样本均可,最为常用。 [14].变异系数(coefficient of variation )用于观察指标单位不同或均数相差较大时两组资料变异 程度的比较。用CV表示。计算:标准差/均数*100%。 [15].正态分布:正态分布又称高斯分布,是一种很重要的连续型分布,应用很广。若指标 X的频率 分布曲线对应于数学上的正态分布曲线,则称该指标服从正态分布。(曲线下面积和分布规律) [16].标准误及X s :通常将样本统计量的标准差称为标准误。许多样本均数的标准差X s称为均数 的标准误(standard error of mean ,SEM ),它反映了样本均数间的离散程度,也反映了样本均 数与总体均数的差异,说明均数抽样误差的大小。 [17].可信区间:按预先给定的概率确定的包含未知总体参数的可能围。该围称为总体参数的可信区 间(con fide nee in terval , Cl)。它的确切含义是:可信区间包含总体参数的可能性是1- a ,而

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

人体解剖生理学重点笔记

第一章绪论 第二节生理学研究的基本范畴 一、机体的内环境和稳态 1、细胞直接生存的环境,即细胞外液被称为机体的内环境。 2、机体内环境的各种理化性质保持相对稳定的状态称为稳态。 二、生理功能的调节 生理功能的调节形式有三种,即神经调节,体液调节和自身调节。 1、神经调节。 神经调节的基本过程是反射。 反射是指在中枢神经系统的参与下,机体对内、外环境的变化(刺激)所作出的规律性反应。反射活动的结构基础是反射弧。 反射弧由 5 个部分组成,即感受器、传入神经、神经中枢、传出神经和效应器。 三、体内的反馈控制系统 1、负反馈如果反馈信号对控制部分作用的结果使输出变量向原先活动相反的方向变化则称为负反馈。 2、正反馈如果反馈信号对控制部分作用的结果是使输出变量在原先活动的同一方向上进一步加强则称为正反馈 第三章 第一节细胞膜的物质转运功能 一、被动转运(使膜两侧物质均匀分布)被动转运是指分子或离子顺着浓度梯度或电化学梯度所进行的跨细胞膜的转运,不需要额外消耗能量,转运结果是达到膜两侧物质的浓度或电位的平衡。(一)、单纯扩散 1、物质:脂溶性高、分子小,不带电荷的非极性分子。如O 2、N2、CO2 、乙醇、尿素以 及一些小分子激素或药物。 2、特点:不需要膜上特殊蛋白质的帮助。推动物质转运的力量是物质的浓度梯度。物质转运的方向 是从高浓度向低浓度转运,因而不需要额外消耗能量。转运的结果是物质浓度在细胞膜的 两侧达到平衡。 (二)、易化扩散。(膜蛋白介导)一些单纯扩散不能实现的非脂溶性的较大的分子或带电离子的跨膜转运需要借助于细胞膜上特殊蛋白质的帮助。由细胞膜上蛋白质帮助所实现的物质跨膜扩散称为易化扩散。 1、经载体的异化扩散。(离子,分子,选择性高)载体指镶嵌在细胞膜上的一类具有特殊的物质转运功能的蛋白质。物质:葡萄糖和氨基酸。 特征:饱和现象、立体构想特异性、竞争性抑制。 2、经通道的异化扩散。(速度快,被动) 特征:离子选择性 门控特性:电压门控通道、化学门控通道和机械门控通道。 二、主动转运(使膜两侧物质更不均匀)主动转运是通过细胞的耗能或称,将物质分子或离子逆着浓度梯度或电化学梯度所进行的跨膜转运。 (一)、原发主动转运 原发性主动转运是由细胞膜或内膜上具有ATP酶活性的特殊泵蛋白,直接水解ATP提 供能量而将一种或多种物质逆着各自的浓度梯度或电化学梯度进行跨膜转运。 钠钾泵。(外Na+内K+) 每分解一份子的ATP可逆着浓度梯度将3个Na+移出胞外,同时将2个K+移入胞内

医学统计学重点图表总结

描述内容 指 标 意 义 适 用 场 合 平均水平 均 数 个体的平均值 对称分布 几何均数 平均倍数 取对数后对称分布 中 位 数 位次居中的观察值 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 众 数 频数最多的观察值 不拘分布形式,概略分析 调和均数 基于倒数变换的平均值 正偏峰分布资料 变 异 度 全 距 观察值取值范围 不拘分布形式,概略分析 标 准 差 (方 差) 观察值平均离开均数的程度 对称分布,特别是正态分布资料 四分位数间距 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开口资料;④分布不明 变异系数 标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但数量级相差悬殊的变量间比较 4. 常用统计图有哪些?分别适用于什么分析目的? 常用统计图的适用资料及实施方法 图 形 适 用 资 料 实 施 方 法 条 图 组间数量对比 用直条高度表示数量大小 直 方 图 定量资料的分布 用直条的面积表示各组段的频数或频率 百分条图 构成比 用直条分段的长度表示全体中各部分的构成比 饼 图 构成比 用圆饼的扇形面积表示全体中各部分的构成比 线 图 定量资料数值变动 线条位于横、纵坐标均为算术尺度的坐标系 半对数线图 定量资料发展速度 线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标系 散 点 图 双变量间的关联 点的密集程度和形成的趋势,表示两现象间的相关关系 箱 式 图 定量资料取值范围 用箱体、线条标志四分位数间距及中位数、全距的位置 茎 叶 图 定量资料的分布 用茎表示组段的设置情形,叶片为个体值,叶长为频数 定性资料统计描述常用的统计指标及其适用场合 指标 计算公式 适用场合 频率 n/N 估计总体中某一结局发生的概率 频率分布 n 1/N ,n 2/N,…..,n k /N 估计总体中所有可能结局发生的概率 强度 阳性人数/总观察人时数 估计总体中单位时间内某一结局发生的概率 比 A/B 估计两个指标的相对大小 4.常用参考值范围的制定? 参考值范 围(%) 正态分布法 百分位数法 双侧 单侧 双侧 单侧 下限 上限 下限 上限 90 S X 64.1± S X 1.28- S X 1.28+ P 5~P 95 P 10 P 90 95 S X 96.1± S X 64.1- S X 64.1+ P 2.5~P 97.5 P 5 P 95 99 S X 58.2± S X 2.33- S X 2.33+ P 0.5~P 99.5 P 1 P 99

相关文档
最新文档