医学统计学知识点梳理

合集下载

医学统计学知识点

医学统计学知识点

实用标准文案精彩文档第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。

2、研究对象:具有不确定性结果的事物。

3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。

4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。

5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。

6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。

变异,指总体内的个体间存在的、绝对的差异。

统计学通过对变异的研究来探索事物。

(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。

变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。

(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。

包括二分类、无序多分类。

(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。

统计方法的选用与数据类型有密切的关系。

(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。

样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。

抽样,是从研究总体中随机抽取部分有代表性的观察单位。

参数,指描述总体特征的指标。

统计量,指描述样本特征的指标。

(4)误差误差,指观测值与真实值、统计量与参数之间的差别。

可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。

随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。

抽样误差,是抽样引起的统计量与参数间的差异。

医学统计学知识点

医学统计学知识点

医学统计学知识点 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】第一章绪论1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。

2、研究对象:具有不确定性结果的事物。

3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。

4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。

5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。

6、医学统计学中的基本概念(1) 同质与变异同质,指根据研究目的所确定的观察单位其性质应大致相同。

变异,指总体内的个体间存在的、绝对的差异。

统计学通过对变异的研究来探索事物。

(2) 变量与数据类型变量,是反映实验或观察对象生理、生化、解剖等特征的指标。

变量的观测值,称为数据分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。

(如身高、体重、血压、温度等)定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。

包括二分类、无序多分类。

(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等)有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。

统计方法的选用与数据类型有密切的关系。

(3)总体与样本总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。

样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。

抽样,是从研究总体中随机抽取部分有代表性的观察单位。

参数,指描述总体特征的指标。

统计量,指描述样本特征的指标。

(4)误差误差,指观测值与真实值、统计量与参数之间的差别。

可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。

医科大学医学统计学重点知识总结

医科大学医学统计学重点知识总结

第一章绪论1、统计学的定义:统计学研究数据的收集、整理、分析的一门学科。

医学统计学:医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理、方法,研究医学资料的搜集、整理、分析和推断的一门科学。

2、医学统计研究三个步骤:研究设计、资料分析、结论3、(必考的)几个概念:(1)同质:性质相同异质:性质不同观察单位间的同质性是进行研究的前提同质是相对的(不同研究中或同一研究中不同观察指标对观察对象的同质性的要求不同)(2)个体变异:同质个体间的差异。

变异的两个方面:不同观察单位(个体)间的差别;同一个体在不同阶段的差别(重复测量)个体变异是普遍存在的;个体变异是有规律的。

注意:由于个体变异的存在,同质个体指标的取值会存在差异!(例:体温波动)(3)总体:按研究目的所确定的同质研究对象的全体。

有限总体:有时间、空间的概念,观察单位有限无限总体:无时间、空间的概念(例:某种治疗措施的效果,就包括接受这种治疗措施的所有病人过去、现在、未来,因而观察单位无限)(4)个体:组成总体的基本单位。

样本:从研究总体中随机抽取具有代表性的部分观察单位随机性的三个体现:抽样随机、分组随机、试验顺序随机(5)随机变量:观察对象个体的特征或测量的结果观察结果在一定范围内以一定的概率分布随机取值的变量,表示随机现象。

在一定条件下,并不总是出现相同结果变量值:个体观察指标具体取值(6)总体参数:总体的统计指标或特征值固有的、不变的,但往往是未知的(7)样本统计量:由样本所算出的统计指标或特征值已知的,且随着试验的不同而不同,但分布是有规律的(8)样本含量:样本中包含个体的数量(9)频率f=m/n,f的值随n的增大接近常数p,概率P(A)=p即:频率为一变量,是样本统计量;概率为常数,是一总体参数小概率事件:概率小于等于0.05小概率原理:小概率事件在一次试验中是不会发生的(10)抽样误差:两个表现:样本统计量与总体参数间的差别;不同样本统计量间的差别两个原因:个体变异;抽样过程抽样误差不可避免,但是有规律。

新版医学统计学知识点归纳总结

新版医学统计学知识点归纳总结

新版医学统计学知识点归纳总结医学统计学是医学研究中不可或缺的一部分,它涉及到数据的收集、分析和解释,帮助医学工作者从大量数据中提取有价值的信息。

以下是新版医学统计学的知识点归纳总结:1. 研究设计:研究设计是统计分析的前提,包括观察性研究和实验性研究。

观察性研究如队列研究、病例对照研究,而实验性研究如随机对照试验(RCT)。

2. 数据类型:医学统计学中的数据可分为定性数据和定量数据。

定性数据如性别、血型,定量数据如血压、体重。

3. 描述性统计:描述性统计用于描述数据集的特征,包括集中趋势(均值、中位数、众数)和离散程度(方差、标准差、极差)。

4. 概率分布:在统计学中,概率分布描述了随机变量取值的概率。

常见的分布有正态分布、二项分布和泊松分布。

5. 假设检验:假设检验是统计推断的核心,用于判断样本数据是否支持某个假设。

常见的检验方法有t检验、卡方检验和F检验。

6. 置信区间:置信区间提供了一个范围,用以估计总体参数的可能值。

95%的置信区间意味着有95%的把握认为总体参数落在这个区间内。

7. 回归分析:回归分析用于研究一个或多个自变量对因变量的影响。

简单线性回归和多元线性回归是常见的回归分析方法。

8. 生存分析:生存分析关注个体生存时间的分布和相关因素,常用于肿瘤学和流行病学研究。

Kaplan-Meier估计和Cox比例风险模型是生存分析中的重要工具。

9. 诊断试验评价:诊断试验评价涉及敏感性、特异性、阳性预测值和阴性预测值等指标,用于评估诊断方法的准确性。

10. 样本量计算:样本量计算是研究设计的重要环节,它决定了研究的可行性和结果的可靠性。

样本量计算需要考虑效应大小、显著性水平和检验力。

11. 多变量分析:多变量分析用于同时考虑多个变量对结果的影响,如多元回归分析和判别分析。

12. 统计软件的应用:统计软件如SPSS、SAS和R在医学统计分析中扮演着重要角色,它们提供了数据处理和统计分析的功能。

医学统计学重点重点知识总结

医学统计学重点重点知识总结

医学统计学重点选择1.几何均数:平均血清抗体滴度(如P9例2.4)2.正态分布:横轴为μ(界值、面积)2.5% I1.962.5%单侧双侧90%: 1.6495%: 1.64 1.9699%: 2.583.P值与α的关系,α是人为规定的,它们之间没有关系;P值f,Qt(X)4.方差分析自由度V的计算,V总=nT;V组间=组数(k)-1;V组间=V总-V组间5.理论秩和(n(n+1)∕2),实际秩和(通过平均秩次算)6.可信区间的正确应用:总体参数有95%的可能落在该区间内(X);有95%的总体参数在该区间内(X);该区间包含95%的总体参数(X);该区间有95%的可能包含总体参数。

(X);这个区间的可信度为95%(√);总体参数只有一个,要么在区间内,要么不在7.相关系数与回归系数:相关系数为0,两个变量之间没有相关关系(X);回归系数t,相关系数t(X);(要做假设检验)二、名解1.参考值范围:根据正常人的数据估计绝大多数的正常人所在的范围2.区间估计(可信区间):按一定的概率或可信度(bα)用一个区间估计总体参数所在范围。

这个范围称作可信度为1-a的可信区间,又称置信区间。

3.P值:拒绝HO时所冒的风险(或“作出拒绝HO而接受H1”结论时冒了P风险)4.a(第一类错误):HO真实时被拒绝(或HO真实时,拒绝H0,接受H1)5.β(第二类错误):HO不真实时不拒绝(或HO不真实时,不拒绝HO)1-β检验效能:对真实的H1做肯定结论之概率6.秩次:是指全部观察值按某种顺序排列的位序;7.秩和:同组秩次之和8.剩余标准差:扣除了X的影响后,Y方面的变异;引进回归方程后,Y方面的变异。

三、简答1.假设检验与可信区间的联系与区别分辨多个样本是否分别属于不同的总体,并对总体作出适当的结论。

分辨一个样本是否属于某特定总体等。

区间估计(可信区间):按一定的概率或可信度(1-a)用一个区间估计总体参数所在范围。

医学统计学重点知识梳理

医学统计学重点知识梳理

重点知识梳理第一章1.统计学(statistics)是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。

2.总体(population)与样本(sample)任何统计研究都必须首先确定观察单位亦称个体(individual)总体(population)是根据研究目的确定的同质观察单位的全体,或者说,是同质的所有观察单位某种观察值(变量值)的集合。

总体又分为有限总体(finite population)和无限总体(infinite population),有限总体是指在某特定的时间与空间范围内,同质研究对象的所有观察单位的某变量值的个数为有限个无限总体是抽象的,无时间和空间的限制,观察单位数是无限的3.统计学的研究方法(1)大量观察法对所研究事物的全部或足够数量进行观察的方法。

依据是大数定律(2)综合指标法从数量方面对现象总体特征的概括说明(3)统计推断法在一定的置信度下,根据样本资料的特征对总体特征作出估计和预测的方法第二章1.方差(variance):为了全面考虑观察值的变异情况,克服全距和四分位数间距的缺点,需计算总体中每个观察值X与总体均数的差值(X-μ),称之为离均差。

2.标准差(standard deviation):方差的度量单位是原度量单位的平方,将方差开方后与原数据的度量单位相同。

标准差大,表示观察值的变异度大;反之,标准差小,表示观察值的变异度小。

3.变异系数(coefficient of variation,简记为CV):常用于比较度量单位不同或均数相差悬殊的两组或多组资料的变异度。

第三章1.正态分布(Normal distribution),也称“常态分布”,又名高斯分布。

是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。

正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形,因此人们又经常称之为钟形曲线。

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点

(完整版)医学统计学复习要点第⼀章绪论1、数据/资料的分类:①、计量资料,⼜称定量资料或者数值变量;为观测每个观察单位某项治疗的⼤⼩⽽获得的资料。

②、计数资料,⼜称定性资料或者⽆序分类变量;为将观察单位按照某种属性或者类别分组计数,分组汇总各组观察单位数后⽽得到的资料。

③、等级资料,⼜称半定量资料或者有序分类变量。

为将观察单位按某种属性的不同程度分成等级后分组计数,分类汇总各组观察单位数后⽽得到的资料。

2、统计学常⽤基本概念:①、统计学(statistics)是关于数据的科学与艺术,包括设计、搜集、整理、分析和表达等步骤,从数据中提炼新的有科学价值的信息。

②、总体(population)指的是根据研究⽬的⽽确定的同质观察单位的全体。

③、医学统计学(medical statistics):⽤统计学的原理和⽅法处理医学资料中的同质性和变异性的科学和艺术,通过⼀定数量的观察、对⽐、分析,揭⽰那些困惑费解的医学问题背后的规律性。

④、样本(sample):指的是从总体中随机抽取的部分观察单位。

⑤、变量(variable):对观察单位某项特征进⾏测量或者观察,这种特征称为变量。

⑥、频率(frequency):指的是样本的实际发⽣率。

⑦、概率(probability):指的是随机事件发⽣的可能性⼤⼩。

⽤⼤写的P表⽰。

3、统计⼯作的基本步骤:①、统计设计:包括对资料的收集、整理和分析全过程的设想与安排;②、收集资料:采取措施取得准确可靠的原始数据;③、整理资料:将原始数据净化、系统化和条理化;④、分析资料:包括统计描述和统计推断两个⽅⾯。

第⼆章计量资料的统计描述1. 频数表的编制⽅法,频数分布的类型及频数表的⽤途①、求极差(range):也称全距,即最⼤值和最⼩值之差,记作R;②、确定组段数和组距,组段数通常取10-15组;③、根据组距写出组段,每个组段的下限为L,上限为U,变量X值得归组统⼀定为L≤X<U,最后⼀组包括下限。

医学统计知识点整理

医学统计知识点整理

医学统计学知识点整理第一节统计学中基本概念一、同质与变异同质:统计研究中,给观察单位规定一些相同的因素情况。

如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。

变异:同质的基础上个体间的差异。

“同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的μ.δ.πX.S.p1.2.变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。

一、数值变量资料又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。

表现为数值大小,带有度、量、衡单位。

如身高(cm)、体重(kg)、血红蛋白(g)等。

二、无序分类变量资料又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。

分类:二分类:+ -;有效,无效;多分类:ABO血型系统特点:没有度量衡单位,多为间断性资料【例题单选】某地A、B、O、AB血型人数分布的数据资料是( )A.定量资料B.计量资料C.计数资料D.等级资料分组统计描述:是利用统计指标、统计表和统计图相结合来描述样本资料的数量特征及分布规律。

统计推断:是使用样本信息来推断总体特征。

统计推断包括区间估计和假设检验。

第四节统计表与统计图★一、统计表统计表的基本结构与要求标题:高度概括表的主要内容,时间、地点、研究内容,位于表的上方,居中摆放,左侧加表的序号。

标目:横标目和纵标目。

线条:通常采用三线表和四线表的形式。

没有竖线或斜线。

数字:表内数字一律用阿拉伯数字。

同一指标,小数位数应一致,位次对齐。

无数字用“—”表示。

暂缺用“…”表示。

“0”为确切值。

备注:位于表的下面,通常是对表内数字的注解和说明,必要时可以用“*”等标出。

一张统计表的备注不宜太多。

二、制表原则1.(7理分布。

【例题填空】描述某地十年间结核病死亡率的变化趋势宜绘制_________图。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学知识点梳理 Revised as of 23 November 2020医学统计学知识点梳理医学统计学:是用统计学原理和方法研究生物医学问题的一门学科。

他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达。

统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。

统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征:①参数估计:用样本的指标去推断总体相应的指标②假设检验:由样本的差异推断总体之间是否可能存在的差异同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。

总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。

总体可分为有限总体和无限总体。

总体中的所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。

样本应具有代表性。

所谓有代表性的样本,是指用随机抽样方法获得的样本。

随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。

随机抽样是样本具有代表性的保证。

变异:在自然状态下,个体间测量结果的差异称为变异(variation)。

变异是生物医学研究领域普遍存在的现象。

严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。

(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。

计量资料亦称定量资料、测量资料。

.其变量值是定量的,表现为数值大小,一般有度量衡单位。

(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。

计数资料亦称定性资料或分类资料。

其观察值是定性的,表现为互不相容的类别或属性。

(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。

0﹤P (A)﹤1。

频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。

当试验重复很多次时P(A)= m/n。

随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。

它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。

误差变量一般服从正态分布。

随机误差可以通过统计处理来估计。

抽样误差(sampling error )是指样本统计量与总体参数的差别。

在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。

系统误差可以通过实验设计和完善技术措施来消除或使之减少。

随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。

随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。

参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。

总体参数是固定的常数。

多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。

统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。

样本统计量可用来估计总体参数。

总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。

算术均数(arithmetic mean)描述一组数据在数量上的平均水平。

总体均数用μ表示,样本均数用X 表示。

几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。

记为G。

中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。

反映一批观察值在位次上的平均水平。

极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。

百分位数的另一个重要用途是确定医学参考值范围。

四分位数间距(inter-quartile range)是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。

方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。

用CV 表示。

计算:标准差/均数*100%统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statistical inference)。

抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(sampling error)。

标准误及X s :通常将样本统计量的标准差称为标准误(standard error of mean,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。

可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。

该范围称为总体参数的可信区间(confidence interval,CI)。

参数估计:指用样本指标值(统计量)估计总体指标值(参数)。

假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。

I?型错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用α表示。

II?型错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用β表示。

检验效能:1-β称为检验效能(power of test),它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。

率(rate)又称频率指标,说明一定时期内某现象发生的频率或强度。

计算公式为:发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率(%)、千分率(‰)等。

构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。

计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。

比(ratio)又称相对比,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。

计算公式为:A/B ,表示方式有:倍数或分数等。

非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。

参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计(parametric statistics)秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank)。

秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量。

直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。

直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。

回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用b 表示,b 的统计意义为X每增(减)一个单位时,Y平均改变b 个单位。

相关系数r:用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。

二相关概念医学科研数据统计分析大致分以下4个步骤。

数据整理统计描述统计推断结果表达频数表的制作•求全距R•找到资料中的最大值A和最小值B•计算全距R,•划分组段•确定组数•确定组距•确定各组段的上下限•下限(lower limit)上限(upper limit)•第一组段,其下限可取小于最小观察值得数•半开半闭区间 [ -- ,-- )•画表频数分布表和频数分布图的用途•揭示频数分布的特征•集中趋势•集中趋势是指一组数据向某一个位置聚集或集中的倾向。

•离散趋势•离散趋势反映的是一组数据的分散性和变异度,即各个数据离开集中位置的程度。

•便于观察数据的分布类型•正态分布?•集中趋势的指标:均数•离散趋势的指标:标准差•偏态分布•集中趋势的指标:中位数•离散趋势的指标:四分位间距?2.结合均值与正态分布的规律,估计参考值的范围。

变异系数(coefficient of variation)适用范围1观察指标单位不同,如身高、体重——不同单位资料2均数相差悬殊变异系数的特点及相应的用途•没有单位n 反映标准差占均数的百分比或标准差是均数的几倍n 可用来比较度量衡单位不同的资料的变异度•不受平均水平的影响n 反映的是以均数为基数的相对变异的大小n 比较均数相差悬殊的资料的变异度变异指标小结1.极差较粗,适合于任何分布2.标准差与均数的单位相同,最常用,适合于近似正态分布3.变异系数主要用于单位不同或均数相差悬殊资料4.平均指标和变异指标分别反映资料的不同特征,常配套使用如——正态分布:均数、标准差;偏态分布:中位数、四分位间距相对数使用应注意的问题1.根据需要正确选择相对数,常见错误是以构成比代率。

2.分母应当够大。

分母小于20时可靠性较差。

如果分母太小,宜用绝对数表示。

3.计算观察单位数不等的几个率的平均率时,不能将几个率直接相加求平均率。

相关文档
最新文档