医学统计学基本概念[资料]

合集下载

医学统计学考试重点整理

医学统计学考试重点整理

一、基本概念1.总体与样本总体:所有同质观察单位某种观察值(即变量值)的全体样本:是总体中抽取部分观察单位的观察值的集合2.普查与抽样调查普查:就是全面调查,即调查目标总体中全部观察对象抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查3.参数与统计量参数:总体的某些数值特征统计量:根据样本算得的某些数值特征4.Ⅰ型与Ⅱ型错误假设检验的结论真实情况拒绝H0不拒绝H0H0正确Ⅰ型错误(ɑ)推断正确(1−ɑ)H0不正确推断正确(1−β) Ⅱ型错误(β)Ⅰ型错误(ɑ错误):H0为真时却被拒绝,弃真错误Ⅱ型错误(β错误): H0为假时却被接受,取伪错误5.随机化原则与安慰剂对照随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。

(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。

安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。

(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。

安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应)6.误差与标准误(区分率与均数)㈠均数抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。

标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n㈡样本率率的抽样误差:样本率p和总体率π的差异率的标准误:样本率的标准差,公式为σp=√π(1-π)/n7。

方差分析方差分析:又称F检验,是通过对数据变异按设计类型的不同,分解成两个或多个样本均数所代表总体均数是否有差别的一种统计学方法。

医学统计学基本概念和步骤

医学统计学基本概念和步骤
1999年中国农村死亡原因构成 (%)
消化系病 4%
其它 14%
恶性肿瘤 18%
损伤中毒 11%
呼吸系病 23%
心脏病 12%
脑血管病 18%
资料仅供参考,不当之处,请联系改正。
二、医学统计学与流行病学的关系
相同点:研究工具学(研究方法学)
不同点:流行病学—“三间分布”、偏倚、专业 统计学——“抽样误差”、基础
例如:同性别、同年龄、同地区、同体重儿童 的血压有高有低——血压的变异。
同样的疾病、同样的治疗方案,但疗效可能不 同!
第二节
资料仅供参考,不当之处,请联系改正。
常用统计基本概念
二、总体和样本
总体(population)—根据研究目的所确定 的全部同质研究个体。确切地说,是性质 相同的所有观察对象某项变量值的集合。
方法研究数据的收集、整理、分析和推断的 一门学科。它在不同领域的应用,就形成不 同的统计学。
资料仅供参考,不当之处,请联系改正。
统计学
理论基础
研究对象
概率论 数理统计
有变异的 事物
资料仅供参考,不当之处,请联系改正。
一、医学统计学的定义和内容
2、统计学的任务
●进行统计设计、收集、整理资料 ●对所收集资料进行统计描述和处理 ●对统计处理的结果进行分析和解释
P=0,事件不可能发生; P=1,事件必然发生; P→0,事件发生的可能性愈小; P→1,事件发生的可能性愈大
资料仅供参考,不当之处,请联系改正。
随机事件(random event):可以发生也可 以不发生,可以这样发生也可以那样发 生的事件。亦称偶然事件。
其 0<P<1
资料仅供参考,不当之处,请联系改正。

《医学统计学》之医学统计学绪论

《医学统计学》之医学统计学绪论
利用样本数据估计总体参数,如总体均数、总体率等。
研究生存时间、生存率等指标,分析影响因素和预测模型。
多元统计分析
如因子分析、聚类分析、主成分分析等,适用于复杂数据结构的研究。
生存分析
适用于长期观察和随访研究的数据分析。
利用多种统计方法综合分析多个变量之间的关系。
01
02
03
04
05
06
05
医学统计学的报告与解读
置信区间
VS
在解释研究结果时,应注意结果的统计学显著性和实际意义。如果观察到的结果具有统计学显著性,但无实际意义或价值较小,则不应过度强调或夸大其效果。同时,应注意结果的稳健性和可重复性,以评估结果的可靠性和可信度。
研究结果的报告
在报告研究结果时,应遵循准确、客观、完整和可理解的原则。结果应清晰明了地呈现,并附有适当的解释和说明。同时,应注意结果的伦理和法律问题,保护受试者的隐私和权益,避免误导读者或造成不必要的困扰。
《医学统计学》之医学统计学绪论
目录
contents
医学统计学简介医学统计学的基本概念医学统计学的应用领域医学统计学的数据处理与分析方法医学统计学的报告与解读医学统计学的挑战与未来发展
01
医学统计学简介
医学统计学是一门应用数理统计学的原理和方法,对医学实验和调查数据进行整理、分析和推断的学科。它具有数学性质和应用性质,是医学领域中不可或缺的工具。
生物统计学在药物研发过程中起到关键作用,如新药临床试验的设计与分析、药物疗效的评估等。
03
02
01
04
医学统计学的数据处理与分析方法
实验室研究:通过实验手段获取有关生物标志物、病理生理等方面的数据。
去除或纠正错误、异常或不完整的数据。

课堂笔记——医学统计学

课堂笔记——医学统计学

第一章医学统计中的基本概念一、医学统计工作的内容:实验设计(experiment design)、收集资料(collecting data)、整理资料(sorting data)和分析资料(analyzing data)二、变异:医学研究的对象是有机的生命体,其功能十分复杂,不同的个体在相同的条件下,对外界环境因素可以发生不同的反应,这种现象称为个体差异或称为变异三、总体(population)和样本(sample):总体是同质的个体所构成的全体。

从总体中抽取部分个体的过程称为抽样,所抽的部分称为样本,在一个样本里含有的个体数可以不同,样本包含的个体数目称为样本容量。

四、样本的特性:代表性(representation)——要求样本能够充分反应总体的特征;随机性(randomization)——需要保证总体中的每个个体都有相同的几率被抽做样本;可靠性(reliability)——实验的结果要具有可重复性,即由科研课题的样本得出的结果所推测总体的结论有较大的可信度;可比性(comparability)——指处理组(临床设计中称为治疗组)与对照组之间,除处理因素不同外,其他可能影响实验结果的因素要求基本齐同,也称为齐同对比原则。

五、误差:①系统误差(system error)②③六、概率(probability):是描述某一件事发生的可能性大小的一个量度。

习惯将P≤0.05或P≤0.01的事件称为小概率事件第二章集中趋势的统计描述一、频数表(frequency table):①概念:一种格式的统计表,即同时列出观察指标的可能取值区间及其在各区间内出现的频数。

由于这种资料的表达方式较完整地体现了观察值的分布规律,所以也称为频数分布表。

②制作图标的步骤:确定组数、确定组距、确定组段、对各组段计数及手工编制划记表。

二、直方图(histogram):①概念:直方图是以垂直条段代表频数分布的一种图形,条段的高度代表各组的频数,由纵轴标度;各组的组限由横轴标度,条段的宽度表示组距。

医学统计学基本概念

医学统计学基本概念

资料仅供参考,不当之处,请联系改正。
伪造统计数据违反科学道德
➢ 1976年New Science 杂志关于科研舞弊 行为的调查
(1)74%的调查表反映有不正当修改数据 的情况
(2)17%拼凑实验结果 (3)7%凭空捏造数据 (4)2%故意曲解结果
资料仅供参考,不当之处,请联系改正。
第二节 统计工作的基本内容 (步骤)
对“证据”解释的苛刻要求,使医学研究人员认识 到:要使自己的研究结果成为被同行认可的科学证 据,必须在研究工作中采用科学方法。
统计学在医学研究中的运用越来越广泛,越来越深 入。在医学研究报告和医学期刊中,一些研究结果 直接用数据和图表表示,并且充满了均数(X )和 标准差( S )、随机分组、值等统计专业术语。
医学统计学发展:
1. 法国数学家Laplace提出医学是概率论应用 的一个重要领域。
2. 19世纪,Louis 把统计学引入到医学,强 调用数据表达疗效
3. Karl Pearson是现在统计学之父。 4. 另一位统计学奠基人Fisher ,临床随机对
照实验
资料仅供参考,不当之处,请联系改正。
为什么要学习统计学
资料仅供参考,不当之处,请联系改正。
三、整理资料
对资料进行整理、清理、核实、查对使资 料系统化、条理化便于计算和分析。
1. 原始资料的检查与核对:数据的取值范围 检错和数据间逻辑关系检错
2. 资料的分组设计与归纳汇总:质量分组和 数量分组和编制频数分布表。
常用软件:Excel、SPSS、SAS
总有效率达到百分之90%,而不说治疗两例有效 两种药物治疗某种疾病,甲法治愈20例,乙法治
愈40例,是否说明乙法就优于甲法 上课点名,点三次,某同学被抓两次 小说

医学统计学基础

医学统计学基础

医学统计学基础医学统计学是一门研究医学中数据的收集、分析和解释的科学。

它在医学研究中扮演着至关重要的角色,并且对医学实践和决策具有深远影响。

本文将介绍医学统计学的基本概念、常用的统计方法以及其在医学领域的应用。

一、基本概念1.1 总体与样本在医学统计学中,我们常常需要研究某个感兴趣的群体,这个群体被称为总体。

总体可以是人群中的所有个体,也可以是其他单位,如医院、地区等。

由于总体往往很大,我们无法对其进行全面的研究,因此我们从总体中选取一部分个体进行研究,这部分个体称为样本。

1.2 数据类型医学研究中常见的数据类型包括定性数据和定量数据。

定性数据是描述性质或属性的数据,如性别、病情分类等;定量数据是可度量或计数的数据,如年龄、生命体征等。

了解数据类型对选择合适的统计方法至关重要。

1.3 描述统计学与推断统计学描述统计学用于总结和描述已有数据的特征,如均值、中位数、标准差等。

推断统计学则是通过对样本进行分析,推断总体的特征,并对结果进行估计和推断。

推断统计学可通过假设检验和置信区间来实现。

二、常用统计方法2.1 均值与标准差均值是用来描述一组数据集中趋势的指标,一般用于定量数据。

标准差则衡量了数据的离散程度,即数据的波动情况。

2.2 相关分析相关分析用于研究两个变量之间的关系。

通过计算相关系数,可以了解两个变量是正相关、负相关还是无关。

2.3 生存分析生存分析是用来研究事件发生和持续时间的统计方法。

在医学中,生存分析常用于研究患者的生存时间、复发时间等。

2.4 方差分析方差分析用于比较两个或多个组的均值是否存在显著差异。

它适用于一组分类变量和一个连续变量的比较。

三、医学统计学的应用3.1 临床试验设计与分析临床试验是评价药物疗效的重要手段。

医学统计学在临床试验的设计和分析中起到关键作用,如确定样本量、随机分组、双盲试验等。

3.2 流行病学研究流行病学研究可以揭示疾病的发病原因、预后以及控制策略。

医学统计学的方法可以帮助研究者分析大量数据,确定疾病的危险因素和相关性。

《医学统计学》复习资料

《医学统计学》复习资料

统计学概述一、统计学的意义统计学是研究数据的收集、整理、分析的一门科学,是认识社会和自然现象客观规律数量特征的重要工具。

统计学方法就是帮助人们透过偶然现象认识其内在的规律性,揭示疾病或现象发生、发展规律,为预防疾病、促进健康提供客观依据。

二、统计学的基本概念(一)同质与变异同质是指被研究指标的影响因素相同。

变异是同质基础上的观察单位(亦称为个体)之间的差异。

(二)总体与样本总体是指根据研究目的确定的同质观察单位的全体。

样本从总体中随机抽取的部分观察单位,其测量值(或变量值)的集合。

(三)变量与变量值变量:确定总体后,研究者应对每个观察单位的某些特征进行测量或观察,这种特征称为变量,如:身高、体重等。

变量值:变量的测得值。

如身高150cm,体重50Kg等。

(四)参数与统计量参数是指总体特征的统计指标。

如某地健康成年男性的平均血红蛋白值。

统计量是指样本特征的统计指标。

如从某地健康成年男性中抽取一部分人的平均血红蛋白值。

(五)误差误差泛指测量值与真实值之差。

根据误差的性质和来源,统计工作中产生的误差主要有三种类型,即系统误差、随机测量误差、抽样误差。

1.系统误差:测量结果有倾向性。

查明原因,可以避免。

特点:①测量结果有倾向性。

如仪器、试剂、判定标准等。

②查明原因,可以避免。

2.随机测量误差:收集资料的过程中,即使避免了系统误差,但由于各种偶然因素造成的测量值与真实值不完全一致,这种误差称为随机测量误差。

特点:①随机误差没有大小和方向。

②不可避免。

3.抽样误差:由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异称为抽样误差。

特点:变异是绝对的,抽样误差不可避免。

原因:个体之间的差异;抽样时只能抽取总体中的一部分作为样本。

(六)概率(P)概率是描述某随机事件发生可能性大小的量值,常用符号P表示。

随机事件的概率在0~1之间,即0≤P≤1。

小概率事件:P≤0.05或P≤0.01的事件。

医学统计学基础

医学统计学基础

医学统计学基础医学统计学是研究医学和健康领域中数据收集、分析和解释的一门科学。

它通过运用概率和统计方法来帮助医学专业人员进行决策,并从数据中提取有用的信息。

本文将介绍医学统计学的基本概念和应用。

一、基本概念1.1 总体与样本在统计学中,总体是指我们想要了解的所有个体或事物的集合,而样本是从总体中抽取的一部分个体。

研究人员通常无法调查整个总体,而是通过对样本的研究来推断总体的一般情况。

1.2 数据类型医学统计学中常用的数据类型包括定类数据和定量数据。

定类数据是以类别或分类方式进行描述的,例如性别、病种等。

定量数据则是以数值方式进行描述的,例如身高、体重等。

这些数据类型的不同决定了在统计分析中所采用的方法和技术。

1.3 描述性统计描述性统计是用来对数据进行总结和描述的统计方法。

通过描述性统计,我们可以了解数据的集中趋势、离散程度和分布形状等。

常见的描述性统计指标包括均值、中位数、标准差和频率分布等。

二、统计推断2.1 抽样误差与抽样分布由于我们只能通过样本来推断总体的情况,样本与总体之间存在抽样误差。

而抽样分布则是指在相同抽样方式下,反复从总体中抽取样本,得到的样本统计量的分布。

抽样分布的特点有助于进行统计推断。

2.2 参数估计参数估计是利用样本统计量来估计总体参数的值。

常见的参数估计方法包括点估计和区间估计。

点估计是使用单个统计量来估计总体参数的值,例如用样本均值估计总体均值。

区间估计则是利用样本统计量来估计总体参数的范围,例如给出一个置信区间。

2.3 假设检验假设检验是用来对总体参数假设进行验证的统计方法。

假设检验可分为参数检验和非参数检验。

参数检验是在对总体参数分布假设的前提下,通过样本统计量计算出一个检验统计量,并根据该统计量判断总体参数的假设是否成立。

非参数检验则不依赖对总体参数分布的假设。

三、相关性和回归分析3.1 相关性分析相关性分析是用来研究两个或多个变量之间关系的统计方法。

通过计算相关系数来衡量变量之间的相关程度。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

医学统计学基本概念1.医学统计学是以医学理论为指导,应用概率论与数理统计的有关原理和方法,研究医学资料的搜集、整理、分析和推断的一门应用科学。

2.统计工作的步骤:(1)设计(2)收集资料(3)整理资料(4)分析资料;或者分三步:(1)研究设计(2)资料分析(3)结论。

3.定量资料:又称为数值变量资料,特点:(1)各观察值之间有量的差别;(2)数据间有连续性。

它是指变量的取值不止是可列个,而是可取某区间[a,b],(-oo,oo)上的一切值。

4.定性资料:又称为分类资料、分类变量资料(包括二项分类、多项分类资料),特点:(1)各观察值之间有质的差别;(2)数据间有离散性。

它是指变量的取值有限的,至多是可列多个。

附:无序分类:二项分类、多项分类5.等级资料:又称为半定量资料,有序分类,指各类之间有程度的差别。

特点:()各观察单位间或者相同,或者存在质的差别;(2)各等级间只有顺序,而无数值大小,故等级之间不可度量。

6.个体individual:即每个观察单位。

7.总体population:根据研究目的确定的同质观察单位的全体。

8.样本:是从总体中随机抽取部分观察单位,其实测值的集合。

样本包含的观察单位数称为样本含量或样本大小。

9.参数parameters:描述某总体特征的统计指标称为总体参数,简称参数。

如总体均数、总体标准差等。

特点:参数是未知的,固有的,不变的!10.统计量:描述某样本特征的的统计指标称为样本统计量,简称统计量。

特点:统计量是已知的,变化的,有误差的!11.概率probability:是描述随机事件发生的可能性大小的数值。

常用P表示。

它的大小界于0和1之间。

12.随机事件:(1)可重复性:相同条件下可重复进行;(2)随机性:出现两种机两种以上结果;(3)偶然性:实验前不能肯定将出现哪种结果。

13.频率的稳定性:在重复试验中,事件A的频率随着试验次数的不断增加将愈来愈接近一个常数p,频率的这一特性称为频率的稳定性。

14.概率的统计定义:频率的稳定性充分说明随机事件出现的可能是事物本身固有的一种客观属性,因而是可以被认识和度量的。

这个常数p就称为事件A出现的概率(probability),记作P(A) 或P。

这一定义称为概率的统计定义。

它是事件A发生的可能性大小的一个度量。

容易看出,频率为一变量,是样本统计量,而概率为常数,是一总体参数。

实践中,当试验次数足够多时,可以近似地将频率作为概率的一个估计。

15.小概率原理:当某事件发生的概率小于或等于0.05时,统计学通常称该事件为小概率事件,其涵义为该事件发生的可能性很小,进而认为其在一次抽样中不可能发生,此即为小概率原理。

16.同质(homogeneity):性质相同的事物称为同质的。

17.变异(variation):同质的事物内个体之间或同一个体重复测量间的差别称为变异。

18.参考值范围(reference interval)又称正常值范围(normal range)。

由于正常人的形态、功能、生化等各种指标的数据因人而异,而且同一个人的某些指标还会随着时间、机体内外环境的改变而变化,因此需要确定其波动范围,即正常值范围,简称正常值(normal value)。

19.正常值范围(normal ranges),是指绝大多数正常人的某指标范围。

20.抽样误差(sampling error):由于抽样造成的样本统计量和总体参数之间的差异。

21.标准误(standard error):样本统计量的标准差称为标准误。

样本均数的标准差称为均数的标准误。

22.参数估计:由样本信息估计总体参数称为参数估计,包括点估计和区间估计。

23.点估计(point estimation) :直接用样本统计量作为总体参数的估计值。

这种估计方法简单,但未考虑抽样误差的大小。

24.区间估计(interval estimation) :按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围,这个范围称作可信度为1-α的可信区间(confidence interval, CI),又称置信区间。

这种估计方法称为区间估计。

25.可信度为1-α的可信区间的确切涵义是:每100个样本所算得的100(1-α)%可信区间,平均有100(1-α)个包含了总体参数。

如取α=0.05,则每100个样本所算得的100个95%可信区间,平均有95个包含总体参数在内,有5个不包含总体参数。

26.可信区间的两个要素:第一个要素是可靠性,常用可信度1-α的大小表示;第二个要素是精确性,常用可信区间的长度CU-CL衡量。

27.均数95%可信区间,其涵义是:如果重复100次抽样,每次样本含量均为n,每个样本均按(见课本P42)构建可信区间,则在此100个可信区间内,理论上有95个包含总体均数,而有5个不包含总体均数。

28.可信度为95%的CI的涵义:每100个样本,按同样方法计算95%的CI,平均有95%的CI包含了总体参数。

这里的95%,指的是方法本身!而不是某个区间!29.第一类错误(I型错误):拒绝了实际上成立的H0假设,称为“假阳性”, 用α来表示。

30.第二类错误(II型错误):不拒绝实际上不成立的H0,称为“假阴性”,用β来表示。

31.检验效能(power of a test)或检验功效:1-β称检验效能(power of a test),过去称把握度。

为当两总体确有差异,按检验水准α所能发现该差异的能力。

1-β只取单尾。

32.完全随机设计:根据某一试验因素,将试验对象完全按随机设计分为若干个组,每个组的样本例数可以相等,也可以不等,分别求出各组试验结果的均数,即为单因素多个样本均数,单个因素可以有多个水平,R>233.随机区组设计又称配伍组设计(Random Block Design):即两因素多个样本均数的比较(或称两因素方差分析,two way analysis of variance)。

34.绝对数:在计数资料中,各组的观察数称绝对数。

35.相对数:是两个有联系的指标的比,计数资料的统计描述主要是相对数(relative number)。

36.率(rate):说明某现象发生的频率或强度,常用%、‰、1/万、1/10万等作单位,表示在一定范围内,某现象的发生数与可能发生某现象的总数之比。

率的结果常以保留1-2位整数为宜。

37.构成比(constituent ratio):说明一事物内部各组成部分所占的比例,常以%来表示。

38.比:也称相对比(relative ratio),两个有关指标之比。

通常以某种现象的数量为1或100作基数,看另一种现象的数量是多少,说明一事物是另一事物的若干倍或百分之几。

两个相比的指标可以性质相同,如时间比、性别比;也可性质不同。

比=A/B39.秩次是指全部观察值按某种顺序排列的位序;秩和:是同组秩次之和。

40.秩变换:将等级变成秩次的方法称为秩变换。

41.秩和检验:就是通过秩次的排列求出秩和,从而对总体的分布进行假设检验的方法。

42.确定性关系:是指两变量间的关系是函数关系。

非确定性关系:是指两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。

相关关系:指既是必然的又是不确定的关系称为相关关系。

当两个变量之间出现如下关系,一个增大,另一个也同时增大,或缩小,我们称这种现象为共变,也就是说两个变量之间有相关关系。

相关关系不一定是因果关系。

相关关系可以是因果关系,也可以是伴随关系。

43.直线相关系数:简称为相关系数,用符号r表示,是用于说明具有直线关系两个变量之间,相关关系的密切程度和相关方向的指标。

44.等级相关的含义:等级相关反映的是两变量等级间的相关,并不反映两变量间的数值关系。

45.直线相关:这种直线关系,或分析这种直线关系的理论和方法,统称为直线相关。

46.直线回归: 直线回归是用于研究两个变量x与y之间的线性依存关系的一种统计分析方法。

47.试验研究设计:是指研究者根据研究目的、通过对受试对象施加干预,严格控制各种影响因素,获得干预研究结果。

48.双盲临床试验:是指观察者方和被观察者方在整个试验过程中不知道受试者接受的是何种处理;单盲临床试验是指仅被观察者方处于盲态。

观察者方指的是研究者、参与试验效应评价的研究人员、数据管理人员、统计分析人员;被观察者方指的是受试对象及其亲属或监护人。

双盲双模拟:试验组:试验药+阳性对照药的安慰剂;对照组:阳性对照药+试验药的安慰剂。

医学统计学相关知识1.频数分布表的用途:(1)看出频数分布的两个重要特征:集中趋势、离散趋势(2)揭示资料的分布类型2. 描述定量资料集中趋势的三个指标及其应用条件:(1)均数(也称算术均数):适用于单峰对称分布的资料;(2)几何均数:适用于等比资料、对数正态分布资料;(3)中位数:适用于偏态分布资料、分布不规则或未知分布资料、一端或两端有不确定数据(开口资料)的资料。

3. 描述定量资料离散程度的指标(极差、四分位数间距、标准差、变异系数)及其适用范围:这四个指标均反映定量资料的离散程度。

极差和四分位数间距可用于任何分布(极差常用于描述单峰对称分布小样本分布资料的变异程度,或用于初步了解资料的变异程度;四分位数间距常用于描述偏态分布资料、两端无确切值或分布不明确资料的离散程度),后者比前者稳定,但均不能综合反映各观察值的变异程度;标准差最常用,要求资料近似服从正态分布;变异系数可用于比较度量单位不同的两组或多组资料的变异度或均数相差悬殊的两组或多组资料的变异度。

4. 正态分布的特征:(1)正态分布是一单峰分布,高峰位置在均数处;(2)正态分布以均数为中心,左右完全对称;(3)正态分布取决于两个参数,即均数μ和标准差σ。

μ是位置参数,μ越大,则曲线沿横轴向右移动;μ越小,曲线沿横轴向左移动。

σ为形态参数,表示数据的离散程度,若σ小,则曲线形态“瘦高”;σ大,则曲线形态“矮胖”。

(4)有些指标不服从正态分布,但通过适当的变换后服从正态分布;(5)正态分布曲线下的面积分布是有规律的。

5.正态曲线下的面积规律•正态曲线下面积总和为1;正态曲线关于均数对称;对称的区域内面积相等;•对任意正态曲线,按标准差为单位,对应的面积相等;μ-1.64σ~μ+1.64σ内面积为90%;•μ-1.96σ~μ+1.96σ内面积为95%;μ-2.58σ~μ+2.58σ内面积为99%。

•小于μ-3σ的面积为0.13%; 小于μ-2σ的面积为 2.28%; 小于μ-σ的面积为15.87%。

6. 标准误与标准差的关系区别标准差s标准误s x意义个体变异统计量的抽样误差用途正常值范围(x±1.96s)总体均数的可信区间(x±t α, νs x)与n关系n↑s趋于稳定n↑s x趋于0联系 1.两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准误。

相关文档
最新文档