统计学名词解释

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

名词解释

1.统计学:是应用概率论和数理统计的基本原理和方法,研究数据的收集、整

理、分析、表达和解释的一门科学。

2.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据

信息的搜集整理、分析、表达和解释的一门科学。

3.抽样:是从研那个研究总体抽取少量有代表性的个体,称为抽样。

4.统计推断:是根据已知的样本信息来推断未知的总体,是统计分析的目的,

包括参数估计和假设检验。

5.总体:是根据研究目的确定的同质研究对象的全体。

6.概率:是随机事件发生可能性大小的数值度量。

7.同质:是指所研究的观察对象具有某些相同的性质或特征。

8.变异:是同质个体的某项指标之间的差异,即个体差异。

9.正态分布:频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称

为近似正态分布,如果两端完全对称则称为正态分布。

10.医学参考值围:又称正常值围,医学上常将包括绝大多数正常人的某指

标值的波动围称为该指标的正常值围。

11.动态数列(dynamic series):是按照一定的时间顺序,将一系列描述

某事物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数。

12.人口金字塔:将人口的性别与年龄资料结合起来以图形的方式表达人口

的性别与年龄结构,以年龄为纵轴,人口百分比为横轴,左侧为男,右侧为女,两个对应的直方图,其形似金字塔。

13.负担系数(dependency ratio):又称抚养比或抚养系数,是指人口中

非劳动年龄人数与劳动年龄人数之比。

14.标准化死亡比(SMR):实际死亡人数与期望死亡人数之比称为标准化死亡

比。

15.统计图:是用点的位置、线段的升降、直条的长短和面积的大小等来表

达数据的一种形式。

16.半对数线图(semi-logarithmic linear chart):横轴是算数尺度,纵轴

是对数尺度,使线图上的数量关系变为对数关系。适用于描述某项指随某个连续型数值变量变化而变化的速度(相对变化趋势)。

17.直方图(histogram):一般用横轴表示连续性数值变量,纵轴表示表示

频数或频率,每个矩形的宽度等于各组段的组距,高度等于相应组段的频数

或频率。常适用于描述连续性数值变量的频数或频率分布了解一组数据的分布类型和分布特征。

18.散点图(scatter plot):是用直角坐标上点的密集程度或趋势表示两

变量间的相关关系。

19.箱式图(box plot):箱式图用于描述练箱连续型变量的分布特征,它

表现连续型变量的5个特征值,即最小值、下四分位数、中位数、上四分位数、最大值。

20.统计地图(statistical map):是运用统计数据反应制图对象数量特征

的一种图形,主要用于某种现象的数量在地域空间上的分布。

21.随机抽样(random sampling):是指按照随机化的原则(总体中每一个观察单位都

有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

22.抽样误差(sampling error of mean):是抽样产生的由于个体差异所导致

的样本均数与样本均数之间、样本均数与总体均数之间的差异。

23.统计推断(statistical inference):通过样本指标来说明总体特征,这种通

过样本获取有关总体信息的过程称为统计推断。

24.四分位数间距(inter-quartile range, IQR):是由第三(上)四分位数减去

第一(下)四分位数所得,常常与中位数一起使用,用来描述偏态分布资料的分布特征,较极差稳定。

25.变异系数(coefficient of variation):用于观察指标单位不同或均数相差

大时两组资料变异程度的比较。用CV 表示。

24.第Ⅰ类错误(typeⅠerror):是指拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误,其概率大小用α表示。

25. II 型错误(type II error):是指接受了实际上不成立的H0,这类“存伪”的错误称为II 型错误,其概率大小用β表示,未知。

26. 检验效能:1- β称为检验效能(power of test),也称把握度,它是指当两总体确有差别,按规定的检验水准a 能发现它们有差异的能力。

27. 随机区组设计(randomized block design):是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组(block),使每一区组的受试对象例数与处理因素的分组数相等,使每个实验组从每一区组得到一例受试对象。

28.完全随机设计(completely random design):是采用完全随机化的分组方法,将全部试验对象分配到g个处理组(水平组),各组分布接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应。

29.配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组,或者比较受试者实验前后的变量值改变情况,甚至比较同一标本接受两种不同测定方法的检查结果的差别。

29.析因设计(factorial design )实验:凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计(factorial design )实验。

30.方差分析(analysis of variance ANOVA )的基本思想:是把全部观察值的总变异按设计和需要分解成两个或多个组成部分,再进行分析。

31 . LSD-t 检验:即最小显著性差异t 检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较。

32. SNK (student-Newman-Keuls )法:又称q 检验,是根据q 值的抽样分布作出统计推论,适用于多个样本均数两两之间的全面比较。

33.Dunnett-t 检验:适用于g-1个实验组与一个对照组均数差别的多重比较。

34. 二项分布(binorminal distribution):是指每次试验有且仅有两个可能结果如“阳性或“阴性“之一的n 次独立重复试验中,每次试验的发生”阳性“概率“π保持不变,出现”阳性“数x=0,1,2,3…,n 的一种概率分布。

35.率的抽样误差(standard error of rate ):由于个体差异的存在,在抽样研究中表现出来的样本率与总体率或样本率的之间的差异称为率的抽样误差。

36.Poisson 分布:是一种离散型分布,二项分布的一种极限情况,用于描述单位时间、空间、面积等小概率事件发生次数的概率分布。它是由法国人S.D.Poisson 首先提出来。

37. 分布:是一种以分布为基础的连续型分布,可用于检验资料的实际频数和

按检验假设计算的理论频数是否相符等问题,以值为检验统计量的计数资料的假

设检验方法。

标准正态分布:对任意一个服从正态分布(U,)的随机变量,可经Z 变换后的Z 值仍然服从正态分布,且其总体均数为0、总体标准差为1。我们称此正态分布为标准正态分布,用N(0,1)表示。

38.nonparametric statistics :非参数检验,针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于该方法不受总体参数的限制,故称为非参数检验,或称为不拘分布的统计分析方法,又称为无分布形式假定的统计分析方法。

39.参数检验(parametric text):通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数检验。

40.Wilcoxon 两样本秩和检验的基本思想:如果Ho 成立,则两样本来自分布相同的总体,两样本的平均秩次T1/n1与T2/n2应相等或接近,含量n1的样本的秩和T1应在n1(N+1)/2的左右变化。若T 值偏离此值太远,H0成立的可能性就很小。若偏离出给定值所确定的围时,则P<,拒绝H0。

41.Friedman 的M 检验的基本思想:在H0成立的条件下,各区组观察值取秩次为

1,2,…,k 的概率相等,则各处理组的秩和应接近R(平均)=n(k+1)/2,而M 值反映了实2χ2χ2χ

相关文档
最新文档