统计学名词解释47761
统计学名词解释

名词解释:医学统计学:用统计学的原理和方法研究生物医学问题的一门学科。
变量(variable):观察单位的某项特征变量值(value of variable):变量的观察结果(测量值)总体(population):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。
样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。
随机抽样(random sample):按随机化原则从总体中抽取部分观察单位的过程。
同质(homogeneity):是针对被研究指标来讲,其影响因素相同。
简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。
变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。
等级资料(ordinal data):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡。
有序变量(定性变量的一种)。
概率(probability):是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大,0<P(A)<1,小概率事件。
频率(frequency):在相同的条件下,独立重复做n次实验,事件A出现了m次,比值m/n称为随机事件A在n次实验中出现的频率。
随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计。
系统误差(system error):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免。
随机变量(random variable):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。
统计学名词解释

1、总体与总体单位:总体亦称统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
构成总体的这些个别单位称为总体单位。
2、变异与变量:数量标志就是变量,指标志表现由一种状态到另一种状态称为变异。
3、重点调查:是指在全体调查对象中选择一部分重点单位进行调查,以取得统计数据的一种非全面调查方法。
4、统计分组:是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
5、分配数列:在统计分组的基础上,把总体的所有单位按组归并排列,形成总体中各个单位在各组间的分布,称为分配数列,也称分布数列或次数分布。
6、总量指标:是反映某种社会经济现象在一定时间、空间和条件下的总规模、总水平或工作总量的综合指标。
7、平均指标:又称平均或均值,反映的是现象在某一空间或时间上的平均数量状况。
8、时期数列和时点数列:时期数列是指每一指标所反映的是某种社会经济现象在某一定时期内发展过程及其发展水平的绝对数动态数列。
时点数列是指每个指标所反映的都是某种社会经济现象在某一时点(或时刻)上的状态及发展水平时折绝对数动态数列。
9、发展水平:P13610、发展速度:P14811、总指数:是反映全部现象总体(即复杂现象总体)数量变动的相对数。
12、综合指数:是两个总量指标对比形成的指数,在总量指标中包含两个或两个以上的因素,将其中被研究因素以外的一个或一个以上的因素固定下来,仅观察被研究因素的变动,这样编制的指数,称为综合指数,它的特点是先综合后对比。
13、抽样平均误差:是反映抽样误差一般水平的指标,它的实质含义是指抽样平均数(或成数)的标准差。
即它反映了抽样指标与总体指标的平均离差程度。
14、样本:按一定方法从总体中随机抽取的部分个体。
15、相关系数:是变量之间相关程度的指标。
简答题12:回归分析:对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定因变量和自变量之间数量变动关系的数学表达式,以便对因变量进行估计或预测的统计分析方法。
统计学名词解释

统计学名词解释、总体:是特定研究中所关注的所有个体的集合样本是指那些从总体中选出的个体,通常在研究中是被用来代表的总体的。
参数是一个值,通常是一个描述总体的数值。
统计量:是一个值,通常是一个描述样本的数值。
描述统计用来总结、整理和简化数据的统计方法。
推论统计用来研究样本并对样本所来自的总体做出推论的技术。
抽样误区:是一种差异,是一些存在于样本统计量和相应的总体参数间的误差。
变量是指因个体不同而可以改变的,有不同值的特征。
连续数据是指任意两个数据点之间都可以无限地划分出大小不同的数值,在数轴上用一段距离表示离散数据是指不连续的,任意两个数据点所取得的数值个数是有限的,在数轴上用一个点表示。
集中趋势是一种类型的统计指标,用来描述一组数据分布的中心。
离散趋势是描述和度量一组数据变异或分散程度的统计指标。
百分等级是指一个数据分布中,低于某个分数的数据个数在总数据中所占的百分比。
概率的古典定义如果某随机现象包含的基本事件的个数为n,且每个基本事件发生的可能性相同,随机事件A包括有m个基本事件,则随机事件A发生(成功)的概率表示为P101概率的统计定义:当观测次数很大时。
事件的估计概率或经验概率被理解为事件发生的频率中心极限定理:P120简答题平均值的特征1 改变一个数据2 引入一个新的数据或去除一个原始数据3从每一个数据中增加或减去一个常数4每个数据乘以或除以一个常数(PS 补充一个公式P54)方差和标准差的意义P80标准化分布1 在分布形状上,Z分数的分布与原始分数的最初分布是一样的2对于平均数,Z分数分布的平均数总为03 对于标准差,Z分数分布的标准差总是为1 正太分布特点P109填空题中位数众数全距百分等级计算P88总体方差及标准差公式P76样本方差以及标准差公式P77 P78标准分数P91二项分布公式P106。
统计名词解释

1统计学:运用概率论、数理统计的原理与方法研究数据的搜集;分析;解释;表达的科学。
2医学统计学:就是运用统计学的基本原理和方法来研究医学问题的一门学科,它包括设计,数据收集,整理,分析以及分析结果的正确解释和表达。
3总体:是根据研究目的所确定的同质观察单位某种观察值(即变量值)的全体。
4参数:医学研究通常都想了解关于总体某些数值特征,这些数值特征称为参数。
5统计量:根据样本算得的某些数字特征称为统计量。
6抽样误差:在抽样研究中,由于变异的存在,即使在同一总体中抽取的几个样本,各样本统计量往往不等。
样本统计量与总体参数也不等,这种由于抽样研究所至样本之间和样本与总体之间的差异称为抽样误差。
7样本:从总体中抽出供研究的观察单位就称为样本。
8变量:观测单位的某种特征或属性,变量的观测值就是所谓的变量值,有时也称为数据或资料。
9误差:泛指实测值与真实值之差,一般可区分为随机误差和非随机误差两大类。
10系统误差(非随机误差)(偏性或偏倚):最常见的非随机误差即所谓系统误差,是指使实测值系统偏离真实值的,具有方向性的误差,因此也常称为偏性或偏倚。
11随机事件:根据某一研究目的,在一定条件下对某一随机事件(不确定现象)进行观测,其结果在事先是不确定的,将其称为随机事件,简称事件。
12小概率事件;把概率很小的随机事件称为小概率事件,一般P小于等于0.05或p小于等于0.01的事件。
13观察性研究是一种客观地观察,记录和描述事物或现象的认识活动。
14目标总体:调查目的所确定的总体称为目标总体。
15样本含量:确定调查对象和观察单位后,还要确定需要调查多少观察单位,即样本含量。
16抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查。
17同质:是指观察单位(研究个体)间被研究指标的影响因素相同。
18统计资料:也称统计信息,是统计部门或单位进行工作所搜集,整理,编制的各种统计数据资料的总称。
统计学名词解释

名词解释1.统计学:是应用概率论和数理统计的基本原理和方法,研究数据的收集、整理、分析、表达和解释的一门科学.2.医学统计学:是应用统计学的基本原理和方法,研究医学及其有关领域数据信息的搜集整理、分析、表达和解释的一门科学.3.抽样:是从研那个研究总体抽取少量有代表性的个体,称为抽样.4.统计推断:是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验.5.总体:是根据研究目的确定的同质研究对象的全体.6.概率:是随机事件发生可能性大小的数值度量.7.同质:是指所研究的观察对象具有某些相同的性质或特征.8.变异:是同质个体的某项指标之间的差异,即个体差异.9.正态分布:频数分布的高峰在中间,两端基本对称,逐步减少,这种分布称为近似正态分布,如果两端完全对称则称为正态分布.10.医学参考值范围:又称正常值范围,医学上常将包括绝大多数正常人的某指标值的波动范围称为该指标的正常值范围.11.动态数列dynamic series:是按照一定的时间顺序,将一系列描述某事物的统计指标依次排列起来,观察和比较该事物在时间上的变化和发展趋势,这些统计指标可以为绝对数、相对数或平均数.12.人口金字塔:将人口的性别与年龄资料结合起来以图形的方式表达人口的性别与年龄结构,以年龄为纵轴,人口百分比为横轴,左侧为男,右侧为女,两个对应的直方图,其形似金字塔.13.负担系数dependency ratio:又称抚养比或抚养系数,是指人口中非劳动年龄人数与劳动年龄人数之比.14.标准化死亡比SMR:实际死亡人数与期望死亡人数之比称为标准化死亡比.15.统计图:是用点的位置、线段的升降、直条的长短和面积的大小等来表达数据的一种形式.16.半对数线图semi-logarithmic linear chart:横轴是算数尺度,纵轴是对数尺度,使线图上的数量关系变为对数关系.适用于描述某项指随某个连续型数值变量变化而变化的速度相对变化趋势.17.直方图histogram:一般用横轴表示连续性数值变量,纵轴表示表示频数或频率,每个矩形的宽度等于各组段的组距,高度等于相应组段的频数或频率.常适用于描述连续性数值变量的频数或频率分布了解一组数据的分布类型和分布特征.18.散点图scatter plot:是用直角坐标上点的密集程度或趋势表示两变量间的相关关系.19.箱式图box plot:箱式图用于描述练箱连续型变量的分布特征,它表现连续型变量的5个特征值,即最小值、下四分位数、中位数、上四分位数、最大值.20.统计地图statistical map:是运用统计数据反应制图对象数量特征的一种图形,主要用于某种现象的数量在地域空间上的分布.21.随机抽样random sampling:是指按照随机化的原则总体中每一个观察单位都有同等的机会被选入到样本中,从总体中抽取部分观察单位的过程.随机抽样是样本具有代表性的保证.22.抽样误差sampling error of mean:是抽样产生的由于个体差异所导致的样本均数与样本均数之间、样本均数与总体均数之间的差异.23.统计推断statistical inference:通过样本指标来说明总体特征,这种通过样本获取有关总体信息的过程称为统计推断.24.四分位数间距inter-quartile range, IQR:是由第三上四分位数减去第一下四分位数所得,常常与中位数一起使用,用来描述偏态分布资料的分布特征,较极差稳定.25.变异系数coefficient of variation:用于观察指标单位不同或均数相差较大时两组资料变异程度的比较.用CV 表示.24.第Ⅰ类错误typeⅠerror:是指拒绝了实际上成立的H0,这类“弃真”的错误称为Ⅰ型错误,其概率大小用α表示.25. II 型错误type II error:是指接受了实际上不成立的H0,这类“存伪”的错误称为II 型错误,其概率大小用β表示,未知.26. 检验效能:1- β称为检验效能power of test,也称把握度,它是指当两总体确有差别,按规定的检验水准a 能发现它们有差异的能力.27. 随机区组设计randomized block design:是事先将全部受试对象按某种可能与实验因素有关的特征分为若干个区组block,使每一区组内的受试对象例数与处理因素的分组数相等,使每个实验组从每一区组得到一例受试对象.28.完全随机设计completely random design:是采用完全随机化的分组方法,将全部试验对象分配到g个处理组水平组,各组分布接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应.29.配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同的处理组,或者比较受试者实验前后的变量值改变情况,甚至比较同一标本接受两种不同测定方法的检查结果的差别.29.析因设计factorial design实验:凡同时配置两个或两个以上处理因素,这些因素的各水平又具有完全组合的实验,统称为析因设计factorial design实验.30.方差分析analysis of variance ANOVA的基本思想:是把全部观察值的总变异按设计和需要分解成两个或多个组成部分,再进行分析.31 . LSD-t检验:即最小显着性差异t检验,适用于一对或几对在专业上有特殊意义的样本均数间的比较.32. SNKstudent-Newman-Keuls法:又称q检验,是根据q 值的抽样分布作出统计推论,适用于多个样本均数两两之间的全面比较.33.Dunnett-t检验:适用于g-1个实验组与一个对照组均数差别的多重比较.34. 二项分布binorminal distribution:是指每次试验有且仅有两个可能结果如“阳性或“阴性“之一的n次独立重复试验中,每次试验的发生”阳性“概率“π保持不变,出现”阳性“数x=0,1,2,3…,n的一种概率分布.35.率的抽样误差standard error of rate:由于个体差异的存在,在抽样研究中表现出来的样本率与总体率或样本率的之间的差异称为率的抽样误差.分布:是一种离散型分布,二项分布的一种极限情况,用于描述单位时间、空间、面积等小概率事件发生次数的概率分布.它是由法国人首先提出来.37. 2χ分布:是一种以2χ分布为基础的连续型分布,可用于检验资料的实际频数和按检验假设计算的理论频数是否相符等问题,以2χ值为检验统计量的计数资料的假设检验方法.标准正态分布:对任意一个服从正态分布U,的随机变量,可经Z变换后的Z值仍然服从正态分布,且其总体均数为0、总体标准差为1.我们称此正态分布为标准正态分布,用N0,1表示.statistics:非参数检验,针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法.由于该方法不受总体参数的限制,故称为非参数检验,或称为不拘分布的统计分析方法,又称为无分布形式假定的统计分析方法.39.参数检验parametric text:通常要求样本来自总体分布型是已知的如正态分布,在这种假设的基础上,对总体参数如总体均数进行估计和检验,称为参数检验.两样本秩和检验的基本思想:如果Ho成立,则两样本来自分布相同的总体,两样本的平均秩次T1/n1与T2/n2应相等或接近,含量n1的样本的秩和T1应在n1N+1/2的左右变化.若T值偏离此值太远,H0成立的可能性就很小.若偏离出给定值所确定的范围时,则P<,拒绝H0.的M检验的基本思想:在H0成立的条件下,各区组内观察值取秩次为1,2,…,k的概率相等,则各处理组的秩和应接近R平均=nk+1/2,而M值反映了实际获得的k个处理组的秩和与偏离的程度.M值越大,越有理由怀疑各处理组的总体分布不同.随着b和k的增大,M值近似服从自由度为k-1的2χ分布.42.直线相关:是分析服从正态分布的两个随机变量x与y有无线性相关关系的一种统计分析方法.43.相关系数:是描述两个变量间线性相关关系的密切程度与方向的统计指标.44.直线回归linear regression:建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小.直线回归是回归分析中最基本、最简单的一种,故又称简单回归.45. 回归系数regression coefficient :即回归直线的斜率slope,表示自变量x每改变一个单位时,应变量y平均变化b个单位.46.可信区间:按预先给定的概率确定的包含未知总体参数的可能范围.该范围称为总体参数的可信区间confidence interval,CI.它的确切含义是:可信区间包含总体参数的可能性是1- α ,而不是总体参数落在该范围的可能性为1-α .47.四分位数间距inter-quartile range, IQR:是由第三上四分位数减去第一下四分位数所得,常常与中位数一起使用,用来描述偏态分布资料的分布特征,较极差稳定.48.标准正态分布:均数为0,标准差为1的正态分布被称为标准正态分布standard normal distribution,通常记为N0, 12.49.偏回归系数:多元线性回归中的偏回归系数表示在其他自变量固定不变的情况下,自变量Xj每改变一个单位时,单独引起应变量Y的平均改变量.50.系统抽样systematic sampling:又称机械抽样和等矩抽样,现将总体的观察单位按照某一顺序分成n个部分,再从第一部分随机抽取第k号观察单位,依次用相等的间隔,从每一部分抽取一个观察单位组成样本.51.分层抽样stratified sampling:又称分类抽样,先按影响观察值变异较大的某种特征将总体分为若干层,再将从每层内随机抽取一定数量的观察单位组成的样本.r称为决定系数coefficient of determination,表示由x与y的直线关系导致的y的变异SS回在总变异SS总中所占的比重,即回归效果的好坏,rr越接近1,即回归的效果越好.53.抽样调查sampling survey:是从总体中随机抽取一部飞的研究对像组成样本,对样本进行调查,然后根据样本信息来推断总体特征.54.典型调查typical survey:典型调查又称案例调查,是有目的的选着典型的人和单位进行调查.55.变异系数coefficient of variation用于观察指标单位不同或均数相差较大时两组资料变异程度的比较.用CV 表示.analysis:残差分析,旨在通过残差深入了解数据与模型之间的关系,评价实际资料是否符合回归模型假设,识别异常点等.57.最小二乘原则least squares method:所有的数据点到回归直线的纵线距离的平方和最小.58.拟合优度检验:是判断样本实际频数分布与拟合的理论频数分布是否符合,或者说判断此样本是否来自某种分布.59.回归直线的置信带confidence band:以相应的X为横坐标,Y为纵坐标,将置信区间的上下线分别连接起来形成的两条弧形线的区域,称为回归直线的置信带.60.标准化残差standardized residual:将每个残差值减去所有残差值的均数,再除以所有残差值的标准差,便得标准化残差.·61.随机化:是采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组或对照组.62.双盲double blind:指受试对象和研究者均不知道受试对象在哪一组,称为双盲.63.定群寿命表cohort life table:亦称队列寿命表,它是对某特定人群中的每一个人,从进入该特定人群直到最后一个人死亡记录的实际死亡过程.由于人的生命周期很长,如果用现时寿命表方法研究人群的生命或死亡过程.不仅随访人数要很多,而且随访时间要上百年.1.算术均数arithmetic mean描述一组数据在数量上的平均水平.总体均数用μ表示,样本均数用X 表示.2.几何均数geometric mean用以描述对数正态分布或数据呈倍数变化资料的水平.记为G.3.中位数medianMd将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值.反映一批观察值在位次上的平均水平.4.极差range亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差.5.方差variance:方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到.6.标准差standard deviation是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用.7.构成比proportion又称构成指标,说明某一事物内部各组成部分所占的比重或分布.。
统计学名词解释

统计包括统计工作,统计资料,统计学。
统计学的研究对象是客观事物总体的数量方面,其特征是:数量性,总体性。
总体:统计所要研究的事物或现象的全体。
特征:同质性,大量性,变异性。
样本:指从总体中抽取出来作为代表这一总体,由部分个体组成的集合体。
标志是说明个体的属性或特征的具体名称。
指标是反映现象总体数量特征的概念及其具体数值。
特征:数量性,综合性,具体性。
变量是指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
数据是对变量进行计量的结果。
参数是描叙总体数量特征的指标。
统计数据的来源:直接来源,间接来源。
统计调查:按统计调查的组织形式不同分为统计报表和专门调查,按调查对象包括的范围不同分为全面调查和非全面调查,按调查登记的时间是否连续分为经常性调查和一次性调查。
统计调查方案的设计:1调查任务和目的2调查对象,调查单位和填报单位3,拟定调查项目,设计调查表或问卷4调查时间5制定调查工作的组织实施计划。
统计调查的主要组织形式:普查,抽样调查。
搜集数据的具体方法:询问调查法,观察法,实验法。
统计数据的误差包括登记性误差,代表性误差(又可以分为随机性误差和系统性误差)。
统计分组就是根据被研究总体的内在特点以及统计研究的目的,将总体按照一定的标志划分为若干个性质不同的组成部分的一种统计方法。
统计分组的作用:划分现象的类型,揭示现象的内部结构,分析现象之间的依存关系。
统计分组的原则:穷尽原则,互斥原则。
上下限之间的中点数值称为组中值,闭口组的组中值=(上限+下限)/2,缺下限的开口组组中值=上限—邻组组距/2,缺上限的开口组组中值=下限+邻组组距/2。
频数的构成要素:各组变量值,总体单位在各组中出现的次数。
计算累计频数的方法:1,从变量值最小的频数或频率开始依次向变量值最高的频数或频率进行累计,称为向上累计。
2从变量值最大组的频数或频率开始依次向变量值最低组的频数或频率进行累计。
统计表的结构:形式上,由总标题,横行标题,纵栏标题,数字资料构成,内容上由主词和宾词构成。
统计学重点名词解释

什么叫因素或因子:所要检验的对象。
因素的不同表现成为水平或处理,每个因子水平下得到的数据称为观察值。
无偏性:估计量抽样分布的数学期望等于被估计的总体参数。
有效性:对同一总体参数的两个无偏估计量,有更小估计差得估计量更有效。
一致性:随着样本量的增大,点估计量的值越来越接近被估总体的参数。
原假设:提出一个或两个参数是否等于或大于、小于某个特殊值的命题。
备择假设:与原假设逻辑相反的假设。
点估计:就是用样本统计量的某个取值直接作为总体参数的估计值。
区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减误差得到。
置信水平:将构造置信区间的步骤重复很多次,置信区间包括总体参数真值的次数所占的比例。
方差分析就是通过检验个总体的均值是否相等来判断分类自变量对数值型因变量是否有相助影响假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。
显著性水平:是一个统计专有名词,在假设检验中,它的含义是当原假设正确时却被拒绝的概率或风险单因素方差分析:研究一个分类型自变量同数值型自变量之间关系的一种统计方法。
离散系数:也称为变异系数,一组数据的标准差与其相应的平均数之比,是测度数据离散程度的相对值。
离散程度:它反映的是各变量值远离其中心值的程度。
统计学:收集、处理、分析、解释数据并从数据中得到结论的科学。
统计量:描述样本特征的概括性数字度量。
误差的控制主要方法有:改变样本容量、构造不同的抽样框、注意问卷中得措辞方式以及对调查过程的质量控制。
估计量:用来估计总体参数的统计量的名称。
根据一个具体样本计算出来的估计量数值称为估计值。
抽样调查的作用:应用范围广、调查结果准确可靠、调查速度快、节省调查费中位数:将所研究的总体中的各单位标志值按大小顺序排列,位于中点位置的那个标志值就是中位数小概率原理:是指在发生概率很小的随机事件再一次试验中几乎是不可能发生的。
根据这一原理可以做出是否拒绝原假设的决定。
统计名词解释

统计学(statistics):是运用概率论、数理统计的原理和方法,研究数据资料的收集、整理、分析、推断的一门应用科学。
是处理数据变异的方法学、工具学。
总体Population:根据研究目的所确定的同质观察单位的全体样本Sample:从总体中随机抽取部分观察单位,其实测值的集合。
参数(parameter):由总体计算出来的量,刻画了总体特征,如总体均数、总体标准差;统计量(statistics) :由样本计算出来的量,反映了样本的特征,如样本均数、样本标准差;概率描述了随机事件发生的可能性的大小。
同质(homogeneity):指同一总体中个体的性质、影响条件或背景相同或非常相近。
变异(va riation):在自然状态下,个体间测量结果的差异称为变异。
变量Variable:可以测量的任何特征或属性(不同个体结果可能不同),能表现观察单位变异性的某种特征随机变量random variable:在概率论中称变量为随机变量。
指取值事先不能确定的结果。
从理论上讲,每个随机变量的取值服从特定的概率分布。
定量变量Quantitative variable:其变量值是用定量方法测得的,变量值有大小之分,一般有度量衡单位。
定性变量Qualitative variable:定性方法得到的,通常将观察单位按某种属性或类别分组,不同的属性或类别即定性变量。
定量资料(Quantitative data):定量资料是以数字形式表现出来的研究资料。
定性资料(Qualitative Data):定性资料是以文字、图形、录音、录象等非数字形式表现出来的研究资料。
频率(frequency):在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率。
当试验重复很多次时P(A)= m/n。
概率Probability:描述了随机事件发生的可能性的大小。
0≤P ≤1频数(frequency):在一批样本中,相同情形出现的次数称该情形的频数。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
1、统计学统计学是一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
2、指标和标志标志是说明总体单位属性或特征的名称。
指标是说明总体综合数量特征和数量关系的数字资料。
3、总体、样本和单位统计总体是统计所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。
简称总体。
构成总体的个体则称为总体单位,简称单位。
样本是从总体中抽取的一部分单位。
4、统计调查统计调查是根据统计研究的目的和要求、采用科学的方法,有组织有计划的搜集统计资料的工作过程。
它是取得统计数据的重要手段。
5、统计绝对数和统计相对数反映总体规模的绝对数量值,在社会经济统计中称为总量指标。
统计相对数是两个有联系的指标数值之比,用以反映现象间的联系和对比关系。
6、时期指标和时点指标时期指标是反映总体在一段时期内累计总量的数字资料,是流量。
时点指标是反映总体在某一时刻上具有的总量的数字资料,是存量。
7、抽样估计和假设检验抽样估计是指根据所抽取的样本特征来估计总体特征的统计方法。
假设检验是先对总体的某一数据提出假设,然后抽取样本,运用样本数据来检验假设成立与否。
8、变量和变异标志的具体表现和指标的具体数值会有差别,这种差别就称为变异。
数量标志和指标在统计中称为变量。
9、参数和统计量参数是反映总体特征的一些变量,包括总体平均数、总体方差、总体标准差等。
统计量是反映样本特征的一些变量,包括样本平均数、样本方差、样本标准差等。
10、抽样平均误差样本平均数与总体平均数之间的平均离散程度称之为抽样平均误差,简称为抽样误差。
重复抽样的抽样平均误差为总体标准差的1/n。
11、抽样极限误差抽样极限误差是指样本统计量和总体参数之间抽样误差的可能范围。
我们用样本统计量变动的上限或下限与总体参数的绝对值表示抽样误差的可能范围,称为极限误差或允许误差。
12、重复抽样和不重复抽样重复抽样也称为回置抽样,是从总体中随机抽取一个样本时,每次抽取一个样本单位时都放回的抽样方式。
不重复抽样也叫不回置抽样,它是在每次抽取样本单位时都不放回的抽样方式。
13、点估计和区间估计点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。
区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。
14、统计指数广义上来说,它是表明社会经济现象的数量对比关系的相对指标。
狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。
15、综合法总指数凡是一个总量指标可以分解为两个或两个以上的因素指标时,将其中一个或一个以上的因素指标固定下来,仅观察另一个因素指标的变动程度,这样的总指数就叫综合法指数。
16、平均法总指数平均法总指数是通过对个体指数进行加权平均而求得的反映不能直接加总的多个个体所组成的复杂总体综合变动的指数。
分为两种:加权算术平均法总指数和加权调和平均法总指数。
17、时间数列时间数列是指同一观察现象的观察值按其发生的时间先后顺序排列而形成的数列。
时间数列也称为时间序列和动态数列。
18、相关分析和回归分析相关分析是一种分析几个变量之间是否存在关系以及它们的关系如何的统计方法。
回归分析是指对具有显着相关关系的现象,根据其关系形态,选择一合适的数学模式,用来近似地表达变量见的平均变动关系的统计分析的方法。
19、时间序列的最初水平、中间水平和最末水平时间数列中第一个观察值称为最处水平,最后一个观察值称为最末水平,其余各个观察值称为中间水平。
20、调查对象、调查单位和填报单位调查对象是所要研究对象的总体。
调查单位是所要研究对象的个体。
填报单位是提交调查资料的单位。
调查单位和填报单位有时相同,有时不同。
21、环比发展速度和定基发展速度环比发展速度是以报告期水平与其前一期水平对比,所得到的动态相对数。
表明现象逐期的发展变动程度。
定基发展速度是用报告期水平与某一固定基期水平(通常为最初水平)对比,所得到的动态相对数。
它表明所观察现象在一段时期内发展的总速度。
22、经常性调查与一次性调查的区别两者的区分是以调查单位的登记在时间上是否具有连续性为依据的。
经常性调查的对象本身具有连续不断变化的特点。
商品零售额。
一次性调查的对象是时点现象。
如人口普查。
二、简答题1、指标和标志的区别与联系两者的区别:(1)指标是反映总体特征的,而标志是反映总体单位特征的。
(2)标志可以用文字来反映,也可以用数字来表示。
而指标都是用数量来表示的。
两者的联系:(1)指标是指标的汇总和综合。
(2)根据研究目的的不同,两者有时可以互换。
2、统计总体的特点(1)同质性。
即总体单位都必须具有某些共同的品质标志属性或数量标志属性。
这是构成总体的前提。
(2)大量性。
即构成总体的总体单位数目要足够多。
这是形成总体的充分条件。
(3)差异性。
即总体单位必须具有一个或若干个可变的品质标志或数量标志。
这是形成总体的必要条件。
3、重点调查、抽样调查、典型调查的区别与联系联系:都是非全面调查,调查对象都是总体中的一部分4、统计绝对数的分类(1)按其反映总体内容的不同分:总体单位总量和总体标志总量。
(2)按其反映不同的时间状况不同分:时期指标和时点指标。
(3)按其采用的计量单位的不同分:实物指标、价值指标和劳动指标。
5、时期指标和时点指标的区别时期指标:(1)连续记数,其值可以相加(2)具有时间长度,与时间长短有关(3)是流量时点指标:(1)间断记数,其值不可以相加,相加无实际意义(2)不具有时间长度,与时间长短无关(3)是存量6、抽样技术的特点(1)在调查单位的抽取上,遵循随机原则。
(2)以样本数据估计总体数据。
(3)以概率估计的方法对总体进行估计。
(4)在推断理论上,以大数定律和中心极限定理为基础。
(5)抽样误差可以计算并加以控制。
7、抽样误差的种类(1)登记性误差。
又称调查误差或工作性误差,是完全可以避免的。
(2)代表性误差。
它又可以分为系统性误差和随机性误差。
系统性误差是破坏随机原则造成的偏差,也是可以避免的。
随机性误差包括抽样个体误差和抽样平均误差。
抽样个体误差不确定,难以计算。
抽样平均误差无法避免,但可以计算和控制。
8、影响抽样误差的因素(1)总体总变量值X间的差异大小。
差异越大,误差越大。
(2)样本容量。
样本容量越大,抽样误差越小。
(3)抽样方法。
重复抽样误差一般大于不重复抽样误差。
(4)抽样调查的组织形式。
不同的组织形式,误差不同。
9、统计相对数的种类(1)计划完成相对数。
是实际完成数与计划数的比值。
(2)结构相对数。
是总体各组成部分数值与总体总数值的比值。
(3)比例相对数。
总体中某一组的指标数值与总体中另一组的指标数值的比值。
(4)动态相对数。
某现象报告期数值与同一现象基期数值的比值。
(5)比较相对数。
某类现象的数值与不同空间同类现象的数值的比值。
(6)强度相对数。
某一现象数值与另一有联系但性质不同的现象数值的比值。
10、强度相对数与平均数的区别(1)概念含义不同。
平均数=总体标志总量/总体单位总量。
强度相对数是某一现象数值与另一有联系但性质不同的现象数值的比值。
(2)作用不同。
强度相对数是反映某现象在另一现象中的强度、密度或普遍程度,反映现象间依存性的比例关系。
而平均数是反映总体各单位的某一变量的各个变量值一般水平的代表值。
(3)表现形式不同。
强度相对数的单位多是复合单位,由分子、分母的指标单位复合而成。
平均数则是和标志总量单位的一致。
(4)强度相对数分子、分母可以互换,平均数的分子、分母不可以互换,互换无意义。
11、统计指数的种类(1)按反映对象的范围不同分:个体指数、类指数和总指数。
(2)按反映统计指标的不同内容分:质量指标指数和数量指标指数。
(3)按所采用的基期不同分:定基指数和环比指数。
(4)按表现形式不同分:综合法总指数和平均法总指数。
12、相关关系的种类(1)从涉及的因素多少来分,可分为单相关和复相关。
只研究两个因素之间的相关关系叫单相关。
两个以上的为复相关。
(2)从相关关系所呈现形态来分,可分为直线相关和曲线相关。
(3)直线单相关按呈现相关关系的方向划分,又可分为正相关和负相关。
正相关表明两个因素的变动方向是相同的,负相关表明两个因素的变动方向是不同的。