统计学名词解释整理

合集下载

统计学名词解释(超全)

统计学名词解释(超全)统计学：是一门搜集、整理、显示和分析统计数据的方法论科学。

总体：就是统计所要研究的事物或现象的全体，即由客观存在的，具有某种共同特征的许多个别事物构成的整体。

参数：是描述总体数量特征的指标，又称总体指标。

样本：是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。

变量：指给所要研究的事物起的名字，包括可变的标志和所有的统计指标。

总体参数：描述总体数量特征的指标，又称总体指标。

样本统计量：是根据样本数据计算出来的样本指标，用来描述样本的数量特征。

普查：为某一特定目的而专门组织的一次性全面调查。

抽样调查：是按随机原则，从总体中抽选部分单位进行观察，并根据部分单位（样本）的调查数据，从数量方面推断总体参数的一种非全面调查。

统计分组：根据被研究现象总体的内在特点以及统计研究的目的，将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。

统计表：指显示统计整理结果的表格，就是把通过整理的调查数据，使其成为得以说明现象总体数量特征的分组数据，并按一定顺序排列而形成的表格。

时期数据：反映现象总体在一段时期内发展变化总结果的总量指标。

时点指标：反应现象整体在某一的点（瞬间）上所处状况的总量指标。

众数：是一组数据中出现次数最多的变量值。

时间序列：将反映某种现象的统计指标在不同时间上的数值，按时间顺序排列而成的序列。

发展水平：时间序列中的每一项指标数值，都称为发展水平，它反映了某种现象在一定时期或时点所达到的规模和水平。

均匀发展水平：将不同时间的发展水平加以均匀而得到的均匀数。

发展速度：是反映现象发展变化快慢程度的动态相对指标，是根据两个不同时期的发展水平对比求得的。

环比发展速度：是时间序列中敷陈期发展水平与前期发展水平之比，表明现象逐期发展变化的方向和程度。

定基发展速度：是报告期发展水平与某一固定时期发展水平（最初发展水平）之比，说明现象在较长时期内总的发展变动方向与程度。

统计学名词解释整理

第一章：绪论第一节统计的产生与发展1.统计—总括地计算；对某一现象有关的数据进行搜集、整理、计算和分析等；统计学概括地说统计就是用数字作为语言表述事实。

它有三层含义即:统计资料、统计工作、统计学2统计资料是反映一定社会经济现象或科学技术内容的统计数字和相联系的文字分析报告。

3统计工作是在一定理论指导下，采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。

3统计学是研究如何测定、收集、整理、归纳和分析反映客观现象总体数量的数据，以便给出正确认识的方法论科学。

其目的就是探索数据内在的数量规律性（为什么?）。

P8三者之间的关系：统计工作和统计资料是过程与成果的关系；统计工作和统计学是实践与理论的关系，理论源于实践，理论又高于实践，反过来又指导实践。

统计学是统计工作的经验概括和总结，是系统化了的知识体系。

第二节统计的基本问题1.统计的作用认识世界的有力武器是治国和管理的重要手段是科学研究的有效工具P42.统计的特点数量性总体性（综合性）具体性3.统计工作过程统计设计→统计调查→统计整理→统计分析4、统计设计就是根据统计活动的目的，结合研究对象的性质、特点，对统计范围、统计指标、分类目录、资料搜集整理方法、分析要求及有关组织工作等方面所作出的整体规划。

5、统计调查就是根据统计活动的目的所确定的统计指标，把研究对象中各总体单位的某些必须了解的特征记录下来。

6、统计整理就是根据统计设计的要求，将调查资料进行审核、分组、汇总、编制统计表等科学加工处理的过程，以便清晰地反映研究总体的综合特征。

7、统计分析就是根据统计研究的任务，以统计数据为基础，结合具体情况，运用静态和动态分析方法进行研究，肯定成绩，发现问题，找出原因，根据事物的本质及其规律性，提出解决问题的方法，更好地为社会主义现代化建设服务。

第三节统计学的若干基本概念1、总体：指在某种共性的基础上由许多个别事物结合起来的整体。

简言之总体是同质个体所组成的整体。

(完整)统计学名词解释

名词解释：医学统计学：用统计学的原理和方法研究生物医学问题的一门学科.变量（variable ）：观察单位的某项特征变量值（value of variable ）：变量的观察结果（测量值）总体(population ）：是根据研究目的确定的同质的观察单位的全体，确切的说是同质的所有的观察单位某种变量值的集合。

样本（sample)从总体中随机抽取部分由代表性的观察单位，其测量值的集合称为样本。

随机抽样(random sample ）：按随机化原则从总体中抽取部分观察单位的过程。

同质（homogeneity ）:是针对被研究指标来讲，其影响因素相同.简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。

变异（variation)：指在自然地状态下,个体测量结果在同质基础上的差异。

等级资料（ordinal data ）：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位称为等级资料，如患者的治疗结果可分为治愈,好转，有效，无效,死亡.有序变量(定性变量的一种）。

概率（probability)：是度量某一随机事件A 发生可能性大小的一个数值，记为P （A ），P （A ）越大，说明A 事件发生的可能性越大,0〈P(A)<1,小概率事件.频率（frequency ）：在相同的条件下，独立重复做n 次实验，事件A 出现了m 次,比值m/n 称为随机事件A 在n 次实验中出现的频率。

随机误差（random error):排除了系统误差后的尚存的误差，受多种因素影响，使观察值不按照方向性和系统性而随机的变化，误差变量一般服从正态分布,可以通过统计处理来估计.系统误差（system error ）:由于受试对象,研究者，仪器设备，研究方法等非实验因素影响等确定性原因造成，有一定倾向性或规律性的误差，可以避免.随机变量（random variable ）:是指取值不能事先确定的观察结果，不能用一个正常数来表示，每个变量的取值服从特定的概率分布。

统计学（名词解释及简答）

统计学名词解释统计量：用来描述样本特征的概括性数字度量简单随机抽样：指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

整群抽样：是将总体中各单位归并成若干个互不交叉、互不重复的集合，称之为群；然后以群为抽样单位抽取样本的一种抽样方式。

系统抽样：根据样本容量要求确定抽选间隔，然后随机确定起点，每隔一定的间隔抽取一个单位的一种抽样方式众数：是一组数据中出现次数最多的变量值中位数：是一组数据排序后处于中间位置上的变量值平均数：也称均值，是一组数据相加后除以数据的个数得到的结果标准差：离均差平方和平均后的方根区间估计：在点估计的基础上，给出总体参数估计的一个区间范围，该区间通常由样本统计量加减抽样误差得到。

假设检验：利用样本信息，对提出的命题进行检验的一套程序和方法。

双侧假设检验：当统计量U的观测值的绝对值大于临界值Uα/2即|u0|＞Uα/2时，则拒绝原假设H0，此时假设检验的拒绝域在统计量分布的两侧尾部，则称这种假设检验为双侧假设检验。

相关系数：是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

回归模型：描述因变量y如何依赖于自变量x和误差项的方程。

回归方程：描述因变量y的期望值如何依赖于自变量x的方程。

估计的回归方程：根据估计数据求出的回归方程的估计。

多重共线性：是指线性回归模型中的两个或两个以上的自变量彼此相关。

时间序列：是同一现象在不同时间上的相继观察值排列而成的序列。

趋势：是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动，也称长期趋势。

季节变动（季节性）：时间序列在一年内重复出现的周期性波动。

指数：广义的讲，任何两个数值对比形成的相对数都可以称作指数，狭义的讲，指数是用于测定多个项目在不同场合下综合变动的一种相对数。

消费者价格指数（CPI）：反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。

简答一、概率抽样与非概率抽样比较答：非概率抽样不是依据随机原则抽选样本，样本统计量的分布是不确切的，因而无法使用样本的结果对总体相应的参数进行推断。

统计名词解释

2 2 2 2 2
应很小，即出现大X 值概率很小。即X 越大，P越小，若P≤a时，就怀疑假设的成立，拒绝H0。若P>a则没有理由拒绝H0。 29. X 用途：（1）实际频数与拟合频数拟合优度： A推断两个或两个以上总体率或构成比有无差别（四格表/行x列表）。 B两变量之间有无相互关系。C频数分布的拟合优度检验（判断次样本是否来自某种分布）。（2）某些分布可用X 近似。（3）间接应用：如t分布和F分布就是在X 分布基础上推导出来的。 30. 方差分析的基本思想：根据研究目的和设计类型，把总体变异中离均差平方和分解成两部分或更多部分，也把总变异中的自由度相应分成两部分或更多部分，然后再进行比较，评价由某种因素引起的变异是否具有统计学意义。 31.假设检验中P，a,b（倍他）的关系及统计学意义： a：检验水准，即显著性检验，在此概率之下的认为是小概率事件，统计学上以为此事件“不可能发生”，以此判断是否不拒绝H0无效假设，在假设检验中，按a检验水准，拒绝了原来正确的H0，即犯了第1类错误，犯此错误的概率为a。 b：在T假设检验中，按照a检验标准，没有拒绝原来错误的无效假设，即犯了第2类错误，犯次错误的概率是b。 P：是在H0成立时大于等于用样本计算的统计值出现的概率用P值与检验水准a比较，根据比较的结果作出统计判断。如果P≤a时，就怀疑假设的成立，拒绝H0。若P>a则接受H0拒绝H1。P值越小只能说明作出拒绝H0，接受H1的推论时犯错误的机会越小。 32.制定参考值步骤：（1）从正常人总体中抽样（2）控制测量误差（3）判定是否需要分组确定参考值范围（4）决定单侧还是双侧（5）选择合适的百分上限（6）对资料的分布进行正态性检验（7）根据资料的分配类型选定恰当的方法进行参考值范围的估计 33. 标准差与标准误不同：（1）二者描述内容不同：前者个体变异；后者群体变异。（2）二者与n样本含量关系不同：n很小时S不稳定，n足够大时S接近总体标准差；而S不变时，n接近无穷大时，标准误接近0。（3）二者用途不同：S：描述观察值的离散程度/计算CV即变异系数/估计医学参考值范围/计算标准误；标准误：反映均数抽样误差大小/估计总体均数可信区间/用于假设检验。 34. 变量：观察指标在统计学上统称为指标变量，它反应的是生物个体间的变异情况，根据其性质可分为定性变量（分类）和定量变量（连续）。

统计学名词解释

名词解释：1、分类数据：是只能归于某一类别的非数字型数据，它是对事物进行分类的结果，数据表现为类别，是用文字来表示的。

(P5)2、四分位数：也称四分位点，它是一组数据排序后处于25%和75%位置上的值。

(P89)3、方差分析：是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

(P264)4、相关系数：是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

(P304)5、居民消费价格指数：是度量居民消费品和服务项目价格随时间变动的相对数，反映居民家庭购买的消费品和服务价格水平的变动情况。

(420)6、顺序数据：是只能归于某一有序类别的非数字型数据。

(P6)7、抽样误差：是由于抽样的随机性引起的样本结果与总体真值之间的误差。

(P33)8、离散系数：也称变异系数，它是一组数据的标准差与其相应的平均数之比。

计算公式为：(P103)1.v s= s／⎺x9、置信区间：在区间估计中，由样本统计量所构成的总体参数的估计区间。

(P177)10、点估计：用样本统计量＾θ的某个取值直接作为总体参数θ的估计值。

(P176)11、系统抽样：将总体中的所有单位（抽样单位）按一定的顺序排列，在规定的范围内随机地抽取一个单位作为初始单位，然后按后按事先规定好的规则确定其他样本单位。

(P19)12、中心极限定理：设从均值为μ、方差为σ2（有限）的任意一个总体中抽取样本量为n的样本，当n充分大时，样本均值⎺X的抽样分布近似服从均值为μ、方差为σ2／n的正态分布。

(P165)13、回归模型：描述因变量ｙ如何依赖于自变量ｘ和误差项的方程。

对于只涉及一个自变量的一元线性回归模型可表示为ｙ=β0+β1ｘ+ε。

(P308)14、指数平滑法：是通过对过去的观察值加权平均进行预测的一种方法，该方法是t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。

(P378)15、非概率抽样：是相对于概率抽样而言的，指抽取样本时不是依据随机原则，而是根据研究目的对数据的要求，采用某种方式从总体中抽出部分单位对其实施调查。

统计学名词解释

抽样平均误差:是指所有可能出现的样本的样本指标的标准差，也可以说是所有可能出现的样本指标和总体指标的平均离差。

总量指标：是反映社会经济现象在一段时间、地点、条件下的总规模或总水平的统计指标。

也称绝对指标或绝对数。

平均指标：平均指标是说明同质总体内某一数量标志在一定历史条件下一般水平的综合指标。

不变价格：是在综合不同的产品产量并反映他们的总动态时，为了消除不同时期价格变动的影响所用的固定价格。

指数：广义：指一切说明社会经济现象数量变动或差异程度的相对数。

狭义：指一种特殊相对数，也即专指不能直接相加和对比的复杂社会经济现象综合变动程度的相对数。

置信区间：统计上把这个给定的抽样误差范围叫做抽样极限误差，也称置信区间（抽样误差范围：变动的的抽样指标与确定的全及指标之间离差的可能范围）发展水平：在动态数列中，各项具体的指标数值叫发展水平或动态数列水平。

它反映社会经济现象在不同时期所达到的水平，是计算其他动态分析指标的基础。

长期趋势：就是研究某种现象在一个相当长的时期内持续向上或向下发展变动的趋势。

抽样推断：按已经抽定的样本指标（样本平均数或样本成数）来估计总体指标（总体平均数或总体成数），或其所在的区间范围。

抽样调查：按照随机原则从总体中抽取一部分单位进行观察，并运用数理统计的原理，以被抽取的那部分单位的数量特征为代表，对总体作出数量上的推断分析。

质量指标：指反映现象总体的社会经济效益和工作质量的各种相对指标和平均指标。

标准差系数：根据标准差与算术平均数对比的离散系数。

数量指标:指说明总体规模和水平的各种总量指标。

相对指标：又称相对数，它是两个有联系的指标数值对比的结果。

用来对比的两个数，既可以是绝对数，也可以是平均数和相对数。

估计标准误差:就是用来说明回归方程推算结果的准确程度的统计分析指标，或者说是反映回归直线代表性大小的统计分析指标。

指数体系：是由三个或三个以上有联系的指数所组成的数学关系式。

完整版)统计学名词解释

完整版)统计学名词解释统计学名词解释第一章绪论在统计学上，随机变量指的是取值之间不能预料到的变量。

总体，又称母全体或全域，是指具有某种特征的一类事物的全体。

构成总体的每个基本单元称为个体。

从总体中抽取的一部分个体称为样本。

次数指的是某一事件在某一类别中出现的数目，又称为频数。

频率，又称相对次数，指某一事件发生的次数被总的事件数目除，即某一数据出现的次数被这一组数据总个数去除。

概率指某一事物或某一情在某一总体中出现的比率。

一旦确定了某个值，就称这个值为某一变量的观测值。

参数，又称为总体参数，是描述一个总体情况的统计指标。

样本的那些特征值叫做统计量，又称特征值。

第二章统计图表统计表是由纵横交叉的线条绘制，并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。

一般由表号、名称、标目、数字、表注组成。

统计图一般采用直角坐标系，通常横轴表示事物的组别或自变量x，称为分类轴。

纵轴表示事物出现的次数或因变量，称为数值轴。

一般由图号及图题、图目、图尺、图形、图例、图组成。

简单次数分布表适合数据个数和分布范围比较小的时候用，它是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。

而分组次数分布表适合数据个数和分布范围比较大的时候用。

数据量很大时，应该把所有的数据先划分在若干区间，然后将数据按其数值大小划归到相应区域的组别内，分别统计各个组别中包括的数据个数，再用列表的形式呈现出来。

分组次数分布表的编制步骤包括求全距、定组距和组数、列出分组组距、登记次数和计算次数。

相对次数分布表用频数比率或百分数来表示次数，而累加次数分布表则把各组的次数由下而上或由上而下加在一起。

最后一组的累加次数等于总次数。

双列次数分布表用同一个表表示有联系的两列变量的次数分布。

而不等距次数分布表则适用于像工资级别和年龄分组这样的不等距数据。

需要注意的是，归组效应是分组次数分布表的缺点之一，因为原始数据不见了，从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入，出现误差。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

统计学名词解释整理
统计学名词解释整理
1、统计学是收集、分析、表述和解释数据的科学。

2、社会统计方法是指搜集、整理与分析资料的研究技术或手段。

3、大量观察是就总体中足够多的单位进行调查和综合分析，用以反映社会总体的数量特征，大量观察法是统计调查阶段的重要方法。

4、统计按其内容主要包括两个方面：描述统计和推断统计。

5、描述统计就是讨论范围仅以搜集的资料本身为限，而不予以扩大，是统计分析方法的基础。

内容有搜集数据、整理数据、展示数据、描述性分析，目的在于描述数据特征、找出数据的基本规律。

6、推断统计主要是依据概率论，研究如何依据有限资料对总体性质作推断，从而使统计的功能大为扩充。

内容有参数估计和假设检验，目的在于对总体特征作出推断。

7、参数估计，即由样本的指标数值推断总体的相应的指标数值，包括点估计和区间估计。

8、假设检验，即就社会研究中提出的某种假设应用抽样方法来加以统计检验。

9、程序是指研究工作的顺序和步骤，是人们根据客观法则和人的认识规律而作出的一种逻辑安排。

10、社会统计工作的程序：①制定计划②统计调查③统计整理
④统计分析⑤统计报告
11、统计调查就是按照统计研究所预定的目的和任务，运用各种调查的组织形式，有组织、有计划地向调查对象搜集原始资料的工作过程。

12、统计整理就是根据统计研究的目的和任务，对调查所得的资料进行加工整理，使之条理化、系统化。

13、统计分析是对研究对象进行定量分析。

14、统计报告就是将所得结果用文字报告的形式表达出来。

15、统计数据是对现象进行计量的结果，不是指单个的数字，而
是由多个数据构成的数据集，不仅仅是指数字，它可以是数字的，也可以是文字的。

16、统计数据的分类：①按计量层次分：分类数据、顺序数据、数值型数据②按收集方法分：观察的数据、试验的数据
③按时间状况分：截面数据、时序数据
17、分类数据：对事物进行分类的结果，数据表现为类别，用文字来表述，例如，人口按性别分为男、女两类。

18、顺序数据：对事物类别顺序的测度，数据表现为类别，用文字来表述，例如，产品分为一等品、二等品、三等品、次品等。

19、数值型数据：对事物的精确测度，结果表现为具体的数值，例如：身高为175cm、168cm、183cm。

20、观测的数据：通过调查或观测而收集到的数据，在没有对事物人为控制的条件下而得到的，有关社会经济现象的统计数据几乎都是观测数据。

21、试验的数据：在试验中控制试验对象而收集到的数据，比如，对一种新药疗效的试验，对一种新的农作物品种的试验等，自然科学领域的数据大多数都为试验数据。

22、截面数据：在相同或近似相同的时间点上收集的数据，描述现象在某一时刻的变化情况，比如，2002年我国各地区的国内生产总值数据。

23、时间序列数据：在不同时间上收集到的数据，描述现象随时间变化的情况，比如，1996年至2002年国内生产总值数据。

24、总体，就是作为统计研究对象的、由许多具有共性的单位构成的整体，构成总体的每一个个体称为总体单位，简称单位，也称为个体。

也可以说是所研究的全部元素的集合，其中每一个元素称为个体。

总体具有三个基本特征：大量性、同质性和变异性。

25、总体按其包括的'单位的数目是有限还是无限，分成有限总体和无限总体。

有限总体的范围能够明确确定，且元素的数目是有限的，无限总体所包括的元素是无限的，不可数的。

26、无限总体是指在一个合理时间内不能将全部单位一一列举。

27、样本是从总体中抽取的一部分元素的集合，构成样本的元素的数目称为样本容量。

从总体中选出样本的过程叫做抽样。

28、总体的每个单位都具有许多属性和特征，说明总体单位属性或数量特征的名称在统计上称为标志。

如在学生总体中，每个学生的性别、籍贯、年龄、文化程度、民族等特征，就是该总体单位的标志。

29、凡能用数量的多少来表示的标志，称为数量标志，如年龄，它们用以说明事物量的规定性。

30、凡不能用数量的多少来表示而只能用文字表述的标志，称为品质标志，如性别，它们用以说明事物质的规定性。

31、标志按变异情况可以分为不变标志和可变标志。

32、不变标志是构成总体同质性的基础，任何个体只有在某些预设的不变标志的基础上才能集合成一个总体。

33、可变标志是统计研究真正所关心的，可变的品质标志无法用数值表示，我们称之为变项；可变的数量标志能够用数值表示，我们称之为变量。

《统计学名词解释整理》。