统计学名词解释超级大全
统计学名词解释(超全)

统计学名词解释(超全)统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。
总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。
参数:是描述总体数量特征的指标,又称总体指标。
样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
总体参数:描述总体数量特征的指标,又称总体指标。
样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。
普查:为某一特定目的而专门组织的一次性全面调查。
抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。
统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。
统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。
时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。
时点指标:反应现象整体在某一的点(瞬间)上所处状况的总量指标。
众数:是一组数据中出现次数最多的变量值。
时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。
发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。
均匀发展水平:将不同时间的发展水平加以均匀而得到的均匀数。
发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。
环比发展速度:是时间序列中敷陈期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。
定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。
统计学名词解释

1、统计包括三方面的涵义:统计活动、统计资料、统计学;2、统计活动:是在一定的理论指导下,采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。
3、统计资料:即统计信息,它集中、全面、综合地反应国民经济和社会发展的现象和过程4、统计学:即统计理论,是一门独立的方法论科学,它根据自己的研究对象,系统的阐述统计理论的方法5、统计总体:是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的,具有某种共同性质的许多个别单位构成的整体。
6、总体单位:是指构成总体的个体单位,它是总体的基本单位。
(又称个体)7、同质性:指总体各单位在某一标志上的共同性8、变异性:指总体所有单位至少有一个以上的可变品质标志或数量标志9、大量性:指统计总体中的单位应有足够的数量,如果总体单位应有足够的数量,如果总体单位数量很少,就难以揭示总体的规律性10、标志:是指统计总体中各单位所具同具有的属性和特征11、品质标志:表明总体单位属性方面的特征,用文字表示12、数量标志:数量方面的特征13、指标:是反映社会经济现象总体数量特征的概念和数值。
14、变异:统计中的标志和指标都是可变的15、变量:可以取不同值得量,在社会经济统计学中,各种数量标志和全部统计指标都是变量16、连续变量:数值是连续不断的,相邻两值之间可作无限分割,即可去无限数值17、离散变量:数值都是以整数位断开的,其数值要用计算的方法取得18、确定性变量:变量值的变动受制于某种决定性因素,致使其沿着一定的方向变动19、随机变量:影响变量值变动的因素有很多,作用不同,因而变量值变动无确定方向20、统计法:国家制定和认可的调整参与统计活动的各方面——统计主体、客体、宿体在统计活动中形成的社会关系的法律规范的总称21、统计设计:对一个完整的统计工作涉及各个方面和各个环节的通盘考虑和适当安排22、统计指标体系:将反映社会经济现象数量特征的一系列相互依存、相互联系的统计指标有机结合所组成的整体;23、指标名称:指标质的规定,它反映一定的社会经济范畴24、指标数值:根据指标的内容所计算出来的具体数值25、数量指标:反映总体总规模、总水平或总工作量的统计指标,又称总量指标26、质量指标:反映总体内部数量关系、单位一般水平、工作质量的统计指标27、描述指标:对总体及其组成部分的规模水平和数量关系进行客观描述的统计指标28、评价指标:反映社会经济总体的结构、比例、速度以及利用状况和效益、效果的统计指标29、监测指标:对社会经济总体运行进行跟踪监测,看其是否偏离既定目标,是否保持平衡的统计指标30、预警指标:可以对总体运行中出现的偏离进行及时的调控31、统计调查:是按照统计的任务和调查的目的要求,运用科学的方法搜集或者收集被研究对象的各个标志值的过程。
(完整)统计学名词解释

名词解释:医学统计学:用统计学的原理和方法研究生物医学问题的一门学科.变量(variable ):观察单位的某项特征变量值(value of variable ):变量的观察结果(测量值)总体(population ):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。
样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。
随机抽样(random sample ):按随机化原则从总体中抽取部分观察单位的过程。
同质(homogeneity ):是针对被研究指标来讲,其影响因素相同.简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。
变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。
等级资料(ordinal data ):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡.有序变量(定性变量的一种)。
概率(probability):是度量某一随机事件A 发生可能性大小的一个数值,记为P (A ),P (A )越大,说明A 事件发生的可能性越大,0〈P(A)<1,小概率事件.频率(frequency ):在相同的条件下,独立重复做n 次实验,事件A 出现了m 次,比值m/n 称为随机事件A 在n 次实验中出现的频率。
随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计.系统误差(system error ):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免.随机变量(random variable ):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。
统计学名词解释

名词解释1.备择假设(alternative hypothesis):与原假设逻辑上反面的假设。
2.标准分数(standard score):也称标准化值或分数,它是变量值与其平均数的离差除以标准差后的值。
3.残值(residual):因变量的观测值y i与根据估计的回归方程求出的预测值y i之差,用e表示。
对于第i个观测值,残差为e i=y i-y i。
4.α错误(αerror):原假设为真却在检验中将原假设被拒绝,又称弃真错误或者第一类错误(type I error),用α表示其概率。
5.β错误(βerror)原假设为伪却在检验中未拒绝的原假设,又称取伪错误或者第二类错误(type II error),用β表示其概率。
6.对照组(control group):随记选取的实验对象的子集。
在这个子集中,每个单元不接受实验组成员所接受的某种特别的处理。
7.多重共线性(multicollinearity)回归模型中两个或两个以上的自变量彼此相关。
8.多重判定系数(multiple coefficient of determination)回归平方和占总平方和的比例,反映因变量y取值的变差中,能被估计的多元回归方程所解释的比例。
9.峰态(kurtosis)对数据分布平峰或尖峰的程度的测度。
10.假设检验(hypothesis testing)根据样本信息,对提出的命题进行检验的一套程序和方法。
11.离散系数(coefficient variation)也称变异系数,一组数据的标准差与其相对应的平均数之比,是测度数据离散程度的相对值。
12.拟合优度实验(goodness of fit test)对多个总体比例是否等于其期望概率的检验。
当期望概率相同时,表现为对多个总体的比例是否相等的检验。
13.偏态(skewness)对数据分布对称性的测度。
14.异众比率(variation ratio)非众数组的频数占总频数的比例。
统计学名词解释

17.相对指标:也称相对数,就是将两个有联系指标的数值进行对比的结果;
18.时期数列:是由时期指标形成的,数列中的每个指标数值都是反映某种社会经济现象在一段时期内发展过程的总量;
29.简单随机抽样:这是按随机原则从总体N个单位中直接抽取n个单位做样本,使总体中每一个单位都有同等的可能性被抽中;
30.简单相关表:是资料未经分组的相关表,它是相关因素的标志值按照大小顺序并配合结果标志值一一对应而平行排列起来的统计表;
31.常住单位:是指在我国的经济领土上具有经济利益中心的经济单位;
88.组中值:指本组的上限与下限之间的中点值。它代表组内所有单位的标准值的平均水平。
89.次数分布:是指在统计分组的基础上,将总体的所有单位按组归类整理,并按一定顺序排列,形成总体单位在各组间的分布。
90.总体:按数量标志分组就形成变量分配数列,简称变量数列。
91.统计表就是用来表现统计资料汇总整理结果的汇总表。
92.累计次数:是指数列中高于或低于某一变量值的次数总和。
93.强度相对指标:是两个性质不同但是存在一定联系的指标的对比,用来反映事物的强度、密度和普遍程度的指标。
94.众数:是指总体中出现次数最多的标志值。
95.平均发展水平:将不同时期的发展水平加以平均而得的平均数叫平均发展水平,在统计上又称为序时平均数或动态平均数。
44.资本形成
:是指各机构单位通过经济交易获得或处理生产资产的行为;
45.因素分析法:它是利用指数体系,对现象的综合变动从数量上分析其受各因素影响的一种分析方法。
统计学名词解释超级大全

大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不 变的。
有效数字:指能影响测量准确性的数字。
变量:又称随机变量。具有变异性的数据。三个特性,离散型,变异性,规 律性。
推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通 过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据 已知的情况推测未知情况。
实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、 更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。
统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保 持总体的特征。这种样本特性保持着总体特性的现象叫做统计常态法则。
次数:某一事件在某一类别中出现的数目,又叫频数,用 f 表示。 频率:指每一组的数据个数除以数据的总和,又称相对次数。用符号 p 表示。 百分频率:频率与百分数的乘积。
组中值:每一组的中点值,常用 m 或 Xc 表示。 全距:全部数据的距离,也称极差,是用一群数据中的最大值减去最小值。 组距:指每一组所包含的间隔或数据单位,用 i 表示。 组限:指每一组的起止点或每一组的界限。
统计表:以表格的形式表达统计资料数量关系的方式或工具。 统计图:以几何图形和形象图形表示统计资料数量关系的工具。
次数分布 累积次数:以简单次数为基础,从最低组开始逐级累加直至最高组,或从最 高组开始逐级累加直至最低组,用符号 cum﹒f 或 F 表示。 累积百分频率:各组累计次数与总次数的比值。
一时性资料:在一定时限内所收集的有关问题的资料为一时性资料。来源三 个方面,教育与心理调查,教育与心理测量和教育与心理实验。
统计学名词解释

1、统计学:是运用数理统计的基本原理和方法研究预防医学和卫生事业管理中资料的收集,整理和分析的一门应用科学。
具体地讲,是按照设计方案去收集、整理、分析数据,并对数据结果进行解释,从而做出比较正确的结论。
2、总体:是根据研究目的确定同质的所有观察单位某种变量的集合。
3、变异:同一性质的事物,其观察值(变量值)之间的差异。
4、抽样研究:从所研究的总体中随机抽取一部分有代表性的样本进行研究,用样本指标推论总体,最终达到了解总体的目的。
这种用样本指标推论总体参数的方法称为抽样研究。
5、统计描述:用统计图表或计算统计指标的方法表达一个特定群体的某种现象或特征。
6、统计推断:根据样本资料的特性对总体的特性作估计或推论的方法称统计推断,常用方法是参数估计和假设检验。
7、概率:是指某事件出现可能性大小的度量,以符号P表示。
8、医学参考值范围:参考值范围又称正常值范围。
医学上常把包括绝大多数人某项指标的数值范围称为该指标的参考值范围。
9、正态分布规律:实际工作中,经常需要了解正态曲线下横轴上的一定区域的面积占总面积的百分数,用以估计该区间的观察例数占总例数的百分数,或变量值落在该区间的频数或概率。
10、可比性:是指对研究结果有影响的非处理因素在各处理组之间尽可能相同或相近。
11、动态数列:是一系列按时间顺序排列起来的统计指标,包括绝对数、相对数或平均数,用以说明事物在时间上的变化和发展趋势。
12、抽样误差:在同一总体中随机抽取样本含量相同的若干样本时,样本指标之间的差异以及样本指标与总体指标的差异。
13、标准误:表示样本均数间变异程度。
14、率的抽样误差:抽样过程中产生的同一总体中均数之间的差异称为均数的抽样误差,率之间的差异称为率的抽样误差。
15、参数估计:是指用样本指标(称为统计量)估计总体指标(称为参数)。
16、可信区间:总体参数的所在范围通常称为参数的可信区间或置信区间,即该区间以一定的概率(如95%或99%)包含总体参数。
统计学名词解释

名词解释:1、分类数据:是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来表示的。
(P5)2、四分位数:也称四分位点,它是一组数据排序后处于25%和75%位置上的值。
(P89)3、方差分析:是通过检验个总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
(P264)4、相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
(P304)5、居民消费价格指数:是度量居民消费品和服务项目价格随时间变动的相对数,反映居民家庭购买的消费品和服务价格水平的变动情况。
(420)6、顺序数据:是只能归于某一有序类别的非数字型数据。
(P6)7、抽样误差:是由于抽样的随机性引起的样本结果与总体真值之间的误差。
(P33)8、离散系数:也称变异系数,它是一组数据的标准差与其相应的平均数之比。
计算公式为:(P103)1.v s= s/⎺x9、置信区间:在区间估计中,由样本统计量所构成的总体参数的估计区间。
(P177)10、点估计:用样本统计量^θ的某个取值直接作为总体参数θ的估计值。
(P176)11、系统抽样:将总体中的所有单位(抽样单位)按一定的顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按后按事先规定好的规则确定其他样本单位。
(P19)12、中心极限定理:设从均值为μ、方差为σ2(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值⎺X的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。
(P165)13、回归模型:描述因变量y如何依赖于自变量x和误差项的方程。
对于只涉及一个自变量的一元线性回归模型可表示为y=β0+β1x+ε。
(P308)14、指数平滑法:是通过对过去的观察值加权平均进行预测的一种方法,该方法是t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。
(P378)15、非概率抽样:是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计学名词解释超级大全第一章导论统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。
教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门科学。
描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。
推断统计:又称抽样统计。
它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。
换言之,就是根据已知的情况推测未知情况。
实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。
统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。
这种样本特性保持着总体特性的现象叫做统计常态法则。
小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。
此处“小数”是指小数量的意思。
大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。
有效数字:指能影响测量准确性的数字。
变量:又称随机变量。
具有变异性的数据。
三个特性,离散型,变异性,规律性。
数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。
即数据。
总体:性质相同的一类事物的全体。
个体:构成总体的每一基本单位或单元。
样本:总体抽出的部分个体。
参数:表示总体特征的量数。
统计量:直接从样本计算出的量数,代表样本的特征。
名称变量:指一事物与其他事物在属性、类别上不同。
顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。
既无相等的单位又无绝对的零点的变量。
等距变量:只具有相等的单位,而没有绝对的零点的变量。
比率变量:既有相等的单位,又有绝对的零点的变量。
连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之间可以划分成无限多个细小单位,其数字形式多取小数。
离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。
计数数据:计算人或物的个数所获得的数据。
度量数据:用一定的测量工具或测量标准测量时所获得的数据。
指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果。
标志:指统计总体中各个个体共同具有的属性和特征,它是说明个体属性和特征的名称。
绝对数:用来表明在一定时间、地点条件下某种教育、心理现象的总体规模和发展水平的统计指标,又称总量指标。
相对数:指教育与心理现象中两个单位相同的相互联系的指标数值的比率。
品质标志:是表明个体属性特征的,不能用数量说明,只能用文字说明。
数量标志:是表明个体数量特征的标志,是用数值表示的。
第二章数据的搜集、整理与表达次数:某一事件在某一类别中出现的数目,又叫频数,用f表示。
频率:指每一组的数据个数除以数据的总和,又称相对次数。
用符号p表示。
百分频率:频率与百分数的乘积。
组中值:每一组的中点值,常用m或X c表示。
全距:全部数据的距离,也称极差,是用一群数据中的最大值减去最小值。
组距:指每一组所包含的间隔或数据单位,用i表示。
组限:指每一组的起止点或每一组的界限。
统计表:以表格的形式表达统计资料数量关系的方式或工具。
统计图:以几何图形和形象图形表示统计资料数量关系的工具。
次数分布累积次数:以简单次数为基础,从最低组开始逐级累加直至最高组,或从最高组开始逐级累加直至最低组,用符号cum﹒f或F表示。
累积百分频率:各组累计次数与总次数的比值。
一时性资料:在一定时限内所收集的有关问题的资料为一时性资料。
来源三个方面,教育与心理调查,教育与心理测量和教育与心理实验。
经常性资料:主要是日常工作中的记录和统计报表等。
直条图:用直条(或矩形)的长短表示统计数据多少的图形。
直方图:以矩形面积表示连续变量的统计图。
折线图:以纵轴的高度表示次数,并将各点用线段连接的统计图形。
散点图:表示事物相互关系的图形。
圆形图:用圆的面积表示一组数据的整体,用扇形表示各组成部分所占比重或百分比的统计图。
枝叶图:把首位数字或首几位数字定位枝,其他位数定为叶的一种数字图。
第三章集中量数集中量数:一组数据的代表值,用以说明一组数据分布的典型情况或一般水平,它比个别数据更能反映客观现象或事物的实际情况。
集中趋势:在实验、测量或调查中获得的大量观测数据,具有一种向数据中央某一点靠拢的趋势。
平均数:所有观测值(或变量值)的总和除以总个数所得的商。
中数:按一定顺序排列的一组数的中央位置的数值。
众数:一群数据中出现次数最多的那个数值,又称范数。
几何平均数:几个变量值乘积的n次方根。
调和平均数:指一群数据倒数的算术平均数的倒数,又称倒数平均数。
百分位数:任意百分位上的数值。
四分位数:1/4位置上的数值和3/4位置上的数值。
第四章差异量数离中趋势:差异量数:描述一组数据离中趋势的量数。
方差(S2/V/MS):一列数据离差平方的算术平均数。
一列数据平均差距地平方。
标准差(S/SD):方差的算术平方根。
一列数据的平均差距。
平均差(AD):离差绝对值的平均数。
全距(R g):最大值与最小值的差。
偏态量(SK/α3):三级中心动差。
峰态量(α4):四级中心动差。
百分位差:表示某两个百分位数之间差异程度的指标。
四分位差:是百分位差的特例。
用于分析P75与P25之差的一半。
统计动差:在统计学上,借用物理学中的动势(或动差)概念而称为统计动差。
中心动差:以平均数所在的位置为原点,以各组观测值与均数的差(X-X)为力臂,各组次数为作用力来计算动差。
这种以均数为原点计算的统计动差叫做中心动差。
第五章相对量数相对地位量数:就某一特质来描述个体在团体中所占的地位的量数。
相对差异量数:指差异量数与集中量数的百分比,又叫差异系数。
用符号CV表示。
标准差系数:标准差与平均数的百分比,用符号CV S表示。
百分等级:指把一组观测值先按高低次序排列起来,然后计算出某个个体的分数在百分位上超出多少人,或是在此分数下占多少百分比的一种量数,用符号P R表示标准分数:它有许多变形,其中最典型的标准分数为Z分数。
以标准差为单位所表示的“原始分数”与平均数的偏差,亦即原始分数与其平均数之差除以标准差所得的商。
第六章相关量数相关量数:分析或研究两个或两个以上变量之间相互关系的量数。
正相关:指一列变量由大到小或由小而大变化时,另一列变量亦由大而小或由小而大的变化,即两列变量是同方向变化的,属“同增共减”的关系。
负相关:指一列变量由小到大或由大而小变化时,另一列变量却由小而大或由大而小的变化,即两列变量是反方向变化的,属“此增彼减”的关系。
零相关:又称无相关,指两列变量的变化看不出一定的趋势。
相关系数:表示相关方向和大小的一种数值。
用符号r表示。
直线相关:指两列变量中的一列变量在增加时,另一列变量随之而增加;或一列变量在增加,另一列变量却相应的减少,形成一种直线关系。
曲线相关:指两列相伴随变化的变量,未能形成直线关系。
简相关:指只有两个变量的相关。
复相关:指有三个或三个以上变量的相关。
积差相关:直线相关中最基本的方法。
利用离差乘积的关系来说明事物的关系,是将原始记分转换为离差乘积,再转换为标准积差后所求得的标准积差的平均数。
用符号r XY表示斯皮尔曼等级相关:根据两列变量的成对等级差数计算的相关系数,又称“等级差数法”,用符号r p或r s表示。
肯德尔W系数:用于描述多列等级变量相关程度或一致性程度的相关方法。
点二列相关:研究一列等距或比率变量与一列“二分”名称变量之间相关的统计方法。
r pb二列相关:研究一列正态的比率或等距变量和一列人为“二分”名称变量之间相互关系的统计方法。
用符号r b或r bis表示phi系数:专门研究两列“二分”变量之间相关的统计方法,衡量两个分类变量均分为两类时其关联程度的指标。
即Φ相关。
用符号rΦ或Φ表示。
第七章概率分布及其应用二项分布:二项试验结果的概率分布。
正态分布:就是中间量数次数分布多,两端量数次数分布少,呈对称型的概率分布。
又叫高斯分布。
t分布:由小样本统计量形成的概率分布。
频率:一种随机事件发生的次数与总试验次数的比值。
概率:随机事件在试验中发生可能的程度或可能性的大小,用P表示。
概率的统计定义是指通过频率来计算的概率;又称经验概率。
概率的古典定义是根据问题本身所具有的“对称性”特点直接计算事件的概率;又称先验概率。
中心极限定理:推断统计中最基本的理论与方法,用极限的方法所求得随机变量分布的一系列定理。
随机抽样:随机样本:指按照概率的规律抽取的样本,即随机样本所包含的研究对象不是由某个人或集体的意向所决定的,只能凭各研究对象相互独立的机会而定。
抽样误差:由于抽样的随机性所引起的样本统计量与总体参数之间的不同。
标准误:样本统计量分布的标准差或某统计量在抽样分布上的标准差。
用符号SE或σx表示。
自由度:在推断统计中,把一群数据或观测值可以独立自由变动的数目称为自由度。
df /n’确定性事件:指在一定条件下必然会发生或必然不会发生的事件。
分为必然事件和不可能事件。
必然事件:指在一定条件下必然会发生的事件。
不可能事件:指在一定条件下必然不会发生的事件。
随机事件:在一定条件下,可能发生,也可能不发生的事件。
模糊事件:指对象类属边界和性态不确定的事件。
第八章参数估计参数估计:根据样本统计量去估计相应总体的参数。
总体平均数估计:用样本的均数去估计总体的均数。
点估计:在参数估计中直接以样本的统计量作为总体参数的估计值。
区间估计:以统计量的区间值来估计相应总体。
置信系数:指被估计的总体参数落在置信区间内的概率D,或以1-α表示,又叫置信水平,置信度,可靠性系数,置信概率。
置信区间:指在特定的可靠性(即置信系数)要求下,估计总体参数所落得区间范围,亦即进行估计的全距。
置信限:被估计的总体参数所落区间的上、下界限。
推断统计:指由样本资料区推测相应总体情况的理论与方法,也就是部分推全体,由已知推未知的过程。
无偏估计量:用统计量估计总体参数必然存在一定误差,恰好相等的情形是极少见的,当然,无偏性并不是说没有一点误差,而是要求用各个样本的统计量作为估计值,其偏差为0。
即∑(X-μ)=0。
这时的统计量被称为无偏估计量。
第九章参数检验假设检验:由于在进行差异检验时需要先对事物是否存在差异作出假设,然后再作统计检验,因此称为假设检验,又称差异的显著性检验。
α错误:指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使做出了拒绝虚无假设的结论,又称Ⅰ型错误。