完整版)统计学名词解释
统计学名词解释(超全)

统计学名词解释(超全)统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。
总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。
参数:是描述总体数量特征的指标,又称总体指标。
样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
总体参数:描述总体数量特征的指标,又称总体指标。
样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。
普查:为某一特定目的而专门组织的一次性全面调查。
抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。
统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。
统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。
时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。
时点指标:反应现象整体在某一的点(瞬间)上所处状况的总量指标。
众数:是一组数据中出现次数最多的变量值。
时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。
发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。
均匀发展水平:将不同时间的发展水平加以均匀而得到的均匀数。
发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。
环比发展速度:是时间序列中敷陈期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。
定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。
(完整)统计学名词解释

名词解释:医学统计学:用统计学的原理和方法研究生物医学问题的一门学科.变量(variable ):观察单位的某项特征变量值(value of variable ):变量的观察结果(测量值)总体(population ):是根据研究目的确定的同质的观察单位的全体,确切的说是同质的所有的观察单位某种变量值的集合。
样本(sample)从总体中随机抽取部分由代表性的观察单位,其测量值的集合称为样本。
随机抽样(random sample ):按随机化原则从总体中抽取部分观察单位的过程。
同质(homogeneity ):是针对被研究指标来讲,其影响因素相同.简单地理解就是指对研究指标影响大约可以控制的主要因素应尽可能相同。
变异(variation):指在自然地状态下,个体测量结果在同质基础上的差异。
等级资料(ordinal data ):将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位称为等级资料,如患者的治疗结果可分为治愈,好转,有效,无效,死亡.有序变量(定性变量的一种)。
概率(probability):是度量某一随机事件A 发生可能性大小的一个数值,记为P (A ),P (A )越大,说明A 事件发生的可能性越大,0〈P(A)<1,小概率事件.频率(frequency ):在相同的条件下,独立重复做n 次实验,事件A 出现了m 次,比值m/n 称为随机事件A 在n 次实验中出现的频率。
随机误差(random error):排除了系统误差后的尚存的误差,受多种因素影响,使观察值不按照方向性和系统性而随机的变化,误差变量一般服从正态分布,可以通过统计处理来估计.系统误差(system error ):由于受试对象,研究者,仪器设备,研究方法等非实验因素影响等确定性原因造成,有一定倾向性或规律性的误差,可以避免.随机变量(random variable ):是指取值不能事先确定的观察结果,不能用一个正常数来表示,每个变量的取值服从特定的概率分布。
统计学(名词解释及简答)

统计学名词解释统计量:用来描述样本特征的概括性数字度量简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果标准差:离均差平方和平均后的方根区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。
假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。
双侧假设检验:当统计量U的观测值的绝对值大于临界值Uα/2即|u0|>Uα/2时,则拒绝原假设H0,此时假设检验的拒绝域在统计量分布的两侧尾部,则称这种假设检验为双侧假设检验。
相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。
回归模型:描述因变量y如何依赖于自变量x和误差项的方程。
回归方程:描述因变量y的期望值如何依赖于自变量x的方程。
估计的回归方程:根据估计数据求出的回归方程的估计。
多重共线性:是指线性回归模型中的两个或两个以上的自变量彼此相关。
时间序列:是同一现象在不同时间上的相继观察值排列而成的序列。
趋势:是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势。
季节变动(季节性):时间序列在一年内重复出现的周期性波动。
指数:广义的讲,任何两个数值对比形成的相对数都可以称作指数,狭义的讲,指数是用于测定多个项目在不同场合下综合变动的一种相对数。
消费者价格指数(CPI):反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。
简答一、概率抽样与非概率抽样比较答:非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。
统计学名词解释超级大全

大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不 变的。
有效数字:指能影响测量准确性的数字。
变量:又称随机变量。具有变异性的数据。三个特性,离散型,变异性,规 律性。
推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通 过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据 已知的情况推测未知情况。
实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、 更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。
统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保 持总体的特征。这种样本特性保持着总体特性的现象叫做统计常态法则。
次数:某一事件在某一类别中出现的数目,又叫频数,用 f 表示。 频率:指每一组的数据个数除以数据的总和,又称相对次数。用符号 p 表示。 百分频率:频率与百分数的乘积。
组中值:每一组的中点值,常用 m 或 Xc 表示。 全距:全部数据的距离,也称极差,是用一群数据中的最大值减去最小值。 组距:指每一组所包含的间隔或数据单位,用 i 表示。 组限:指每一组的起止点或每一组的界限。
统计表:以表格的形式表达统计资料数量关系的方式或工具。 统计图:以几何图形和形象图形表示统计资料数量关系的工具。
次数分布 累积次数:以简单次数为基础,从最低组开始逐级累加直至最高组,或从最 高组开始逐级累加直至最低组,用符号 cum﹒f 或 F 表示。 累积百分频率:各组累计次数与总次数的比值。
一时性资料:在一定时限内所收集的有关问题的资料为一时性资料。来源三 个方面,教育与心理调查,教育与心理测量和教育与心理实验。
统计学名词解释

统筹学统计学:是一门搜集、整理、显示和分析统计数据的方法论科学。
总体:就是统计所要研究的事物或现象的全体,即由客观存在的,具有某种共同特征的许多个别事物构成的整体。
参数:是描述总体数量特征的指标,又称总体指标。
样本:是指从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体。
变量:指给所要研究的事物起的名字,包括可变的标志和所有的统计指标。
总体参数:描述总体数量特征的指标,又称总体指标。
样本统计量:是根据样本数据计算出来的样本指标,用来描述样本的数量特征。
普查:为某一特定目的而专门组织的一次性全面调查。
抽样调查:是按随机原则,从总体中抽选部分单位进行观察,并根据部分单位(样本)的调查数据,从数量方面推断总体参数的一种非全面调查。
统计分组:根据被研究现象总体的内在特点以及统计研究的目的,将总体按照一定的标志分为若干个性质不同的组成部分的一种统计方法。
统计表:指显示统计整理结果的表格,就是把通过整理的调查数据,使其成为得以说明现象总体数量特征的分组数据,并按一定顺序排列而形成的表格。
时期数据:反映现象总体在一段时期内发展变化总结果的总量指标。
时点指标:反映现象总体在某一的点(瞬间)上所处状况的总量指标。
众数:是一组数据中出现次数最多的变量值。
时间序列:将反映某种现象的统计指标在不同时间上的数值,按时间顺序排列而成的序列。
发展水平:时间序列中的每一项指标数值,都称为发展水平,它反映了某种现象在一定时期或时点所达到的规模和水平。
平均发展水平:将不同时间的发展水平加以平均而得到的平均数。
发展速度:是反映现象发展变化快慢程度的动态相对指标,是根据两个不同时期的发展水平对比求得的。
环比发展速度:是时间序列中报告期发展水平与前期发展水平之比,表明现象逐期发展变化的方向和程度。
定基发展速度:是报告期发展水平与某一固定时期发展水平(最初发展水平)之比,说明现象在较长时期内总的发展变动方向与程度。
年距发展速度:反映报告期发展水平对于上年同期发展水平的变化方向与程度。
统计学的名词解释

统计学的名词解释统计学是一门研究数据收集、分析和解释的学科,旨在通过收集和解析数据来支持决策过程和了解现象。
统计学涉及一系列概念和方法,包括数据收集、数据描述性统计、概率理论、假设检验、统计推断和回归分析等。
1. 数据收集:统计学中的第一步是收集数据。
数据可以通过各种方法获得,包括实地观察、实验、调查问卷和从现有的数据集中获取等。
2. 数据描述性统计:在收集到数据后,统计学家使用描述性统计来总结和描述数据的特征。
描述性统计包括计算数据的平均数、中位数、众数、标准差和百分位数等。
3. 概率理论:概率理论是统计学的基石之一。
它研究随机现象发生的可能性,并给出事件发生的数学表达。
概率理论为统计推断和建立模型提供了理论基础。
4. 假设检验:假设检验用于确定一个观察结果是否与一个给定的假设相符。
它提供了一种确定性地评估研究或实验结果的方法,并决定是否拒绝或接受一个假设。
5. 统计推断:统计推断是通过对样本数据进行分析和推断来对总体进行推断的过程。
它使用样本数据估计总体参数,并根据这些估计进行一些统计判断。
6. 回归分析:回归分析是一种统计方法,用于建立和探索变量之间的关系。
它可以用来预测一个变量(因变量)如何随着其他变量(自变量)的变化而变化。
7. 统计模型:统计模型是由统计学方法和理论构建的数学表达式,用于描述和解释观察数据之间的关系。
统计模型可以是简单的线性模型,也可以是更复杂的非线性模型。
8. 抽样方法:在统计学中,由于往往难以调查每一个个体或观察每一个事件,人们通常采用抽样方法来从总体中选择一部分样本进行研究。
常见的抽样方法包括随机抽样和分层抽样等。
9. 统计图表:统计图表是一种可视化数据的方式,用来展示和比较数据。
常见的统计图表包括柱状图、饼图、散点图和箱线图等。
10. 多元统计分析:多元统计分析是一项通过同时考虑多个变量来分析数据的方法。
它包括主成分分析、因子分析和聚类分析等。
总之,统计学是一门研究数据收集、分析和解释的学科,它运用一系列概念和方法来帮助人们理解数据,并从中获取有关现象和决策的信息。
统计学名词解释
1、统计学统计学是一门说明怎样去收集、整理、显示、描绘、剖析数据和由数据得出结论的一系列观点、原理、原则、方法和技术的科学,是一门独立的、适用性很强的通用方法论科学。
2、指标和标记标记是说明整体单位属性或特色的名称。
指标是说明整体综合数目特色和数目关系的数字资料。
3、整体、样本和单位统计整体是统计所要研究的对象的全体,它是由客观存在的、拥有某种共同性质的很多个体所构成的整体。
简称整体。
构成整体的个体则称为整体单位,简称单位。
样本是从整体中抽取的一部分单位。
4、统计检查统计检查是依据统计研究的目的和要求、采纳科学的方法,有组织有计划的收集统计资料的工作过程。
它是获得统计数据的重要手段。
5、统计绝对数和统计相对数反应整体规模的绝对数目值,在社会经济统计中称为总量指标。
统计相对数是两个有联系的指标数值之比,用以反应现象间的联系和对照关系。
6、期间指标和时点指标期间指标是反应整体在一段期间内累计总量的数字资料,是流量。
时点指标是反应整体在某一时辰上拥有的总量的数字资料,是存量。
7、抽样预计和假定查验抽样预计是指依据所抽取的样本特色来预计整体特色的统计方法。
假定查验是先对整体的某一数据提出假定,而后抽取样本,运用样本数据来查验假定建立与否。
8、变量和变异标记的详细表现和指标的详细数值会有差异,这类差异就称为变异。
数目标记和指标在统计中称为变量。
9、参数和统计量参数是反应整体特色的一些变量,包含整体均匀数、整体方差、整体标准差等。
统计量是反应样本特色的一些变量,包含样本均匀数、样本方差、样本标准差等。
10、抽样均匀偏差样本均匀数与整体均匀数之间的均匀失散程度称之为抽样均匀偏差,简称为抽样偏差。
重复抽样的抽样均匀偏差为整体标准差的1/n 。
11、抽样极限偏差抽样极限偏差是指样本统计量和整体参数之间抽样偏差的可能范围。
我们用样本统计量改动的上限或下限与整体参数的绝对值表示抽样偏差的可能范围,称为极限偏差或同意偏差。
(完整版)统计学名词解释
统计学名词解释第一章绪论1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。
2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。
3.个体:构成总体的每个基本单元称为个体。
4.样本:从总体中抽取的一部分个体,称为总体的一个样本。
5.次数:指某一事件在某一类别中出现的数目,又称为频数。
6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
7.概率:某一事物或某一情在某一总体中出现的比率。
8.观测值:一旦确定了某个值。
就称这个值为某一变量的观测值。
9.参数:又称为总体参数,是描述一个总体情况的统计指标。
10.统计量:样本的那些特征值叫做统计量,又称特征值。
第二章统计图表1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。
一般由表号、名称、标目、数字、表注组成。
2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。
纵轴表示事物出现的次数或因变量,称为数值轴。
一般由图号及图题、图目、图尺、图形、图例、图组成。
3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。
4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。
5.分组次数分布表的编制步骤:(1)求全距(2)定组距和组数(3)列出分组组距(4)登记次数(5)计算次数6.分组次数分布的意义:(1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。
B.可显示一组数据的集中情况和差异情况等。
(2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。
统计学名词解释
统计学名词解释1、统计包括三方面的涵义:统计活动、统计资料、统计学;2、统计活动:是在一定的理论指导下,采用适宜的科学方法搜集、处理统计资料的一系列调查研究过程。
3、统计资料:即统计信息,它集中、全面、综合地反应国民经济和社会发展的现象和过程4、统计学:即统计理论,是一门独立的方法论科学,它根据自己的研究对象,系统的阐述统计理论的方法5、统计总体:是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的,具有某种共同性质的许多个别单位构成的整体。
6、总体单位:是指构成总体的个体单位,它是总体的基本单位。
(又称个体)7、同质性:指总体各单位在某一标志上的共同性8、变异性:指总体所有单位至少有一个以上的可变品质标志或数量标志9、大量性:指统计总体中的单位应有足够的数量,如果总体单位应有足够的数量,如果总体单位数量很少,就难以揭示总体的规律性10、标志:是指统计总体中各单位所具同具有的属性和特征11、品质标志:表明总体单位属性方面的特征,用文字表示12、数量标志:数量方面的特征13、指标:是反映社会经济现象总体数量特征的概念和数值。
14、变异:统计中的标志和指标都是可变的15、变量:可以取不同值得量,在社会经济统计学中,各种数量标志和全部统计指标都是变量16、连续变量:数值是连续不断的,相邻两值之间可作无限分割,即可去无限数值17、离散变量:数值都是以整数位断开的,其数值要用计算的方法取得18、确定性变量:变量值的变动受制于某种决定性因素,致使其沿着一定的方向变动19、随机变量:影响变量值变动的因素有很多,作用不同,因而变量值变动无确定方向20、统计法:国家制定和认可的调整参与统计活动的各方面——统计主体、客体、宿体在统计活动中形成的社会关系的法律规范的总称21、统计设计:对一个完整的统计工作涉及各个方面和各个环节的通盘考虑和适当安排22、统计指标体系:将反映社会经济现象数量特征的一系列相互依存、相互联系的统计指标有机结合所组成的整体;23、指标名称:指标质的规定,它反映一定的社会经济范畴24、指标数值:根据指标的内容所计算出来的具体数值25、数量指标:反映总体总规模、总水平或总工作量的统计指标,又称总量指标26、质量指标:反映总体内部数量关系、单位一般水平、工作质量的统计指标27、描述指标:对总体及其组成部分的规模水平和数量关系进行客观描述的统计指标28、评价指标:反映社会经济总体的结构、比例、速度以及利用状况和效益、效果的统计指标29、监测指标:对社会经济总体运行进行跟踪监测,看其是否偏离既定目标,是否保持平衡的统计指标30、预警指标:可以对总体运行中出现的偏离进行及时的调控31、统计调查:是按照统计的任务和调查的目的要求,运用科学的方法搜集或者收集被研究对象的各个标志值的过程。
统计学名词解释
1.总体:根据研究的目的确定的同质观察单位的全体,更确切的说,它是同质的所有观察单位某种观察值的集合2.参数:描述总体数量特征的统计指标3.样本:从总体中随帆抽取部分观察单位,其测量结果的集合称为样本。
样本应具有代表性。
所谓有代表性的样本,是指用随机抽样方法获得的样本,该样本中所包含的观察单位数称该样样本的样本含量。
4.误差:泛指实测值与真值之差。
按其产生的原因的性质可粗分为随机误处和非随机误差,后者又可分为系统误差和非系统误差。
5.标准误:将样本统计量的标准差称为标准误,样本均数的标准差也称为均数的标准误(反应样本均数间的离散程度,也反应样本均数与相应总体均数间的差异,从而说明均数抽样误差的大小)6.医学参考值:指包括绝大多数的正常人的人体形态、功能和代谢产物等各种生理级生化指标常数,也叫正常值。
由于存在个体差异,生物医学数据并非常数,而是在一定的范围内波动,故又采用医学参考值范围作为判定正常或者异常的标准。
7.医学参考值范围:7:I类错误:指拒绝了实际上成立的HO,这类“弃真”的错误称为I型错误,其架率大小用a表示。
8.II类错误:指接受了实际上不成立的HO,这类“存伪”的误称为II 型错误,其频率大小用β。
9.系统误差:在实验过程中产生的误差,它的值或恒定不变,或遵循一定的变化规律,其产生的原因往往是克制的或可以掌握地。
10.医学参考值:指包括绝大多数正常人的人体形态、功能和代谢产物等各种的生理及生化指标常数,也成正常值。
11.随机误差:是一类不恒定、陆机变化的误差,由多种尚无法控制的因素引起。
在抽样过程中由于抽样的偶然性而出现的抽样误差。
脸机误差是不可避免的,在大量的重复测量中,或在抽样过程中,它可出现或大或小或正或负,呈一定规律的变化。
12.抽样误差:这种由个体变异产生,随机抽样造成的样本统计量与总体参数的差异。
13.P 值:概率又叫几率,是度量某一随机事件A发生可能性的大小的一个数值,(Λ),P(A)越大,说明此时入事件发生的概率越大。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
完整版)统计学名词解释统计学名词解释第一章绪论在统计学上,随机变量指的是取值之间不能预料到的变量。
总体,又称母全体或全域,是指具有某种特征的一类事物的全体。
构成总体的每个基本单元称为个体。
从总体中抽取的一部分个体称为样本。
次数指的是某一事件在某一类别中出现的数目,又称为频数。
频率,又称相对次数,指某一事件发生的次数被总的事件数目除,即某一数据出现的次数被这一组数据总个数去除。
概率指某一事物或某一情在某一总体中出现的比率。
一旦确定了某个值,就称这个值为某一变量的观测值。
参数,又称为总体参数,是描述一个总体情况的统计指标。
样本的那些特征值叫做统计量,又称特征值。
第二章统计图表统计表是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。
一般由表号、名称、标目、数字、表注组成。
统计图一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。
纵轴表示事物出现的次数或因变量,称为数值轴。
一般由图号及图题、图目、图尺、图形、图例、图组成。
简单次数分布表适合数据个数和分布范围比较小的时候用,它是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。
而分组次数分布表适合数据个数和分布范围比较大的时候用。
数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来。
分组次数分布表的编制步骤包括求全距、定组距和组数、列出分组组距、登记次数和计算次数。
相对次数分布表用频数比率或百分数来表示次数,而累加次数分布表则把各组的次数由下而上或由上而下加在一起。
最后一组的累加次数等于总次数。
双列次数分布表用同一个表表示有联系的两列变量的次数分布。
而不等距次数分布表则适用于像工资级别和年龄分组这样的不等距数据。
需要注意的是,归组效应是分组次数分布表的缺点之一,因为原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差。
11.直方图是一种图形,用矩形面积表示连续性随机变量次数分布,也称为等距直方图。
如果没有画矩形,则称为组织图。
横轴为等距分组点,纵轴为频数。
12.次数多边形图是一种表示连续性随机变量次数分布的线形图。
横轴为组中值,纵轴为频数。
13.累加次数分布图根据累加次数分布表绘制而成,分为两种类型:累加直方图和累加曲线。
累加曲线也称为递加线,可以连接累加直方图各组矩形右顶点。
横轴为精确上限或精确下限,纵轴为累加次数。
其形状有以下三种:正偏态、负偏态和正态。
例如,如果一次测验大多数人分数偏低,只有少数人得高分,即少数人的分数朝向高分一端,分布即为正偏态。
14.条形图主要用于表示离散型数据,用直条长短表示数量的大小。
一个轴为分类轴,一个轴为数量轴。
与直方图不同之处在于描述数据的方式不同,标尺分点意义不同,图形形状也不同。
15.圆形图也称为饼图,用于表示间断性资料,表示各部分在整体中所占比重。
16.线形图(折线图、曲线图)更多用于表示连续数据的函数关系,描述某种现象在时间上的发展趋势,以及描述两种或多种变化的关系。
17.散点图用圆点多少和分布疏密来表示两个变量的相关程度。
18.茎叶图适用于观测数据不是很多的情况,茎代表观测值中位数部分,时代个位数部分。
主要优点是既保留了全部原始数据,又呈现出直方图的形式,具有次数分布表与直方图的双重优点。
19.箱型图是一种用于显示一组数据分散情况的统计图,主要包含上边缘、上四分位数、中位数、下四分位数、下边缘和异常值这六个节点。
第三章集中量数1.集中趋势指数据分布中大量数据向某方向集中的程度。
2.集中量数指描述一组数据集中趋势特点的统计量。
3.算术平均数是所有观察值的总和除以总频数得到的商,一般简称为平均数或均数、均值。
一般用字母M表示,如果是由X变量计算的,就记为X,若由Y变量求得,则记为Y。
4.中数是按顺序排列在一起的一组数据中居于中间位置的数,即在这组数据中,有一半的数据比它大,有一半的数据比它小。
又称中点数、中位数、中值,符号为Md或Mdn。
5.众数指在次数分布中出现频次最多的那个数的数值。
又称为范数、密集数、通常数等,常用符号M。
6.加权平均数指根据每个数据的权重计算的平均数,解决各个平均数求整体平均数之类的问题。
7、几何平均数是指一组变量值成几何级数增长时的平均数。
它适用于计算平均比率和平均发展速度,并被称为对数平均数。
8、调和平均数是指将一组数据取倒数后进行平均并再次取倒数得到的平均数。
它主要用于描述研究速度方面的问题。
9、最方原理是指只有各个变量与平均数之差的平均和最小,才能说明每个数据与平均数之差的平方和最小。
这个原理适用于确定中数或众数等常数的情况。
第四章差异量数1.差异量数又称离散量数,用于度量和描述一组数据的变异性和离中趋势特点的统计量。
2.百分位数是指量尺上的一个点,从这个点以下的数据包括全部数据个数的一定百分比。
3.百分等级可以利用百分位数的计算公式计算任意分数在整个分数分布中所处的百分位置。
4.平均差是次数分布中所有原始数据与平均数绝对离差的平均值,通常用A.D.或M.D.表示。
5.___表示每一个观测值与平均数的距离大小,正负号说明了重量施于什么方向。
离均差的总和为零,标志着完全平衡。
有时简称为离差或偏差。
6.方差也称为变异数或均方,用符号S²表示样本量,用符号σ表示总体参数。
它是每个数据与该组数据平均数之差乘方后的均值,即离均差平方后的平均数。
7.标准差是方差的平方根,用s或SD表示。
如果用σ表示,则是指总体的标准差。
8.差异系数又称变异系数或相对标准差等,它是一种相对差异量,用CV表示,为标准差对平均数的百分比。
9.标准分数又称基分数或Z分数,它以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。
第五章相关关系1、相关是指不同现象之间的相互关系,包括因果关系、共变关系和相关关系。
在统计学中,相关指的是具有相关关系的不同现象之间的关系程度,分为正相关、负相关和零相关。
2、相关系数是用来表示两列变量间相关程度的数字表现形式,通常用r表示样本相关系数,用希腊字母ρ表示总体参数。
它的取值范围为-1.00≦r≦1.00.3、相关分析需要综合考虑样本量大小和相关系数取值大小,才能确定变量之间是否存在显著的相关。
对于非线性相关关系,用直线相关计算r值可能会很小,但不能说明两变量关系不密切。
4、皮尔逊相关是一种计算相关系数的常用方法,也称为积距相关。
它通过将X和Y的离均差积的总和除以N,来表示两个变量之间的相关性。
5、等级相关是指以等级次序排列的变量之间的相关,不要求变量总体分布,因此为非参数相关。
6、质量相关是指一列为等比或等距的测量变量,另一列为按性质划分的变量,求这两个变量之间的直线相关。
它包括点二列相关、二列相关和多系列相关。
7、点二列相关是指当一个变量为正态的等比或等距测量变量,另一个变量为“二分”名义变量时(如男女、已婚与未婚等),这两个变量之间的直线相关称为点二列相关。
8、二列相关是指当两个变量为正态连续变量,其中一个变量被人为地划分为二分变量时,这两个变量之间的相关称为二列相关。
例如,测验成绩分为及格与不及格,身体状态分为健康与不健康两类。
9、多列相关是指两个正态连续变量,其中一个变量被人为地划分成多种类别,如研究成绩被分为优、良、中、差四类。
这种情况下,表示这两种变量之间的相关称为多系列相关。
10、四分相关是指两因素本身都是连续的正态变量,分别被人为划分为两种不同类别。
这类四格表大都用于同一个被试样本中,分别调查四个不同因素两项分类的情况。
第六章概率分布1.概率是指在一定条件下可能出现或不出现的随机事件的客观指标。
概率论研究的主要内容是概率,其定义有后验概率和先验概率两种。
2.概率具有非负性、必然性和互补性等基本性质。
3.互不相容事件是指在一次实验和调查中,若事件A发生则事件B就一定不发生,否则二者为相容事件。
4.独立事件是指一个事件的出现对另一个事件的出现不发生影响。
5.概率分布类型是指对随机变量取值的概率分布情况用数学方法(函数)进行描述。
主要有离散分布与连续分布、经验分布与理论分布以及基本随机变量分布与抽样分布等。
6.正态分布是一种连续随机变量概率分布,也称为常态分布或常态分配。
它在数理统计的理论与实际应用中占有最重要地位。
①点估计给出一个具体的数值作为总体参数的估计,而区间估计给出一个范围作为总体参数的估计。
②假设性检验是根据样本信息推断总体参数是否符合某个假设,而区间估计是根据样本信息推断总体参数的范围。
③置信区间和显著性水平是区间估计中的重要概念,而在假设性检验中则是拒绝域和p值。
参数估计是利用样本数据来估计总体参数的值,而假设检验则是利用样本数据来检验对总体参数的先验假设是否成立。
区间估计是通过样本估计值来求得以其为中心的双侧置信区间,而假设检验则包括双侧和单侧检验,立足于小概率。
完全随机设计和随机区组设计的分组方式不同。
完全随机设计将被试分为若干组,每组接受不同自变量水平的实验处理;而随机区组设计则根据被试特点将其分为几个区组,同一区组接受不同处理,设计原则是同一区组被试应尽量同质,区组间可以异质。
完全随机设计与随机区组设计的设计思想也不同。
完全随机设计为单因素设计,仅考虑处理因素;而随机区组设计为双因素设计,考虑的因素有两个,一个是处理因素,一个是区组因素。
估计总体平均数的步骤详见第201页。
差异显著是指当两个事物之间出现差异时,经过统计检验发现差异超过了统计学所规定的某一误差限度时,表示差异已经不属于抽样误差,统计上将这样的情况称为差异显著,反之即是差异不显著。
假设检验是通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异。
在进行研究时,需要先对研究结果作出一种预想的希望证实的假设,即备择假设。
虚无假设则是与其对立的假设,假设检验的问题就是要判断虚无假设是否正确。
显著性水平是指拒绝虚无假设的小概率值,用α表示。
如果一件事情发生的概率小于显著性水平,就将其归为“小概率事件”,认为它是一件“几乎不可能发生”的事件。
5、假设检验基于小概率原理,即认为小概率事件在一次实验中几乎不可能发生。
因此,假设检验先假定虚无假设为真,若导致违反常理或不合理的现象出现,则拒绝虚无假设;否则接受虚无假设。
6、假设检验中存在两类错误。
一是I类错误,当虚无假设为真时,将拒绝区域内的假设判定为假所犯的错误,也叫α类错误。
二是II类错误,当虚无假设为假时,未落入拒绝区域而接受虚无假设时所犯的错误,也叫β类错误。
7、差异显著是指经过检验后,所得差异超过了统计学规定的误差限度,表明这个差异已不属于抽样误差,而是总体上确有差异。