统计(名词解释)
统计名词解释(带英文)

两阶段交叉设计(two stage cross-over design)在医学研究中,欲将A、B两种处理先后施加于同一批试验对象,随机地使半数受试者先接受A后接受B,而另一半受试者则先接受B后接受A。由于两种处理在全部试验过程中交叉进行,这种设计称为交叉设计
观察单位(observational unit)是医学研究中的基本单位,因研究目的不同而不同。
样本含量(sample size)样本所包含的观察单位数。
同质(homogeneity)指被研究指标的影响因素相同
抽样研究(sampling research)从总体中抽取样本,根据样本信息来推断总体特征的方法
标准化法(standardization)采用统一的内部构成,然后计算标准化率的方法.其基本思想是采用某影响因素的统一标准构成以消除构成不同对合计率(总率)的影响,使通过标准化后的标准化合计率具有可比性
二项分布(binomial distribution)在只会产生两种可能结果如阳性或阴性之一的n次独立重复试验中,当每次试验的阳性概率π保持不变时,出现阳性的次数X的一种概率分布。
随机事件random event:随机现象中的各种可能的结果。
统计量(statistic)通过对样本观察测量所获得的数据进行统计分析所产生的统计指标
参数(parameter)是指总体的水平。
完全随机设计(completely randomized design)是采用完全随机化的分组方法,将全部受试对象分配到g个处理组(水平组),各组分别接受不同的处理,试验结束后比较各组均数之间的差别有无统计学意义,推论处理因素的效应
统计名词解释

1.参数(parameter):总体的统计指标或特征值。
总体参数是事物本身固有的、不变的。
统计量(statistic):由样本所算出的统计指标或特征值。
2.正态分布:以均数u为中心左右完全对称的分布,记为X~N(u, )标准正态分布:以均数为0,标准差为1的正态分布,记为u~N(0,1)3.平均数:也叫平均值,是一组(群)数据典型或有代表性的值。
这个值趋向于落在根据数据大小排列的数据的中心,包括算术平均数、几何平均数、中位数等。
标准差S:将方差开方,得到标准差,它是最常用的变异指标,标准差越大,说明数据的变异程度越大。
标准误S X:在统计理论上将样本统计量的标准差称为标准误,用来衡量均数抽样误差的大小。
据此,样本均数的标准差称为标准误。
S p(样本率的标准差):率的标准误,用来描述样本率的抽样误差。
4.参数检验:总体分布已知,对其中一些未知参数进行估计或检验。
这类统计推断的方法叫参数统计或参数检验。
参数检验:假定比较数据服从某分布,通过参数的估计量( , s)对比较总体的参数(μ)作检验,统计上称为参数法检验(parametric test)。
如t、u检验、方差分析。
非参数检验:是指在统计检验中不需要假定总体分布形式和用参数估计量,直接对比较数据的分布进行统计检验的方法,称为非参数检验(nonparametric test).5.率(rate):强度相对数,用以说明某现象发生的频率或强度。
是某事物或现象发生的实际数与可能数的比例关系。
构成比(proportion):结构相对数,它说明一种事物内部各组成部分所占的比重或分布,常以百分数表示,其计算公式为:比(ratio):又称相对比,是A、B两个有关指标之比,说明A为B的若干倍或百分之几,它是对比的最简单形式。
其计算公式为:比=A/B。
6.相关系数:用以说明具有直线关系的两个变量间相关关系的密切程度和相关方向的指标,称为相关系数,又称为积差相关系数。
统计学名词解释

1、‘‘统计”一词有哪几种含义?它们之间的关系如何?统计工作又称统计活动,是指对社会经济现象总体客观存在的数量方面进行收集、整理和分析,并探索数据的内在数量规律性的活动过程。
统计资料或称统计数据,即统计活动过程所获得的各种数字资料和其他资料的总称。
表现为各种反映社会经济现象数量特征的原始记录、统计台帐、统计表、统计图、统计分析报告、政府统计公报、统计年鉴等各种数字和文字资料。
统计学是指阐述统计工作基本理论和基本方法的科学,是对统计工作实践经验的理论概括和科学总结。
它是以社会经济现象总体的数量方面为研究对象,阐明统计设计、统计调查、统计整理和统计分析的理论与方法,是一门方法论科学。
统计工作、统计资料和统计学之间有着密切联系。
统计工作和统计资料是过程和成果的关系。
统计工作和统计学是理论与实践的关系。
统计工作、统计资料和统计学相互依存、相互联系,共同构成了一个完整的有机统一体。
2.统计学的产生与发展过程中曾经出现过那几个重要的学派?它们的历史贡献是什么?数理统计学派产生于19世纪中叶,创始人是比利时的统计学家、天文学家、人类学家阿道夫·凯特勒(A.Quetelet 1796—1874年)。
代表作有《统计学的研究》、《概率论书简》、《社会物理学》等。
社会统计学派产生于19世纪后半叶,创始人是德国大学教授克尼斯(K.G.A.Knies,1821—1898年)。
主要代表人物为恩格尔(C.L E.Engel 1821—1896年)和梅尔(G.V.Mayr 1841—1925年)。
克尼斯在1850年发表了《独立科学的统计学》一书,提出了把“国势论”作为“国势学”的科学命名,把“统计学”作为“政治算术”的科学命名,从而结束了对统计学研究对象长达200年之久的争论。
现代统计学时期(20世纪初到现在)20世纪20年代以来,数理统计学发展的主流从描述统计学转向推断统计学。
19世纪末和20世纪初的统计学主要是关于描述统计学中的一些基本概念、资料的搜集、整理、图示和分析等,后来逐步增加概率论和推断统计的内容。
完整版)统计学名词解释

完整版)统计学名词解释统计学名词解释第一章绪论在统计学上,随机变量指的是取值之间不能预料到的变量。
总体,又称母全体或全域,是指具有某种特征的一类事物的全体。
构成总体的每个基本单元称为个体。
从总体中抽取的一部分个体称为样本。
次数指的是某一事件在某一类别中出现的数目,又称为频数。
频率,又称相对次数,指某一事件发生的次数被总的事件数目除,即某一数据出现的次数被这一组数据总个数去除。
概率指某一事物或某一情在某一总体中出现的比率。
一旦确定了某个值,就称这个值为某一变量的观测值。
参数,又称为总体参数,是描述一个总体情况的统计指标。
样本的那些特征值叫做统计量,又称特征值。
第二章统计图表统计表是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。
一般由表号、名称、标目、数字、表注组成。
统计图一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。
纵轴表示事物出现的次数或因变量,称为数值轴。
一般由图号及图题、图目、图尺、图形、图例、图组成。
简单次数分布表适合数据个数和分布范围比较小的时候用,它是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。
而分组次数分布表适合数据个数和分布范围比较大的时候用。
数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来。
分组次数分布表的编制步骤包括求全距、定组距和组数、列出分组组距、登记次数和计算次数。
相对次数分布表用频数比率或百分数来表示次数,而累加次数分布表则把各组的次数由下而上或由上而下加在一起。
最后一组的累加次数等于总次数。
双列次数分布表用同一个表表示有联系的两列变量的次数分布。
而不等距次数分布表则适用于像工资级别和年龄分组这样的不等距数据。
需要注意的是,归组效应是分组次数分布表的缺点之一,因为原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差。
统计名词解释

名词解释:1,总体(population):总体指根据研究目的所确定的同质的观察单位的全体。
更确切的说,它是同质的所有观察单位某种观察值的集合。
可分为有限总体和无限总体。
总体中只包含有限个观察单位者为有限总体,反之为无限总体。
2,样本(sample):从总体中随机抽取部分观察单位的测量结果集合称为样本。
样本应具有可靠性和代表性。
样本的可靠性是指样本的确是来自同一总体,具有同质性;代表性是必须采用随机抽样方法从总体中获得的足够多的观察单位。
3,参数(parameter):参数是用来表示总体分布特征的统计数字。
统计中常用的总体参数有描述总体分布中心位置或集中趋势的总体平均数指标;有描述总体离散度的总体变异指标。
4,统计量(statistic):统计量是依据样本观察值推算出的反映样本分布特征(如样本平均数、样本变异等)的一些量。
5,误差(error):观察值与真值之差称为误差。
误差分为过失误差、系统误差和随机误差三类。
6,抽样误差(sampling error):抽样误差是随机误差中的一种,它是由抽样所至的样本统计量与总体参数间的差异。
抽样误差愈小,用样本推算总体的精确度就愈高,反之亦然。
7,正态分布(normal distribution)和标准正态分布():由密度曲线f(x) = (1/√2π)×(1/σ)×EXP[(-1/2)×(x-x0)^2/σ^2]确定的中间高、两边低、左右对称的连续随机变量的分布称为正态分布。
记为N(μ,σ2) ,其中μ为总体均数σ为总体标准差;把总体均数为0,把总体标准差为1的正态分布N(0,1)称为标准正态分布。
一般正态分布可以通过μ=(x-μ)/σ转化为标准正态分布。
8,抽样误差(sampling error):在抽样研究中,由抽样所至的样本与总体参数间的差异称为抽样误差。
9,标准误(standard error):标准误就是样本统计量的标准差,它反映了统计量间的变异程度,也间接的反映抽样误差的大小。
统计名词解释

参数(Parameter):描述总体的统计指标:μ、 、π等。
统计量(Statistic):描述样本的统计或分析指标。
如χ、s、p;u值、t值等。
随机误差:由于偶然因素引起的测量误差和抽样误差随机测量误差(random measurement error)——由于偶然的因素所引起的测定误差。
它没有固定的倾向,是不可避免的,但可提高操作者熟练程度、增加重复测定使其减少。
随机抽样误差(random Sampling error)因总体中各个体之间的差异,由抽样所造成的样本统计量与总体参数之差(以及样本统计量之差),为~。
通常计算统计指标是:平均数(反映集中趋势)变异指标(反映离散趋势)正态分布:频数分布以均数为中心,靠近均数两侧频数较多,离均数愈远,频数愈少,形成一个中间多、左右两侧逐渐减少、呈基本对称的钟型分布资料统计学处理作:参数检验:u / t检验(两个均数)、F检验(两个以上均数)非参数检:验秩和检验(两个及以上均数)二平均指标:算术均数、几何均数、中位数变异指标:极差、百分位数与四分位间距\ 方差、标准差、变异系数﹡标准差用途:1. 表示同质计量变量值的离散程度;2. 与均数结合,表示均数的代表性(x ±s),同时描述正态分布特征、估计频数、确定医学参考值范围;3. 与均数结合,计算变异系数;4. 与样本含量(n)结合,计算标准误。
计量资料(数值变量)用定量的方法测定同质观察单位某项指标测定值的集合,亦称~。
计数资料(二项分类、多项无序分类变量)按性质和类别进行分组所得的资料。
其变量值是定性的。
区间估计:考虑抽样误差的影响、在一定可信度(Confidence level)下,计算出包含有未知总体均数的一个范围,即为~。
相对数:计数资料常用的统计指标,又称相对指标(Relation number标准化率(Standardized rate):又称调整率(Adjusted rate), 是把原率资料按影响因素的标准构成调整后计算出来的率。
统计名词解释

1.总体:根据研究目的确定的研究对象称为总体。
样本:总体的一部分。
样本具有一定的含量和代表性。
总体与样本的关系:样本来自总体;具有一定容量和代表性。
2.参数:由总体计算的特征数。
统计数:由样本计算的特征数。
总体参数由相应的统计数来估计。
3.准确性:指在试验或调查中某一实验指标或性状的观测值与气真值接近的程度。
精确性:指在试验或调查中同一实验指标或性状的重复观测值彼此接近的程度。
正确性:精确性、准确性合称为正确性。
4.随机误差:这是由于虚度无法控制的内在和外在的偶然因素,尽管在试验中力求一致但不可能绝对一致所造成的。
带有偶然性,难以消除,影响试验的精确性。
系统误差:这是由于试验动物的初始条件不同所引起的。
容易克服,影响试验的准确性。
5.平均数:用来描述资料的集中性。
主要包括:算数平均数、中位数、众数、几何平均数、调和平均数。
6.标准差:样本标准差s是表示资料中观测值变异程度大小的统计数,描述了资料的离中性。
7.变异系数:表示资料中观测值变异程度大小。
8.小概率事件实际不可能性原理:把小概率事件在一次试验中看成是实际不可能发生的事件称为~。
9.显著水平:用来确定无效假设是否被否定的概率标准。
10.试验指标:用来衡量结果的好坏或处理效应的高低、在试验中具体测定的性状或观测的项目。
11.卡方检验的用途:适合性检验、独立性检验、资料的分布类型检验、方差同性质检验。
12.适合性检验:判断实际观察的属性类别分配是否符合已知属性类别分配理论或学说的假设检验。
13.独立性检验:根据次数资料判断两类因子彼此相关或相互独立的假设检验。
14.直线回归分析:在回归分析中,只有一个自变量一个因变量,这两个变量之间的关系可以用一条直线描述,这种回归分析叫~~。
15.决定系数r2:是回归平方和与离回归平凡和的比值,表示回归直线方程估计可靠程度的高低。
相关系数r:决定系数的平方。
R2:拟合度,回归曲线的相关系数。
16.能直线化的曲线类型:双曲线函数、幂函数、指数函数、对数函数、Logistic生长曲线17.协方差(ANOCOV):与均积相应的总体参数。
(完整版)统计学名词解释

统计学名词解释第一章绪论1.随机变量:在统计学上,把取值之间不能预料到什么值的变量。
2.总体:又称母全体、全域,指具有某种特征的一类事物的全体。
3.个体:构成总体的每个基本单元称为个体。
4.样本:从总体中抽取的一部分个体,称为总体的一个样本。
5.次数:指某一事件在某一类别中出现的数目,又称为频数。
6.频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。
7.概率:某一事物或某一情在某一总体中出现的比率。
8.观测值:一旦确定了某个值。
就称这个值为某一变量的观测值。
9.参数:又称为总体参数,是描述一个总体情况的统计指标。
10.统计量:样本的那些特征值叫做统计量,又称特征值。
第二章统计图表1.统计表:是由纵横交叉的线条绘制,并将数据按照一定的要求整理、归类、排列、填写在内的一种表格形式。
一般由表号、名称、标目、数字、表注组成。
2.统计图:一般采用直角坐标系,通常横轴表示事物的组别或自变量x,称为分类轴。
纵轴表示事物出现的次数或因变量,称为数值轴。
一般由图号及图题、图目、图尺、图形、图例、图组成。
3.简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表,适合数据个数和分布范围比较小的时候用。
4.分组次数分布表:数据量很大时,应该把所有的数据先划分在若干区间,然后将数据按其数值大小划归到相应区域的组别内,分别统计各个组别中包括的数据个数,再用列表的形式呈现出来,适合数据个数和分布范围比较大的时候用。
5.分组次数分布表的编制步骤:(1)求全距(2)定组距和组数(3)列出分组组距(4)登记次数(5)计算次数6.分组次数分布的意义:(1)优点:A.可将杂乱无章数据排列成序,以发现各数据的出现次数及分布状况。
B.可显示一组数据的集中情况和差异情况等。
(2)缺点:原始数据不见了,从而依据这样的统计表算出的平均值会与用原始数据算出的值有出入,出现误差,即归组效应。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计
第一章绪论
统计学:是研究统计方法和原理,一类是数理统计【以概率论为基础,对统计数据量关系模式加以解释,对统计原理和方法加以数学证明】,一类是应用统计【数理统计的方
法在各个邻域的应用】。
教育统计学:应用数理统计的方法和原理研究教育问题的一门学科。
从具体应用:描述统计:对已获得的数据进行整理概括显现其分布特征的统计
方法
推断统计:根据样本提供的信息,运用概率的理论分析,论证,
在一定可靠程度上对总体分布特征进行推测和估计
其内容包括假设检验和总体参数估计。
基本概念:随机变量:我们把能表示随机现象各个结果的变量称作随机变量。
总体:是我们研究的具有某种共同特性的个体的总和。
总体中的每个单位称
作个体
样本:从总体中抽取的作为观察对象的一部分个体。
统计量:样本的数据特征
参数:总体的数据特征
第二章数据统计分类
按数据来源分:点计数据:指计算个数获得的数据
度量数据:指用一定工具或一定测量标准所获得的数据。
按随机变量:间断性随机变量:数据单位是独立的,两个单位之间不能在划分为更细小的单
位
连续性随机变量:取值个数无限。
统计图表:表示间断变量统计图:直条图、圆形图、
表示连续变量统计图:线形图、频数分布图【直方图、多边图、累计频数和累
计百分比】
第三四章集中量差异量【注意每个量的表示】
算数平均数:原始数据计算
频数分布表计算【每一段频数计算组中值,乘以个数求和】
方差标准差:离差平方的算数平均数是方差,开放后为表准差
原始数据的计算,定义式的计算。
中位数:是位于以一定大小顺序排列的一组数据中央位置的数据。
原始数据计算【个数分奇偶】频数计算方式。
【大小】
四分位距:第三个四分位数与第一个四分位数的差的一半称之为四分位距
百分位距:两个百分位数之差,通常是90%和10%的差。
众数:理论众数:频数分布曲线最高点对应的横坐标上的一点。
粗略众数:一组数据中频数出现最多的那个数。
皮尔逊经验法、金氏插补法。
平均差:每一个数据和中位数离差的绝对值的算术平均数。
原始数据、频数计算
差异系数:标准差和算术平均数的百分比,【1】可以比较不同单位的差异程度、【2】比较单位相同但平均数差异较大的离散程度、【3】可判断特殊差异情况。
※平均数、众数、中位数三者之间的关系:
第五章概率的概念即分布
后验概率:以随机事件A在大量重复试验中出现的稳定频率值作为随机事件A的概率的估计值。
先验概率:又称古典概率,满足两个条件【1】实验结果有限【2】每一种结果出现的可能性相等。
若所有结果总数为n,随机事件A包括着m个可能的结果则A的概率。
二项实验:满足一下实验条件的实验【1】一次试验只有两种结果,即成功与失败。
【2】歌词实验相互独立。
【3】各次实验中成功的概率相等,失败的概率也相等。
二项分布:用n次方的二项展开式来表达在n次试验中成功的事件出现的次数的概率分布称作二项分布
二项分布通式:
二项分布图:当p=q,不管n有多大,二项分布呈对称形。
当n很大时,二项分布接近于正太分布。
当p≠q的时候,且n很小,图形呈偏态。
但当p<q且np≥5或者p>
q且np≤5二项分布出现向正太接近的趋势。
正太分布:是一种连续型随机变量的概率分布。
正态分布在测验记分应用:【1】将原始数据转化成标准分数、【2】确定录取分数线、【3】确
定等级评定人数、【4】品质评定数量化。
第六章抽样分布和总体平均数推断
抽样分布:某一种统计量的抽样分布
平均数抽样分布:一切可能样本的平均数进行频数分布,就形成一个实验性的平均数抽样分布。
标准误:某种统计量在抽样分布上的标准差称之为标准误。
标准误越小,表明样本统计量和总体参数值越接近。
t分布:当总体标准差未知,需要用估计量S来代替,于是平均数标准误也被代替,这时,一切可能样本平均数与总体平均数的离差统计量呈t分布。
自由度:总体参数估计量中变量值独立变化的个数。
总体平均数估计:点估计:用某一样本统计量的值来估计总体参数值称为点估计。
无偏性(无偏估计量)【如果一切可能样本统计量的值与总统
参数值偏差的平均值等于0】有效性【总统参数多个无偏估量,
某种估计量的一切可能样本值发差小者为有效】一致性【样本
容量无限增大,估计量的值能越来越接近他所估计的总统参数
值。
】
区间估计:一样本统计量的抽样分布为理论依据,按一定概率要求,由
样本统计量的值估计总统参数值的所在范围。
假设检验:根据一定概率,对总体参数或分布的某一假设做出拒绝或保留的决断,成为假设检验。
零假设:当前样本所属总体与假设总体无区别的假设。
备择假设:当前样本所属总体与假设总体相反的假设。
小概率事件:样本统计量的值在其抽样分布上的概率小于或等于事先规定的水
平,这是就认为小概率事件发生了。
显著性水平:把拒绝零假设的概率称作显著性水平。
两类错误及其控制:第一类错误就是如果样本统计量的总体参数值就是假设的总体参数值,但落入到拒绝区域遭到拒绝,我们就犯了第一类错误。
第二类错误就是保留了属于不真实的零假设。
控制方法:合理安排拒绝区域,双侧假设和单侧假设。
第七章平均数差异性显著性检验
概念:两个总体平均数之差等于0的一切可能样本平均数之差的概率分布。
平均数之差的标准误:就是两个样本平均数差的抽样误差
相关样本:两个样本存在一一对应的关系
独立样本:两个样本内的个体是随机抽取的,不存在一一对应的关系,称之为独立样本。
方差齐性检验:对两个总体的方差是否哟显著性差异所进行的检验称为方差齐性检验。
第八章方差分析
方差分析:通过对组间差异和组内差异的比值的分析来推断几个相应平均数差异的显著性,这就是方差分析的逻辑
因素:试验中的自变量,只有一个自变量的实验称为单因素实验,有两个或两个以上的自变量称为多因素。
某一个因素的不同情况称作因素的水平,包括量差和质别两
类情况。
完全随机设计:从同一个总体中随机抽取被试,在随机的分入各实验组。
用方差分析法对多个独立样本的平均数差异性的显著性检验,称为完全随机设计的方差检验。
随机区组设计:为减少被试间个别差异对结果的影响,把从统一整体中抽取的被试按条件相同的原则分成各个组,使每组内的被试尽量保持同质。
对歌区组实行多个实
验处理后,用方差分析法对多个相关样本的平均数差异进行显著性检验。
第十章卡方检验
卡方检验:对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验。
单向表:把实得的点计数据按一种分类标准编制成表
双向表:把点计数据按两种分类标准编制成表
第十一章相关分析。
相关:两个变量不确定不稳定的变化关系称之为相关关系。
它与函数关系区别就在于两个变量值不是一一对应的。
分为正相关、负相关、零相关。
相关系数:用来描述两个变量之间变化方向及密切程度的数字特征称为相关系数。
积差相关:当两个变量都是正太连续变量,而且两者之间呈线性关系时,表示两个变量之间的相关程度。
等级相关:以等级次序排列或以等级次序表示时的变量之间的相关。
斯皮尔曼等级相关【以等级次序排列或以等级次序表示时,两个相应总体并不一
定呈正态分布,其样本容量也不一定大于30,表示这两个变量之间的相关】
肯德尔系数【当多个变量值以等级次序排列或表示的时候,描述这几个变量之间
的一致性程度
质与量的相关:一个变量为质,另一个变量为量,这两个变量之间的相关。
二列相关:当两个变量都是正太连续变量,其中一个变量被人为的划分为二分变量,表示这两个变量之间的相关
点二列相关:当两个变量,其中一个是正太连续变量,另一个是真正意义上的二分变量。
表示这两个变量之间的相关。