统计学名词解释简答

合集下载

统计学名词解释及简答题.

统计学名词解释及简答题.

统计学名词解释及简答题.名词解释一、分类数据(categorical data )是只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,使用文字来表述的。

二、顺序数据(ran k data )是只能归于某一有序类别的非数字型数据。

三、数值型数据(metric data )是按数字尺度测量的观察值,其结果表现为具体的数值。

四、系统抽样(systematic sampling )将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机的抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位,这种抽样方法被称为系统抽样。

五、非概率抽样(non-probability sampling )是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采取某种方式从总体中抽出部分单位对其实施调查。

六、抽样误差(sampling error )是由于抽样的随机性引起的样本结果与总体真值之间的误差。

七、四分位数(quartile)也称四分位点,他是一组数据排序后处于25%和75%位置上的值。

四分位数是通过3个点将全部数据等分为4部分,其中每部分包括25%的数据。

八、离散系数也成为变异系数(coefficient of variation ),它是一组数据的标准差与其相应的平均数之比。

其计算公式为:s s v x =离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。

离散系数大,说明数据的离散程度也大;离散系数小,说明数据的离散程度也小。

九、泊松分布(Poisson distribution )是用来描述在一指定时间范围内或在指定的面积或体积之内某一事件出现的次数的分布。

十、中心极限定理(central limit theorem ):设从均值μ、2σ(有限)的任意一个总体中抽取样本量为n 的样本,当n 充分大时,样本均值X 的抽样分布近似服从均值为μ、方差2σ/n 的正态分布。

统计学名词解释 简答

统计学名词解释 简答

5、时期指标和时点指标的区别
时期指标:(1)连续记数,其值可以相加 (2)具有时间长度,与时间长短有关 (3)是流量
时点指标:(1)间断记数,其值不可以相加,相加无实际意义 (2)不具有时间长度,与时间长短无关 (3)是存量
6、抽样技术的特点
(1)在调查单位的抽取上,遵循随机原则。
两者的联系:(1)指标是指标的汇总和综合。
(2)根据研究目的的不同,两者有时可以互换。
2、统计总体的特点
(1)同质性。即总体单位都必须具有某些共同的品质标志属性或数量标志属性。这是构成总体的前提。
(2)大量性。即构成总体的总体单位数目要足够多。这是形成总体的充分条件。
(3)差异性。即总体单位必须具有一个或若干个可变的品质标志或数量标志。这是形成总体的必要条件。
13、点估计和区间估计
点估计也叫定值估计,就是直接用抽样平均数代替总体平均数,用抽样成数代替总体成数。区间估计是在一定概率保证下,用样本统计量和抽样平均误差去推断总体参数的可能范围的估计方法。
14、统计指数
广义上来说,它是表明社会经济现象的数量对比关系的相对指标。狭义上来说,它是反映不能直接相加对比的复杂总体综合变动的动态相对数。
(3)按所采用的基期不同分:定基指数和环比指数。
(4)按表现形式不同分:综合法总指数和平均法总指数。
12、相关关系的种类
(1)从涉及的因素多少来分,可分为单相关和复相关。只研究两个因素之间的相关关系叫单相关。两个以上的为复相关。
(2)从相关关系所呈现形态来分,可分为直线相关和曲线相关。
(3)直线单相关按呈现相关关系的方向划分,又可分为正相关和负相关。正相关表明两个因素的变动方向是相同的,负相关表明两个因素的变动方向是不同的。

统计学复习资料(名词解释、简答)

统计学复习资料(名词解释、简答)

统计学复习资料(名词解释、简答)计算题:以老师圈的重点,以及之前布置的作业为主,重点复习11/12章一、名词解释:时间序列数据:是在不同时间收集到的数据,这些数据是按时间顺序收集到的,用于所描述现象随时间变化的情况.总体:是包含所研究的全部个体(数据)的集合样本:是从总体中抽取的一部分元素的集合样本量:构成样本的元素的数目统计量:用来描述样本特征的概括性数字度量参数:用来描述总体特征的概括性数字度量概率抽样:即随机抽样,遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本非概率抽样:抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。

系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式抽样误差:由抽样的随机性引起的样本结果与总体真值之间的误差分组数据:根据统计研究的需要,将原始数据按照某种标准化分成不同的组别,分组后的数据称为分组数据。

方法有单变量值分组和组距分组两种。

众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果算术平均数:是指在一组数据中所有数据之和再除以数据的个数。

几何平均数:是n个变量乘积的n次方根方差:各变量值与其平均数离差平方的平均数经验法则:当一组数据对称分布时,经验法则表明:约有68%的数据在平均数1个标准差的范围之内。

约有95%的数据在平均数2个标准差的范围之内。

约有99%的数据在平均数3个标准差的范围之内。

统计学名称解释

统计学名称解释

第一章一、名词解释1、参数parameter:也叫参变量,是一个变量;如果我们引入一个或一些另外的变量来描述自变量与因变量的变化,引入的变量本来并不是当前问题必须研究的变量,我们把这样的变量叫做参变量或参数;描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值;2、统计量statistic:描述样本特征的数,是统计理论中用来对数据进行分析、检验的变量;3、总体population:根据研究目的确定的研究对象的全体;当研究有具体而明确的指标时,总体是指该项变量值的全体;4、样本 sample:从总体中随机抽取的部分观察单位,总体中有代表性的一部分;5、同质 homogeneity:是指观察单位研究个体间被研究指标的影响因素相同;6、变异 variation:同质事物个体间的差异;来源于一些未加控制或无法控制的甚至不明原因的因素;7、概率 probability:度量随机事件发生可能性大小的一个数值,是一个在0到1之间的实数;8、抽样误差 sampling error:由于抽样所造成的样本统计量与总体参数的差别;三、简答题1、统计学的基本步骤有哪些设计、搜集、整理、分析资料2、总体与样本的区别与关系区别:总体:根据研究目的确定的研究对象的全体;当研究有具体而明确的指标时,总体是指该项变量值的全体;样本:总体中有代表性的一部分;联系:总体包含样本,样本是总体中的一部分3、抽样误差产生的原因有哪些可以避免抽样误差吗产生原因:1总体单位的标志值的差异程度; 差异程度愈大则抽样误差愈大,反之则愈小; 2样本单位数的多少; 在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小;3抽样方法; 抽样方法不同,抽样误差也不相同;一般说,重复抽样比不重复抽样,误差要大些;4抽样调查的组织形式; 抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差;不可以,它具有不可避免性,只能减少抽样误差4、何为概率及小概率事件概率:度量随机事件发生可能性大小的一个数值,是一个在0到1之间的实数; 小概率事件:统计分析中的很多结论都基于一定置信程度下的概率推断,习惯上将 pA≤或≤称为小概率事件,认为小概率事件在一次试验中不可能发生;第二章第三章1. 正态分布 normal distribution:也叫高斯分布Gaussian distribution,一种最常见、最重要的连续型对称分布正态分布是对称分布,但对称分布不一定是正态分布2. 中位数 median:是将一批数据从小至大排列后位次居中的数据值,反映一批观察值在位次上的平均水平;3. 四分位数间距 quartile interval:是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.即:Q3 --Q14. 方差 variance:样本观察值的离均差平方和的均值;表示一组数据的平均离散情况;反映一组数据的平均离散水平;5. 正偏态分布 positively skewed distribution:也称右偏态分布,右侧的组段数多于左侧的组段数,频数向右侧拖尾6. 负偏态分布 negatively skewed distribution:左偏态分布,左侧的组段数多于右侧的组段数,频数向左侧拖尾7. 对数正态分布 logarithmic normal distribution :对数为正态分布的任意随机变量的概率分布;如果X是正态分布的随机变量,则 exp X为对数分布;同样,如果Y是对数正态分布,则 log Y为正态分布;8. 医学参考值范围 medical reference range:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围;最常用的是95%参考值范围;三、简答题1. 描述数值变量资料集中趋势的指标有哪些其适用范围有何异同平均数:描述一组变量值的集中位置或平均水平的指标体系;不同的分布使用不同的指标算术均数:正态或近似正态或观察值相差不大的小样本资料几何均数:对数正态分布或等比级数资料中位数:一般偏态分布传染病发病的潜伏期2. 描述数值变量资料离散趋势的指标有哪些其适用范围有何异同反映数据的离散度 Dispersion ;即个体观察值的变异variation程度;常用的指标有:1. 极差Range 全距适用范围:任何计量资料;是参考变异指标2. 百分位数与四分位数间距 Percentile and Quartile range百分位数:适用范围广泛,可用于偏态资料,分布不明的资料和分布两端无确定值的资料四分位数间距:常用于描述偏态分布资料的离散程度,值越大——变异程度越大,中位数与四分位间距一起使用,描述偏态分布资料的特征;3. 方差 Variance正态分布资料4. 标准差Standard Deviation适用范围:均数与标准差经常被同时用来描述正态分布资料的集中和离散趋势;5. 变异系数 Coefficient of Variation适用范围:主要用于单位不同或均数相差悬殊资料3. 医学中参考值范围的涵义是什么确定的步骤和方法是什么医学参考值范围:指绝大多数正常人的解剖、生理、生化、免疫及组织代谢产物的含量等各种数据的波动范围;最常用的是95%参考值范围;步骤与方法:1. 确定“正常人”对象的范围:即根据研究目的确定的未患被研究疾病的个体;2. 统一测定标准:即检验用的试剂批号、仪器、人员、条件等应相同;3. 确定分组:一般需用年龄、性别等对“正常人”对象进行分组,分组特征也可根据检验判断;4. 样本含量确定:一般来讲,正态分布资料所需的样本含量应在100以上,偏态或未知分布时样本含量应更大;5. 确定参考值范围的单双侧:一般生理物质指标多为双侧、毒物指标则多为单侧;6. 确定百分位点:一般取95%或99%;第四章第五章一、名词解释1 标准误standard error:表示样本统计量抽样误差大小的统计指标,统计上通常将统计量如样本均数、样本率p等的标准差称为标准误;2 可信区间confidence interval:按一定的或1-α用一个区间来估计参数所在的范围,该范围通常称为参数的可信区间或者置信区间confidenceinterval,CI,预先给定的概率1-α称为可信度或者confidencelevel,常取95%或99%;3 假设检验hypothesis testing:利用样本提供的信息判断假设是否成立的统计方法称为统计假设检验;4 统计推断statistical inference:用一个或一系列样本的结果去估计总体可能的结果的过程;包括假设检验和参数估计;5 Ⅰ型错误type I error::“实际无差别,但下了有差别的结论”,假阳性错误;犯这种错误的概率是其值等于检验水准6 Ⅱ型错误type II error:“实际有差别,但下了不拒绝H0的结论”,假阴性错误;犯这种错误的概率是其值未知7 检验效能power of test:当两总体确有差别,按检验水准所能发现这种差别的能力;8 变量变换 variable transformation:也称变量代换,是将原始数据作某种函数转换,如转换为对数值;三、简答题1 假设检验的基本原理和步骤;假设检验过去称显着性检验;它是利用小概率反证法,从问题的对立面H0出发间接判断要解决的问题H1是否成立;然后在H0成立的条件下计算检验统计量,最后获得P值来判断;1. 建立检验假设,确定检验水准选用单侧或双侧检验1无效假设null hypothesis零假设,记为H0;2备择假设又称对立假设,记为H1;2. 计算检验统计量根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等如数据的分布类型选择相应的检验统计量;3. 确定P值,下结论;选定显着性水平α的值,P≤α,拒绝H0,接受H1 ,下“有差别”的结论;P>α不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论;2 标准差和标准误的异同;相同点:都是用来表示变异程度的,均是反映随机误差的;区别:标准差与标准误的意义、作用和使用范围均不同;标准差亦称单数标准差一般用SD 表示,是表示个体间变异大小的指标,反映了整个样本对样本平均数的离散程度,是数据精密度的衡量指标;而标准误一般用SE 表示,反映样本平均数对总体平均数的变异程度,从而反映抽样误差,是量度结果精密度的指标;标准差是最常用的统计量, 一般用于表示一组样本变量的分散程度;标准误一般用于统计推断中,主要包括假设检验和参数估计,如样本平均数的假设检验、参数的区间估计与点估计等;3 参考值范围和置信区间有何区别参考值范围是指具有明确背景资料的参考人群某项指标的测定值,例如医学参考范围指包括绝大多数的正常人的人体形态,功能和代谢产物等,表示值时可能有单侧也可能有双侧,表示方法为正态分布或百分位数法.置信区间是指在做区间的估计时指按一定的概率1-a估计总体参数所在的范围,其中1-a被称为置信度,两者的不同之处在于前者是对于某种指标的估计,后者是对参数的估计;前者用,后者用;前者用,后者用α为,为v的t或u界值;4 t 检验和方差分析的基本思想各是什么二者的区别是什么t 检验假设检验的一种:假设检验的基本思想是小概率反证法思想;小概率思想是指小概率事件P<或P<在一次试验中基本上不会发生;反证法思想是先提出假设检验假设H0,再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立;方差分析的基本思想是根据资料设计的类型及研究目的,可将总变异分解为两个或多个部分,每个部分的变异可由某因素的作用来解释;通过比较可能由某因素所至的变异与随机误差,即可了解该因素对测定结果有无影响;区别:t检验可用于2个样本均数差异的显着性检验,但不适于多组均数的检验;方差分析是判断多组≥3 数据之间均数差异是否显着的一种假设检验方法;5、t 检验和t 检验的应用条件有何异同t 检验:样本含量n较小时如n<601正态分布2方差齐性homogeneity of variance方差分析:总体——正态且方差相等样本——独立、随机6 以随机区组设计的两因素方差分析为例,简述方差分析的基本原理;正态分布且方差齐同的资料,应采用两因素处理、配伍方差分析two-way ANOVA或配对t检验g=21总变异:反映所有观察值之间的变异,记为SS总;2 处理间变异:由处理因素的不同水平作用和随机误差产生的变异,记为SS处理;3 区组间变异:由不同区组作用和随机误差产生的变异,记为SS区组.4 误差变异:由随机误差产生的变异,记为SS误差;对总离均差平方和及其自由度的分解,有:7 可信区间和假设检验的区别和联系;一主要区别:1、可信区间是以样本资料估计总体参数的真值,假设检验是以样本资料检验对总体参数的先验假设是否成立;2、可信区间为双侧,假设检验既有双侧检验,也有单侧检验;3、可信区间立足于大概率,假设检验立足于小概率;二主要联系:1、都是根据样本信息推断总体参数;2、都以抽样分布为理论依据,建立在概率论基础之上的推断;3、二者可相互转换,形成对偶性;可信区间与假设检验各自不同的作用,要结合使用;一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1;另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义;8 配对t 检验与两样本t 检验的基本原理有何不同;配对t 检验适用于配对设计的计量资料;配对设计类型:①两同质受试对象分别接受两种不同的处理;②同一受试对象分别接受两种不同处理;③同一受试对象一种处理前后;两样本t 检验适用于完全随机设计两样本均数的比较,第七章1. 二项分布、Poisson 分布与正态分布间有何关系二项分布:是正态分布的特殊形式,记作X~Bn, ,理论上n→+∞且→则二项分布呈正态分布;在实际应用中,当n较大、np与n1-p均>5, 且有→时,二项分布可看成近似正态分布;Poisson 分布:它是普通二项分布在次数极大,发生机率很小时的极限,记作PX,λ越大则Poisson分布渐近正态分布;实际应用上,λ≥20就可将其看作()~λ是正态分布;第六章分类资料的统计描述一、名词解释1、率rate:是说明某事物或现象发生的频率或强度的指标;2、构成比constituent ratio:是说明某事物内部各组成部分的比重或分布的指标;3、相对比relative ratio:是说明两个有关联的事物间的相对关系的指标;4、标准化率standardized rate:也称调整率,是多组率之间按统一的“标准”进行调整,使之具有可比性的率;5、标化发病比standardized incidence ratio:被标化组实际发病数与预期发病数之比;6、标化死亡比standardized mortality ratio:被标化组实际死亡发病、患病等数与预期死亡发病、患病等数之比;第七章二项分布与Poisson分布及其应用第八章X2检验第九章秩和检验三、简答题1、二项分布、Poisson分布与正态分布间有何关系2、X2检验的应用条件有哪些1四格表的分析方法选择条件:n≥40,T≥5,专用公式;n≥40,1≤T<5,校正公式;n<40或T<1,直接计算概率;X2连续性校正仅用于v=1的四格表资料,当v≥2时,一般不作校正;2配对四格表的分析分析方法选择条件:b+c>40,专用公式;20<b+c≤40,用校正公式;b+c<20,二项分布直接计算概率;3R×C表的分析方法选择条件:1.理论数不能小于1;2.理论数大于等于1小于5的格子数不超过总格子数的1/5;3.否则用Fisher确切概率,或似然比检验;4.如果以上条件不能满足,可采用:增加样本含量;删去某行或某列;合理地合并部分行或列;Fisher精确概率法;5.多个率或构成比比较的X2检验,结论为拒绝H0时,仅表示几组有差别,并非任两组之间都有差别;若要了解之,可进行多重比较:X2表的分割或率的可信区间法;6.对于有序的分类变量,采用X2检验方法不能考虑数据的有序性质;为此,对于单向有序可采用秩和检验、Ridit分析,双向有序可采用趋势检验等;3、X2检验用于解决哪些问题1推断两个总体率或构成比之间有无差别2多个总体率或构成比之间有无差别3多个样本率的多重比较4两个分类变量之间有无关联性4、四格表的u检验与X2检验有何异同二者的相同点:1.四格表u检验是根据正态近似的原理np,n1-p>5,n充分大,凡是能用u检验的都可以用卡方检验,u2=x2ν=1;2.两者都有连续性校正问题;二者的不同点:1.由于正态分布可确定单双侧检验界值,当满足正态分布近似条件时,可使用u检验进行单侧检验;2.满足四格表U检验的资料,计算两率间的95%可信区间,尚可分析两率之差有无实际意义;检验可用于2×2列联表资料有无关联的检验5、请列举R×C表X2检验的注意事项;1注意对T值大小的要求:要求T<5的个数不能超过1/5,且不能有T<1;如果不符可选用以下方法处理:1.增加样本例数;2.相邻行列例数进行合理地合并;3.删去理论数小的行或列;4.确切概率法;(2)注意多组比较结果如为差别有显着性,并不代表每两组差别有显着性,如需分析可进一步作两两比较;(3)注意有序行×列表资料不宜采用X2检验,因为X2检验与分类变量的顺序无关;。

统计学(名词解释及简答)

统计学(名词解释及简答)

统计学名词解释统计量:用来描述样本特征的概括性数字度量简单随机抽样:指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。

整群抽样:是将总体中各单位归并成若干个互不交叉、互不重复的集合,称之为群;然后以群为抽样单位抽取样本的一种抽样方式。

系统抽样:根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式众数:是一组数据中出现次数最多的变量值中位数:是一组数据排序后处于中间位置上的变量值平均数:也称均值,是一组数据相加后除以数据的个数得到的结果标准差:离均差平方和平均后的方根区间估计:在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减抽样误差得到。

假设检验:利用样本信息,对提出的命题进行检验的一套程序和方法。

双侧假设检验:当统计量U的观测值的绝对值大于临界值Uα/2即|u0|>Uα/2时,则拒绝原假设H0,此时假设检验的拒绝域在统计量分布的两侧尾部,则称这种假设检验为双侧假设检验。

相关系数:是根据样本数据计算的度量两个变量之间线性关系强度的统计量。

回归模型:描述因变量y如何依赖于自变量x和误差项的方程。

回归方程:描述因变量y的期望值如何依赖于自变量x的方程。

估计的回归方程:根据估计数据求出的回归方程的估计。

多重共线性:是指线性回归模型中的两个或两个以上的自变量彼此相关。

时间序列:是同一现象在不同时间上的相继观察值排列而成的序列。

趋势:是时间序列在长时期内呈现出来的某种持续上升或持续下降的变动,也称长期趋势。

季节变动(季节性):时间序列在一年内重复出现的周期性波动。

指数:广义的讲,任何两个数值对比形成的相对数都可以称作指数,狭义的讲,指数是用于测定多个项目在不同场合下综合变动的一种相对数。

消费者价格指数(CPI):反映一定时期内消费者所购买的生活消费品价格和服务项目价格的变动趋势和程度的一种相对数。

简答一、概率抽样与非概率抽样比较答:非概率抽样不是依据随机原则抽选样本,样本统计量的分布是不确切的,因而无法使用样本的结果对总体相应的参数进行推断。

统计学简答题及部分名词解释

统计学简答题及部分名词解释

统计学简答题及部分名词解释1.简述总体与样本、参数和统计量的含义总体:我们所要研究的所有基本单位的总和。

样本:总体的一部分单位。

参数:描述总体或概率分布的数量值。

统计量:又称样本统计量,是对样本数据特征值的数量描述。

2.关于样本均值的抽样分布,中心极限定理的含义是什么?样本均值的抽样分布:当总体服从正态分布N(μ,σ2)时,在重复抽样条件下,来自该总体的容量为n的样本的均值某也服从正态分布,某的数学期望为μ,方差为σ2/n。

即某~N(μ,σ2/n)中心极限定理:设从均值为,方差为2的一个任意总体中重复地抽取容量为n的样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布含义:中心极限定理就是一个抽自任意总体样本容量为n的随机样本。

当n充分大时,样本均值的抽样分布将近似于一个具有均值和标准差的正态分布。

3.什么是抽样误差?其特点是什么?抽样误差是利用样本推断总体时产生的误差。

特点:对任何一个随机样本来讲都是不可避免的;是可以计量的,并且是可以控制的;样本的容量越大,抽样误差就越小;总体的变异性越大,抽样误差也就越大。

4.简述样本容量与置信水平、总体方差、允许误差的关系样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。

5.假设检验中的第一类错误和第二类错误分别是指什么?它们发生的概率大小之间存在怎样的关系?第Ⅰ类错误(弃真错误):原假设为真时拒绝原假设时所犯的错误第Ⅱ类错误(取伪错误):原假设为假时未拒绝原假设当样本容量n确定后,当α变小时,则检验的拒绝域变小,相应的接受域会变大,因此β值也就随之变大;相反,若β变小,则α又会变大.6.试解释“上组限不在内”的原则是指当相邻两组的上下限相叠时,为了“不重”(任一个单位数值只能分在其中某一组中,不能同时分在两组中),上组限数值不算在该组内。

统计学名词解释

统计学名词解释

名词解释●统计工作:是从数量方面对社会经济现象做调查研究的一种工作,是人们为认识客观事物而进行的搜集、整理、分析和提供统计资料的工作过程;●统计资料:是统计工作的成果,是指在统计实践活动中所取得的,反映统计研究对象有关特征的各种综合性的数字资料和分析报告;●统计学:是阐述统计理论与方法的系统性科学,是统计工作实践的理论概括和科学总结,是研究、整理、分析统计资料的理论和方法的科学;●总体:是指客观存在的,在某一相同性质基础上结合起来的许多个别事物的整体●总体单位:构成总体的个别事物●样本:从总体当中抽取出来,用从代表这一总体的部分个体组成的集合●标志:是说明总体单位属性或特征的名称●统计指标:说明总体数量特征的,简称指标;有俩种理解,一是指反映现象总体数量特征的概念;二是指反映现象总体数量特征的概念及其数量表现;●普查:是专门组织的一次性的全面调查;这种调查,主要用来搜集一些比较全面而又不能或不宜从经常调查中得出的统计资料;●重点调查:是一种非全面调查,它是从所要调查的单位中选择一部分重点单位进行调查●抽样调查:也是一种非全面调查,它是按照随机原则从被研究总体中抽取出一定数量的单位样本进行调查,根据样本指标数值来推算总体指标数值的一种调查●典型调查:是一种十分重要的、行之有效的非全面调查方法;它是从研究总体中有意识地选取若干具有代表性单位典型单位进行调查,用来了解总体的详细情况●统计调查:根据统计工作任务和统计设计的要求,用科学的方法,有计划有组织地向调查单位搜集调查资料的过程●统计分组:根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法●分配数列:又称分布数列、次数数列,是在统计分组的基础上形成的,用来反映总体单位在各组中分布状况的统计数列●总量指标:是反映社会经济现象的总体规模和水平的统计指标;总量指标通常是将总体单位数相加或总体单位某一数量标志值相加得到的,大多数是统计整理的直接成果,是用绝对数的形式表示的,因此也称统计绝对数●相对指标:是将两个有联系的反映社会经济现象的统计指标相互对比得到的一种抽象的比值,是反映社会经济现象间数量对比关系的综合指标●平均指标:是反映总体各单位某一数量标志值一般水平的综合指标,又称统计平均数●标志变异指标:是反映总体各单位标志值的差异程度的,即反映分配数列中各标志值的变动范围或离差程度的综合指标,也叫标志变动度,简称变异指标●成数:具有某种表现或不具有某种表现的单位数占全部总体单位数的比重●时间数列:是将说明社会经济象在各个不同时期或时点上某种数量特征的指标数值,按时间的先后顺序排列起来而形成的统计数列; 时间数列中每项数值是与时间相对应的,所以又称动态数列●时期数列:在绝对数动态数列中,各项指标都是反映某种现象在一段时间内发展过程的总量●时点数列:在绝对数动态数列中,每个指标所反映的事现象在某一时点上瞬间所处状态的数量水平●发展水平:社会经济现象在某时期或某时点达到的指标数值●统计指数:广义指同类社会经济现象数量对比的相对数,包括动态相对数、比较相对数、计划完成程度相对数等;狭义指用来反映由不能直接加总的多要素所构成的复杂社会经济现象综合变动程度的特殊相对数●抽样误差:指在遵守随机原则的条件下,用抽样指标代表总体所产生的不可避免的误差;●简单随机抽样:又称纯随机抽样;它是对全及总体的所有单位不进行任何分类或排队处理,而是完全按照随机原则从总体中抽出样本单位加以观察,以保证总体中每个单位有相等被抽中的机会●类型抽样:也称分层抽样或分类抽样;它首先把全及总体按某一标志分成若干组,然后分别在各组内按随机原则抽取一定数目的样本单位构成样本的抽样方式●等距抽样:又称机械抽样或系统抽样,它是先将总体各单位按某一标志排队,然后按固定的顺序和间隔来抽选样本单位的一种抽样组织形式●整群抽样:将总体各单位划分成若干群或组,然后以群或组为单位从中随机抽取一些群,对中选群的所有单位进行全面调查的抽样组织形式●相关关系:是现象之间确实存在有数量上的依存关系,但这种数量上的关系式不确定的●相关表:指按照相关现象的数量对应关系以及一定的逻辑顺序编制成的一种统计表。

统计学的名词解释

统计学的名词解释

统计学的名词解释统计学是一门研究数据收集、分析和解释的学科,旨在通过收集和解析数据来支持决策过程和了解现象。

统计学涉及一系列概念和方法,包括数据收集、数据描述性统计、概率理论、假设检验、统计推断和回归分析等。

1. 数据收集:统计学中的第一步是收集数据。

数据可以通过各种方法获得,包括实地观察、实验、调查问卷和从现有的数据集中获取等。

2. 数据描述性统计:在收集到数据后,统计学家使用描述性统计来总结和描述数据的特征。

描述性统计包括计算数据的平均数、中位数、众数、标准差和百分位数等。

3. 概率理论:概率理论是统计学的基石之一。

它研究随机现象发生的可能性,并给出事件发生的数学表达。

概率理论为统计推断和建立模型提供了理论基础。

4. 假设检验:假设检验用于确定一个观察结果是否与一个给定的假设相符。

它提供了一种确定性地评估研究或实验结果的方法,并决定是否拒绝或接受一个假设。

5. 统计推断:统计推断是通过对样本数据进行分析和推断来对总体进行推断的过程。

它使用样本数据估计总体参数,并根据这些估计进行一些统计判断。

6. 回归分析:回归分析是一种统计方法,用于建立和探索变量之间的关系。

它可以用来预测一个变量(因变量)如何随着其他变量(自变量)的变化而变化。

7. 统计模型:统计模型是由统计学方法和理论构建的数学表达式,用于描述和解释观察数据之间的关系。

统计模型可以是简单的线性模型,也可以是更复杂的非线性模型。

8. 抽样方法:在统计学中,由于往往难以调查每一个个体或观察每一个事件,人们通常采用抽样方法来从总体中选择一部分样本进行研究。

常见的抽样方法包括随机抽样和分层抽样等。

9. 统计图表:统计图表是一种可视化数据的方式,用来展示和比较数据。

常见的统计图表包括柱状图、饼图、散点图和箱线图等。

10. 多元统计分析:多元统计分析是一项通过同时考虑多个变量来分析数据的方法。

它包括主成分分析、因子分析和聚类分析等。

总之,统计学是一门研究数据收集、分析和解释的学科,它运用一系列概念和方法来帮助人们理解数据,并从中获取有关现象和决策的信息。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

1.总体:是依据一定的统计研究的目的确定的所要研究对象的全体,它是由客观存在的、具有某种共同性质的多个个别失误所构成的整体。

2.单位:是构成统计总体的各个个别事务。

3.标志:是说明总体单位特征的名称。

4:变量:是可变的数量标志。

5统计分组:根据统计研究的目的和要求,将总体单位或全部数据按照一定的标志划分成若干个类型或组,使组内的差异尽可能小,组间的差别尽可能明显,从而使大量无序的、混沌的数据变得有序的、反映总体特征的综合资料。

6变量数列:经过变量分组后形成的分布数列,其组别表现为不同的数值或数域。

7抽样推断:是指在抽样调查的基础上,利用样本的实际资料计算样本质变,并据以推算总体相应特征值的一种统计分析方法。

8.抽样平均误差:用来放映抽样误差的一般水平的指标。

9.抽样极限误差:根据概率论,以一定的可靠程度保证抽样误差不超过某一给定的范围。

10.发展水平:是时间序列中各具体时间条件下的指标数值,反映事物的发展变化在一定时期内或时点上所达到的水平。

11.发展速度:是现象在两个不同时期发展水平的比值,用以表明现象发展变化的相对程度。

12.序时平均数:将时间序列中各个发展水平加以平均而得到的平均数,泳衣反映现象在一段时间内发展变化所达到的一般水平。

13.动态数列:是将某种现象在时间上变化发展的一系列同类的统计指标,按照时间先后顺序排列,就形成了一个动态数列,也称时间数列。

简答题
1常用的统计直接调查方式主要有哪些?
普查、抽样调查、重点调查、典型调查、统计报表。

2.统计调查方案的内容有哪些?
首先,应明确本次调查的目的、任务和意义。

其次,确定调查对象和调查单位。

再者,确定调查项目,制作调查表。

接着,制定调查时间和调查期限。

最后,明确所采用的调查方法、调查组织和实施的具体细节。

3.时间指标和时点指标有哪些区别?
I.指数数值的收集是否连续等级。

II.同一总体不同时间的同类指标的数值是否可以相加。

III.指标数值是否与时间长度有直接联系。

4影响抽样平均误差大小的因素有哪些?
(1)总体各单位标志值的差异程度;(2)样本的单位数;(3)抽样方法;(4)抽样调查的组织形式。

5.影响样本容量的因素有哪些?
I.总体方差大小。

总体方差越大,要求样本容量越大,反之则相反。

II.容许误差的大小。

III。

抽样方法。

IV抽样方式
V.抽样推断的置信度的大小。

置信度越大,要求样本容量越大。

相关文档
最新文档