统计学重点
统计学重点

复习重点:统计学基本概念、问题简答复习重点统计1.简述统计的含义及其相互之间的关系。
统计资料、统计工作、统计学统计资料是统计工作的成果统计工作满足对统计资料的准确性统计学与统计工作是理论和实践的关系2.简述变量分配数列编制的步骤。
步骤:①将原始资料按其数值大小重新排列②确定全距③确定组距和组数④ 确定组限⑤ 编制变量数列3.什么是统计指标、什么是统计标志?说明二者的联系与区别。
统计指标是反映社会经济现象总体数量特征的概念标志指标简称标志,是反映总体单位某种特征的名称。
区别:指标是说明总体特征的,而标志是说明总体单位特征的;标志有不能用数值表示的品质标志和能够用数值表示的数量标志两种,而指标都能用数值表示联系:许多统计指标的数值是从总体单位的数量标志汇总而来的;指标和数量标志之间存在着转化关系。
4.什么是发展速度?包括哪些类型?各类之间的数量关系?发展速度是两个时期发展水平之比,它表明现象发展的程度和方向。
(一)定基发展速度=报告期水平÷某一固定时期水平(二)环比发展速度=报告期水平÷前一期水平数量关系:1.环比发展速度的连连乘积等于相应的定基发展速度2.相邻的两个定基发展速度之比等于相应时期的环比发展速度5.什么是结构相对指标、强度相对指标和比例相对指标?各类之间的关系如何?结构相对指标是利用分组的方法,将总体去区分为性质不同的若干部分,以部分数值与总体数值对比,计算各部分所占比重或比率的相对数,是反映同一时期总体内部组成状况的综合指标。
部分与总体的关系比例相对指标是反映同一总体内部各部分之间数量对比关系的综合指标,用来反映总体各组成部分之间的数量联系程度和比例关系。
部分与部分的关系强度相对指标是将两个性质不同但有一定联系的总体的指标对比而得到的相对数,用以反映现象强度、密度或普遍程度的综合指标。
关联指标间的关系6.什么是统计调查?有哪些类型?统计调查方案包括哪些内容?统计调查是根据研究的任务和目的,按照预先设计的方案,采用统计学的理论和方法,对所研究对象进行有计划,有组织的搜集资料的工作过程。
统计学重点

简答1、抽样框是包含全部抽样单位的名单框架。
主要有三种形式:名单抽样框;区域抽样框;时间表抽样框。
2、样本估计量的标准差定义为抽样平均误差;抽样平均误差的平方为抽样方差;一定概率下抽样误差的可能范围,称为极限误差3、必要抽样数目因素影响(1)总体方差(或总体标准差)(2)允许误差范围(3)置信度(4)抽样方法(5)抽样组织形式4、估计量:样本指标又称样本统计量与或估计量。
标准为:无偏性;有效性;一致性5、点估计常用的方法有哪两种?其基本思想是什么?一是矩估计法。
其基本思想是:由于样本来源于总体,样本矩在一定程度上反映了总体矩,而且由大数定律可知,样本矩依概率收敛与总体矩。
因此,只要总体x的k阶原点矩存在,就可用样本矩作为相应总体矩的估计量,用样本矩的函数作为总体矩的函数的估计量。
二是极大似然估计法。
其基本思想是:设总体分不函数形式已知,但又未知参数,未知参数可以取很多值,在未知参数的一切可能取值中选一个使样本观测值出现的概率为最大的参数作为估计量。
6什,么是抽样推断?抽样推断都有哪几方面的特点?答:抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推断总体相应数量特征的统计分析方法。
特点:(1)是由部分推算整体的一种认识方法论。
(2)建立在随机取样的基础上。
(3)运用概率估计的方法。
(4)抽样推断的误差可以事先计算并加以控制。
7,什么是参数和统计量?各有何特点?答:参数指的就是某一个全及指标,它反映了全及总体某种数量特征,统计量即样本指标,它反映了样本总体的数量特征。
其特点是:全及指标是总体变量的函数,但作为参数其指标值是确定的、唯一的,是由总体各单位的标志值或标志属性决定的;而统计量是样本变量的函数,是总体参数的估计值,其数量由样本各单位标志值或标志属性决定,统计量本身也是随机变量,8数据计量尺度:定类尺度、定序尺度、定距尺度、定比尺度。
其中定类是分类数据,定序是顺序数据,定距和定比是数值型数据。
统计学重点

第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。
第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。
每个单位被抽中的概率是已知的,或是可以计算出来的。
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。
2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。
(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。
统计学基础知识考试重点

统计学基础知识考试重点第一章统计和数据第二章●统计是用来处理数据的,是关于数据的一门学问。
1、统计学:是用以收集数据、分析数据和由数据得出结论的一组概念、原则和方法。
2、统计分析数据的方法分为:(1)描述统计(2)推断统计3、描述统计:是研究数据搜集、处理和描述的统计学方法。
4、推断统计:是研究如何利用样本数据来推断总体特征的统计学方法。
5、推断统计包括:(1)参数估计(2)假设检验6、定性变量的特点:只反映现象的属性特点,不能说明具体量的大小和差异。
●定性变量包括分类变量和顺序变量。
●只反映现象分类特征的变量称分类变量。
分类变量没有数值特征,所以不能对其数据进行数学运算。
●如果类别具有一定的顺序,这样的变量称为顺序变量。
顺序变量不仅能用来区分客观现象的不同类别,而且还可以表明现象之间的大小、高低、优劣关系。
7、定量变量的特点:可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异。
●数值型数据(定量数据)作为统计研究的主要资料,其特征在于它们都是以数值的形式出现的,有些数值型数据只可以计算数据之间的绝对差,而有些数值型数据不仅可以计算数据之间的绝对差,还可以计算数据之间的相对差。
其计量精度远远高于定性数据。
在统计学研究中,数值型数据有着最广泛的用途。
8、数据按获取的方法不同分为:(1)观测数据(2)实验数据9、观测数据:是对客观现象进行实地观测所取得的数据,在数据取得的过程中一般没有人为的控制和条件约束。
10、实验数据:一般是在科学实验环境下取得的数据。
11、统计数据资料的来源:(1)通过直接的调查或实验获得的原始数据,这是统计数据的直接来源;(2)别人调查的间接数据,并将这些数据进行加工和汇总后公布的数据,这是数据的间接来源。
12、数据的直接来源:(1)统计调查(2)实验法●通过统计调查得到的数据,一般称为观测数据。
●运用实验法时,实验组和对照组的产生应当是随机的。
统计学重点

1、非全面调查方式有哪几种?说明他们各自的特点及应用场合。
(1)抽样调查是一种专门组织的非全面调查,是按照随机原则从总体中抽取部分单位组成样本,以样本数据推断总体特征的一种调查方法,是实际中应用最广的一种调查方式。
具体来说:①不可能进行全面调查的社会现象,为了测算全面数据,必须采取抽样调查方法;②没必要或很难进行全面调查的社会现象,也可采用抽样调查;③其他应用,如进行生产过程的质量控制、对全面调查结果进行检验修正等。
(2)重点调查时在调查对象中选择一部分重点所进行的非全面调查。
但只有在当调查任务是掌握调查对象的基本情况,而在总体中的确存在的重点单位时,才能进行重点调查。
(3)典型调查是根据调查的目的和任务,在对调查对象全面分析的基础上,有意识地选择若干有典型意义或有代表性的单位进行深入、细致调查的一种非全面调查方式。
可以用来研究某些复杂的专门问题或新生事物。
2、数据分组的关键是什么?如何选择分组标志?(1)数据分组的关键是选择分组标志和划分各组界限。
(2)应根据研究的目的选择分组标志;选择能够反映事物本质的标志;考虑现象所在的历史条件或经济条件选择分组标志。
3、简述均值、中位数和众数的特点及应用场合。
(1)均值的计算利用了全部数据信息,具有优良的数学性质,主要适用于数值型变量集中趋势测度值。
主要缺点是易受极端值的影响。
算术平均数是实际中应用最广泛的集中趋势测度值;调和平均数主要用于不能直接计算均值的数据;几何平均数主要用于计算比率或速度数据的平均数。
(2)中位数是一组数据中间位置上的代表值,其特点是不受数据极端值得影响,主要适用于作为顺序数据的集中趋势测度值。
(3)众数是一组数据分布的峰值,它也是一种位置的代表值,不受极端的影响。
其缺点是不具有唯一性。
众数主要适用于作为分类数据的集中趋势测度值。
(4)当数据呈对称分布或接近对称分布时,应选择均值作为集中趋势的代表值。
当数据呈偏态分布时,可以选择众数或中位数作为集中趋势测度值。
统计学重点

1.统计的三种含义:统计工作、统计资料、统计学2.统计学的研究对象是大量社会经济现象3.统计学的特点:数量性、总体性、具体性、社会性、差异性4.统计学研究方法:大量观察法、统计分组法、统计指标法、统计推断法、统计模型5.统计的基本职能:信息(最基本)、咨询、监督职能6.统计工作的过程:统计设计、统计调查、统计整理、统计分析7.总体和总体单位(判断):总体是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
构成总体的这些个别单位成为总体单位。
总体的特点:同质性、大量性、差异性8.标志和指标:标志是用来说明总体单位特征的名称,分为品质标志和数量标志。
指标是说明总体的综合数量特征的。
指标包括:空间、时间、指标名称、指标数值、计量单位、计算方法9.标志和指标的区别和联系:区别-(1)标志是说明总体单位特征的,而指标是说明总体特征的。
(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,使用属性表示的。
(3)指标数值是经过一定的汇总取得的,而标志中的数量指标不一定经过汇总,可直接取得。
(4)标志一般不具备时间地点等条件,但作为一个完整的统计指标,一定要讲时间地点和范围。
联系-(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的。
(2)两者存在着一定的变换关系。
10.变量按取值是否连续可分为离散变量和连续变量。
11.统计调查的特征:准确性、及时性、全面性12.统计调查方案设计:确定调查目的、确定调查对象和调查单位、确定调查项目、确定调查时间和调查期限、制定调查的组织实施计划、选择调查方法13.确定调查单位就是要赋予调查单位以科学的定义,而填报单位是负责上报调查资料的单位。
14.问卷的结构:封面信、指导语、问题与答案、编码15.调查时间是指调查资料所属的时点或者时期。
调查期限是指调查工作进行的起讫时间(从开始到结束的时间)。
16.统计调查的组织形式:(1)按调查对象包括的范围分类:普查、统计报表制度、抽样调查、重点调查、典型调查(2)按调查的组织形式分类:统计报表制度和专门调查(3)按登记事物的连续性分类:经常调查和一时调查17.各类统计调查的特点调查范围调查时间组织形式统计报表全面或非全面经常报表制度普查全面一时专门调查抽样调查非全面经常或一时专门调查重点调查非全面经常或一时报表或专门典型调查非全面一时专门调查18.统计整理阶段的工作内容程序:资料审核、统计分组、统计汇总、编制统计表19.统计分组:就是根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
统计学重点

1.时点指标和时期指标的区别。
时期指标反映现象在某一时期内发展过程的总数量;时点指标反映现象在某一时刻(瞬间)上状况的总量。
时期指标和时点指标各有不同的特点:(1)时期指标的数值时连续计数的,它的每个数值是表示现象在某一点时期内发生的总量;而时点指标的数值是间断计数的,它的每个数值是表示现象发展到某一时点上所处的水平。
(2)时期指标具有累加性,即各个时期值相加可以说明现象在较长时期内发生的总量;而时点指标不具有累加性;(3)时期指标的大小受时期的长短的制约;而时点指标数值的大小与时点间的间隔长短无直接的关系。
2.什么叫统计分组?统计分组有哪些分类?(1)统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。
其目的是把同质总体中的具有不同性质的单位分开,把性质相同的单位合在一起,保持各组内统计资料的一致性和组间资料的差异性,以便进一步运用各种统计方法研究现象的数量表现和数量关系,从而正确地认识事物的本质及其规律。
(2)①简单分组,又称为单一分组,就是对被研究现象总体只按照一个标志进行的分组;②复合分组,就是对同一总体选择两个或两个以上标志层叠起来进行的分组;③分组体系,采用一系列相互联系,相互补充的标志对现象进行分组,这些分组结合起来构成一个体系,在统计学上叫做分组体系。
4.单项式分组和组距式分组分别在什么情况下应用?变量数值不多,变动范围不大,即总体单位的不同标志值较少,这时可做成单项式分组;变量数值较多,变动范围较大,即总体单位的不同标志值较多,则应该作组距式分组。
5.什么是同度量因素,在编制指数时如何确定同度量因素的所属时间。
(1)同度量因素是使若干由于度量单位不同不能直接相加的指标,过渡到可以加总和比较而使用的媒介因素。
(2)确定同度量因素的一般原则是:质量指标指数应当以报告期的数量指标作为同度量因素,即使用派氏公式,而数量指标指数则应以基期的质量指标作为同度量因素,即使用拉氏公式。
统计学考试重点

精品文档统计学考试重点(是我去年考试时的,命中率百分之百)1.统计的涵义:从数量方面认识总体现象的本质和规律的一种认识活动或调查研究活动。
概括为:统计工作,统计资料,统计学。
2.统计工作,统计资料与统计学的联系:统计工作是获取统计资料的实践活动,统计资料是统计工作的成果。
同时又服务于统计工作,统计学来源于统计实践,有用于指导统计实践,它可以使统计工作进行的更科学,得到的统计资料更全面、更及时、更准确3.统计的研究对象是大量社会经济现象的数量特征与规律。
4.统计的研究对象具有以下特点:①数量性②总体性③具体性。
5.统计工作可分为四个阶段,统计设计,统计调查,统计整理,统计分析。
6.统计工作的基本方法:大量观察法,统计分组法,综合指标法,统计推理法7.统计总体:简称总体,是根据统计研究目的确定的所研究对象的全体。
8.总体单位:简称单位或个体,是只构成总体的个别单位。
9.指标是指用来说明总体单位数量特征或属性特征的概念或名称。
10.标志根据表现形式分为:品质标志和数量标志11.指标是说明总体数量特征的科学概念和具体数值。
12.指标所包含的要素有:指标名称,指标数值,时间,空间,计量单位。
13.指标按其表现形式不同,又可分为总量指标,相对指标,平均指标。
14.按所反映总体内容不同可分为:数量指标和质量指标。
15.变量,所谓变量,是指可变的数量标志。
16.统计数据的计量尺度分为:定类尺度,定序尺度,定距尺度,定比尺度。
17.数据的类型有:定性数据(由定类尺度和定序尺度计量形成) 。
定量数据(由定居尺度和定比尺度计量形成) 。
18.统计调查方案的设计(内容):①确定调查的目的和任务②确定调查对象、调查单位与报告单位,③确定调查项目、设计调查表式,④确定调查时间、空间和调查期限,⑤制定调查工作的组织实施计划。
⑥选择调查方法精品文档19.统计数据搜集的原则:准确性原则,及时性原则,系统性原则,完整性原则。
20.统计数据搜集的方法:观察法,报告法,询问法。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。
第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。
每个单位被抽中的概率是已知的,或是可以计算出来的。
当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。
2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。
(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。
(4)环形图:同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。
用于结构比较研究、用于展示分类和顺序数据3、数值型数据的整理:(1)分组方法:1、单变量值分组,2、组距分组(1、等距分组,2、异距分组)4、组距分组:(1)等距分组:连续性组距数列的统计原则:“上组限不在内”等距分组一般在变量值变动比较均匀的条件下所有。
做法:先用定性方法确定组数,再用全距除以组数得组距。
即:组距(i)=全距(R)/组数(k)(2)异距分组:异距分组一般在变量值变动不均匀,急剧上升或下降的条件下所有。
或当变量值按一定比例发展变化时使用。
需要用频数密度(频数密度=频数/组距)反映频数分布的实际状况。
Ex:5、图示(1)分组数据-直方图:(与条形图的区别)1、条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)是固定的2、直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3、直方图的各矩形通常是连续排列,条形图则是分开排列4、条形图主要用于展示分类数据,直方图则主要用于展示数值型数据(2)分组数据-折线图:是在直方图的基础上,把直方图顶部的中点(组中值)连接起来。
(3)未分组数据-茎叶图:以高位数值作树茎,低位数字作树叶,适用于小批量数据(4)未分组数据-箱线图:由最大值、最小值、中位数和两个四分位数绘制而成。
(5)时间序列数据-线图:长宽比例大致为10 : 7,时间一般绘在横轴,数据绘在纵轴(6)多变量数据-二维散点图:展示两个变量之间的关系(7)多变量数据-气泡图:展示三个变量之间的关系,数据点的大小依赖于第三个变量。
(8)多变量数据—雷达图:蜘蛛图,在显示或对比各变量的数值总和时十分有用6、统计表的设计1.合理安排统计表的结构2.总标题内容应满足3W要求3. 数据计量单位相同时,可放在表的右上角标明,不同时应放在每个变量后或单列出一列标明4. 表中的上下两条横线一般用粗线,其他线用细线5. 通常情况下,统计表的左右两边不封口6. 表中的数据一般是右对齐,有小数点时应以小数点对齐,而且小数点的位数应统一7. 对于没有数字的表格单元,一般用“—”表示8. 必要时可在表的下方加上注释第四章1、众数:异距数列,用频数密度2、中位数:3、四分位数:4、分类数据-异众比率:非众数组的频数占总频数的比例,对分类数据离散程度的测度∑∑∑-=-=im imi r f f f f f v 15、顺序数据-四分位差:对顺序数据离散程度的测度,用于衡量中位数的代表性,上四分位数与下四分位数之差,即Q3-Q1。
6、方差和标准差:分组数据方差(重复抽样):Nf M Kiii ∑=-=122)(μσ(fi 为组中值,u 为均值,若是样本,除以N-1)不重复抽样:xσ-=i f f f f f f L M ⨯-+--+=+--)()(111&方差加法定理:总方差=组内方差的平均数+组间方差组间方差是:分组均值与总均值的差的平方乘以组内个数的和除以总数。
7、标准分数:s x x z i i -=服从N (0,1)分布。
8、相对离散程度-离散系数:标准差与其相应的均值之比,xsv s =9、偏态:偏态系数=0为对称分布,偏态系数> 0为右偏分布,偏态系数< 0为左偏分布10、峰态:峰态系数=0峰度适中,峰态系数<0为扁平分布,峰态系数>0为尖峰分布第六章1、中心极限定理:设从均值为μ,方差为σ 2的一个任意总体中抽取容量为n 的样本,当n 充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n 的正态分布2、样本均值的抽样分布:3、均值的抽样标准误:所有可能的样本均值的标准差,测度所有样本均值的离散程度,小于总体标准差,计算公式为:n X σσ=4、比例:5、样本比例的抽样分布:6、比率的抽样标准误:7、两个样本均值之差的抽样分布:(1)两个总体都为正态分布,即),(~2111σμN X ,),(~2222σμN X ,(2)两个样本均值之差21X X -的抽样分布服从正态分布, (3)数学期望为两个总体均值之差:2121)(μμ-=-X X E ,(4)方差为各自的方差之和222121221n n X X σσσ+=-。
8、两个样本比例之差的抽样分布:(1)两个总体都服从二项分布(2)分别从两个总体中抽取容量为n1和n2的独立样本,当两个样本都为大样本时,两个样本比例之差的抽样分布可用正态分布来近似(3)分布的数学期望为2121)(ππ-=-P P E (4)方差为各自的方差之和2221112)1()1(21n n P P ππππσ-+-=-第七章1、评价估计量的标准无偏性:估计量抽样分布的数学期望等于被估计的总体参数有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效 一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数 2、总体均值的区间估计3、总体比率的区间估计假定条件:总体服从二项分布、可以由正态分布来近似。
总体比率π在1-α置信水平下的置信区间为。
正态分布统计量 z:4、两个总体均值之差的区间估计其中:2)1()1(212222112-+-+-=nnsnsnsp,1)/(1)/()(22222121212222121-+-+=nnsnnsnsnsv5、两个总体比率之差的区间估计假定条件:两个总体服从二项分布、可以用正态分布来近似、两个样本是独立的两个总体比率之差π1-π2在1-α置信水平下的置信区间为6、估计总体均值时样本容量的确定估计总体均值时样本容量n为,样本容量n与总体方差σ2、允许误差E、可靠性系数Z或t之间的关系为:与总体方差成正比、与允许误差成反比、与可靠性系数成正比7、估计总体比率时样本容量的确定根据比率区间估计公式可得样本容量n为。
第八章1、两类错误:显著性水平为a影响 b 错误的因素:1、随着假设的总体参数与真实参数值差异的减小而增大2、当显著性水平a减少时增大3、当总体标准差 增大时增大4、当样本容量n减少时增大。
2、假设检验:3、单边检验单边检验解题步骤: 1、计算样本均值,2、用样本均值和要比较的K 比较,若样本均值大于K,则右边检验。
若样本均值小于k则左边检验3、画图4、计算统计量值5、查找临界值并和统计量值比较其中:右边检验:,拒绝域在右边左边检验:,拒绝域在左边4、假设检验步骤与注意点步骤:1、陈述原假设和备择假设2、从所研究的总体中抽出一个随机样本3、确定一个适当的检验统计量,并利用样本数据算出其具体数值4、确定一个适当的显著性水平,并计算出其临界值,指定拒绝域5、将统计量的值与临界值进行比较,作出决策a)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0b)也可以直接利用P值作出决策注意点:(1)当检验统计量落在拒绝域内,不代表我们证明原假设为错误的。
只能说我们对于原假设所陈述的内容真实性有很大的怀疑—零假设不是不正确,就是极不可能发生,(2)当检验统计量落在无法拒绝域中,并不是证明原假设为真,仅是表示证据不足以推翻我们的假设。
5、P值(1)在原假设为真的条件下,P值是抽样分布中大于或小于样本统计量的概率即:双侧检验为分布中两侧面积的总和、左侧检验为小于等于检验统计量部分的面积、右侧检验为大于等于检验统计量部分的面积(2)反映实际观测到的数据与原假设H0之间不一致的程度(3)被称为观察到的(或实测的)显著性水平(4)决策规则:若p值< ,拒绝H0(5)P<0.10代表有“一些证据”不利于原假设、P<0.05代表有“适度证据”不利于原假设、P<0.01代表有“很强证据”不利于原假设6、一个参数总体均值的检验7、一个参数总体比率的检验8、两个总体均值之差的检验其中:2)1()1(212222112-+-+-=n n s n s n s p ,()()1122222121212222121-+-⎪⎪⎭⎫ ⎝⎛+=n n s n n s n s n s v 9、两个总体比率之差的检验(1)(2)其中:2221121211n n n p n p n n x x p ++=++=第九章一、单因素方差分析 1、误差平方和-ss组内平方和SSE :()∑∑==-=k i n j i ij ix x SSE 112,每个组各样本数据与其组平均值的离差平方和组间平方和SSA :()()∑∑∑===-=-=ki i i ki n j i x x n x x SSA i12112,组平均值),,2,1(k i x i Λ=与总平均值x 离差平方和总平方和SST :()∑∑==-=k i n j ij ix x SST 112全部观察值ijx 与总平均值x 的离差平方和总离差平方和(SST )、误差项离差平方和(SSE )、水平项离差平方和 (SSA ) 之间的关系()()()∑∑∑∑∑=====-+-=-k i n j ij k i i i k i n j ijiix x x x n x x11212112,即SST = SSA + SSE三个平方和的作用:1、SST 反映全部数据总的误差程度;SSE 反映随机误差的大小;SSA 反映随机误差和系统误差的大小2、如果原假设成立,则表明没有系统误差,组间平方和SSA 除以自由度后的均方与组内平方和SSE 除以自由度后的均方差异就不会太大;如果组间均方显著地大于组内均方,说明各水平(总体)之间的差异不仅有随机误差,还有系统误差3、判断因素的水平是否对其观察值有影响,实际上就是比较组间方差与组内方差之间差异的大小 2、平方和除以相应的自由度----均方(方差)—MS(1)各误差平方和的大小与观察值的多少有关,为消除观察值多少对误差平方和大小的影响,需要将其平均,这就是均方,也称为方差,计算方法是用误差平方和除以相应的自由度。