统计学期末以及考研复习知识点(内容详细)

统计学期末以及考研复习知识点(内容详细)
统计学期末以及考研复习知识点(内容详细)

统计学知识点

第一章绪论

1、今天,“统计”一词有三种含义:

⒈统计工作:搜集、整理和分析统计数据的活动。

⒉统计数据:统计工作的成果。

⒊统计学:指导统计工作的理论。如数理统计学,社会统计学,经

济统计学,应用统计学等。

统计三个含义的关系十分密切:统计工作与统计数据是过程与成果的关系;统计工作与统计学是实践与理论的关系。

2、第一部统计学著作是英国人威廉·配第(1623—1687)的《政治算

术》(1690)一书。

3、统计学是一门搜集、整理、显示和分析统计数据的科学,其目的

是探索数据内在的数量规律性。

4、统计工作全过程一般可以划分为四个环节:

统计设计、统计调查、统计整理、统计分析

5.统计的基本方法

大量观察法、综合分析法(整理、分析)、归纳推断法(分析)

6、统计学与其他学科的关系

(一)统计学与数学的关系

区别:首先,数学研究抽象的数,统计学则研究具体事物的数量;

其次,数学使用纯粹的演绎方法,而统计学则使用演绎与归纳相结合的逻辑方法。

(二)统计学与其他学科的关系

凡涉及处理实质性数据的学科都要以统计方法为工具。可以说,统计学是其他学科的工具。

第二章调查与整理

1、目前,数据的计量尺度由粗略(低级)到精确(高级)分为四个层次,即列名尺度、顺序尺度、定距尺度和定比尺度。

1.列名尺度:按照事物的某种属性对其进行平行的分类。例如,人按性别分为男、女,……。该尺度的数据不能比较大小、优

劣。

2.顺序尺度:对事物之间等级差或顺序差别的一种测度。例如,考试成绩可分为优、良、中、……。该尺度的数据能比较优劣,不能进行数学运算。

3.定距尺度:对事物之间等级差或顺序差别较精确地定量测度。

如考试成绩的95 分、86 分、……;天气温度的50C、00C、-50C、……。该尺度的“0”表示一个水平。该尺度的数据能

进行加、减运算。

4.定比尺度:用来表明数值中存在绝对零点状况下数量特征的描述尺度。例如,企业利润、产品数量等。该尺度的“0”表示“没有”或“不存在”。该尺度的数据能进行加、减、乘、除运算。

2、数据的类型

1.定性数据。也称品质数据,由列名尺度或顺序尺度计量形成,说明事物品质特征,通常用文字描述。

2.定量数据。也称数量数据,由定距尺度或定比尺度计量形成,说明现象的数量特征,用数值表示。

3、统计指标构成要素:①指标名称;②计量单位;③计算方法;④

空间限制;⑤时间限制;⑥指标数值。

4、统计指标的特点:①数量性。②综合性。③具体性。

5、标志按其表现形式不同分为数量标志和品质标志;

标志按其在总体内是否有变异分为不变标志和可变标志。

6、标志与指标的区别:①标志是说明单位的,指标是说明总体的。

②标志有不用数值表示的品质标志,而指标都是用数值表示的。

7、统计指标按表现形式可分为绝对指标、相对指标和平均指标。

8、总量指标按其反映的内容不同,分为总体单位总量和总体标志总

量,简称为单位总量(N)和标志总量(ΣX i)。

9、总量指标按其计量单位不同,分为实物量指标、劳动量指标和价

值量指标。

10、统计调查方式。普查、抽样调查、统计报表、重点调查和典型调

查。

11、调查方案设计。⑴调查目的;⑵调查对象和调查单位;⑶调查项目

和调查表;⑷调查方法;⑸调查时间;⑹调查组织与实施。

12、分组原则:①“相斥”原则;②“穷尽”原则。

13、分组作用:①划分现象的类型;②反映总体的结构;③表明现象

之间的依存关系。

14、确定实际组限的原则有两个:一是“同组同质原则”;二是“上

组限不在内原则”。

15、确定组距的原则有4个:①质别原则(不同质数据分在不同组内);

②特征原则(准确显示同质数据的分布特征);③便利原则(为后续

工作提供方便);④大量原则(所分的每一组都是一个小总体,因而每组应有若干个数据)。综合考虑这4个原则,确定组距为5件。每组起点数值的个位定为0或5。

第三章数据分布特征的描述

1、极差也称全距,是一组数据的最大值与最小值之差。极差计算简

单,易于理解。实践中,常用于工业产品质量的检查和控制。2.统计表的形式。统计表由标题、横行、纵栏和统计数字四部分组成。

3.统计表的种类。统计表按主词的分组情况可分为三种:

⑴简单表:主词不分组的统计表。⑵分组表:主词进行简单分组

的统计表。⑶复合表:主词进行复合分组的统计表。例如

第四章概率与概率分布

⒈古典定义:某一事件A发生的概率,是该事件所包含的基本事件

数m与基本空间中基本事件总数n的比值。(客观存在)

⒉统计定义:在相同条件下重复进行n次试验,事件A发生m次,

随着试验次数n的增大,事件A发生的频率m/n围绕某一常数p 上下波动的幅度愈来愈小,且逐步趋于稳定,则称p为事件A的概率。(多次试验)

⒊主观定义:人们根据经验和所掌握的有关信息,对事件发生的可

能性大小给出的估计值。(调查研究)

4、随机变量的概念。描述随机现象某一侧面的变量。

5、随机变量的特点。①取值的随机性;②取值的规律性。

6、大数定律是阐述大量随机变量的平均结果具有稳定性的一系列定

律的总称。本节只介绍两个最常用的大数定律。

⒈独立同分布大数定律该定律表明,当n足够大时,独立同分

布的一系列随机变量的均值接近(依概率收敛于)数学期望,即平

均数具有稳定性。

⒉贝努力大数定律该定律表明,当n足够大时,事件A发生的

频率接近于事件A发生的概率,即频率具有稳定性。

第五章抽样与抽样估计

⒈全集总体。也叫母体,简称为总体,是指所要认识对象全部单位

的集合体,它是由具有某种共同性质的许多单位组成的。

⒉抽样框:包括全部抽样单位的名单框架。

抽样框的形式:①名单抽样框:可供抽取的所有总体单位的名录

一览表,如企业名单等;②区域抽样框:按地理位置将总体范围

划分为若干小区域,以小区域为抽样单位;③时间表抽样框:把

总体的时间过程分为若干个小的时间单位作为抽样单位,如对流

水线上24小时内生产的产品进行质量抽查时,以10分钟为一个

抽样单位。

3、总体与抽样框的关系:①一致型②包容型

4、抽样调查误差包括登记性误差和代表性误差(随机误差、系统误差)

5、影响抽样误差的因素

⒈总体变异度。抽样误差与总体标准差(σ)成正比。

⒉样本容量。抽样误差与样本容量(n)的算术平方根成反比。

⒊抽样方法。不重复抽样比重复抽样所产生的误差小。

⒋抽样组织。一般说来,常用抽样组织形式的抽样误差由小到大的

顺序是:类型(分层)抽样、机械(等距)抽样、纯随机(简单随机)抽样、整群抽样。

6、抽样平均误差是指所有可能样本估计值与所要估计参数离差的平

均数。

7、点估计

(一)估计方法也称定值估计,即以样本指标值作为总体指标的估计

值.

(二)估计量优良的标准

⒈无偏性:指一个优良的估计量,其数学期望应等于被估计总体

参数的真值。

⒉有效性:指作为优良的估计量,其方差应比较小。这样才能保

证估计量的取值能集中在被估计的总体参数附近。

⒊一致性:指随着样本容量n 的增大,一个好的估计量将在概

率意义下愈来愈接近于所要估计的总体参数真值。

8、区间估计:就是根据样本估计量以一定可靠程度推断总体参数所

在的区间范围。

9、区间估计的依据:⑴样本信息;⑵置信度。

10、抽样设计的原则:1)保证实现抽样的随机性原则。2)保证实

现最大的抽样效果原则。

第六章假设检验

1、假设检验的特点

⒈采用反证法。先假设H0是正确的,然后根据抽样理论和样本

信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。

⒉依据“小概率事件在一次试验中不能发生”的原理.即一次抽样

调查的结果不是小概率事件。

2、基本抽样组织:

抽样组织抽样

单位

样本

代表性

产生误

差原因

抽样误

必要抽

样数目

估计

置信度

应用

分层抽样总体

单位

最好

层内

方差

最小最少最高

单位

差异大

等距抽样总体

单位

较好

总体

方差

较小较少较高

单位

可排序

纯随机~总体

单位

一般

总体

方差

一般一般一般

均匀

总体

整群抽样单位

群体

较差

群间

方差

较大较多较低

总体

可分群

3、假设检验的程序。⑴提出原假;⑵选择检验统计量;⑶规定显著性水平α,确定决策临界值;⑷计算检验统计值,作出决策。

第七章相关与回归分析

1、相关关系。当一个或几个相互联系的变量取一定的数值时,与之

相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系。

2、可决系数与相关系数

⒈相关系数与可决系数的联系

相关系数(r)的平方等于回归模型的可决系数(r2)。

⒉相关系数与可决系数的区别

⑴说明的内容不同:相关系数说明变量之间线性关系的紧密程度;

可决系数说明回归模型的拟合程度。

⑵取值范围不同:-1≤r≤1;0≤r2≤1

a —因变量的基础水平;

b —自变量增加一个单位时,因变量平均变动的数值.

3、经检验,自变量对因变量影响显著时,就可用于预测。

当xf 值在样本之内时,称为内插预测或事后预测;

当xf 值在样本之外时,称为外推预测或事前预测。

4、预测误差的来源。⑴模型本身的误差;⑵回归系数估计值的误差;

⑶自变量取值偏离样本所造成的误差;⑷未来时期总体回归系数

发生变化所造成的误差。

第八章时间数列分析

1、时间数列由两个基本要素构成:一是资料所属的时间(时序);另

一个是各时间上的统计指标数值(数列)。

2、分析时间数列的目的:一是研究事物的发展状况;二是分析现象

的发展趋势;三是揭示事物的演变规律;四是为了预测事物在未来时间上的数量。

3、时间数列按其指标表现形式不同分为绝对数~、相对数~和平均

数~三种。

4、间隔:时点数列中两数值的时点间距。

5、相对数~和平均数~的共同特点是:它们都由绝对数时间数列派

生而得;它们的指标数值具有不可加性。

6、编制时间数列的原则:基本原则:保证数列中各数值的可比性。

7、平均发展水平和静态平均数的区别:

平均数序时平均数静态平均数

分析对象总体自身总体单位

数值类型指标值标志值

计算依据动态数列变量数列

作用说明总体的动态水平。说明单位的一般水平。8、平均发展水平的计算:

1.累计增长量与逐期增长量的关系:连续的逐期增减量之和等于

累计增减量。

2.定基发展速度与环比发展速度的关系:环比发展速度的连乘积

等于定基发展速度。

9、.平均发展速度的计算。①时点数列。采用水平法。②时期数列。

当现象较稳定地增长(或下降)时,采用水平法;当现象呈升降交替地发展时,应采用累计法。

10、增长百分之一的绝对值:上期水平的百分之一。

11、长期趋势模型的选择。如果时间数列逐期增长量相对稳定,选用

直线模型;如果现象的二级增长量大体相同,选用抛物线模型;

如果环比速度序列基本一致,选用指数曲线模型。

相关主题
相关文档
最新文档