中级经济师(统计)

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章统计与统计数据

统计学:一门关于数据的学科,它提供了一系列用于收集、处理、分析和解释数据的方法。

统计学的两个分支:描述统计和推断统计。

描述统计:研究数据收集、整理和描述的统计学方法。其内容包括如何取得所需要的数据,如何用图表或数学方法对数据进行整理和展示,如何描述数据的一般性特征。

推断统计:研究如何利用样本数据来推断总体特征的统计学方法,其内容包括参数估计和假设检验两大类。

参数估计:利用样本信息推断总体特征;

对于不同类型的数据,可以采用不同的统计方法处理和分析。对分类数据可以计算出各类别的频率,而数值型数据则可以计算均值和方差等统计量。

统计调查过程有两个重要特征:一是调查是一种有计划、有方法、有程序的活动;二是调查的结果表现为搜集到的数据。

按调查对象的范围不同分为:全面调查、非全面调查

第二章描述统计

均值既平均数,是数据组中所有数值的总和除以该组数值的个数。

设一组数据为X1,X2,…,X n,平均数X的计算公式为:

【提示1】均值是集中趋势中最主要的测度值,是一组数据的重心所在,解释了一组数据的平均水平。

【提示2】均值主要适用于数值型数据,但不适用于分类数据和顺序数据。

【提示3】均值易受极端值的影响,极端值会使得均值向极大值或极小值方向倾斜,使得均值对数据组的代表性减弱。

中位数:把一组数据按从小到大或从大到小的顺序进行排列,位置居中的数值叫做中位数,用Me 表示:

中位数是一个位置代表值,主要用于顺序数据和数值型数据,但不适用于分类数据。中位数的优点是不受极端值的影响,抗干扰性强。

众数:指一组数据中出现次数(频数)最多的变量值。适用于描述分类数据和顺序数据,不适用于

离散程度反映的是各变量值远离中心值的程度。

衡量离散程度的指标包括:方差、标准差、离散系数。

集中趋势的测度值是对数据一般水平的一个概括性变量,它对一组数据的代表程度,取决于该组数

据的离散水平。数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性就越好。

方差是数据组中各数值与其均值离差平方的平均数,它能较好地反映出数据的离散程度,是实际中应用最广泛的离散程度测度值。方差越小,说明数据值与均值的平均距离越小,均值的代表性越好。方差对极端值敏感。

对于总体数据,常用的方差计算公式有两种:

对于样本数据,常用的方差计算公式为:

标准差:方差的平方根,不仅能度量数值与均值的平均距离,还与原始数值具有相同的计量单位。

标准差的计算公式:

方差、标准差只适用于数值型数据,易受极端值的影响。标准差的大小不仅与数据的测度单位有关,也与观测值的均值大小有关,不能直接用标准差比较不同变量的离散程度

离散系数也称为变异系数或标准差系数,即标准差与均值的比值。标准差/均值:CV =s/X

离散系数= (标准差)/

(均值)

离散系数消除了测度单位和观测值水平不同的影响,因而可以直接用来比较变量的离散程度。

标准分数也称Z 分数,是统计学上常用的一种标准化方法。标准分数可以给出数值距离均值的相对位置,用于比较不同分布的变量值。

标准分数Z =(给出的数值-均值)÷标准差(标准分数Z 越大越好)

1.因为两科考试的标准差不同,因此不能用原始分数直接比较。需要将原始分数转换成标准分数,然后进行比较。

2.标准分数的计算

标准分数Z =(原始分数Xi —

平均分数X )÷标准差s

【补充】标准分数表示一个给定的分数距离平均数有多少个标准差,含有标准差的个数越多,说明该分数和平均数的距离越大(标准分数越大越好)

在实际应用中,当数据服从对称的钟形分布时,可以运用经验法则来判断与均值的距离在特定倍数标准差之内的数据项所占比例。

1. 约有68%的数据与平均数的距离在1个标准差之内,标准分数在【-1,1】范围内;

2. 约有95%的数据与平均数的距离在2个标准差之内;标准分数在【-2,2】范围内;

3.

约有99%的数据与平均数的距离在3个标准差之内;标准分数在【-3,3】范围内;

上述内容可记忆三个数据,即168;295;399.

两变量之间的相关关系可以用散点图来展示,在散点图中,每个点代表一个观测值,横纵坐标值分别代表两个变量相应的观测值。

相关系数是度量两个变量之间相关关系的统计量。最常用的相关系数是pearson(皮尔逊)相关系数。

根据实际数据计算出的r,其取值一般为-1

第三章抽样调查

总体:即调查对象的全体,调查总体必须是明确的而不能是模糊的。例如:全国钢铁产量。

样本:总体的一部分,它由从总体中按一定原则或程序抽出的部分个体所组成。例如:抽取了20家钢铁企业。

样本量:样本中包含的入样单位的个数。例如:20

抽样框:供抽样所用的所有抽样单元的名单,是抽样总体的具体表现。常用的抽样框有名录框,如企业名录、电话簿、人员名册。例如:工商局注册的20家企业。

总体参数就是总体指标值,它是未知的常数,是根据总体中所有单位的数值计算的,是通过调查想要了解的,不受样本的抽选结果影响。

常用的总体参数有:总体总量、总体均值、总体比例、总体方差。

样本统计量(估计量):是根据样本中各单位的数值计算的,是对总体参数的估计,也称估计量。它是一个随机变量,取决于样本设计和正好被选入样本的单元特定组合。

常用的样本统计量有:样本均值、样本比例、样本方差。

抽样调查步骤:确定调查问题、调查方案设计、实施调查过程、数据处理分析、撰写调查报告

1.确定调查问题:包括对整个问题的叙述以及确定研究问题的具体组成部分。

2.调查方案设计:明确如何实施调查,包括抽样方案的设计和问卷设计。

3.实施调查过程:获得样本单元的调查数据,关键的问题是要保证原始数据的质量。

4.数据处理分析:

①对调查获得的原始数据进行检查、核对;

②对验收合格的数据进行编码和录入;

③对录入数据进行预处理;

④对数据进行统计分析;

⑤对总体参数进行估计等。

5.撰写调查报告:调查活动的最终成果。

误差:样本估计值和总体参数真值之间的差异。

调查中的误差分为:抽样误差和非抽样误差

抽样误差:由于抽样的随机性造成的(抽样误差产生的根本原因),用样本统计量估计总体参数时出现的误差。

非抽样误差产生的原因:抽样框误差、无回答误差、计量误差

1)抽样框误差:抽样框不完善造成的。

例如:用工商局签发的营业执照作为掌握个体商业零售额情况的抽样框。有些无照经营、有些有执照但不再经商、有些有一个摊点却办理多个营业执照,易造成结果失真。

2)无回答误差:调查人员没能够从被调查者那里得到所需要的数据。

例如:(随机因素)被调查者恰巧不在家,这会减少有效样本量,造成估计量方差增大;(非随机因素)被调查者不愿告诉实情而拒绝回答,无回答不仅造成估计量方差增大,还会带来估计偏差。3)计量误差:调查所获得的数据与其真值之间不一致造成的误差。

例如:调查员在调查中有意无意地诱导被调查者;记录答案错误;对调查问题的理解有偏误;受访者提供虚假数字等。

简单随机抽样分为:不放回简单随机抽样、有放回简单随机抽样

有放回简单随机抽样:从总体中随机抽出一个样本单位,记录观测结果后,将其放回到总体中去,再抽取第二个,如此类推,一直到抽满n个单位为止。

【注】单位有被重复抽中的可能,容易造成信息重叠而影响估计的效率,较少采用。

不放回简单随机抽样:从包含N个单元的总体中逐个随机抽取单元并无放回,每次都在所有尚未被

相关文档
最新文档