2第二章 计量经济学的统计学基础知识

合集下载

计量经济学的统计学基础

计量经济学的统计学基础

计量经济学的统计学基础引言计量经济学是经济学的一个分支,它研究如何利用统计学方法和经济理论来分析经济现象。

在计量经济学中,统计学是非常重要的基础,它为我们提供了估计经济模型参数的工具。

本文将介绍计量经济学中的统计学基础知识,包括概率分布、假设检验和回归分析。

1. 概率分布概率分布是描述随机变量可能取值的概率的函数。

在计量经济学中经常使用的两个概率分布是正态分布和 t 分布。

1.1 正态分布正态分布是一种对称的连续型概率分布,它的特点是均值和标准差可以完全描述该分布。

正态分布在计量经济学中的应用非常广泛,例如在回归分析中,我们通常假设误差项服从正态分布。

在Markdown文本中,我们可以使用数学公式来表示正态分布的概率密度函数如下:$$f(x;\\mu,\\sigma) = \\frac{1}{\\sqrt{2\\pi}\\sigma} e^{-\\frac{(x-\\mu)^2}{2\\sigma^2}}$$其中,x是随机变量,$\\mu$ 是均值,$\\sigma$ 是标准差。

1.2 t 分布t 分布是一种对称的连续型概率分布,它的形状和正态分布很类似。

t 分布与正态分布的不同之处在于 t 分布有一个称为自由度的参数。

在计量经济学中,t 分布通常用于小样本情况下的假设检验。

给定一个自由度为v的 t 分布,其概率密度函数可以表示为:$$f(x;v) = \\frac{\\Gamma(\\frac{v+1}{2})}{\\sqrt{\\pi v}\\Gamma(\\frac{v}{2})} \\left(1+\\frac{x^2}{v}\\right)^{-\\frac{v+1}{2}}$$其中,$\\Gamma(\\cdot)$ 表示 gamma 函数。

2. 假设检验假设检验是计量经济学中常用的统计推断方法之一,它用于判断某个经济假设是否成立。

在假设检验中,我们首先提出一个原假设,然后根据样本数据来判断是否拒绝原假设。

2第二章计量经济学的统计学基础知识

2第二章计量经济学的统计学基础知识

if
1 1
,
2
2已知
理论: H 0 : 1 2 ; H1 : 1 2
X
~
N
(1
,
1
n1
),Y
~
(2
,
2
n2
)
X
Y
~
N
(1
2
,
1
n1
2
) n2
U X Y (1 2 ) ~ N (0,1) 1 2
n1 n2
if , H 0right
U
X Y ~ N (0,1)
1 2
n1 n2
P{U u } 查附表知u, 如果U u, 则接受H1
n
P( X xi ) 1
i 1
一、概率分布
连续性的随机变量概率函数
P(a X b)
b
f (x)dx
a
x
其中f (x)为概率密度函数。密度函数满足条件
f (x) 0;
b
f (x)dx 1
a
概率分布还可用分布函数表示。分布函数是概率的累积,即
随机变量X取小于某个x值的累积概率是x的函数,记为F(x).
t0.001(9) 3.25
例3(卡方分布):设已知维尼纶纤度在正常 生产条件下服从正态分布N(1.405, 0.002304)。 在生产某段时间,抽取了5根纤维,测得其纤 度为1.32, 1.55, 1.36, 1.4, 1.44.问该段时间母体方
差是否正常?(显著性水平是0.1)
解:H0 : 2 02 0.0482
注意:这里的分母是子样标准差除以自由度, 实际上是子样均值的标准差!只有这样才与 分子保持一致性。分子被平均了,分母当然 也要平均! t分布在小样本(n<30)统计推断中占有重要的地位。

计量经济学复习笔记

计量经济学复习笔记

第一章统计概念1.什么是计量经济学计量经济学是对经济的测度,利用经济理论、数学、统计推断等工具对经济现象进行分析的一门社会科学。

2.计量经济学的方法论(计量经济分析步骤)(1)建立理论假说。

(2)收集数据。

(3)假定数学模型。

(4)设立统计或计量模型。

(5)估计经济模型参数(6)核查模型的适用性:模型设定检验。

(7)检验源自模型的假定(8)利用模型进行预测4.数据类型(1)时间序列数据:按时间跨度获得的数据。

特征是一般变量如 Y t、X t下标为t。

(2)截面数据:同一时点上的一个或多个变量的数据集合。

如:各地区2002年人口普查数据。

(3)合并数据:既包括时间序列数据有包括截面数据。

例:20年间10个国家的失业数据。

20年失业数据是时间序列,10个国家又是截面数据。

(4)面板数据:同一个横截面的单位的跨期调查数据。

例:对相同的家庭数量在几个时间间隔内进行的财务状况调查。

5.理解回归关系回归关系是一种统计上的相关关系,并不意味着自变量和因变量之间存在着因果关系。

第二章线性回归的基本思想1.回归分析的含义: 回归分析是反映的自变量和因变量之间的统计关系,回归分析是在自变量给定条件下的因变量的变化,是一种条件回归分析E(Y i|X i)=B1+B2X i2.随机误差项的性质(为什么要引入随机误差项)(1)随机误差项代表着未纳入模型变量对因变量的影响(2)即使模型包括了影响因变量的所有因素,模型也有不可避免的随机性。

(3)μ还代表着度量误差(4)模型设定应该尽可能简单,只要不遗漏重要变量,把因变量的次要影响因素归于随机项 μ 。

(奥卡姆剃刀原则)3.参数估计方法———普通最小二乘法的基本思想 选择参数使得残差平方和最小——Min ∑e i 2=Min ∑(Y i −Yi ̌)2=Min ∑(Y i −b 1−b 2X i )^24.根据Ols 法得出参数 b 1 b 2 称为最小二乘估计量,最小二乘估计量的性质: (1)Ols 方法获得样本回归直线过样本均值点(X ,Y ) (2)残差的均值总为0,(3)残差项与解释变量的乘积求和为0,即残差项与解释变量不相关。

计量经济学 统计学基础

计量经济学  统计学基础

编辑版pppt
2
编辑版pppt
3
编辑版pppt
4
编辑版pppt
5
向下累计频率
编辑版pppt
6

根据上表得出
编辑版pppt
7
2.3. 连续型随机变量的分布 2.3.1. 概率密度
分布函数为
因此,若已知X的分布函数,我们就知道X落在
任一区间
上的概率。分布函数F(x)在x处的
函数值就表示X落在区间
上的概率。
编辑版pppt8来自编辑版pppt9
编辑版pppt
10
编辑版pppt
11
编辑版pppt
12
编辑版pppt
13
编辑版pppt
14
编辑版pppt
15
编辑版pppt
16
编辑版pppt
17
编辑版pppt
18
F分布其均值为 n 2
n2 2
方差为 2n22(n1 n2 2)
n1(n2 2)2(n2 4)
编辑版pppt
19
编辑版pppt
20
编辑版pppt
21
编辑版pppt
22
感谢亲观看此幻灯片,此课件部分内容来源于网络, 如有侵权请及时联系我们删除,谢谢配合!
编辑版pppt
23
分布函数fx在x处的函数值就表示x落在区间上的概率10111213141516171819f分布其均值为方差为202122感谢亲观看此幻灯片此课件部分内容来源于网络如有侵权请及时联系我们删除谢谢配合
第2章 统计学基础
编辑版pppt
1
抽样调查:部分个体数据推测总体一般结 论。
概率:某一结果、事件发生的可能性。 概率性质

计量经济学的统计学基础

计量经济学的统计学基础

协方差的性质 (1)cov(x, x) D(x)
(2) cov(x, y) cov( y, x) (3) cov(ax,by) ab cov(x, y) (4) cov(x1 x2, y) cov(x1, y) cov(x2, y) (5) cov(c, x) 0,其中c为常数
第四节 随机变量的分布 ——总体和样本的连接点
x
N为自由度
定理 2 分布的和仍然服从 2 分布
若X 1 ,
X
2
,.
.
.
.
.
.
,X

n
互独立
,且X
i
~
2 (ki ),
i 1,2,......,n。则
n
X1+X 2+.....+ . X n ~ 2 ( ki ) i 1
n 时, 2(n) 正态分布
(3) t分布
• t分布的定义
若连续型随机变量X ~ N(0,1),Y ~ 2(n), X与Y相互独立,
变量X的取值 x1 x2 相应概率P p1 p2
…… xn …… pn
n
Ex
p 1
x1
p 2
x2
pn xn
p i
xi
i 1
• 定义: 连续型随机变量数学期望的定义(略)
若连续型随机变量X有分布密度函数 x ,若积分
x
xdx绝对收敛,则E
x
x
xdx称为X的数学期望。
2.1 数学期望(续)
• 小结:数学期望的定义 • 随机变量的可能值以相应概率为权数的算术
平均数
• 数学期望,平均值,均值 • 反映了随机变量的平均水平或集中趋势 • 通常以E(*)表示期望运算,以μ表示期望值。

计量经济学的统计学基础

计量经济学的统计学基础

正态分布E 的 数 , ,方学 V 差 a 期 r 2望
现在您浏览到是二十三页,共六十三页。
正态分布图示
F(x)
x1 x2
X
f(x) x1 x2 X
现在您浏览到是二十四页,共六十三页。
正态分布的标准化
定义 标准正态分布
当0,21的正态分布,正 称态 为分 标布 准,
记作 ~N0,1。密度函数为 x
F(x)
f(x)
现在您浏览到是十二页,共六十三页。
x1 x2 X
x1 x2 X
第二节 对总体的描述
——随机变量的数字特征
2.1、数学期望 2.2、方差 2.3、数学期望与方差的图示
现在您浏览到是十三页,共六十三页。
2.1.1 数学期望:一个加权平均值
数学期望描述随机变量(总体)的一般水平。
(2)一般情况下,我们采用方差来描述 离散程度。 因为离均差的和为0,无法体现随机变量 的总离散程度。方差中由于有平方,从 而消除了正负号的影响,并易于加总。
现在您浏览到是十七页,共六十三页。
2.2.3 方差的性质
(1)Var(c )=0 (2)Var(c+x)=Var(x ) (3)Var(cx)=c2Var(x) (4)x,y为相互独立的随机变量,则
现在您浏览到是九页,共六十三页。
连续型随机变量的分布密度
定义:对于任何实数x,如果随机变量X的分布函数F
(x)可以写成
x
Fx tdt
其中x0,则称 X为连续型随机变量, x 称 为X的概率分布密度函也数常,写X成~x。
现在您浏览到是十页,共六十三页。
分布密度函数的性质:
(1)x0
(2)xdx1
计量经济学的统计学基础

计量经济学第02章 统计学基础知识_第3节_24

计量经济学第02章 统计学基础知识_第3节_24
错误或第一类错误;称在 H0 为非真时接受 H0 为 “取伪”错误,习惯上称为 错误或第二类错误。 假设检验中,对原假设不论作出何种判断都有可 能犯错误,区别在于犯错误的概率的大小。但是
两种错误不可能同时发生,其发生概率也不可能 同时为0。 在一定的样本容量下,若减小一类错 误的概率将会引起另一类错误的概率增大。例如
某工厂准备购买一批较便宜的原材料,要是这批 原材料的次品率达到5%以上,就拒绝购买。当假
设检验的结果是拒绝购买的,就有可能犯第一类 错误,工厂就会拒绝一批合格便宜的材料,而出 高价购买别的原材料,这样便会增加产品成本。 反之,如果厂方接受这批原材料,就有可能犯第 二类错误,即工厂购进一批不合格的原材料,产 品的次品率就要上升。这是一对矛盾,只要以样 本为依据进行统计推断,就会存在发生两类错误 的风险。
表2-1 由假设的真伪和接受与否形成的四种可能结果
检验的结果
接受 H 0拒绝 H 0来自H0假 属真 设
正确概率
1
的 情 况
H0
属伪
以假为真(取伪错 误,第二类错误)
概率
以真为假(弃真错 误,第一类错误)
概率
正确概率
1
我们称在H0为真时拒绝H0为“弃真”错误,习
惯上称为 错误或第一类错误;称在H0为非真时
备择假设是与原假设相对立,在原假设被否定时 所接受的假设,用H1表示。上面谈到,原假设一 般是稳定的,不易被否定的,但并不表示永远不 会被否定,否则就失去假设检验的研究意义了。 当经过抽样调查,有充分根据否定原假设H0时, 就产生了需要接受其逻辑对立面的假设,就是备 择假设。显然对任一个假设检验问题,其所有的 可能结果都应包含在这两个假设的范围内,要么 无显著差异,要么有显著差异,除此之外,不可 能有其它结果。因此,这两个假设总有一个成立。

《计量经济学》第二章知识

《计量经济学》第二章知识

第二章 数学基础 (Mathematics)第一节 矩阵(Matrix)及其二次型(Quadratic Forms)第二节 分布函数(Distribution Function),数学期望(Expectation)及方差(Variance) 第三节 数理统计(Mathematical Statistics ) 第一节 矩阵及其二次型(Matrix and its Quadratic Forms)2.1 矩阵的基本概念与运算 一个m ×n 矩阵可表示为:v a a a a a aa a a a A mn m m n n ij ⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡== 212222111211][矩阵的加法较为简单,若C=A +B ,c ij =a ij +b ij但矩阵的乘法的定义比较特殊,若A 是一个m ×n 1的矩阵,B 是一个n 1×n 的矩阵,则C =AB 是一个m ×n 的矩阵,而且∑==nk kj ikij b ac 1,一般来讲,AB ≠BA ,但如下运算是成立的:● 结合律(Associative Law ) (AB )C =A (BC ) ● 分配律(Distributive Law ) A (B +C )=AB +AC 问题:(A+B)2=A 2+2AB+B 2是否成立?向量(Vector )是一个有序的数组,既可以按行,也可以按列排列。

行向量(row ve ctor)是只有一行的向量,列向量(column vector)只有一列的向量。

如果α是一个标量,则αA =[αa ij ]。

矩阵A 的转置矩阵(transpose matrix)记为A ',是通过把A 的行向量变成相应的列向量而得到。

显然(A ')′=A ,而且(A +B )′=A '+B ',● 乘积的转置(Transpose of a production ) A B AB ''=')(,A B C ABC '''=')(。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第二章 统计学基础知识
第一节 常用的统计量——平均数、方差 第二节 常用的概率分布
复习:
什么是计量经济学? 计量经济学与其他学科有什么关系? 计量经济学研究现实问题的程序是什么?
第一节 常用的统计量——平均数、方差
一、算术平均
算术平均(arithmetic mean)就是我们日 常生活中使用的普通的平均数,其定义如 下式:
X X1 X 2 X n X
n
n
二、加权算术平均
加权平均(weighted arithmetic mean)是将 各数据先乘以反映其重要性的权数(w),再 求平均的方法。其定义如下式:
X w
w1X1 w2 X2 wn Xn w1 w2 wn
wi Xi w
三、变化率
变化率的定义如下式:
(3)R=0 不相关(no correlation)
(4)R<0 负相关(negative correlation)
(5)R=-1完全负相关 (perfect correlation)
negative
为什么会有上述结果?请结合公式思考。
第二节 常用的概率分布
经济计量模型研究具有随机性特征的经济变 量关系。本节将对数理统计中常用的随机变 量分布及一些概念作一简单回顾。
n
P( X xi ) 1
i 1
一、概率分布
连续性的随机变量概率函数
P(a X b)
b
f (x)dx
a
x
其中f (x)为概率密度函数。密度函数满足条件
f (x) 0;
b
f (x)dx 1
a
概率分布还可用分布函数表示。分布函数是概率的累积,即
随机变量X取小于某个x值的累积概率是x的函数,记为F(x).
所谓相关系数(correlation coefficient)是 用来测量诸如收入与消费、气温和啤酒的消 费量、汇率与牛肉的进口价格等两个变量X、 Y之间的相互关系的大小和方向(正或负) 的系数。通过计算相关系数,可以知道X与 Y之间具有多大程度的线性(linear)关系。 相关系数R的定义如下式:
方差的计算方法是,先将每个数据与算术 平均数之差(即离差)的平方相加求和,再 除于样本数减一。而标准差是方差的正的平 方根。由于方差是通过平方计算的,它与原 数据的次数有所不同,而标准差由于是方差 的平方根,因而又与原数据的次数相同。因 此,标准差与原数据的单位相同,而方差则 不附加单位。
方差S2的定义分别如下式(样本):
R ( X X )(Y Y ) ( X X ) 2 (Y Y ) 2
n XY X Y
n X 2 ( X )2nY 2 (Y)2
相关系数的R的取值范围为,R的取值具有以下 的不同含义:
(1)R=1完全正相关 correlation)
(perfect positive
(2)R>0 正相关(positive correlation)
X t X t1 (t 2 ,3,n) X t1
四、几何平均 几何平均(geometric mean)是n个数
据连乘积的n次方根,其定义如下式:
G n X1 X 2 X n
五、移动平均
所谓移动平均(moving average), 就是对时间序列数据的前后数据求平均, 将不必要的变动( 循环变动、季节变动 和不规则变动)平滑(smoothing),也 即剔除这些变动,从而发现长期变化方向 的一种方法。
-4 -3 -2 -1
0
1
2
3
4
四、抽样分布
1、 2 分布 2、 t 分布 3、 F 分布 注:正态母体子样分布性质:
X
是来自正态母体的随机
CV
标准差 算术平均数
S X
八、标准化变量
标准差变量(standardized variable),又称基准 化变量,它是用来测量某个数据的数值与算术平 均数的偏离程度,是标准差s的多少倍。借此可以 看出该数据在全体数据所处的位置。标准化变量z 的定义如下式:
z
X
算术平均数 标准差
X
X s
九、相关系数
一、概率分布 二、总体与样本 三、正态分布 四、抽样分布
一、概率分布
随机变量在各个可能值上出现的概率的大小的情况, 叫概率分布。概率分布可用概率函数描述。
离散性随机变量X的可能取值为xi,P为概率,则概 率函数为
P(X= xi ) i=1,2,3, …n
概f (x)
1
(x)2
e 2 2
2
时,称X的分布为正态分布,记为X~

N(, 2)
密度函数中 和 是X的数学期望和方差。
2
三、正态分布(总体分布)
当 0 和 2 1 时,称X服从标准正态分
布,记为X~ N(0,1) 。
对于非标准正态分布的X,总可以作如下变 换,Z X ,使Z服从标准正态分布。
通常,移动平均大多用简单的奇数项来计算,下面 是3项移动平均和5项移动平均的定义。
3项移动平均:
Xt
X t 1
Xt 3
X t 1
5项移动平均:
Xt
X t2
X t1
Xt 5
X t1
X t2
EXCEL演示
三项移动平均 五项移动平均
六、方差与标准差
为了了解数据的结构,有必要考察数据的集 中趋势和分散的程度。对于集中的趋势,我们 从前面学习过的算术平均中已经大体有所了解, 而对于分散的程度,通过对方差(variance) 与标准差(standard deviation),以及下一 节将要介绍的变动系数的计算,能够得到很多 信息。
离散性随机变量,F (x) P( X xi ) xi x
连续性随机变量,F(x) P(X
xi )
x
f (x)dx
二、总体与样本
数理统计中把所研究对象的全部单位所组成的 集合,叫做总体。从总体中抽出的部分单位所 组成的集合,叫做样本。
三、正态分布
当连续的随机变量的概率密度函数形式为
s2 (X1 X)2 (X2 X)2 (Xn X)2 n 1
1 n 1
(Xi X)2
标准差S的的定义分别如下式:
S 方差 S 2
七、变动系数
变动系数(coefficient of variation)又称变异 系数,它用标准差S除于算术平均数的商来表 示。变动系数CV的定义如下式:
相关文档
最新文档