4异方差
异方差定义及检验

4、帕克(Park)检验和戈里瑟(Glejser)检验
2 e x e i • Park检验的辅助模型为: i 2 • 求对数后为: ln(ei ) ln( ) ln xi
(4.1.2)
2 e • Glejser检验以 i 为被解释变量,以原模型的某一解释 变量 x j为解释变量,建立如下方程 :
ei f x ji i (4.1.3) • • f x j 可有多种函数形式。(利用试回归法,选择关于 变量的不同的函数形式,对方程进行估计并进行显著 性检验,如果存在某一种函数形式,使得方程显著成 立,则说明原模型存在异方差性。) • 可利用Eviews软件实现。
2
第二节 异方差的修正
方式2:在方程窗口中点击Estimate\Options\Weighted, 并在权数变量栏输入权数变量;
3)利用White检验判断是否消除了异方差性 权数变量的确定:依据Pack检验和Gleiser检验的结 果,或直接取成1/ei
精品课件!
作业四:
• 第五章3/4/6/8。
步骤:1)将解释变量的样本值按从小到大排序,再利用
ห้องสมุดไป่ตู้ • 检验统计量:
• F服从分布
2 1
n c k 1 2 RSS 2 2 F (4.1.1) 2 2 RSS1 RSS1 n c k 1 2
nc nc F (k 1), (k 1) 2 2
2.戈德菲尔德—匡特(Goldfeld—Quant)检验
原理:适合递增型的异方差,利用方差与解释变量同步增
长的原理,通过检验小方差与大方差是否有明显差异,达 到检验异方差的目的。 OLS求出估计值和残差序列 ei 2)在所有样本点中删去中间的c个点,将余下的点分为两组, 每组样本为 n c 2 个。 3)将两组样本分别作OLS,求得各自的残差平方和,再设计 统计量检验两组残差平方和是否有显著差异,若有,异方 差存在。
异方差的概念

③对每个子样分别进行OLS回归,并计算各自 的残差平方和;
④在同方差性假定下,构造如下满足F分布的 统计量
F
e~22i
(n
2
c
k
1)
~
F(n
c
k
1,
n
c
k
1)
方差。 怀特检验的基本思想与步骤(以二元为例):
Yi 0 1 X 1i 2 X 2i i
然后做如下辅助回归
e~i2
0
1 X 1i
2 X 2i
3
X
2 1i
4
X
2 2i
5 X 1i X 2i
i
(*)
可以证明,在同方差假设下:
R2为(*)的可决系数,h为(*)式解释变量的个数, 表示渐近服从某分布。
e~12i
( n c k 1) 2
2
2
⑤给定显著性水平,确定临界值F(v1,v2), 若F> F(v1,v2), 则拒绝同方差性假设,
表明存在异方差。
当然,还可根据两个残差平方和对应的
子样的顺序判断是递增型异方差还是递减异
型方差。
4. 怀特(White)检验 怀特检验不需要排序,且适合任何形式的异
X 递减异方差
X 复杂型异方差
怎样通过Eviews作x- e2 散点图
❖ 键入 LS y c x 作回归; ❖ 键入 GENR E1=resid 调用残差; ❖ 键入 GENR E2=E1^2 生成残差平方序列; ❖ 键入 SCAT E2 X
如果呈现出某种有规律的分布,说明残差中蕴 涵着模型(1)未提取净的信息,或(2)可能存 在异方差或自相关,或(3)设定有误。
异方差的例子

异方差的例子异方差指的是在统计分析中,不同观测值的方差不相等。
这种情况下,使用传统的线性回归模型可能会导致结果的偏差和误差。
因此,为了得到更准确的结果,需要采取一些方法来处理异方差性。
下面将列举一些常见的异方差的例子,并介绍相应的处理方法。
1. 股票价格波动:股票价格的波动通常呈现出非常明显的异方差性。
在股票市场中,有些股票的价格非常波动,而有些股票的价格相对稳定。
这种情况下,可以使用加权最小二乘法来处理异方差。
2. 学生考试成绩:学生考试成绩的方差通常也会存在异方差性。
一些学生的考试成绩波动较大,而一些学生的考试成绩相对稳定。
在分析学生的考试成绩时,可以考虑使用方差齐性检验来确定是否存在异方差,并选择相应的处理方法。
3. 经济增长率:经济增长率在不同的时间段和地区通常也会呈现出异方差性。
一些地区的经济增长率波动较大,而一些地区的经济增长率相对稳定。
在分析经济增长率时,可以使用异方差稳健标准误来处理异方差。
4. 气温变化:气温在不同的季节和地区通常也会呈现出异方差性。
一些地区的气温波动较大,而一些地区的气温相对稳定。
在分析气温变化时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
5. 金融市场波动:金融市场的波动性也会导致异方差的问题。
一些金融资产的价格波动较大,而一些金融资产的价格相对稳定。
在分析金融市场波动时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
6. 人口增长率:人口增长率在不同的国家和地区也会呈现出异方差性。
一些国家的人口增长率波动较大,而一些国家的人口增长率相对稳定。
在分析人口增长率时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
7. 网络流量:网络流量在不同的时间段和地区也会呈现出异方差性。
一些地区的网络流量波动较大,而一些地区的网络流量相对稳定。
在分析网络流量时,可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。
8. 土地价格:土地价格在不同的地区和时间段也会呈现出异方差性。
IV和GMM相关估计步骤,内生性、异方差性等检验方法

IV和GMM相关估计步骤,内⽣性、异⽅差性…⼯具变量和⼴义矩估计相关步骤⼀、解释变量内⽣性检验⾸先检验解释变量内⽣性(解释变量内⽣性的Hausman 检验:使⽤⼯具变量法的前提是存在内⽣解释变量。
Hausman 检验的原假设为:所有解释变量均为外⽣变量,如果拒绝,则认为存在内⽣解释变量,要⽤IV;反之,如果接受,则认为不存在内⽣解释变量,应该使⽤OLS。
reg ldi lofdiest imat es st ore olsxt ivreg ldi (lofdi=l.lofdi ldep lexr)est imat es st ore ivhausman iv ols(在⾯板数据中使⽤⼯具变量,St at a提供了如下命令来执⾏2SLS:xt ivreg depvar [varlist1] (varlist_2=varlist_iv) (选择项可以为fe,re等,表示固定效应、随机效应等。
详⻅help xt ivreg)如果存在内⽣解释变量,则应该选⽤⼯具变量,⼯具变量个数不少于⽅程中内⽣解释变量的个数。
“恰好识别”时⽤2SLS。
2SLS的实质是把内⽣解释变量分成两部分,即由⼯具变量所造成的外⽣的变动部分,以及与扰动项相关的其他部分;然后,把被解释变量对中的这个外⽣部分进⾏回归,从⽽满⾜OLS前定变量的要求⽽得到⼀致估计量。
⼆、异⽅差与⾃相关检验在球型扰动项的假定下,2SLS是最有效的。
但如果扰动项存在异⽅差或⾃相关,⾯板异⽅差检验:xt gls enc invs exp imp esc mrl,igls panel(het)est imat es st ore het eroxt gls enc invs exp imp esc mrl,iglsest imat es st ore homolocal df = e(N_g) - 1lrt est het ero homo, df(`df')⾯板⾃相关:xt serial enc invs exp imp esc mrl则存在⼀种更有效的⽅法,即GMM。
异方差性的检验及处理方法

图2显示回归方程的残差分布有明显的扩大趋势,即表明存在异方差性。
⒉Goldfeld-Quant检验
⑴将样本按解释变量排序(SORT X)并分成两部分(分别有1到10共11个样本合19到28共10个样本)
⑵利用样本1建立回归模型1(回归结果如图3),其残差平方和为2579.587。
【实验步骤】
【例1】表1列出了1998年我国主要制造工业销售收入与销售利润的统计资料,请利用统计软件Eviews建立我国制造业利润函数模型。
表1 我国制造工业1998年销售利润与销售收入情况
行业名称
销售利润
销售收入
行业名称
销售利润
销售收入
食品加工业
187.25
3180.44
医药制造业
238.71
1264.1
SMPL 1 10
LS Y C X
图3样本1回归结果
⑶利用样本2建立回归模型2(回归结果如图4),其残差平方和为63769.67。
SMPL 19 28
LS Y C X
图4样本2回归结果
⑷计算F统计量: =63769.67/2579.59=24.72, 分别是模型1和模型2的残差平方和。
取 时,查F分布表得 ,而 ,所以存在异方差性
食品制造业
111.42
1119.88
化学纤维制品
81.57
779.46
饮料制造业
205.42
1489.89
橡胶制品业
77.84
692.08
烟草加工业
183.87
1328.59
塑料制品业
144.34
1345
纺织业
316.79
4-异方差

5.
3 Spearman等级相关系数检验
1. 2. 3.
利用最小二乘法进行回归分析,计算残差 原假设:同方差;备择假设:异方差
ˆ µi
ˆ 对解释变量Xi和 µ i 分别按从小到大的顺序排列,并赋予1到n中的 一个顺序号表示其等级 ˆ 对每个下标i,计算Xi和 µ i 的等级差di
计算等级相关系数
四. 异方差的检验
图示法 Goldfeld-Quandt检验 Spearman等级相关系数检验 Glejser(戈里瑟)检验 Reset检验 White检验
1图示法
ˆ µ ˆ µ
X
X
ˆ µ ˆ Y
ˆ µ
ˆ Y
2 Goldfeld-Quandt检验
1.
建立两个子样本:按大小排列样本观测值,去除中间c个观测值 (c一般为样本容量的1/4到1/3)
第4章
异方差
主要内容
异方差的概念 产生异方差的原因 异方差的结果 异方差的检验 异方差的修正方法
统计知识复习
E(cX ) = cE( X ) 2 Var (cX ) = c Var ( X )
一. 异方差的概念
随机误差项的方差受到解释变量的影响,随解释变量 取值的变化而变化,称随机误差项存在异方差。 同方差(经典假设):随机扰动项ui对每一个样本点的 方差是一个常数 异方差:∂ µ i 与i有关,不再是常数,但ui仍然是一个服 从正态分布的随机变量 Var (µi) = σ2µ =常数
Yi = b0 + b1 ln X 1i + b2 ln X 2i + µ i
(产出) (资本) (劳动力)
对规模小的企业,在一定的劳动投入和资金投 入下,产出的波动幅度小,随机项的方差小 对规模大的企业,在一定的劳动投入和资金投 入下,产出的波动幅度大,随机项的方差大 随机误差项的方差随企业规模增大而递增
实验四异方差性的检验与处理

实验四异方差性的检验及处理(2学时)一、实验目的(1)、掌握异方差检验的基本方法;(2)、掌握异方差的处理方法。
二、实验学时:2学时三、实验要求(1)掌握用MATLAB软件实现异方差的检验和处理;(2)掌握异方差的检验和处理的基本步骤。
四、实验原理1、异方差检验的常用方法(1) 用X-Y的散点图进行判断(2).22ˆ(,)(,)e x e y%%或的图形,),x)i iy%%i i((e或(e的图形)(3) 等级相关系数法(又称Spearman检验)是一种应用较广的方法,既可以用于大样本,也可与小样本。
检验的三个步骤①ˆt ty y=-%ie②|i x %%i i 将e 取绝对值,并把|e 和按递增或递减次序排序,计算Spearman 系数rs ,其中:21n i i d =∑s 26r =1-n(n -1)③ 做等级相关系数的显着性检验。
n>8时,/2(2),t t n α>-反之,若||i i e x %说明与之间存在系统关系,异方差问题存在。
(4) 帕克(Park)检验帕克检验常用的函数形式:若?在统计上是显着的,表明存在异方差性。
2、异方差性的处理方法: 加权最小二乘法如果在检验过程中已经知道:222()()()i i i ji u Var u E u f x σσ===则将原模型变形为:121i i p pi i y x x u βββ=+⋅+⋅+L 在该模型中: 即满足同方差性。
于是可以用OLS 估计其参数,得到关于参数12,,,p βββL 的无偏、有效估计量。
五、实验举例例1、某地区居民的可支配收入x(千元)与居民消费支出y(千元)的数据如下:01i i i y x u ββ=++若用线性模型,研究不同收入家庭的消费情况,试问原数据有无异方差性?如果存在异方差性,应如何处理?解:(一)编写程序如下:(1)等级相关系数法(详见test4_1.m 文件)%%%%%%%%%%%%%%% 用等级相关系数法来检验异方差性 %%%%%%%%[data,head]=xlsread('test4.xlsx');x=data(:,1); %提取第一列数据,即可支配收入xy=data(:,2); %提取第二列数据,即居民消费支出yplot(x,y,'k.'); % 画x和y的散点图xlabel('可支配收入x(千元)') % 对x轴加标签ylabel('居民消费支出y(千元)') % 对y轴加标签%%%%%%%% 调用regres函数进行一元线性回归 %%%%%%%%%%%%xdata=[ones(size(x,1),1),x]; %在x矩阵最左边加一列1,为线性回归做准备[b,bint,r,rint,s]=regress(y,xdata);yhat=xdata*b; %计算估计值y% 定义元胞数组,以元胞数组形式显示系数的估计值和估计值的95%置信区间head1={'系数的估计值','估计值的95%置信下限','估计值的95%置信上限'};[head1;num2cell([b,bint])]% 定义元胞数组,以元胞数组形式显示y的真实值,y的估计值,残差和残差的95%置信区间head2={'y的真实值','y的估计值','残差','残差的95%置信下限','残差的95%置信上限'};[head2;num2cell([y,yhat,r,rint])]% 定义元胞数组,以元胞数组形式显示判定系数,F统计量的观测值,检验的P值和误差方差的估计值head3={'判定系数','F统计量的观测值','检验的P值','误差方差的估计值'}; [head3;num2cell(s)]%%%%%%%%%%%%% 残差分析 %%%%%%%%%%%%%%%%%%figure;rcoplot(r,rint) % 按顺序画出各组观测值对应的残差和残差的置信区间%%% 画估计值yhat与残差r的散点图figure;plot(yhat,r,'k.') % 画散点图xlabel('估计值yhat') % 对x轴加标签ylabel('残差r') % 对y轴加标签%%%%%%%%%%%% 调用corr函数计算皮尔曼等级相关系数res=abs(r); % 对残差r取绝对值[rs,p]=corr(x,res,'type','spearman')disp('其中rs为皮尔曼等级相关系数,p为p值');(2)帕克(park)检验法(详见test4_2.m文件)%%%%%%%%%%%%%%% 用帕克(park)检验法来检验异方差性 %%%%%%%[data,head]=xlsread('test4.xlsx'); %导入数据x=data(:,1);y=data(:,2);%%%%%% 调用regstats函数进行一元线性回归,linear表带有常数项的线性模型,r表残差ST=regstats(y,x,'linear',{'yhat','r','standres'});scatter(x,(ST.r).^2) % 画x与残差平方的散点图xlabel('可支配收入(x)') % 对x轴加标签ylabel('残差的平方') %对y轴加标签%%%%%%% 对原数据x和残差平方r^2取对数,并对log(x)和log(r^2)进行一元线性回归ST1=regstats(log((ST.r).^2),log(x),'linear',{'r','beta','tstat','fstat'})ST1.tstat.beta % 输出参数的估计值ST1.tstat.pval % 输出回归系数t检验的P值ST1.fstat.pval % 输出回归模型显着性检验的P值(3)加权最小二乘法(详见test4_3.m文件)%%%%%%%%%%% 调用robustfit函数作稳健回归 %%%%%%%%%%%%[data,head]=xlsread('test4.xlsx'); % 导入数据x=data(:,1);y=data(:,2);% 调用robustfit函数作稳健回归,返回系数的估计值b和相关统计量stats[b,stats]=robustfit(x,y) %调用函数作稳健回归stats.p % 输出模型检验的P值%%% 绘制残差和权重的散点图 %%%%%%%plot(stats.resid,stats.w,'o') %绘制残差和权重的散点图xlabel('残差')ylabel('权重'(二)实验结果与分析:第一步::用OLS方法估计参数,并保留残差(1)散点图图4.1 可支配收入(x)居民消费支出(y)散点图因每个可支配收入x的值,都有5个居民消费收入y与之对应,所以上述散点图呈现此形状。
异方差的现实意义-概述说明以及解释

异方差的现实意义-概述说明以及解释1.引言1.1 概述概述异方差是指在统计学中,随机变量的方差在不同取值下发生变化的现象。
它是一种常见的统计数据特征,广泛存在于现实中的各种数据集中。
异方差的存在可能会导致统计分析结果的偏差和误判,因此对于异方差的理解和应对策略具有重要意义。
本文旨在探讨异方差的定义、特点以及其在现实中的影响和重要性。
首先,我们将介绍异方差的定义和特点,包括在不同取值下方差的变化趋势和原因。
然后,我们将探讨异方差在现实中的影响,包括统计分析结果的偏差、参数估计的不准确性等。
最后,我们将提出对异方差的认识与应对策略,以及强调异方差的重要性和现实意义。
通过对异方差的深入了解,我们可以更好地理解统计数据的特点,在分析和解释数据时更加准确和全面。
同时,对于异方差的应对策略的掌握,有助于改善统计模型的拟合效果,提高预测和决策的准确性。
因此,对于异方差的研究具有重要的理论和实际价值。
在接下来的部分中,我们将详细介绍异方差的定义和特点,并探讨其在现实中的影响和重要性。
同时,我们将提出对异方差的认识与应对策略,以期为读者提供指导和启示。
让我们一同进入这个有关异方差的探索之旅吧!1.2 文章结构文章结构部分的内容可以如下编写:文章结构部分旨在向读者介绍本篇长文的组织框架和内容安排。
通过清晰明了的文章结构,读者可以更好地理解整篇文章的逻辑顺序和主要论点。
本文的文章结构如下:第一部分是引言部分,通过对异方差的引入和分析,概述了整篇文章的背景和意义。
在概述中,我们将提供对异方差概念的简明扼要的描述,同时阐明本文的目的和意义。
第二部分是正文部分,主要分为两个小节。
首先,我们将在2.1小节详细介绍异方差的定义和特点。
这一小节将对异方差的背景和相关概念进行深入探讨,并分析其特点和表现形式。
其次,在2.2小节中,我们将重点探讨异方差的现实影响。
通过具体的案例研究和数据分析,我们将展示异方差对实证研究和数据分析的影响,并探讨其可能带来的结果偏差和误判。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 异方差性一、单项选择题1、下列哪种方法不是检验异方差的方法【 】 A 戈德菲尔特——匡特检验 B 怀特检验C 戈里瑟检验D 方差膨胀因子检验 2、当存在异方差现象时,估计模型参数的适当方法是【 】 A 加权最小二乘法 B 工具变量法C 广义差分法D 使用非样本先验信息3、加权最小二乘法克服异方差的主要原理是通过赋予不同观测点以不同的权数,从而提高估计精度,即【 】A 重视大误差的作用,轻视小误差的作用B 重视小误差的作用,轻视大误差的作用C 重视小误差和大误差的作用D 轻视小误差和大误差的作用4、如果戈里瑟检验表明,普通最小二乘估计结果的残差i e 与i x 有显著的形式为i i i v x e +=28715.0||的相关关系(i v 满足线性模型的全部经典假设),则用加权最小二乘法估计模型参数时,权数应为【 】 A i x B21i x C i x 1 D ix 15、如果戈德菲尔特——匡特检验显著,则认为什么问题是严重的【 】 A 异方差问题 B 序列相关问题 C 多重共线性问题 D 设定误差问题6、容易产生异方差的数据是【 】A 时间序列数据B 修匀数据C 横截面数据D 年度数据7、若回归模型中的随机误差项存在异方差性,则估计模型参数应采用【 】 A 普通最小二乘法 B 加权最小二乘法C 广义差分法D 工具变量法8、假设回归模型为i i i u x y ++=βα,其中var(i u )=22i x σ,则使用加权最小二乘法估计模型时,应将模型变换为【 】 Axu x xxy ++=βαBxu xxy ++=βαCx u x x y ++=βα D 222x u x xx y ++=βα 9、设回归模型为i i i u x y +=β,其中var(i u )=22i x σ,则β的最小二乘估计量为【 】 A. 无偏且有效 B 无偏但非有效 C 有偏但有效 D 有偏且非有效二、多项选择题1、下列计量经济分析中哪些很可能存在异方差问题【 】 A 用横截面数据建立家庭消费支出对家庭收入水平的回归模型 B 用横截面数据建立产出对劳动和资本的回归模型 C 以凯恩斯的有效需求理论为基础构造宏观计量经济模型 D 以国名经济核算帐户为基础构造宏观计量经济模型 E 以30年的时序数据建立某种商品的市场供需模型2、在异方差条件下普通最小二乘法具有如下性质【 】A 线性B 无偏性C 最小方差性D 精确性E 有效性 3、异方差性将导致【 】 A 普通最小二乘估计量有偏和非一致 B 普通最小二乘估计量非有效C 普通最小二乘估计量的方差的估计量有偏D 建立在普通最小二乘估计基础上的假设检验失效E 建立在普通最小二乘估计基础上的预测区间变宽 4、下列哪些方法可以用于异方差性的检验【 】A DW 检验法B 戈德菲尔德——匡特检验C 怀特检验D 戈里瑟检验E 帕克检验5、当模型存在异方差性时,加权最小二乘估计量具备【 】 A 线性 B 无偏性 C 有效性 D 一致性 E 精确性三、判断说明题1、当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性。
( )2、当异方差出现时,常用的t 检验和F 检验失效。
( )3、在异方差情况下,通常OLS 估计一定高估了估计量的标准差。
( )4、如果OLS 回归的残差表现出系统性,则说明数据中有异方差性。
( )5、如果回归模型遗漏一个重要的变量,则OLS 残差必定表现出明显的趋势。
( )6、在异方差情况下,通常预测失效。
( )四、名词解释异方差性;戈德菲尔特——匡特检验;怀特检验;戈里瑟检验和帕克检验;加权最小二乘法。
五、简答与论述题1、什么是异方差性?试举例说明经济现象中的异方差性。
2、产生异方差性的原因及异方差性对模型的OLS 估计有何影响?3、样本分段法检验(即戈德菲尔特——匡特检验)异方差性的基本原理及其适用条件。
4、戈里瑟检验异方差性的基本原理及优点。
5、检验异方差性的G ——Q 检验和怀特检验是否相同?试述怀特检验、帕克检验和戈里瑟检验的异同之处。
6、加权最小二乘法及其基本原理,它与普通最小二乘法有何差异?7、用横截面数据资料建立企业利润(π)对企业销售收入(I )的线性回归模型,可能遇到的主要问题是什么?六、计算与分析题1、已知消费模型:t t t t x x y μααα+++=22110,其中:t y =消费支出;t x 1=个人可支配收入;t x 2=消费者的流动资产;E(t μ)=0;212)(t t x V σμ=(其中2σ为常数)。
请回答以下问题: (1)请进行适当变换变换消除异方差,并证明之。
(2)写出消除异方差后,模型参数估计量的表达式。
2、附表给出了20个国家的股票价格和消费者价格指数年百分率变化的一个横截面数据。
第二次世界大战后(直至1969年)期间股票价格与消费者价格资料来源: Phillip Cagan Common Stock Values and Inflation: The Historical Record of Many Countries 《普通股票价格与通货膨胀:多国的历史纪录》National Bureau of Economic Research. Suppl. 1974年3月,表1,第四页。
(1)利用数据描绘出Y与X的散点图。
(2)将Y对X回归并分析回归中的残差。
你观察到什么?(3)因智利的数据看起来有些异常(异常值),去掉智利数据后,重作(2)中的回归。
分析从此回归得到的残差,你会看到什么?根据(2)的结论你将得到有异方差的结论,而根据(3)中的结果你又得到相反的结论。
那么你能得出什么一般性的结论呢?3、下表是储蓄与收入的样本观测值,试建立储蓄Y关于收入X的线性回归模型并进行分析。
4、某地区年人均可支配收入X,年人均生活费支出Y的截面数据如下表所示:序号X Y 序号X Y1 3 5472 940 113 626 2 8562 2 769 2 322 12 2 248 1 8463 2 334 1 898 13 2 839 2 3414 1 957 1 560 14 1 919 1 5775 1 893 1 585 15 2 515 1 9476 2 314 1 977 16 1 963 1 609 7 1 953 1 596 17 2 450 2 048 8 1 960 1 660 18 2 688 2 0879 4 297 3 530 19 4 632 3 777 102 7742 311202 8952 303(1) 用Goldfeld —Quandt 检验分析异方差性(不必删除观测值); (2) 用Spearman 等级相关检验分析异方差性;(3) 假设Var(i u )=22i X σ,其中2σ为未知常数,估计Y 关于X 的回归方程。
5、下表是美国1988年的研发费用,试用Spearman 等级相关检验其是否存在异方差性。
序号 行业 销售额 研发费用支出 利润 1 容器与包装 6 375.3 62.6 1 851.1 2 非银行金融机构 11 626.4 92.9 1 569.5 3 服务行业 14 655.1 178.3 274.8 4 金属与采掘业 21 896.2 258.4 2 828.1 5 住房与建筑业 26 408.3 494.7 225.9 6 一般制造业 32 405.6 1 083.0 3 751.9 7 闲暇时间行业 35 107.7 1 620.6 2 884.1 8 纸与林产品行业 40 295.4 421.7 4 645.7 9 食品行业 70 761.6 509.2 5 036.4 10 健康护理业 80 552.8 6 620.1 13 869.9 11 宇航业 95 294.0 3 918.6 4 487.8 12 消费品 101 314.1 1 595.3 10 278.9 13 电器与电子产品 116 141.3 6 107.5 8 787.3 14 化学工业 122 315.7 4 454.1 16 438.8 15 聚合物141 649.9 3 163.8 9 761.4 16 办公设备与计算机 175 025.8 13 210.7 19 774.5 17 燃料 230 614.5 1 703.8 22 626.6 18汽车行业293 543.09 528.218 415.46、美国1988年的研发费用的数据如题6,回归方程给出了对数形式的研发费用支出和销售的回归结果。
ln iY ˆ=-7.364 7+1.322 2ln i X (1) 根据表中数据,验证这个回归结果。
(2) 分别将残差的绝对值和残差平方值对销售量描图。
是否表明存在着异方差? (3) 对回归的残差进行Park 检验和Glejser 检验。
你得出什么结论?(4) 如果在对数回归模型中发现了异方差,你会选择用哪种WLS 变换来消除它? 7、1964年,对9 966名经济学家的调查数据如下: 年龄/岁 中值工资/美元 年龄/岁 中值工资/美元 20~24 7 800 35~39 11 500 25~29 8 400 40~44 13 000 30~34 9 700 45~49 14 800 50~54 15 000 65~69 14 500 55~59 15 000 70~ 12 000 60~6415 000(1) 建立适当的模型解释平均工资与年龄间的关系。
为了分析的方便,假设中值工资是年龄区间中点的工资。
(2) 假设误差与年龄成比例,变换数据求得WLS 回归方程。
(3) 现假设误差与年龄的平方比例,求WLS 回归方程。
(4) 哪一个假设看来更可行? 8、考虑下表中的数据:美国制造业平均赔偿与就业规模所决定的生产率之间的关系 就业规模 (平均就业人数) 平均赔偿 Y/美元 平均生产率 X/美元 赔偿的标准方差i /美元1~4 3 396 9 335 744 5~9 3 787 8 584 851 10~19 4 013 7 962 728 20~494 1048 27580550~99 4 146 8 389 930 100~249 4 241 9 418 1 081 250~499 4 387 9 795 1 243 500~999 4 538 10 281 1 308 1 000~2 4994 84311 7501 112(1) 估计OLS 回归方程: i i i u X B B Y ++=21 (2) 估计WLSiiiiiiiu X B B Y σσσσ++=211计算两个回归方程的结果。
你认为哪个回归方程更好?为什么?9、下表给出了20个国家五项社会经济指标的有关数据,根据这些数据建立一个多元回归模型用以解释表中所示的20个国家的每日卡路里吸入量。