异方差完整案例分析

合集下载

异方差性的概念、类型、后果、检验及其修正方法含案例

例4.1.1：在截面资料下研究居民家庭的储蓄行为 Yi=0+1Xi+i
Yi和Xi分别为第i个家庭的储蓄额和可支配收入。
在该模型中，i的同方差假定往往不符合实际情况。对高收入家庭来说，储蓄的差异较大；低收入家庭的储蓄则更有规律性（如为某一特定目的而储蓄），差异较小。
因此，i的方差往往随Xi的增加而增加，呈单调递增型变化。
– 在选项中，EViews提供了包含交叉项的怀特检验“White Heteroskedasticity（cross terms）”和没有交叉项的怀特检验“White Heteroskedasticity（no cross terms）” 这样两个选择。
• 软件输出结果：最上方显示两个检验统计量：F统计量和White统计量nR2；下方则显示以OLS的残差平方为被解释变量的辅助回归方程的回归结果。
随机误差项具有不同的方差，那么：检验异方差性，也就是检验随机误差项的方差与解
释变量观测值之间的相关性及其相关的“形式”。 • 各种检验方法正是在这个共同思路下发展起来的。
路漫漫其修远兮, 吾将上下而求索
问题在于：用什么来表示随机误差项的方差？一般的处理方法：
路漫漫其修远兮, 吾将上下而求索
2.图示检验法
路漫漫其修远兮, 吾将上下而求索
3.模型的预测失效
一方面，由于上述后果，使得模型不具有良好的统计性质；
【书上这句话有点问题】
其中所以，当模型出现异方差性时，Y预测区间的建立将发生困难，它的预测功能失效。
路漫漫其修远兮, 吾将上下而求索
三、异方差性的检验（教材P111）
1.检验方法的共同思路 • 既然异方差性就是相对于不同的解释变量观测值，
（注意：其中的2完全可以是1）

异方差实验报告步骤(3篇)

第1篇一、实验目的1. 掌握异方差性的基本概念和检验方法。

2. 学会运用统计软件进行异方差的检验和修正。

3. 提高对计量经济学模型中异方差性处理能力的实践应用。

二、实验原理1. 异方差性：在回归分析中，若回归模型的误差项（残差）的方差随着自变量或因变量的取值而变化，则称模型存在异方差性。

2. 异方差性的检验方法：图形检验、统计检验（如F检验、Breusch-Pagan检验、White检验等）。

3. 异方差性的修正方法：加权最小二乘法（WLS）、广义最小二乘法（GLS）等。

三、实验步骤1. 数据准备1. 收集实验所需数据，确保数据质量和完整性。

2. 对数据进行初步处理，如剔除异常值、缺失值等。

2. 模型设定1. 根据研究问题，选择合适的回归模型。

2. 利用统计软件（如Eviews、Stata等）进行初步的回归分析。

3. 异方差性检验1. 图形检验：绘制散点图，观察残差与自变量或因变量的关系，初步判断是否存在异方差性。

2. 统计检验：- F检验：检验回归系数的显著性。

- Breusch-Pagan检验：检验残差平方和与自变量或因变量的关系。

- White检验：检验残差平方和与自变量或因变量的多项式关系。

4. 异方差性修正1. 若检验结果表明存在异方差性，则需对模型进行修正。

2. 选择合适的修正方法：- 加权最小二乘法（WLS）：根据残差平方与自变量或因变量的关系，计算权重，加权最小二乘法进行回归分析。

- 广义最小二乘法（GLS）：根据残差平方与自变量或因变量的关系，选择合适的方差结构，广义最小二乘法进行回归分析。

5. 结果分析1. 对修正后的模型进行回归分析，观察回归系数的显著性、拟合优度等指标。

2. 对实验结果进行分析，解释实验现象，验证研究假设。

6. 实验报告撰写1. 撰写实验报告，包括以下内容：- 实验目的- 实验原理- 实验步骤- 实验结果- 分析与讨论- 结论2. 实验报告应结构清晰、逻辑严谨、语言简洁。

《计量经济学》第五章异方差性

由OLS法得到残差，取得绝对值，然后将对某个解释变量回归，根据回归模型的显著性和拟合优度来判断是否存在异方差。
（二）检验的特点
不仅能对异方差的存在进行判断，而且还能对异方差随某个解释变量变化的函数形式进行诊断。该检验要求变量的观测值为大样本。
36
（三）检验的步骤
1.建立模型并求 ei 根据样本数据建立回归模型，并求残差序列
4
第一节异方差性的概念
本节基本内容：
●异方差性的实质 ●异方差产生的原因
5
一、异方差性的实质
同方差的含义
同方差性：对所有的 i (i 1,2,...,n)有：
Var(ui ) = σ 2
（5.1）
因为方差是度量被解释变量 Y的观测值围绕回归线
E(Yi ) 1 2 X 2i 3X3i ... k X ki （5.2）
1.求回归估计式并计算 et2
用OLS估计式（5.14），计算残差
差的平方 et2 。
et
Yt
-Yˆt
，并求残
2.求辅助函数
用残差平方
et2
作为异方差
σ
2 t
的估计，并建立
X
2t
,
X
3t
,
X
2 2t
,
X
2 3t
,
X
2t
X
3t
的辅助回归，即
eˆt2
=
αˆ1
+
αˆ2
X
2t
+
αˆ3
X
3t
+
αˆ4
X
2 2t
+
αˆ5
X
2 3t
+
αˆ6

异方差的例子

异方差的例子异方差指的是在统计分析中，不同观测值的方差不相等。

这种情况下，使用传统的线性回归模型可能会导致结果的偏差和误差。

因此，为了得到更准确的结果，需要采取一些方法来处理异方差性。

下面将列举一些常见的异方差的例子，并介绍相应的处理方法。

1. 股票价格波动：股票价格的波动通常呈现出非常明显的异方差性。

在股票市场中，有些股票的价格非常波动，而有些股票的价格相对稳定。

这种情况下，可以使用加权最小二乘法来处理异方差。

2. 学生考试成绩：学生考试成绩的方差通常也会存在异方差性。

一些学生的考试成绩波动较大，而一些学生的考试成绩相对稳定。

在分析学生的考试成绩时，可以考虑使用方差齐性检验来确定是否存在异方差，并选择相应的处理方法。

3. 经济增长率：经济增长率在不同的时间段和地区通常也会呈现出异方差性。

一些地区的经济增长率波动较大，而一些地区的经济增长率相对稳定。

在分析经济增长率时，可以使用异方差稳健标准误来处理异方差。

4. 气温变化：气温在不同的季节和地区通常也会呈现出异方差性。

一些地区的气温波动较大，而一些地区的气温相对稳定。

在分析气温变化时，可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。

5. 金融市场波动：金融市场的波动性也会导致异方差的问题。

一些金融资产的价格波动较大，而一些金融资产的价格相对稳定。

在分析金融市场波动时，可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。

6. 人口增长率：人口增长率在不同的国家和地区也会呈现出异方差性。

一些国家的人口增长率波动较大，而一些国家的人口增长率相对稳定。

在分析人口增长率时，可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。

7. 网络流量：网络流量在不同的时间段和地区也会呈现出异方差性。

一些地区的网络流量波动较大，而一些地区的网络流量相对稳定。

在分析网络流量时，可以使用加权最小二乘法或者异方差稳健标准误来处理异方差。

8. 土地价格：土地价格在不同的地区和时间段也会呈现出异方差性。

异方差实验报告

异方差实验报告异方差实验报告引言在统计学中，方差是一种衡量数据分布离散程度的重要指标。

然而，在实际应用中，我们常常会遇到方差不稳定的情况，即异方差。

异方差的存在会对统计分析结果产生显著影响，因此，我们需要探索异方差的原因和解决方法。

本实验旨在通过模拟数据和实际案例来探讨异方差的现象、原因和处理方法。

一、异方差现象的模拟实验为了更好地理解异方差的现象，我们首先进行了一系列的模拟实验。

我们生成了两组数据，一组是服从正态分布的数据，另一组是服从泊松分布的数据。

然后，我们分别对两组数据进行方差分析，并比较其结果。

实验结果显示，当数据服从正态分布时，方差分析的结果较为稳定，各组之间的方差差异不大。

然而，当数据服从泊松分布时，方差分析的结果却出现了明显的差异。

这说明泊松分布的数据具有异方差性质。

二、异方差的原因分析为了深入理解异方差的原因，我们进一步探究了几个可能导致异方差的因素。

1. 数据的变换我们对泊松分布的数据进行了对数变换，然后再进行方差分析。

实验结果显示，经过对数变换后，数据的异方差性质得到了明显改善。

这说明，数据的变换可以在一定程度上解决异方差问题。

2. 数据的离散程度我们生成了两组服从正态分布的数据，一组具有较小的离散程度，另一组具有较大的离散程度。

实验结果显示，离散程度较大的数据组具有更明显的异方差性质。

这表明，数据的离散程度与异方差之间存在一定的关联。

3. 样本容量我们通过不断调整样本容量，观察方差分析结果的变化。

实验结果显示，随着样本容量的增加，方差分析结果的稳定性得到了明显改善。

这说明，样本容量的大小对异方差的影响是显著的。

三、处理异方差的方法针对异方差问题，统计学家们提出了多种处理方法。

以下是一些常见的方法：1. 方差齐性检验在进行统计分析之前，我们可以先对数据进行方差齐性检验。

常用的方差齐性检验方法包括Levene检验和Bartlett检验。

如果检验结果表明数据存在异方差，我们可以采取相应的处理方法。

异方差分析

点击添加标题
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击添加标题
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加标题
ＴｈｅＰａｒｔＯｎｅ
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加标题
ＴｈｅＰａｒｔＯｎｅ
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加标题
ＴｈｅＰａｒｔＯｎｅ
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加标题
点击此处添加标题
ＴｈｅＰａｒｔＯｎｅ
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加标题
ＴｈｅＰａｒ大小、字体可根据需求进行更改。
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。
点击此处添加标题
点击此处添加文字描述，文字颜色、大小、字体可根据需求进行更改。

14异方差案例分析

14异方差案例分析异方差（heteroscedasticity）是指随着自变量的变化，因变量的方差也发生变化的一种情况。

在统计分析中，当异方差存在时，会影响到参数估计的准确性和统计检验的可靠性，因此需要进行异方差的诊断和处理。

下面通过一个案例来分析异方差的问题。

假设有一家电子产品公司，想要研究其产品销售量与广告投入的关系。

公司从10个城市中随机选择了200家零售店作为样本，并分别统计了广告投入金额（自变量）和产品销售量（因变量）。

数据如下：店铺编号，广告投入金额（万元），产品销售量（千件）---------，-----------------，-----------------1，1.2，102，1.8，113，1.5，94，2.3，155，2.0，86，1.6，107，1.9，128，1.1，99，2.5，1610，2.2，14...，...，...200，3.4，18```pythonimport matplotlib.pyplot as pltadvertising = [1.2, 1.8, 1.5, 2.3, 2.0, 1.6, 1.9, 1.1, 2.5, 2.2, ...]sales = [10, 11, 9, 15, 8, 10, 12, 9, 16, 14, ...]plt.scatter(advertising, sales)plt.xlabel("Advertising Investment (million yuan)")plt.ylabel("Product Sales (thousand units)")plt.show```从散点图中我们可以看出，随着广告投入的增加，产品销售量并没有呈现出明显的线性增长趋势，同时也可以看到在销售量较低和高投入时，方差较大的情况。

为了进一步确定是否存在异方差的问题，我们可以进行异方差的诊断检验，最常用的方法是利用残差图。

异方差性的概念、类型、后果、检验及其修正方法(含案例).

~2
~2
异方差。
怀特(White)检验的EViews软件操作要点
• 在OLS的方程对象Equation中，选择View/Residual tests/White Heteroskedasticity。
– 在选项中，EViews提供了包含交叉项的怀特检验“White Heteroskedasticity（cross terms）”和没有交叉项的怀特检验“White Heteroskedasticity（no cross terms）” 这样两个选择。
nR2 ~ 2 ( )
显然，辅助回归仍是检验 ei 与解释变量可能的组合的相关性。如果存在异方差性，那么 ei 与解释变量的某种组合之间必定存在显著的相关性，这时往往显示出有较大的可决系数 R 2 ，并且某一参数的 t 检验值较大。
2 所以，检验准则是：如果 nR2 ≥ ( ) ，则存在异方差；反之，则不存在
如果存在某一种函数形式，使得方程显著成立，则说明原模型存在异方差性。由于f(Xj)的具体形式未知，因此需要选择各种形式进行试验。
4.戈德菲尔德-匡特（Goldfeld-Quandt）检验
G-Q检验以F检验为基础，仅适用于样本容量较大、异方差为单调递增或单调递减的情况。 G-Q检验的思想：
先按某一被认为有可能引起异方差的解释变量对样
本排序，再将排序后的样本一分为二，对子样本①和子样本②分别进行OLS回归，然后利用两个子样本的残差平方和之比构造F统计量进行异方差检验。
G-Q检验的步骤：
①将n对样本观察值(Xi1, Xi2, …,Xik,Yi)按某一被认为有可能引起异方差的解释变量观察值Xij的大小排队。 ②将序列中间的c=n/4个观察值除去，并将剩下的观察值划分为较小与较大的容量相同的两个子样本，每个子样本的样本容量均为(n-c)/2 。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

20世纪70年代中期，美国能源部门试图基于各地过去的汽油消耗量和人口变动情况以及其他一些因素给各地区、各州甚至各零售点直接分配汽油。

实现这种分配必须将大量因素作为各州（各地区）的燃油消耗量（应变量）的函数而建立模型。

而对于这样的横截面模型，即使是估计的模型，也很可能会具有异方差问题。

在模型中，应变量为各州的燃油消耗量，可能的解释变量包括：与各州规模大小相关的变量（例如公路里程数、注册的机动车数量和人口），以及与各州规模大小无关的变量（例如燃油税率和最高限速）。

因为在模型中反映各州规模大小的变量不应多于一个（如果包含过多变量容易导致多重共线性），因为有许多州的最高限速相同（但在时间序列模型中，它将是一个有用的变量）。

因此，一个合理的模型为：PCON i f （REG,TAX ） i oiREG i2TAX i i（ 10-20）式中 PCON i ――第i 个州的燃油消耗量（百万 BTU ）,REG i ――第i 个州的注册机动车数量（千辆）， TAX i ――第i 个州的燃油税率（美分/加仑），i ――经典误差项。

我们可以认为一个州注册的汽车数量越多，该州所消耗的燃油也越多；而一个州的燃油税率越高则该州的燃油消耗量越小（10-20），得到：二我们搜集那一时期的数据（见表 10-1 ）用于估计方程 PCON i 551.70.1861REG i 53.59TAX i（ 10-21）（0.0117）（ 16.86）t 15.883.18R 1 2 0.861 N 50表10-1燃油消费例子中的数据PCONUHMTAX REGPOPe state270 2.2 9 743 1136 62.335 Maine 122 2.4 14 774 948 176.52 New Hampshire 580.7 11 351 520 30.481 Vermont 82120.6 9.937505750101.87Massachusetts1在方程中我们也可用TAX * REG 或者TAX * POP （ POP 代表第i 个州的人口）取代TAX 作为方程的解释变量。

我们在第7.5节中讨论虚拟变量斜率时曾介绍了一个关于交互项的更为复杂的例子。

对于一个给定的税率，它对一个大州的燃油消耗的影响要比对一个小州的影响大得多，而用反映州的规模大小的变量乘以TAX 会使所得到的新变量（交互项）能够更好地度量这一效应。

10.5 —个更完整的例子让我们来看一个更完整的基于横殿面的异方差的例子。

98 3.6 13 586 953 133.92 Rhode lsland450 10.1 11 2258 3126 67.527 Connecticut 1819 36.4 8 8235 17567 163.24 New York 1229 22.2 8 4917 7427 190.83 New lersey 1200 27.9 11 6725 11879 -13.924 Pennsylvania 1205 29.2 11.7 7636 10772 -140.98 Ohio650 17.6 11.1 3884 5482 -29.764 lndiana 1198 30.3 7.5 7242 11466 -299.72 minois760 25.1 13 6250 9116 -258.33 Michigan 460 13.8 13 3162 4745 16.446 Wiscolnsin 503 13.0 13 3278 4133 37.855 Minnesota 371 8.1 13 2346 2906 79.330 lowa571 13.9 7 3412 4942 -240.63 Missouri 136 1.6 8 653 672 -108.50 North Dakota 109 1.6 13 615 694 139.52 South Dakota 203 4.3 13.9 1215 1589 170.08 Nebraska 349 8.4 8 2061 2408 -157.58 Kansas118 1.4 11 415 600 78.568 Delaware 487 9.8 13.5 2893 4270 120.31 Maryland 628 12.4 11 3705 5485 -23.806 Uirginia 192 2.9 10.5 1142 1961 -9.5451 West Virginia 642 17.1 12 4583 6019 -119.64 North Carolina 320 7.1 13 1975 3227 97.385 South Carolina 677 15.6 7.5 3916 5648 -201.65 Ceorgia 1459 28.5 8 8335 10446 -215.37 Florida 434 6.9 10 2615 3692 -68.513 Kentuchy 482 11.9 9 3381 4656 -216.68 Temmessee457 13.7 11 3039 3941 -70.842 A;aba,a 325 6.3 9 1593 2569 -40.877 Mississippi 300 7.4 9.5 1481 2307 -18.235 Arkansas 1417 10.1 8 2800 4383 772.87 Louisiana 451 11.4 6.58 2780 3226 -265.51 Oklahoma3572 59.9 5 11388 15329 1168.6 Texas131 2.3 9 758 805 -79.457 Montana105 2.2 7.5 873 977 -207.25 Idaho163 1.5 8 508 509 -54.515 Wyoming323 9.2 9 2502 3071 -212.07 Coiorado192 4.4 11 1193 1367 7.7577 New mexico291 8.9 10 2216 2892 -137.25 Arizona169 5.0 11 1038 1571 13.608 Utah133 2.4 12 710 876 92.250 Nevada562 14.8 12 3237 4276 50.895 Washington364 8.4 8 2075 2668 -145.18 Oregon2840 62.5 9 17130 24697 -417.81 California155 1.2 8 319 444 -27.336 Alaska214 1.3 8.5 586 997 8.7623 Hawaii资料来源：1958 Statistical Abstract （U.S. Department of Commerce）,except the residual.注：Data File = GAS10这一方程看起来没什么问题。

所有的系数在假设的方向上都是显著的，方程在统计上也是总体显著的。

回归结果没有给出德宾—沃森（Durbi n-Wats on ）d统计值，因为这些观测值不存在“固有的”顺序因而勿需进行序列相关检验（如果你想知道，根据表10-1中的顺序所计算的d统计值为2.20 ）。

根据前面所讨论的，让我们考察方程是否存在由各州规模差异引致异方差的可能性。

为了检验这种可能性，我们从方程（10-21 ）中得到残差，（这些残差被列于表10-1中），对其进行帕克检验。

在进行帕克检验之前，我们必须首先确定比例因子乙。

几乎所有与规模大小有关的变量都可以考虑作为比例因子乙，但注册机动车数量（REG肯定是一个比较合理的选择。

注意，以燃油税率（TAX）作为帕克检验的比例因子乙将是错误的，因为没有证据表明燃油税率明显随着州的规模的不同而变化。

相反，税收总额倒是可以替代REG乍为比例因子Z j。

我们观察残差和注册机动车数量之间的关系（见图10-7 ）,从残差看的确可能存在潜在的异方差。

下一步就是要进行帕克检验：2ln（ e i ）0 1 In REG i i （10-22）式中e ——从方程（10-21）中获取的残差,经典（具有同方差性）误差项。

进行帕克检验的辅助回归，我们得到:2In（u ） 1.650 0.9521n REG j （10-23）（0.308）t 3.092R 0.148 N 50从统计表B-1中可以看出，在显著性水平为 1 %时，双侧检验的t统计量临界值为2.7，这样我们可以拒绝同方差的虚拟假设，因为合适的判定过程为：拒绝H。

： 1 0 如果t pARK〔 2.7不拒绝H。

：如果t PARK 2.7由于方程（10-20 ）的残差显示存在异方差，我们应该如何处理呢？首先，我们应该考察方程的设定看是否存在遗漏的变量。

对于这一方程，尽管存在遗漏变量的可能性，但估计方程非常清晰的显示出纯的异方差。

因此，我们用变量作为比例因子，利用方法来重新估计方程（）:PCON i/REG i 218.54/REG i 0.168 17.398TAX i / REG i (10-25)(0.014 ) (4.682 )t 12.27 3.71R20.333 N 50把所得到的结果与方程（10-21）认真进行比较，注意：3注意这时整个方程两边都除以了REG i。

这实际上是假定误差项为i Z i i。

然而，帕克检验中ln REG的系数接近于1，显示误差项适当的函数形式应为，Z,,当然我们也不能仅仅根据帕克检验中的系数就采取该种形式的变换。

如果理论基础支持这种形式的变换，则整个方程两边应该除以x Z ,但在本例中，理论并不支持这样的变换。

要更深入地了解这一问题，请参考脚注7。

比较方程（10-28 ）和方程（10-21 ）。

注意，正如你所预料的那样，他们的斜率系数是相同1方程（10-25 ）中1/REG的斜率系数实际上是方程（10-21 ）中的截距。

因此，尽管在OLS估计程序中它被当作一个斜率系数看待，但这里并没有计算其t统计值。

2方程（10-25 ）中的截距项实际上是方程（10-21 ）中REG的斜率系数。

注意，我们所得到的估计值在大小和显著性上都与方程（10-21 ）中的结果很接近。

3在WLS估计的方程中，比例因子REG的t统计值比其在潜在异方差方程（10-21 ）中的t 统计值要小；总体拟合优度也较低，但这一点非特别重要，因为两个方程的应变量并不相同。

然而，正如在1043节中所提到的，为了避免由于样本规模差异导致谬误相关所引起的异方差，可供选择的方案是重新思考回归的目的和对方程的变量进行重新定义。