古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(多元回归分析:推断问题)【圣才出品】

古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(多元回归分析:推断问题)【圣才出品】第8章多元回归分析:推断问题8.1 复习笔记考点一:再议正态性假定★当回归模型的参数用于估计和推断两个方面时,还需要假定u i服从正态性假定,即:u i~N(0,σ2)。
在三变量模型中,偏回归系数的OLS估计量与ML估计量一致,是最优线性无偏估计量(BLUE)。
参数估计量也是正态分布的,且(n-3)(σ∧2/σ2)~χ2(n-3)。
参数的t值均服从自由度为n-3的t分布。
t分布可用于构造置信区间并进行假设检验。
χ2分布可用于检验关于真实σ2的假设。
考点二:多元回归中的假设检验的多种形式★1.检验个别偏回归系数的假设。
2.检验估计的多元回归模型的总体显著性,即判别全部偏斜率系数是否同时为零。
3.检验两个或多个系数是否相等。
4.检验偏回归系数是否满足某种约束条件。
5.检验所估计的回归模型在时间上或在不同横截面单元上的稳定性。
6.检验回归模型的函数形式是否正确。
考点三:检验关于个别偏回归系数的假设★★t检验的程序是基于随机误差项u i服从正态分布的假定。
检验方法:给定一个特定的显著性水平α,当t值超过临界值tα/2(df),则拒绝原假设。
或使用p值判断,当p足够小,则拒绝原假设。
参数β∧2的(1-α)置信区间为:(β∧2-tα/2se(β∧2),β∧2+tα/2se(β∧2))。
由于不能直接观测u i,所以利用代理变量u∧i,即残差。
残差的正态性可进行雅克-贝拉(JB)检验(大样本检验)。
考点四:检验样本回归的总体显著性★★★★★1.总体显著性检验(1)定义总体显著性检验的原假设为:H0:β2=β3=0。
也就是检验Y是否与X2和X3存在线性关系。
(2)总体显著性检验与个别显著性检验检验个别显著性时,隐含地假定每一个显著性检验都是根据一个不同的(即独立的)样本进行的。
如果用同一样本数据去进行联合检验,就违反了检验方法所依据的基本假定。
古扎拉蒂《计量经济学基础》第1章

区
大利哥
GDP 0.9 12. 3.6 -1.7 2.7 14.2 6.3
1
3
(3)混合数据
国家和
实际GDP增长率
地区 1992年 1993年 1994年 1995年 1996年 1997年 1998年
加拿大 0.9 2.5 3.9 2.2 1.2 4.0 3.1
智利 12.3 7.0 5.7 10.6 7.4 7.1 3.4 墨西哥 3.6 2.0 4.4 -6.2 5.2 7.0 4.8
换言之,尽管父母双亲都异常高或异常矮, 而儿女的身高则有走向人口总体平均身高的趋势。
(2)高尔顿的普遍回归定律(law of universal regression)还被他的朋友卡尔·皮尔 逊(Karl Pearson)证实。 皮尔逊曾收集过一些家庭群体的一千多名成 员的身高记录。他发现,对于一个父亲高的群体, 儿辈的平均身高低于他们父辈的身高,而对于一
相关分析的例子:吸烟与肺癌之间、统计 学考分与数学考分之间、中学成绩与大学成绩 之间的相关(系数)等。
回归分析:即为根据其他变量的设定值来 估计或预测某一变量的平均值。例如,也许想 知道能否从一个学生的已知数学考分,去预测 他的统计学平均考分。
5. 术语、符号和规定(1)
因变量(Dependent variable)
确定性关系是相对的,随机性关系是绝对 的!
3.回归与因果关系 从逻辑上说。统计关系式本身不可能意味 着任何因果关系。要谈因果律,必须诉诸先验 的或理论上的思考。 如在前面所引的农作物收成一例中,没有 任何统计上的理由可以认为降雨量不依赖于作 物收成。把作物收成看作依赖于降雨量等的因 变量,并非出于统计上的考虑。普通常识提示 了不能把这种关系倒转过来,因为不能用改变 作物收成的方法来控制降雨。
古扎拉蒂《计量经济学基础》(第5版)笔记和课后习题详解

1.78
1.83
5.37
3.36
1996
2.95
1.59
0.08
2.02
1.50
3.87
2.46
1997
2.29
1.63
1.84
1.19
1.70
1.75
3.12
1998
1.56
6
0.58
0.65
0.94
3.15
3.46
1999
2.21
1.71
-0.33
0.52
0.65
1.66
1.52
4.教材图1-5背后的M1货币供给数据由表1-4给出。你能给出货币供给在表中所示时期上升的原因吗?
表1-4经季节调整的M1供给:1959年1月~1999年7月(单位:十亿美元)
资料来源:Board of Governors,Federal Reserve Bank,USA.
答:随着GDP的增加,自然而然就需要更多的货币为增加的产出提供资金支持。美国GDP是逐年增加的,因此货币供给量也相应地逐年增长。
d.哪个国家的通货膨胀率波动最大?你能给出什么样的解释呢?
答:a.通货膨胀率等于当年的CPI减去上一年度的CPI,再除以上一年度的CPI,然后乘以100。因此这些国家的通货膨胀率(%)如表1-2所示,它们是从1981年开始的年度数据。
表1-2
年份
美国
加拿大
日本
法国
德国
意大利
英国
1981
10.32
12.48
(2)横截面数据:横截面数据指对一个或多个变量在同一时间点上收集的数据。当统计分析包含有异质的单位时,必须考虑尺度或规模效应以避免造成混乱。
计量经济学古扎拉蒂课后答案

计量经济学古扎拉蒂课后答案【篇一:计量经济学考试习题及答案】双对数模型 lny?ln?0??1lnx??中,参数?1的含义是()a.y关于x的增长率b.y关于x的发展速度c. y关于x的弹性d. y关于x 的边际变化2、设k为回归模型中的参数个数,n为样本容量。
则对多元线性回归方程进行显著性检验时,所用的f统计量可表示为()ess(/n?k)r2/(k?1)b. a.2rss(/k?1)(1?r)(/n?k)ess(/k?1)r2(/n-k)d.c. tss(/n?k)(1?r2)(/k?1)3、回归模型中具有异方差性时,仍用ols估计模型,则以下说法正确的是()a. 参数估计值是无偏非有效的b. 参数估计量仍具有最小方差性c. 常用f 检验失效d. 参数估计量是有偏的4、利用德宾h检验自回归模型扰动项的自相关性时,下列命题正确的是()a. 德宾h检验只适用一阶自回归模型b. 德宾h检验适用任意阶的自回归模型c. 德宾h 统计量渐进服从t分布d. 德宾h检验可以用于小样本问题5、一元线性回归分析中的回归平方和ess的自由度是()a. nb. n-1c. n-kd. 16、已知样本回归模型残差的一阶自相关系数接近于1,则dw统计量近似等于( )a. 0b. 1 c. 2 d. 47、更容易产生异方差的数据为 ( )a. 时序数据b. 修匀数据c. 横截面数据d. 年度数据8、设m为货币需求量,y为收入水平,r为利率,流动性偏好函数为?2分别是?1 、?2的估计值,则根据经济理m??0??1y??2r??,又设?1、论,一般来说(a )a. ?1应为正值,?2应为负值b. ?1应为正值,?2应为正值c. ?1应为负值,?2应为负值d. ?1应为负值,?2应为正值9、以下选项中,正确地表达了序列相关的是()a.co(v?i,?j)?0,i?jb.co(v?i,?j)?0,i?j ??????????vxi,?j)?0,i?j c.cov(xi,xj)?0,i?jd.co(10、在一元线性回归模型中,样本回归方程可表示为()a. yt??0??1??tb.yt?e(yt/x)??ic. yt??0??1xtd. e(yt/xt)??0??1xt11、对于有限分布滞后模型 ???yt????0xt??1xt?1??2xt?2????kxt?k??t在一定条件下,参数?i 可近似用一个关于i的阿尔蒙多项式表示(i?0,1,2,?,m),其中多项式的阶数m必须满足() ?a.mk b.m=kc.mkd.m?k12、设?t为随机误差项,则一阶线性自相关是指()a.cov(?t,?s)?0(t?s) b. ?t???t?1??tc. ?t??1?t?1??2?t?2??td. ?t??2?t?1??t13、把反映某一总体特征的同一指标的数据,按一定的时间顺序和时间间隔排列起来,这样的数据称为()a. 横截面数据b. 时间序列数据c. 修匀数据d. 原始数据14、多元线性回归分析中,调整后的可决系数r与可决系数r2之间的关系()22n?122a.?1?(1?r) b. ?r n?k22n?k2 c. ?0 d. ?1?(1?r) n?115、goldfeld-quandt检验法可用于检验( )a.异方差性b.多重共线性c.序列相关d.设定误差16、用于检验序列相关的dw统计量的取值范围是( )a.0?dw?1b.?1?dw?1c.?2?dw?2 d.0?dw?417、如果回归模型中解释变量之间存在完全的多重共线性,则最小二乘估计量的值为()a.不确定,方差无限大b.确定,方差无限大c.不确定,方差最小d.确定,方差最小18、应用dw检验方法时应满足该方法的假定条件,下列不是其假定条件的为()a.解释变量为非随机的b.被解释变量为非随机的c.线性回归模型中不能含有滞后内生变量d.随机误差项服从一阶自回归二、多项选择题1、古典线性回归模型的普通最小二乘估计量的特性有()a. 无偏性b. 线性性c. 最小方差性d. 不一致性e. 有偏性2、如果模型中存在自相关现象,则会引起如下后果()a.参数估计值有偏b.参数估计值的方差不能正确确定c.变量的显著性检验失效d.预测精度降低e.参数估计值仍是无偏的????x的特点() ???3、利用普通最小二乘法求得的样本回归直线yt12ta. 必然通过点(,)b. 可能通过点(,)?的平均值与y?的平均值相等 c. 残差et的均值为常数 d. ytte. 残差et与解释变量xt之间有一定的相关性4、广义最小二乘法的特殊情况是()a.对模型进行对数变换 b.加权最小二乘法c.数据的结合d.广义差分法e.增加样本容量5、计量经济模型的检验一般包括内容有()a、经济意义的检验b、统计推断的检验c、计量经济学的检验d、预测检验e、对比检验三、判断题(判断下列命题正误,并说明理由)1、在实际中,一元回归几乎没什么用,因为因变量的行为不可能仅由一个解释变量来解释。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(虚拟变量回归模型)【圣才出品】

第9章虚拟变量回归模型9.1 复习笔记考点一:ANOVA模型★★★1.虚拟变量含义虚拟变量是指仅有0和1两个取值的变量,是一种定性变量。
一般而言,虚拟变量等于0表示变量不具有某种性质,等于1表示具有某种性质。
虚拟变量也可以放到回归模型中。
这种模型被称为方差分析(ANOVA)模型。
2.虚拟变量模型(1)虚拟变量的表达式Y i=β1+β2D2i+β3D3i+u i应看到,除了不是定量回归元而是定性或虚拟回归元(若观测值属于某特定组则取值为1,若它不属于那一组则取值0)之外,方程与前面考虑的任何一个多元回归模型都是一样的。
所有的虚拟变量都用字母D表示。
(2)使用虚拟变量的注意事项①若定性变量有m个类别,则只需引入m-1个虚拟变量,否则就会陷入虚拟变量陷阱,即完全共线性或完全多重共线性(若变量之间存在不止一个精确的关系)情形。
对每个定性变量而言,所引入的虚拟变量的个数必须比该变量的类别数少一个。
②不指定其虚拟变量的那一组被称为基组、基准组、控制组、比较组、参照组或省略组。
所有其他的组都与基准组进行比较。
③截距值(β1)代表了基准组的均值。
④附属于方程中虚拟变量的系数被称为级差截距系数,它反映取值为1的地区的截距值与基准组的截距系数之间的差别。
⑤如果定性变量不止一类,那么,基准组的选择完全取决于研究者。
⑥对于虚拟变量陷阱,如果在这种模型中不使用截距项,那么引入与变量的类别相同数量的虚拟变量就能够回避虚拟变量陷阱的问题。
因此,如果从方程中去掉截距项,并考虑如下模型Y i=β1D1i+β2D2i+β3D3i+u i由于此时没有完全共线性,所以就不会陷入虚拟变量陷阱。
但要确定做这个回归时,一定要使用回归软件包中的无截距选项。
⑦在一个含有截距的方程中,能更容易地处理是否有某个组与基准组有所不同以及有多大的不同,所以在方程中包括截距更方便。
为了检查分组是否得当,也可通过将虚拟变量的系数相对0做t检验(或者更一般地,对适当的虚拟变量系数集做一个F检验),就可以检验分类是否适当。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(定性响应回归模型)【圣才出品】

第15章定性响应回归模型15.1 复习笔记考点一:定性响应模型的性质★★定性响应模型是指模型中的回归子是一个二值或二分变量的模型,通常被称为概率模型。
回归子也可以是多分响应变量或多类型响应变量。
将二值响应变量建立成概率模型的方法包括线性概率模型(LPM)、logit模型、probit模型和tobit模型。
考点二:线性概率模型(LPM)★★★★1.LPM的定义以下述回归模型为例说明:Y i=β1+β2X i+u i。
其中X表示家庭收入;Y=1,则表示该家庭拥有住房;Y=0,则该家庭不拥有住房。
该模型被称为线性概率模型,因为Y i在给定X i下的条件期望E(Y i|X i)可解释为在给定X i下事件(家庭拥有住房)发生的条件概率,即Pr(Y i=1|X i)。
2.LPM的特征令P i表示“Y i=1”(即事件发生)的概率,而1-P i表示“Y i=0”(即事件不发生)的概率,则变量Y i服从贝努利概率分布。
根据期望的定义,有:E(Y i)=0(1-P i)+1P i=P i。
此外有:E(Y i|X i)=β1+β2X i =P i,即模型的条件期望事实上可以解释为Y i的条件概率。
该模型的约束条件为:0≤E(Y i|X i)≤1。
3.LPM的问题(1)干扰项u i的非正态性若把方程写成:u i=Y i-β1-β2X i,u i的概率分布见表15-1。
表15-1 u i的概率分布可见u i服从贝努利分布而不是正态分布。
虽然干扰项不满足正态性假定,但OLS的点估计值仍具有无偏性。
此外在大样本下,OLS估计量一般都趋于正态分布,因此LPM的统计推断仍可用正态性假定下的OLS程序。
(2)干扰项的异方差性即使LPM中的干扰项满足零均值和无序列相关性假定,但也不能说它具有同方差性。
对于贝努利分布,理论上的均值和方差分别为P和P(1-P),可见方差是均值的函数,而均值的取值依赖于X的值,因此LPM中的干扰项具有异方差性。
伍德里奇《计量经济学导论》(第5版)笔记和课后习题详解-第10章 时间序列数据的基本回归分析【圣才出

第10章时间序列数据的基本回归分析10.1复习笔记一、时间序列数据的性质时间序列数据与横截面数据的区别:(1)时间序列数据集是按照时间顺序排列。
(2)时间序列数据与横截面数据被视为随机结果的原因不同。
①横截面数据应该被视为随机结果,因为从总体中抽取不同的样本,通常会得到自变量和因变量的不同取值。
因此,通过不同的随机样本计算出来的OLS估计值通常也有所不同,这就是OLS统计量是随机变量的原因。
②经济时间序列满足作为随机变量是因为其结果无法事先预知,因此可以被视为随机变量。
一个标有时间脚标的随机变量序列被称为一个随机过程或时间序列过程。
搜集到一个时间序列数据集时,便得到该随机过程的一个可能结果或实现。
因为不能让时间倒转重新开始这个过程,所以只能看到一个实现。
如果特定历史条件有所不同,通常会得到这个随机过程的另一种不同的实现,这正是时间序列数据被看成随机变量之结果的原因。
(3)一个时间序列过程的所有可能的实现集,便相当于横截面分析中的总体。
时间序列数据集的样本容量就是所观察变量的时期数。
二、时间序列回归模型的例子1.静态模型假使有两个变量的时间序列数据,并对y t和z t标注相同的时期。
把y和z联系起来的一个静态模型(staticmodel)为:10 1 2 t t t y z u t nββ=++=⋯,,,,“静态模型”的名称来源于正在模型化y 和z 同期关系的事实。
若认为z 在时间t 的一个变化对y 有影响,即1t t y z β∆=∆,那么可以将y 和z 设定为一个静态模型。
一个静态模型的例子是静态菲利普斯曲线。
在一个静态回归模型中也可以有几个解释变量。
2.有限分布滞后模型(1)有限分布滞后模型有限分布滞后模型(finitedistributedlagmodel,FDL)是指一个或多个变量对y 的影响有一定时滞的模型。
考察如下模型:001122t t t t ty z z z u αδδδ--=++++它是一个二阶FDL。
古扎拉蒂《计量经济学基础》复习笔记和课后习题详解(自相关:误差项相关会怎么样?)【圣才出品】

第 12 章 自相关:误差项相关会怎么样? 12.1 复习笔记
考点一:自相关问题癿性质 ★★★ 1.定义 自相关定义为“按时间(如在时间序列数据中)戒空间(如在横截面数据中)排序癿观 测序列各成员乊间癿相关”。若存在自相关,则用符号表示为:E(uiuj)≠0(i≠j)。 2.可能模式 自相关和无自相关癿一些可能模式,如图 12-1 所示。图 12-1(a)到图 12-1(d)中, 残差项随着时间发化表现出明显癿觃律性,本期癿残差和上期癿残差存在一定癿关联性。而 图 12-1(e)则没有明显癿关联,是非自相关模式。
4.自相关出现时癿 BLUE
利用双发量模型幵假定 AR(1)过程,可以证明 β2 癿 BLUE 估计量由下式给出:
ˆ2GLS
n t2
xt xt1
yt yt1 C
n t2
xt xt1
2
其中 C 是一校正因子,在实际中可以忽略。注意下标从 t=2 发到 t=n。从而斱差是:
var ˆ2GLS
2.德宾-沃森d 检验 (1)d 统计量癿一些基本假定 ①回弻含有截距项;
斱差不相关系数和跨度期数 s 相关。
斱程表明,在 AR(1)模式下,ut 癿斱差仍是同斱差癿,但 ut 丌仁不其过去一期癿值
相关,而丏不过去几期癿值也相关。若 ρ=1,上述斱差和协斱差都没有定义。若|ρ|<1,
斱程中给出癿 AR(1)过程是平稳癿,此时残差项癿均值和斱差丌发,协斱差癿值将随着
两个误差癿时间间隑越进而越小。
3.AR(1)模式癿估计结果
回到双发量回弻模型:Yt=β1+β2Xt+ut。在 AR(1)模式下,估计量癿斱差为:
var ˆ2 AR1
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
三、计量经济学方法论
大致说来,传统的计量经济学方法论按如下路线进行:
1.理论或假说的陈述;
2.理论的数学模型设定;
3.统计或计量经济模型设定;
4.获取数据;
5.计量经济模型的参数估计;
理论计量经济学是要找出适当的方法,去测度由计量经济模型设定的经济关系。为此,计量经济学家非常依赖于数理统计。
在应用计量经济学中,利用理论计量经济学工具去研究经济学或管理学中的某些特殊领域。
0.2
本章没有课后习题。本章是全书的一个引言,对计量经济学这门学科作一个简要介绍。对于本章内容,学员简单了解即可。
(3)在问卷调查中,无应答的问题也可能相当严重。
(4)获取数据的抽样方法可能变化很大,要比较不同样本得来的结果常常非常困难。
(5)通常获得的经济数据都是高度加总的。
(6)由于保密性质,某些数据只能以高度加总的形式公布。
研究结果不可能比数据的质量更好。所以,如果在一定情况下,研究者发现研究的结果“不能令人满意”的话,原因不一定是误用模型,而是数据的质量不好。
4.名义尺度
此类变量不具备比率尺度变量的任何一个特征。因此适合于比率尺度变量的计量经济方法可能不适合于名义尺度变量。
1.2
1.表1-1给出了7个工业化国家的消费者价格指数(CPI)数据,以1982~1984年为该指数的基期并令1982—1984=100。
1.经济理论所作的陈述或假说大多数是定性的。计量经济学家的工作就是要提供这一数值估计。换言之,计量经济学对大多数的经济理论赋予经验内容。
2.数理经济学的主要问题,是要用数学形式(方程式)来表述经济理论,而不管该理论是否可以量化或是否能够得到实证支持。计量经济学家常常使用数理经济学家所提供的数学方程式,但要把这些方程式改造成适合于经验检验的形式。这种从数学方程到计量经济方程的转换需要有许多的创造性和实际技巧。
(2)横截面数据:横截面数据指对一个或多个变量在同一时间点上收集的数据。当统计分析包含有异质的单位时,必须考虑尺度或规模效应以避免造成混乱。
(3)混合数据:在混合或组合数据中兼有时间序列和横截面数据的成分。
面板、纵列或微观面板数据是混合数据的一种特殊类型,指对相同的横截面单位在时间轴上进行跟踪调查的数据。如果每个横截面单位都具有相同的观测次数,则是平衡面板;若观测次数不同,则是非平衡面板。
2.研究对象和研究方法
计量经济学研究经济定律的经验判定。计量经济学家的艺术,就在于找出一组足够具体且足够现实的假定,使他尽可能最好地利用他所获得的数据。
计量经济学的研究方法是,利用统计推断的理论和技术作为桥头堡,以达到经济理论和实际测算相衔接的目的。
二、计量经济学是一门单独的学科
计量经济学值得作为一门独立的学科来研究,理由如下:
2.回归分析与相关分析的区别
回归分析中,对因变量和解释变量的处理方法存在着不对称性。因变量被当作是统计的、随机的,也就是它有一个概率分布。而解释变量则被看作是(在重复抽样中)取固定值的。
相关分析中,任何(两个)变量的处理方法都是对称的;因变量和解释变量之间不加区别;两个变量都被看作是随机的。
五、术语与符号
引
0.1 复习笔记
一、计量经济学
1.定义
计量经济学,是对经济学的作用存在某种期待的结果,它把数理统计学应用于经济数据,以使数理经济学构造出来的模型得到经验上的支持,并获得数值结果。
计量经济学可定义为实际经济现象的数量分析。这种分析基于理论与观测的并行发展,而理论与观测又通过适当的推断方法得以联系。
计量经济学可定义为这样的社会科学:它把经济理论、数学和统计推断作为工具,应用于经济现象的分析。
七、对变量测量尺度的注解
1.比率尺 都是有意义的量。这些值在这种尺度下存在着一种自然顺序(上升或下降)。大多数经济变量都属于这一类。
2.区间尺度
一个区间尺度变量满足比率尺度变量的后面两个性质,但不满足第一个性质。
3.序数尺度
只要一个变量满足比率尺度的第三个性质(即自然顺序),那它就属于这一类变量。
6.假设检验;
7.预报或预测;
8.利用模型进行控制或制定政策。
四、计量经济学的类型
计量经济学可划分为两大类:理论计量经济学(theoretical econometrics)和应用计量经济学(applied econometrics)。在每一大类中均可按经典方法(classical)或贝叶斯方法(Bayesian)进行研究。
第1章
1.1
一、回归的现代含义
回归分析是关于研究一个因变量对另一个或多个解释变量的依赖关系,其用意在于通过后者(在重复抽样中)的已知或设定值,去估计和(或)预测前者的(总体)均值。
二、统计关系与确定性关系
在回归分析中,考虑统计依赖关系,主要处理的是随机变量,也就是有着概率分布的变量。但是在函数或确定性依赖关系中,要处理的变量不是随机的。
1.术语
一个有代表性的清单如图1-1所示:
图1-1
2.双变量回归分析与多元回归分析
双变量回归分析研究一个变量对仅仅一个解释变量的依赖关系。
多元回归分析研究一个变量对多于一个解释变量的依赖关系。
六、经济分析所用数据的性质与来源
1.数据类型
(1)时间序列数据:一个时间序列是对一个变量在不同时间取值的一组观测结果。如果一个时间序列的均值和方差不随时间而系统地变化,那它就是平稳的。
2.数据来源
(1)互联网。互联网使数据搜集发生了革命性的变化。
(2)实验或非实验性质的数据。在社会科学中,人们通常获得的数据是非实验性质的。
3.数据的准确性
数据的质量常常不那么好的原因:
(1)大部分社会科学数据是非实验性质的,有观测误差的可能;也可能出于疏漏,或出于委托。
(2)即使是实验得来的数据,测量误差可由近似计算或进位而产生。
三、回归与因果关系
从逻辑上说,回归得到的统计关系式本身不可能意味着任何因果关系。肯德尔和斯图亚特认为,一个统计关系式永远不能确立因果方面的联系:对因果关系的理念,必须来自统计学以外的某种理论。
四、回归与相关
1.相关分析与相关系数
相关分析是以测度两个变量之间的线性关联程度为其主要目的。
相关系数是用来测度线性关联强度的。