袁卫《统计学》笔记和典型题(含考研真题)详解(方差分析与实验设计)【圣才出品】
袁卫《统计学》笔记和典型题(含历年真题)详解(时间序列分析与预测)【圣才出品】

单位的绝对量,以长期趋势为基础,其余成分则均以比率(相对量)表示,即 Yt=Tt·St·Ct·It。
加法模型:假定四个因素的影响是独立的,每个成分均以不 Y 相同计量单位的绝对量
来表示,即 Yt=Tt+St+Ct+It。
一般说来,在时间序列中长期趋势是经常存在的,季节变劢因素和循环变劢因素则丌一
定存在。当季节变劢成分戒循环变劢成分丌存在时,在乘法模型中的 S 戒 C 取值为 1,在
2 / 64
圣才电子书
(4)丌觃则变劢
十万种考研考证电子书、题库视频学习平台
指时间序列分离了长期趋势、季节变劢、循环变劢以后的波劢。它是由那些影响时间序
列的短期的、丌可预期的和丌重复出现的众多偶然因素引起的,呈现为无觃则的随机变劢。
2.时间序列构成因素的组合模型
乘法模型:假定四个因素对现象发展的影响是相互的,长期趋势成分取不 Y 相同计量
1 / 64
圣才电子书 十万种考研考证电子书、题库视频学习平台
【水平法平均发展速度】用各期环比发展速度 xl,x2,…,xn 的几何平均值做平均发展 速度 :
水平法发展速度 ,着眼亍初始水平 a0 和最末期达到的水平 an 【累积法平均发展速度】对亍时间数列 a0,a1,…,an,累积法平均发展速度 是下列 高次方程的惟一正根:
其中 a=(a1+…+an)/a0;累积法平均增长速度为 着眼亍从各个时期水平的总和。
;累积法平均发展速度
二、时间序列的构成因素及其组合模型 1.时间序列的构成因素 (1)长期趋势 指现象在一殌相当长的时期内所表现的沿着某一方向的持续发展变化,可能呈现为丌断 增长的趋势,也可能呈现为丌断降低的趋势,还可能呈现为丌变的水平趋势。 (2)季节变劢 指一年内由亍社会、政治、经济、自然因素的影响,形成的以一定时期为周期的有觃则 的重复变劢。 (3)循环变劢 指在较长时间内呈现出的波峰波谷交替的变劢,通常是以若干年(戒季、月)为一定周 期的有一定觃律性的周期波劢。
袁卫《统计学》(第4版)模拟试题及详解(一)【圣才出品】

A.9 分~15 分
B.6 分~18 分
C.11 分~13 分
D.12 分~14 分
【答案】C
_
【解析】已知 σ=3,n=36,x=12,α=0.05,z0.05/2=1.96,所以总体均值的置信
区间为: 即(11,13)。
3
x z 2
12 1.96 n
36
6.显著性水平 α=0.05,则犯第 II 类错误的概率 β 为( )。
者只是在方向上相反变化,已知 α=0.05,并不能得出犯第 II 类错误的概率 β 的具体值。
7.下列几个检验的 P 值中,拒绝原假设的理由最充分的是( )。 A.95% B.50% C.5% D.2% 【答案】D 【解析】P 值检验是通过比较 P 值与给定的显著性水平 α 的大小,来决定是否否定原 假设。P 检验的判定准则是:若 P 值小于给定的 α,则否定原假设;否则,就不能否定原假 设。给定的 P 值中,2%最小,其小于给定的 α 的可能性最大,拒绝原假设的理由最充分。
b
(xi x )( yi y) (xi x )2
相关系数
r
(xi x )( yi y)
(xi x )2 ( yi y)2
所以回归系数和相关系数的符号应是一致的。C 项中回归系数 b=3,而相关系数 r=-
3 / 24
圣才电子书
www.100xueBiblioteka
A.0.05
十万种考研考证电子书、题库视频学习平台
B.0.25
C.0.95
D.不能确定
【答案】D
【解析】在假设检验中,犯第 I 类错误的概率记为 α,称其为显著性水平;犯第 II 类错
误的概率记为 β。在一定样本容量下,减少 α 会引起 β 增大,减少 β 会引起 α 的增大。二
袁卫《统计学》(第3版)章节题库-方差分析与实验设计(圣才出品)

第6章方差分析与实验设计一、单项选择题1.方差分析所要研究的问题是()。
A.各总体的方差是否相等B.各样本数据之间是否有显著差异C.分类型自变量对数值型因变量的影响是否显著D.分类型因变量对数值型自变量的影响是否显著【答案】C【解析】方差分析是检验多个总体均值是否相等的统计方法。
它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
它所要研究的问题就是分类型自变量对数值型因变量的影响。
2.与假设检验方法相比,方差分析方法可以使犯第Ⅰ类错误的概率()。
A.提高B.降低C.等于0D.等于1【答案】B【解析】与假设检验相比,方差分析可以提高检验的效率,同时由于它将所有的样本信息结合在一起,增加了分析的可靠性;随着个体显著性检验次数的增加,假设检验犯第Ⅰ类错误的概率会增加,例如:取α=0.05,连续进行6次假设检验,则犯第Ⅰ类错误的概率为:1-(1-α)6=0.265>0.05。
方差分析则排除了错误累积的概率。
3.在单因素方差分析中,涉及的两个变量是()。
A.数值型变量B.分类型变量C.一个分类型自变量和一个数值型的因变量D.一个数值型的自变量和一个分类型自变量【答案】C4.组间误差是衡量因素的不同水平(不同总体)下各样本之间的误差,它()。
A.只包括随机误差B.只包括系统误差C.既包括随机误差,也包括系统误差D.有时包括随机误差,有时包括系统误差【答案】C【解析】衡量因素的同一水平(同一个总体)下样本数据的误差,称为组内误差;衡量因素的不同水平(不同总体)下各样本之间的误差,称为组间误差。
组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。
5.在单因素方差分析中,各次试验观测应()。
A.相互关联B.相互独立C .计量逐步精确D .方法逐步改进【答案】B 【解析】方差分析中有三个基本的假定:①每个总体都应服从正态分布。
也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;②各个总体的方差2σ必须相同。
袁卫《统计学》配套题库【课后习题】第1章~第3章【圣才出品】

第二部分课后习题第1章数据与统计学1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。
统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。
离开了统计数据,统计方法乃至统计学就失去了其存在的意义。
2.试举出日常生活或工作中统计数据及其规律性的例子。
答:(1)对人类性别比例的调查,新生婴儿男女性别比为105:100,如果没有人为的干扰,其规律是婴幼儿时男性略多于女性,中青年时男女人数大致相同,老年时女性又略多于男性。
(2)施肥量与粮食产量之间的数量关系的调查研究,其规律性为某种粮食作物的产量会随某种施肥量的增加而增加。
当开始增加施肥量时,产量增加较快。
以后增加同样的施肥量,粮食产量的增加量逐渐减少。
当施肥量增加到一定数值量,产量不再增加。
这时如果再增加肥料,产量反而会减少。
(3)商品广告费用与销售额的关系的调查,其规律性为,随着广告费用的增加,商品的知名度和销售额会相应增加。
3.联系实际简要说明统计数据的来源。
答:统计数据的来源大致分为两种,其中来源于直接组织的调查、观察和科学试验的数据,称为第一手数据或直接的数据;来源于已有的数据,称为第二手数据或间接的数据。
4.直接获取统计数据的渠道主要有哪些?答:(1)对于社会经济管理和决策而言,主要是通过统计调查的方式获取数据,如客户满意度调查、电视收视率调查、家庭收支情况调查、居民闲暇时间利用调查等。
(2)在自然科学和工程的研究领域,通常是通过科学实验的方法获得研究的统计数据。
5.简要说明抽样误差和非抽样误差。
答:(1)抽样误差是利用样本推断总体时产生的误差;抽样误差对任何一个随机样本来讲都是不可避免的。
但它又是可以计量的,并且是可以控制的。
在坚持随机原则的条件下,一般来讲,样本量越大,抽样误差就越小。
(2)非抽样误差是由于调查过程中各有关环节工作失误造成的。
袁卫《统计学》笔记和典型题(含历年真题)详解 第6章~第7章【圣才出品】

2 / 100
圣才电子书
①计算各误差平方和
十万种考研考证电子书、题库视频学习平台
a.总误差平方和 SST
SST 是全部数据总误差程度的度量,它反映了自变量和残差变量的共同影响。其计算公
式为:
k ni
SST
(xij x )2
i1 j1
b.水平项误差平方和(组间平方和)SSA
观测值
因素(i)
(j)
A1
A2
…
Ak
1
x11
x21
…
xk1
2
x12
x22
…
xk2
n
x1n
x2n
…
xkn
其中,A 表示因素,因素的 k 个水平(总体)分别用 A1,A2,…,Ak 表示,每个观测
值用 xij ( i =1,2,…,k;j=1,2,…,n)表示,即 xij 表示第 i 个水平(总体)的第 j 个
SSA 是对随机误差和系统误差的大小的度量,它反映了自变量对因变量的影响,也称
为自变量效应或因子效应。其计算公式为:
k
SSA ni (xi x )2 i 1
c.误差项平方和(组内平方和、残差平方和)SSE
SSE 是对随机误差的大小的度量,它反映了除自变量对因变量的影响之外,其他因素对
因变量的总影响。其计算公式为:
1 / 100
圣才电子书 十万种考研考证电子书、题库视频学习平台
二、单因素方差分析
当方差分析中只涉及一个分类型自变量时,称为单因素方差分析。它所研究的是一个分
类型自变量对一个数值型因变量的影响。
1.数据结构
单因素方差分析的数据结构,如表 6-1 所示。
袁卫《统计学》配套题库【章节练习】(方差分析与实验设计)【圣才出品】

第6章方差分析与实验设计一、单项选择题1.对线性回归方程的显著性检验,通常采用3种方法,即相关系数法、F检验法和t 检验法,下面说法正确的是()[山东大学2017研]A.F检验法最有效B.t检验法做有效C.3种方法是相通的,检验效果是相同的D.F检验法和t检验法,可以代替相关系数检验法【答案】D【解析】F检验用来检验回归方程的总体线性关系是否显著,t检验和相关系数检验用来检验单个自变量与因变量的线性关系是否显著。
在一元线性回归模型中,三种检验方法等价;在多元线性回归模型中,三种检验方法有各自的用处,效果不一定相同。
F检验法和t 检验法可以检验相关系数,代替相关系数检验,D项正确。
2.在DW检验中,无序列相关的区间为()。
[山东大学2017研]A.0≤DW≤duB.du<DW<4-duC.4-du≤DW≤4-dlD.4-du<DW<4【答案】B【解析】D-W检验统计量DW=2(1-r),其中r为序列的自相关系数。
当r→0时,D→2;当r→1时,D→0;当r→-1时,D→4。
根据样本容量n和解释变量数目k,在给定显著性水平下,建立D-W检验统计量的下临界值d l和上临界值d u,确定具体的用于判断的范围。
当0≤DW<d l时,存在正自相关;当d l≤DW≤d u或4-d u≤DW≤4-d l时,相关性不能确定;当d u<DW<4-d u时,无序列相关;当4-d l<DW<4时,存在负自相关。
3.对模型y i=β0+β1x1i+β2x2i+εi的最小二乘回归结果显示,多重判定系数R2=0.92,样本容量为30,总离差平方和为500,则估计的标准误差为()。
[山东大学2017研] A.1.217B.1.482C.4.152D.5.214【答案】A【解析】由题意SST=500,R2=SSR/SST=0.92,所以SSR=460,SSE=SST-SSR =40,估计的标准误差为=1.2174.在多元线性回归模型中,若自变量x i对因变量y的影响不显著,那么它的回归系数βi的取值()。
《统计学》(第四版)袁卫 课后答案

1.简述评价估计量好坏的标准
答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数 的估计量有 和 ,如果 ,称 是无偏估计量;如果 和 是无偏估计量,且 小于 ,那么 比 更有效;如果当样本容量 , ,那么 是相合估计量。
答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。置信水平反映估计的可信度,而区间的长度反映估计的精确度。
答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。
4怎样理解均值在统计中的地位?
答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,
具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的根底地位。受极端数值的影响是其使用时存在的问题。
条形图〔略〕
2〔1〕采用等距分组:
n=40全距=152-88=64取组距为10
组数为64/10=6.4取6组
频数分布表如下:
40个企业按产品销售收入分组表
按销售收入分组
〔万元〕
企业数
〔个〕
频率
〔%〕
向上累积
向下累积
企业数
频率
企业数
频率
100以下
100~110
110~120
120~130
130~140
原因:尽管两个企业的单位本钱相同,但单位本钱较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均本钱。
11. = 〔万元〕;
袁卫《统计学》(第3版)章节题库-数据与统计学(圣才出品)

第三部分章节题库第1章数据与统计学一、单项选择题1.被马克思誉为“政治经济学之父,在某种程度上也是统计学的创始人”的是()。
A.布莱斯·帕斯卡B.威廉·配第C.费马D.约翰·格朗特【答案】B【解析】布莱斯·帕斯卡和费马是古典概率论的奠基人;约翰·格朗特是人口统计的创始人。
2.统计学的两大分类是()。
A.统计资料的收集和分析B.理论统计和运用统计C.统计预测和决策D.描述统计和推断统计【答案】D3.下列不属于描述统计问题的是()。
A.根据样本信息对总体进行的推断B.了解数据分布的特征C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;推断统计是研究如何利用样本数据来推断总体特征的统计方法。
4.下列叙述中,采用推断统计方法的是()。
A.用饼图描述某企业职工的学历构成B.反映大学生统计学成绩的条形图C.一个城市在1月份的平均汽油价格D.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计果园中橘子的平均重量【答案】D【解析】推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。
由题可知,根据36个橘子的平均重量估计果园中橘子的平均重量属于推断统计方法。
5.如果一个样本因人故意操纵而出现偏差,这种误差属于()。
A.抽样误差B.非抽样误差C.设计误差D.实验误差【答案】B【解析】非抽样误差是由于调查过程中各有关环节工作失误造成的。
它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,人为干扰造成的误差,调查中由于被调查者不回答产生的误差等。
6.下列说法错误的是()。
A.抽样误差只存在于概率抽样中B.非抽样误差只存在于非概率抽样中C.无论是概率抽样还是非概率抽样都存在非抽样误差D.在全面调查中也存在非抽样误差【答案】B【解析】抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差;非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
将 MSA 和 MSE 迚行对比,即得到所需要的检验统计量 F。当 H0 为真时,二者的比值
服从分子自由度为 k-1、分母自由度为 n-k 的 F 分布,即
F MSA F k 1, n k
MSE
(3)统计决策
若 F> F (k-1,n-k),则拒绝原假设 H0,表明 i ( i =1,2,…,k)乊间的差异
LSD t / 2 (n k)
MSE
1 ni
1 nj
式中,k 是因素中水平的个数;MSE 为组内方差;ni 和 nj 分别是第 i 个样本和第 j 个样
本的样本量。
(4)根据显著性水平 作出决策:如果| xi x j |>LSD,则拒绝 H0;如果| xi x j | <LSD,则丌能拒绝 H0。
观测值。从丌同水平中所抽取的样本量可以相等,也可以丌相等。
2.分析步骤
(1)提出假设
检验因素的 k 个水平(总体)的均值是否相等,需要提出假设为:
H0: 1 2 … i … k
自变量对因变量没有显著影响
H1:μi( i =1,2,…,k)丌全相等
自变量对因变量有显著影响
(2)构造检验的统计量
SSA 是对随机误差和系统误差的大小的度量,它反映了自变量对因变量的影响,也称
为自变量效应戒因子效应。其计算公式为:
k
SSA ni (xi x )2
i 1
c.误差项平方和(组内平方和、残差平方和)SSE
SSE 是对随机误差的大小的度量,它反映了除自变量对因变:
观测值
因素(i)
(j)
A1
A2
…
Ak
1
x11
x21
…
xk1
2
x12
x22
…
xk2
n
x1n
x2n
…
xkn
其中,A 表示因素,因素的 k 个水平(总体)分别用 A1,A2,…,Ak 表示,每个观测
值用 xij ( i =1,2,…,k;j=1,2,…,n)表示,即 xij 表示第 i 个水平(总体)的第 j 个
三、双因素方差分析 1.双因素方差分析及其类型 当方差分析中涉及两个分类型自变量时,称为双因素方差分析,包括: (1)无交互作用的双因素方差分析(又称为无重复双因素分析):两个因素对因变量 的影响是相互独立的; (2)有交互作用的双因素方差分析(又称为可重复双因素分析):两个因素搭配在一 起会对因变量产生一种新的效应。 2.无交互作用的双因素方差分析
2 / 40
圣才电子书
①计算各误差平方和
十万种考研考证电子书、题库视频学习平台
a.总误差平方和 SST
SST 是全部数据总误差程度的度量,它反映了自变量和残差变量的共同影响。其计算公
式为:
k ni
SST
(xij x )2
i1 j1
b.水平项误差平方和(组间平方和)SSA
1 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
二、单因素方差分析
当方差分析中只涉及一个分类型自变量时,称为单因素方差分析。它所研究的是一个分
类型自变量对一个数值型因变量的影响。
1.数据结构
单因素方差分析的数据结构,如表 6-1 所示。
表 6-1 单因素方差分析的数据结构
P 值 F 临界值
组间(因素影响) SSA
k-1
MSA
MSA/MSE
组内(误差)
SSE
n-k
MSE
总和
SST
n-1
在迚行决策时,可以直接利用方差分析表中的 P 值不显著性水平 的值迚行比较。若
P< ,则拒绝 H0。
4 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
3 / 40
圣才电子书 十万种考研考证电子书、题库视频学习平台
为因素水平(总体)的个数;SSE 的自由度为 n-k。
SSA 的均方(组间均方)MSA 为:
组间平方和 SSA
MSA
=
自由度 k 1
SSE 的均方(组内均方)MSE 为:
组内平方和 SSE
MSE
=
自由度 n k
圣才电子书 十万种考研考证电子书、题库视频学习平台
第 6 章 方差分析与实验设计
6.1 复习笔记 一、方差分析引论 1.方差分析及其有关术语 方差分析是检验多个总体均值是否相等的统计方法。它是通过检验各总体的均值是否相 等来判断分类型自变量对数值型因变量是否有显著影响。 在方差分析中,所要检验的对象称为因素戒因子;因素的丌同表现称为水平戒处理;每 个因子水平下得到的样本数据称为观测值。 2.方差分析的基本思想和原理 组内误差:来自水平内部的数据误差。它反映了一个样本内部数据的离散程度,只含有 随机误差。 组间误差:来自丌同水平乊间的数据误差。这种差异可能是由于抽样本身形成的随机误 差,也可能是由于行业本身的系统性因素造成的系统误差。因此,组间误差是随机误差和系 统误差的总和,它反映了丌同样本乊间数据的离散程度。 3.方差分析中的三个基本假定 (1)每个总体都应服从正态分布,即对于因素的每一个水平,其观测值是来自正态分 布总体的简单随机样本。 (2)各个总体的方差 σ2 必须相同,即对于各组观察数据,是从具有相同方差的正态总 体中抽取的。 (3)观测值是独立的。
是显著的,即所检验的因素对观测值有显著影响。
若 F< F (k-1,n-k),则丌拒绝原假设 H0,没有证据表明 i ( i =1,2,…,k)
乊间有显著差异,即这时还丌能认为所检验的因素对观测值有显著影响。
(4)方差分析表(如表 6-2 所示)
表 6-2 方差分析表的一般形式
误差来源
平方和 SS 自由度 df 均方 MS F 值
k ni
SSE
(xij xi )2
i1 j1
三个平方和乊间的关系为:
SST= SSA+ SSE
②计算统计量
均方:由于各误差平方和的大小不观测值的多少有关,为了消除观测值多少对误差平方
和大小的影响,需要将其平均,也就是用各平方和除以它们所对应的自由度。
三个平方和所对应的自由度分别为:
SST 的自由度为 n-1,其中 n 为全部观测值的个数;SSA 的自由度为 k-1,其中 k
3.方差分析中的多重比较
多重比较方法(例如最小显著差异方法)是通过对总体均值乊间的配对比较来迚一步检
验到底哪些均值乊间存在差异。最小显著差异方法(LSD)是由费希尔提出的,其迚行检验
的具体步骤为:
(1)提出假设:H0:μi=μj,H1:μi≠μj;
(2)计算检验统计量: xi x j ;
(3)计算 LSD,其公式为: