袁卫《统计学》(第3版)章节题库-方差分析与实验设计(圣才出品)
袁卫《统计学》(第3版)课后习题-相关与回归分析(圣才出品)

称为总体回归函数(简记为 PRF)。 (2)如果把因变量 y 的样本条件期望表示为自变量 x 的某种函数,这个函数称为样本
回归函数(简记为 SRF)。 (3)总体回归函数和样本回归函数的区别
2 / 24
量以外的所有因素对 y 的影响,称为随机误差项。
(2)因变量 y 的实际观测值 yi 并不完全等于样本条件期望 yˆi ,二者之偏差称为残差项 或剩余项,用 ei 表示,则 yi − yˆi = ei 。
(3)总体回归函数中的 i 是不可直接观测的,而样本回归函数中的 ei 是只要估计出样
本回归的参数就可以计算的数值。
圣才电子书 十万种考研考证电子书、题库视频学习平台
①总体回归函数虽然未知,但它是确定的;而由于从总体中每次抽样都能获得一个样本, 就都可以拟合一条样本回归线,所以样本回归线是随抽样的样本而变化的,可以有许多条。 所以,样本回归线还不是总体回归线,至多只是未知总体回归线的近似表现。
圣才电子书
十万种考研考证电子书、题库视频学习平台
第 7 章 相关与回归分析
思考题 1.相关分析与回归分析的区别和联系是什么? 答:(1)相关分析与回归分析的联系 相关分析与回归分析具有共同的研究对象,都是对变量间相关关系的分析,二者可以相 互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相 关关系时,进行回归分析去寻求变量间相关的具体数学形式才有实际的意义。同时,在进行 相关分析时,如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且在多 个变量的相关分析中相关系数的确定也是建立在回归分析基础上的。 (2)相关分析与回归分析的区别 ①从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的 方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据自变量的固定值去 估计和预测因变量的平均值。 ②从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系, 也就是不区分自变量和因变量,相关的变量不一定具有因果关系,均视为随机变量;回归分 析是在变量因果关系分析的基础上研究其中的自变量的变动对因变量的具体影响,必须明确 划分自变量和因变量,所以回归分析中对变量的处理是不对称的,在回归分析中通常假定自 变量在重复抽样中是取固定值的非随机变量,只有因变量是具有一定概率分布的随机变量。
袁卫《统计学》配套题库【章节题库】第4章~第6章【圣才出品】

【解析】记总体的一阶原点矩和二阶原点矩分别为 E(X)=µ,E(X2)=D(X)+
(E(X))2=µ2+σ2,最后可求得µ的矩估计为
σ2 的矩估计为
n
xi
x i1 n
n
(xi x)2
i 1
n
使用似然函数,最后可求得µ的极大似然估计为
σ2 的极大似然估计为
n
xi
2.设 X1,X2,X3,X4 是来自总体 X 的样本,EX=μ,则( )是μ的最有效估计。
[山东大学 2017 研]
A.
ˆ
1 4
X1
1 4
X2
1 4
X3
1 4
X4
B.
ˆ
1 5
X1
2 5
X
2
1 5
X
3
1 5
X
4
C.
ˆ
1 9
X1
2 9
X
2
1 9
X3
1 9
X4
1 / 78
圣才电子书 十万种考研考证电子书、题库视频学习平台
D.
ˆ
1 3
X1
1 3
X2
1 6
X
3
1 6
X4
【答案】A
【解析】最有效估计即在无偏估计里方差最小的估计。A
∧
项,Eμ=μ,
D
ˆ
1
2
;
4
∧
B 项,Eμ=μ, D
ˆ
7
2
;C
项,
Eˆ
5
,不是µ的无偏估计;D
∧
项,Eμ=μ,
25
9
D ˆ 5 2 。经比较,在所有无偏估计中,A 项方差最小,因而是最有效估计。
袁卫《统计学》(第3版)课后习题-概率、概率分布与抽样分布(圣才出品)

5.离散型随机变量和连续型随机变量的概率分布的描述有哪些不同?连续型随机变量
的概率密度与分布函数之间是什么关系?
答:(1)离散型随机变量 X 只取有限个可能的值 x1,x2,…, xn ,而且是以确定的概
率取这些值,即
P(X=xi)=pi( i =1,2,…,n)。因此,可以列出 X 的所有可能取值 x1,x2,…, xn ,以 及取每个值的概率 p1,p2,…, pn ,将它们用表格的形式表现出来,就是离散型随机变量
1 / 26
圣电子书
(3)主观概率
十万种考研考证电子书、题库视频学习平台
古典概率和统计概率都属于客观概率,它们的确定完全取决于对客观条件的理论分析或
是大量重复试验的事实,不以个人的意志为转移。而有些事件,特别是未来的某一事件,既
不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计,但决策者又必须
,
对于连续型随机变量,其均值和方差分别为:
= E(X ) = xf (x)dx, 2 = E(X 2) − E2(X ) = − x2 f (x)dx
−
−
7.二项分布与超几何分布的适用场合有什么不同?它们的均值和方差有什么区别?
答:(1)从理论上讲,二项分布只适合于重复抽样(即从总体中抽出一个个体观察完后
对其进行估计从而作出相应的决策,那就需要应用主观概率。
主观概率需要人们根据经验、专业知识、对事件发生的众多条件或影响因素进行分析,
以此确定主观概率。
3.概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)区别 概率密度函数只是给出了连续型随机变量某一特定值的函数值,这一函数值不是真正意 义上的取值概率,连续型随机变量在给定区间内取值的概率对应的是概率密度函数 f(x)曲 线(或直线)在该区间上围成的面积,这一特征恰恰意味着连续型随机变量在某一点的概率 值为 0,因为它对应的面积为 0。而分布函数 F 在 x 处的取值,就是随机变量 X 的取值落在 区间(-∞,x)的概率。 (2)联系
袁卫《统计学》配套题库【课后习题】第1章~第3章【圣才出品】

第二部分课后习题第1章数据与统计学1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。
统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。
离开了统计数据,统计方法乃至统计学就失去了其存在的意义。
2.试举出日常生活或工作中统计数据及其规律性的例子。
答:(1)对人类性别比例的调查,新生婴儿男女性别比为105:100,如果没有人为的干扰,其规律是婴幼儿时男性略多于女性,中青年时男女人数大致相同,老年时女性又略多于男性。
(2)施肥量与粮食产量之间的数量关系的调查研究,其规律性为某种粮食作物的产量会随某种施肥量的增加而增加。
当开始增加施肥量时,产量增加较快。
以后增加同样的施肥量,粮食产量的增加量逐渐减少。
当施肥量增加到一定数值量,产量不再增加。
这时如果再增加肥料,产量反而会减少。
(3)商品广告费用与销售额的关系的调查,其规律性为,随着广告费用的增加,商品的知名度和销售额会相应增加。
3.联系实际简要说明统计数据的来源。
答:统计数据的来源大致分为两种,其中来源于直接组织的调查、观察和科学试验的数据,称为第一手数据或直接的数据;来源于已有的数据,称为第二手数据或间接的数据。
4.直接获取统计数据的渠道主要有哪些?答:(1)对于社会经济管理和决策而言,主要是通过统计调查的方式获取数据,如客户满意度调查、电视收视率调查、家庭收支情况调查、居民闲暇时间利用调查等。
(2)在自然科学和工程的研究领域,通常是通过科学实验的方法获得研究的统计数据。
5.简要说明抽样误差和非抽样误差。
答:(1)抽样误差是利用样本推断总体时产生的误差;抽样误差对任何一个随机样本来讲都是不可避免的。
但它又是可以计量的,并且是可以控制的。
在坚持随机原则的条件下,一般来讲,样本量越大,抽样误差就越小。
(2)非抽样误差是由于调查过程中各有关环节工作失误造成的。
统计学习题答案(袁卫主编第三版)

为大家谋福利,低价供应第1章绪论1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:C B C ED B C C B C(1) 指出上面的数据属于什么类型;用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
袁卫《统计学》笔记和典型题(含历年真题)详解 第6章~第7章【圣才出品】

2 / 100
圣才电子书
①计算各误差平方和
十万种考研考证电子书、题库视频学习平台
a.总误差平方和 SST
SST 是全部数据总误差程度的度量,它反映了自变量和残差变量的共同影响。其计算公
式为:
k ni
SST
(xij x )2
i1 j1
b.水平项误差平方和(组间平方和)SSA
观测值
因素(i)
(j)
A1
A2
…
Ak
1
x11
x21
…
xk1
2
x12
x22
…
xk2
n
x1n
x2n
…
xkn
其中,A 表示因素,因素的 k 个水平(总体)分别用 A1,A2,…,Ak 表示,每个观测
值用 xij ( i =1,2,…,k;j=1,2,…,n)表示,即 xij 表示第 i 个水平(总体)的第 j 个
SSA 是对随机误差和系统误差的大小的度量,它反映了自变量对因变量的影响,也称
为自变量效应或因子效应。其计算公式为:
k
SSA ni (xi x )2 i 1
c.误差项平方和(组内平方和、残差平方和)SSE
SSE 是对随机误差的大小的度量,它反映了除自变量对因变量的影响之外,其他因素对
因变量的总影响。其计算公式为:
1 / 100
圣才电子书 十万种考研考证电子书、题库视频学习平台
二、单因素方差分析
当方差分析中只涉及一个分类型自变量时,称为单因素方差分析。它所研究的是一个分
类型自变量对一个数值型因变量的影响。
1.数据结构
单因素方差分析的数据结构,如表 6-1 所示。
袁卫《统计学》配套题库【章节练习】(概率、概率分布与抽样分布)【圣才出品】

十万种考研考证电子书、题库视频学习平台
【解析】重复抽样下的抽样标准误差为 ,不重复抽样下的标准误差为
n
N n2 N 1 n
。
10.设X、Y、Z表示3个随机事件,则X∪Y∪Z表示( )。[浙江工商大学2017研] A.X、Y、Z全部发生 B.X、Y、Z中恰有一个发生 C.X、Y、Z中至少发生一个 D.X、Y、Z都不发生 【答案】C 【解析】事件 X∪Y∪Z 表示 X 发生或 Y 发生或 Z 发生,即 X、Y、Z 中至少有一个发 生。
有 0≤F(x)≤1,故 AC 两项错误。D 项,若 X 的分布函数存在,则有 F(+∞)=1。
8.设 X 服从参数为 λ 的泊松分布,已知 P(X=1)=1/2×P(X=2),则 λ=( )。 [山东大学 2017 研]
A.2 B.1 C.4 D.0.25 【答案】C 【解析】由泊松分布概率公式
P( X k) k e
因此S不是σ的无偏估计,A项错误;但是随着样本容量的扩大,样本与总体逐渐接近, 样本标准差也与总体标准差逐渐接近,所以S是σ的一致估计。由于随机变量分布函数形式 未知,所以无法知道S是否是σ的最大似然估计,B项错误。
5.对于任意二事件 A 和 B,则( )。[山东大学 2017 研] A.若 AB≠∅,则 A,B 一定独立 B.若 AB≠∅,则 A,B 有可能独立 C.若 AB=∅,则 A,B 一定独立 D.若 AB=∅,则 A,B 一定不独立 【答案】B 【解析】事件A与事件B独立等价于P(AB)=P(A)P(B)。事件AB是否为空集与事 件A、事件B的独立条件无关,无法推出事件A与事件B的独立性,只有B项正确。
【解析】随机变量的概率密度函数应满足 f(x)≥0,且 f (x) dx 1 ;其分布
统计学(第三版袁卫_庞皓_曾五一_贾俊平主编)各章节课后习题答案

5.12 (4.06,14.35)。
5.13 48。
5.14 139。
5.15 57。
5.16 769。
第6章 假设检验
6.1 研究者想要寻找证据予以支持的假设是“新型弦线的平均抗拉强 度相对于以前提高了”,所以原假设与备择假设应为:,。
6.2 =“某一品种的小鸡因为同类相残而导致的死亡率”,,。 6.3 ,。 6.4 (1)第一类错误是该供应商提供的这批炸土豆片的平均重量的
第5章 参数估计
5.1 (1)。(2)E=1.55。
5.2 (1)。(2)E=4.2。(3)(115.8,124.2)。
5.3 (2.88,3.76);(2.80,3.84);(2.63,4.01)。
5.4 (7.1,12.9)。
5.5 (7.18,11.57)。
5.6 (18.11%,27.89%);(17.17%,22.835)。
或(解法二):P(脱靶)=P(第1次脱靶)×P(第2次脱靶)=0.2×0.5= 0.1 3.5 设A=活到55岁,B=活到70岁。所求概率为:
3.6这是一个计算后验概率的问题。 设A=优质率达95%,
=优质率为80%,B=试验所生产的5件全部优质。 P(A)=0.4,P(
)=0.6,P(B|A)=0.955, P(B|
多相同,因为均值和标准差的大小基本上不受样本大小的影
响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因
为样本越大,变化的范围就可能越大。
2.13 (1)女生的体重差异大,因为女生其中的离散系数为0.1大于
男生体重的离散系数0.08。
(2) 男生:=27.27(磅),(磅);
女生:=22.73(磅),(磅);
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第6章方差分析与实验设计
一、单项选择题
1.方差分析所要研究的问题是()。
A.各总体的方差是否相等
B.各样本数据之间是否有显著差异
C.分类型自变量对数值型因变量的影响是否显著
D.分类型因变量对数值型自变量的影响是否显著
【答案】C
【解析】方差分析是检验多个总体均值是否相等的统计方法。
它是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。
它所要研究的问题就是分类型自变量对数值型因变量的影响。
2.与假设检验方法相比,方差分析方法可以使犯第Ⅰ类错误的概率()。
A.提高
B.降低
C.等于0
D.等于1
【答案】B
【解析】与假设检验相比,方差分析可以提高检验的效率,同时由于它将所有的样本信息结合在一起,增加了分析的可靠性;随着个体显著性检验次数的增加,假设检验犯第Ⅰ类错误的概率会增加,例如:取α=0.05,连续进行6次假设检验,则犯第Ⅰ类错误的概率为:
1-(1-α)6=0.265>0.05。
方差分析则排除了错误累积的概率。
3.在单因素方差分析中,涉及的两个变量是()。
A.数值型变量
B.分类型变量
C.一个分类型自变量和一个数值型的因变量
D.一个数值型的自变量和一个分类型自变量
【答案】C
4.组间误差是衡量因素的不同水平(不同总体)下各样本之间的误差,它()。
A.只包括随机误差
B.只包括系统误差
C.既包括随机误差,也包括系统误差
D.有时包括随机误差,有时包括系统误差
【答案】C
【解析】衡量因素的同一水平(同一个总体)下样本数据的误差,称为组内误差;衡量因素的不同水平(不同总体)下各样本之间的误差,称为组间误差。
组内误差只包含随机误差,而组间误差既包括随机误差,也包括系统误差。
5.在单因素方差分析中,各次试验观测应()。
A.相互关联
B.相互独立
C .计量逐步精确
D .方法逐步改进
【答案】B 【解析】方差分析中有三个基本的假定:①每个总体都应服从正态分布。
也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本;②各个总体的方差2σ必须相同。
也就是说,对于各组观察数据,是从具有相同方差的正态总体中抽取的;③观测值是独立的。
6.在单因素方差分析中,所提出的原假设和备则假设分别是( )。
A .H 0:12k μμμ===…,H 1:12k μμμ≠≠≠…
B .H 0:12k μμμ===…,H 1:12k μμμ>>…>
C .H 0:12k μμμ===…,H 1:12k μμμ<<…<
D .H 0:12k μμμ===…,H 1:(1,2,
,)i i k μ=不全相等
【答案】D
【解析】在方差分析中,原假设所描述的是:在按照自变量的值分成的类中,因变量的均值是否相等。
因此,检验因素的k 个水平(总体)的均值是否相等,需要提出如下形式的假设: H 0:12k μμμ===… 自变量对因变量没有显著影响
H 1:(12)i i k μ=,,…,不全相等 自变量对因变量有显著影响
式中:i μ为第i 个总体的均值。
7.在单因素方差分析中,若因子的水平个数为k ,全部观测值的个数为n ,则( )。
A.SST的自由度为n
B.SSA的自由度为k
C.SSE的自由度为n-k-1
D.SST的自由度等于SSA的自由度与SSE的自由度之和
【答案】D
【解析】在单因素方差分析中,三个平方和所对应的自由度分别是:SST的自由度为(n-1);SSA的自由度为(k-1);SSE的自由度为(n-k)。
8.从4个总体中各选取了5个观察值,得到组间平方和SSA=636,组内平方和SSE=742,组间平方和与组内平方和的自由度分别为()。
A.3;16
B.3;20
C.4;16
D.4;20
【答案】A
【解析】在单因素方差分析中,三个平方和所对应的自由度分别是:SST的自由度为:n-1=4×5-1=19;SSA的自由度为:k-1=4-1=3;SSE的自由度为:n-k=4×5-4=16。
9.在单因素方差分析中,如果各因素水平效应相同的原假设为真,则组间平方和SSC ()。
A.等于0
B.等于总平方和
C.完全由抽样的随机误差引起
D.完全由不同处置的差异引起
【答案】C
10.在单因素方差分析中,用于检验的统计量F的计算公式为()。
A.SSA/SSE
B.SSA/SST
C.MSA/MSE
D.MSA/MSE
【答案】C
11.在方差分析中,如果拒绝原假设,则说明()。
A.自变量对因变量有显著影响
B.所检验的各总体均值之间全不相等
C.不能认为自变量对因变量有显著影响
D.所检验的各样本均值之间全不相等
【答案】A
【解析】在方差分析中,如果不拒绝原假设H0,则不能认为自变量对因变量有显著影响,也就是说,不能认为自变量与因变量之间有显著关系;如果拒绝原假设,则意味着自变量对因变量有显著影响,也就是自变量与因变量之间有显著关系。
12.方差分析中的多重比较是通过配对比较来进一步检验()。
A.哪两个总体均值之间有差异
B.哪两个总体方差之间有差异
C.哪两个样本均值之问有差异
D.哪两个样本方差之间有差异
【答案】A
13.设用于检验的行因素有k个水平,列因素有r个水平,并假设两个因素有交互作用,交互作用平方和的自由度是()。
A.k-1
B.kr-1
C.k r(m-1)
D.(k-l)(r-1)
【答案】D
【解析】在有交互作用的双因素方差分析中,行因素平方和的自由度是k-1;列因素平方和的自由度是r-1;交互作用平方和的自由度是(k-l)(r-1);误差平方和的自由度是kr(m-1)。
14.在有交互作用的方差分析中离差平方和的分解公式为()。
A.SST=SSR+SSC+SSRC
B.SST=SSE+SSRC
C.SST=SSC+SSR+SSE
D.SST=SSR+SSC+SSRC+SSE。