统计学贾俊平_第四版课后习题答案第七章
贾俊平统计学第七章 参数估计_09

7-1
第 7 章 参数估计
7.1 参数估计的一般问题 7.2 一个总体参数的区间估计 7.3 两个总体参数的区间估计 7.4 样本容量的确定
7-2
学习目标
1. 估计量与估计值的概念 2. 点估计与区间估计的区别 3. 评价估计量优良性的标准 4. 一个总体参数的区间估计方法 5. 两个总体参数的区间估计方法 6. 样本容量的确定方法
该企业生产的食品总体重量标准差的的置信区
7-23
一个总体参数的区间估计
总体参数 均值 比例 方差
符号表示
2
样本统计量
X P S2
7-24
总体均值的区间估计
(正态总体、2已知,或非正态总体、大样本)
7-25
总体均值的区间估计
(大样本)
1. 假定条件
– 总体服从正态分布,且方差(2) 已知 – 如果不是正态分布,可由正态分布来近似 (n 30)
– 我们只能是希望这个区间是大量包含总体参数真值 的区间中的一个,但它也可能是少数几个不包含参 数真值的区间中的一个
7-16
置信区间与置信水平
均值的抽样分布
x
/2
1-
/2
X
x
(1 - ) % 区间包含了 % 的区间未包含
7-17
影响区间宽度的因素
1. 总体数据的离散程度,用 来测度
112.5 102.6 100.0 116.6 136.8
25袋食品的重量
101.0 103.0 102.0
107.5 95.0 108.8
123.5 102.0 101.6
95.4
97.8 108.6
102.8 101.5 98.4
统计学第四版答案(贾俊平)

统计学第四版答案(贾俊平)第1章统计和统计数据1.1 指出下⾯的变量类型。
(1)年龄。
(2)性别。
(3)汽车产量。
(4)员⼯对企业某项改⾰措施的态度(赞成、中⽴、反对)。
(5)购买商品时的⽀付⽅式(现⾦、信⽤卡、⽀票)。
详细答案:(1)数值变量。
(2)分类变量。
(3)数值变量。
(4)顺序变量。
(5)分类变量。
1.2 ⼀家研究机构从IT从业者中随机抽取1000⼈作为样本进⾏调查,其中60%回答他们的⽉收⼊在5000元以上,50%的⼈回答他们的消费⽀付⽅式是⽤信⽤卡。
(1)这⼀研究的总体是什么?样本是什么?样本量是多少?(2)“⽉收⼊”是分类变量、顺序变量还是数值变量?(3)“消费⽀付⽅式”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。
(2)数值变量。
(3)分类变量。
1.3 ⼀项调查表明,消费者每⽉在⽹上购物的平均花费是200元,他们选择在⽹上购物的主要原因是“价格便宜”。
(1)这⼀研究的总体是什么?(2)“消费者在⽹上购物的原因”是分类变量、顺序变量还是数值变量?详细答案:(1)总体是“所有的⽹上购物者”。
(2)分类变量。
1.4 某⼤学的商学院为了解毕业⽣的就业倾向,分别在会计专业抽取50⼈、市场营销专业抽取30、企业管理20⼈进⾏调查。
(1)这种抽样⽅式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?详细答案:(1)分层抽样。
(2)100。
第3章⽤统计量描述数据为7.2分钟,标准差为1.97分钟,第⼆种排队⽅式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)计算第⼆种排队时间的平均数和标准差。
(2)⽐两种排队⽅式等待时间的离散程度。
(3)如果让你选择⼀种排队⽅式,你会选择哪⼀种?试说明理由。
详细答案:(1)(岁);(岁)。
(2);。
第⼀中排队⽅式的离散程度⼤。
统计学课后习题答案_(第四版)_贾俊平

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3 (1(2)==∑nxx i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学贾俊平_第四版课后习题答案第七章

7.11 (1) 解:已知n=50,1a -=0.9522,ss x z xz nn a aæö-×+×ç÷èø=81.822981.8229101.491.966,101.491.9665050æö-´+´ç÷èø= (100.89,101.91)(2)解:已知n=50,1a -=0.95,2z a =00.0225z =1.96,样本比率p=(50-5)/50=0.9 则食品合格率的95%的置信区间:()()2211,p p p p p zp z nna aæö--ç÷-×+×ç÷èø=()()0.910.90.910.90.9 1.91.966,0.9 1.91.9665050æö---´+´ç÷èø=(0.8168,0.9832)7.22 (1)由题知,该题为大样本,方差已知,则有21m m -的95%的置信区间为:176.12100201001696.1)2325()(2221212/21±=+´±-=+±-n s n s z x x a即(0.824,3.176)(2m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n ntxxpa 即(—2.64,6.64) (3)由题知,该题为小样本,方差不同, 则有21m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.64,6.64) (4)由题知,该题为小样本,样本量不等,方差相等,则合并估计量为()()713128524211212222112==-+-+-=n n s n s n s p 则有21m m -的95%的置信区间为:()()02.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.02,6.02) ,2z a =00.0225z =1.96。
统计学贾俊平第四版第七章课后答案目前最全

7.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差x σ等于多少?(2) 在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σ=n σ=405=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =nα/2σZ =1.96×0.7906=1.5496。
7.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x nσ=49==2.143 (2)在95%的置信水平下,求边际误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2) 7.37.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:2x z x z n n αα⎛-+ ⎝n 100=1.2 (1)构建μ的90%的置信区间。
2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。
2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。
统计学(第四版)袁卫 庞皓 贾俊平 杨灿 统计学 第七章练习题参考解答

STATISTICS
单击练此习处题编第部辑七分母章版参标考题解样答式
练习题7.1
1. 设销售收入 为自变量,销售成本 为因变量。现已根据某百货
公司某年12个月的有关资料计算出以下数据:(单位:万元)
(xt x)2 425053.73 x 647.88
(yt y)2 262855.25
F (k 1, n k) F0.05 (1, 26) 2.91
F=17.70503 F0.05 (1, 26) 2.91
所以y和 联合起来对最终消费有显著影响,即回归方 程整体上是显著的。
练习题7.7
下表给出y对x2和x3回归的结果:
离差来源
平方和(SS) 自由度(df)
由F=58.20479,大于临界值 F0.05 (4 1, 22 4) 3.16 ,
说明模型在整体上是显著的。
练习题7.5
为进一步研究前期的消费对本期消费的影响,准备拟合以下
形式的消费函数: ct 1 yt 2ct1 ut
式中:ct 为t 期的消费;ct1 为 t-1期的消费;yt 为国民总收入。
t 2 (n 2) t0.025 (10) 2.2281 t 245.71875 t0.025 (8) 2.2281
H0 : 0 ,检验说明x对y有显著影响.
(4) 假定下年1月销售收入为800万元,利用拟合的回归方 程预测其销售成本,并给出置信度为95%的预测区间
y 549.8
(xt x)(yt y) 334229.09
(1)拟合简单线性回归方程,并对方程中回归系数的经济意义作 出解释。
统计学第四版答案(贾俊平)

请举出统计应用的几个例子:1、用统计识别作者:对于存在争议的论文,通过统计量推出作者2、用统计量得到一个重要发现:在不同海域鳗鱼脊椎骨数量变化不大,推断所有各个不同海域内的鳗鱼是由海洋中某公共场所繁殖的3、挑战者航天飞机失事预测请举出应用统计的几个领域:1、在企业发展战略中的应用2、在产品质量管理中的应用3、在市场研究中的应用④在财务分析中的应用⑤在经济预测中的应用你怎么理解统计的研究内容:1、统计学研究的基本内容包括统计对象、统计方法和统计规律。
2、统计对象就是统计研究的课题,称谓统计总体。
3、统计研究方法主要有大量观察法、数量分析法、抽样推断法、实验法等。
④统计规律就是通过大量观察和综合分析所揭示的用数量指标反映的客观现象的本质特征和发展规律。
举例说明分类变量、顺序变量和数值变量:分类变量:表现为不同类别的变量称为分类变量,如“性别”表现为“男”或“女”,“企业所属的行业”表现为“制造业”、“零售业”、“旅游业”等,“学生所在的学院”可能是“商学院”、“法学院”等顺序变量:如果类别有一定的顺序,这样的分类变量称为顺序变量,如考试成绩按等级分为优、良、中、及格、不及格,一个人对事物的态度分为赞成、中立、反对。
这里的“考试成绩等级”、“态度”等就是顺序变量。
数值变量:可以用数字记录其观察结果,这样的变量称为数值变量,如“企业销售额”、“生活费支出”、“掷一枚骰子出现的点数”。
定性数据和定量数据的图示方法各有哪些:1、定性数据的图示:条形图、帕累托图、饼图、环形图2、定量数据的图示:a、分组数据看分布:直方图b、未分组数据看分布:茎叶图、箱线图、垂线图、误差图c、两个变量间的关系:散点图d、比较多个样本的相似性:雷达图和轮廓图直方图与条形图有何区别:1、条形图中的每一个矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距。
2、由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
统计学贾俊平课后习题答案完整版

统计学贾俊平课后习题答案HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】附录:教材各章习题答案第1章统计与统计数据1.1(1)数值型数据;(2)分类数据;(3)数值型数据;(4)顺序数据;(5)分类数据。
1.2(1)总体是“该城市所有的职工家庭”,样本是“抽取的2000个职工家庭”;(2)城市所有职工家庭的年人均收入,抽取的“2000个家庭计算出的年人均收入。
1.3(1)所有IT从业者;(2)数值型变量;(3)分类变量;(4)观察数据。
1.4(1)总体是“所有的网上购物者”;(2)分类变量;(3)所有的网上购物者的月平均花费;(4)统计量;(5)推断统计方法。
1.5(略)。
1.6(略)。
第2章数据的图表展示2.1(1)属于顺序数据。
(2)频数分布表如下(4)帕累托图(略)。
2.2(1)频数分布表如下2.3频数分布表如下2.5(1)排序略。
(2)频数分布表如下2.6(3)食品重量的分布基本上是对称的。
2.72.8(1)属于数值型数据。
2.9(1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.10A 班分散,且平均成绩较A 班低。
2.11 (略)。
2.12 (略)。
2.13 (略)。
2.14 (略)。
2.15 箱线图如下:(特征请读者自己分析) 第3章 数据的概括性度量3.1(1)100=M ;10=e M ;6.9=x 。
(2)5.5=L Q ;12=U Q 。
(3)2.4=s 。
(4)左偏分布。
3.2(1)190=M ;23=e M 。
(2)5.5=L Q ;12=U Q 。
(3)24=x ;65.6=s 。
(4)08.1=SK ;77.0=K 。
(5)略。
3.3 (1)略。
(2)7=x ;71.0=s 。
(3)102.01=v ;274.02=v 。
(4)选方法一,因为离散程度小。
3.4 (1)x =(万元);M e= 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
7.11 (1) 解:已知n=50,1α-=0.95,2z α=0.025z =1.96。
由于总体方差未知,但为大样本,可用样本方差代替总体方差。
由excel 算得样本均值=101.4,样本标准差s=1.829
则食品平均重量的95%的置信区间:
2
2
,s s x z x z n
n αα
⎛
⎫-⋅
+⋅
⎪⎝
⎭
= 1.829 1.829101.4 1.96,101.4 1.9650
50⎛⎫
-⨯
+⨯
⎪⎝
⎭
=
(100.89,101.91)
(2)解:已知n=50,1α-=0.95,2z α=0.025z =1.96,样本比率p=(50-5)/50=0.9 则食品合格率的95%的置信区间:
()()2
2
11,p p p p p z p z n
n
αα
⎛
⎫
-- ⎪-⋅
+⋅
⎪⎝
⎭
=()
()0.910.90.910.90.9 1.96,0.9 1.9650
50
⎛
⎫
-- ⎪-⨯+⨯
⎪⎝
⎭
=(0.8168,0.9832)
7.22 (1)由题知,该题为大样本,方差已知,则有21μμ-的95%的置信区间为:
176.12100
20100
1696.1)2325()(2
2
2
1
2
1
2
/21±=+
⨯
±-=+
±-n s n s z x x α
即(0.824,3.176)
(2)由题知,该题为小样本,方差相等,则合并估计量为:
()()1818
3242
11212
2
22
112
==
-+-+-=
n n s n s n s p 则有21μμ-的95%的置信区间为:
()
()64.42112212
212
/21
±=⎪⎪⎭
⎫ ⎝⎛+
-+±-n n s n n t x x
p α
即(—2.64,6.64) (3)由题知,该题为小样本,方差不同, 则有21μμ-的95%的置信区间为:
()
()64.42112212
21
2
/21
±=⎪⎪⎭
⎫ ⎝⎛+
-+±-n n s n n t x x
p α
即(—2.64,6.64) (4)由题知,该题为小样本,样本量不等,方差相等,则合并估计量为
()()7
13128
5242
11212
2
22112
=
=
-+-+-=
n n s n s n s p 则有21μμ-的95%的置信区间为:
()
()02.42112212
21
2
/21
±=⎪⎪⎭
⎫ ⎝⎛+
-+±-n n s n n t x x
p α
即(—2.02,6.02)
(5) 由题知,该题为小样本,样本量不等,方差不相等,则自由度V 为:
()
()
1
/1
/22
2
22
12
1
21
2
222
22
121-+
-⎪⎪⎭
⎫ ⎝⎛+=
n n s
n n s
n s n s v 则有21μμ-的95%的置信区间为:
()()
9.3222
21212/21±=⎪⎪⎭
⎫ ⎝⎛+±-n s n s v t x x α 即(—1.9,5.9) 7.24 由题目数据算得
1110
1101
==
=
∑
=d n
i i
n d d 53.61)
(1
2
=--=
∑=d n
i i
d n d d
s
由比配样本可知,67.41110
53.62622.211)
1(2±=⨯
±=-±n
s n t d d α 即(6.33,15.67)
所以两种方法平均自信心得分之差的95%的置信区间为6.33分到15.67分。
7.26 解:根据自由度n1—1=n2—1=20查F 分布表得:1α-=0.95,
()2
121,1F n n α
--=()0.02520,20F =2.4645, ()121
21,1F n n α
---=
()
2
211
1,1F n n α
--=()0.97520,20F =
()
0.025120,20F =0.4058
由excel 求得样本方差21s =0.058,22s =0.006
所以:()()2
2
1
1
2
2
2
2
2
12
12
12
,
1,11,1s s s s F n n F n n αα-⎛⎫
⎪
⎪---- ⎪ ⎪⎝
⎭=(4.05,24.6)
即两个总体方差比的置信区间为4.05克到24.6克。
7.28 解:由1α-=0.95,得2z α=0.025z =1.96,估计误差E ≤20. 由
22
2
2
x
z n α
σ
⋅=
∆22
2
1.96120
20
⨯=
=138.3,得n=139。
即n ≥139。