统计学第四版第七章答案
《统计学》-第7章-习题答案

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。
2.答:相关和回归都是研究现象及变量之间相互关系的方法。
相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。
3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。
复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。
偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。
4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。
根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。
总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。
两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。
第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。
统计学贾俊平第四版第七章课后答案目前最全

7.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差x σ等于多少?(2) 在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σ=n σ=405=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =nα/2σZ =1.96×0.7906=1.5496。
7.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x nσ=49==2.143 (2)在95%的置信水平下,求边际误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2) 7.37.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:2x z x z n n αα⎛-+ ⎝n 100=1.2 (1)构建μ的90%的置信区间。
2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。
2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。
统计学课后习题答案(第四版)贾俊平(第4、5、7、10章)

《统计学》第四版 第四章练习题答案众数:M o =1O;中位数:中位数位置=n+1/2=5.5 , M e =10 ;平均数:(2) Q L 位置=n/4=2.5, Q L =4+7/2=5.5 ; Q u 位置=3n/4=7.5 , Q u =12(4) 4.2 和 M O =23。
将原始数据排序后,计算中位数的位置为:中位数位置=n+1/2=13,第13个位置上的数值为23,所以中位数为 M e =23(2)Q L 位置=n/4=6.25, Q L ==19 ; Q u 位置=3n/4=18.75,Q u =26.5茎 叶 频数 5 5 1 6 6 7 8 3 71 3 4 8 85(3)第一种排队方式: 离散程度大于第二种排队方式。
(4 )选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方 式。
_ Z X i4.4 ( 1)X8223/30=274.14.1 ( 1 ) 二X i X =n96.9,6 102' (X i-X ) _156.4 42n -1, 9由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
(1)从表中数据可以看出,年龄出现频数最多的是 19和23,故有个众数,即 M O =19(3)⑶平均数-A =600/25=24,标准差—(XLX)\ n —1210626.6525-1n(4) 偏态系数SK=1.08,峰态系数K=0.77(5) 分析:从众数、中位数和平均数来看,网民年龄在 23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数 1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
(1)茎叶图如下: 大于 4.3 —2'(X 一 X ) 4.080.714nn -1■ 8由于两种排队方式的平均数不同,所以用离散系数进行比较。
(2) X 二一^ =63/9=7, S = ■■n中位数位置=n+1/2=15.5 , M e=272+273/2=272.5(2) Q L位置=n/4=7.5, Q L==(258+261)/2=259.5 ; Q u 位置=3n/4=22.5 , Q u=(284+291)/2=287.5' (^-X ^ /3002-7 = 21.17 I n —1 \ 30—12100 +3000 +15004.5 (1)甲企业的平均成本=总成本/总产量=-2100 3000---- + ----- 15 20乙企业的平均成本=总成本/总产量=3255150015006255=18.293255 1500 1500 342____ + _____ + _____152030原因:尽管两个企业的单位成本相同, 但单位成本较低的产品在乙企业的产量中所占比重较 大,因此拉低了总平均成本。
应用统计学(第四版) 第7章案例题目及答案

应用统计学(第四版)第7章案例题目及答案案例分析题一个纺织品制造商收到一个很大的用于制作制服的衣料订单,这些衣料由4条不同的染色流水线进行染色,每条流水线每天生产的衣料数量大致相同。
通常,如果订单数量不是很大,只会用到一条流水线来完成订单,因为这样衣料的图案亮度会控制得较好,而不同流水线染色的图案亮度总会有些差异。
但是这个订单很大,要同时用到4条流水线,这时候需要通过使所有生产的衣料的图案亮度的方差最小化来尽可能使图案保持一致。
最近,顾客抱怨图案亮度的差异太大了。
因此决定对4条流水线生产的衣料图案亮度进行方差分析检验。
从每条流水线随机抽取样本并测量亮度,测量值在0~100之间,数据如下表所示。
要求:(1) 在 =0.05的显著性水平下进行检验并给出你的结论。
(2) 哪两条流水线染色的衣料的平均亮度有明显的不同?(3) 在生产过程中停止某一流水线进行亮度调整的成本很高,如果只能将一条流水线停下来调整,应该调整哪一条呢?应该将其调整到多少亮度值才能使所染色的衣料的图案尽可能保持一致?答案P207四、案例分析因F=10.590967> F crit=2.7826004或P-value=1.526E-05<α=0.05,拒绝原假设H0,即不同流水线对衣料图案的亮度有显著影响。
(2)利用Fisher最小显著差异(LSD)方法进行多重比较,可判断哪些均值间有显著差异。
t分布的自由度为n-k=56-4=52,所以/20.025(52)t tα==2.0066,MSE=6.2109,有关样本均值差的绝对值及相应的LSD计算结果如下表所示:判断:若均值差绝对值大于相应的LSD就拒绝H0,表明它们之间衣料平均亮度有显著差异;否则不拒绝H0,不能认为它们之间有显著差异。
因此,根据上表计算结果判断如下:流水线1和2,流水线1和3,流水线2和4,流水线3和4它们之间衣料的图案的平均亮度有明显的不同。
(3)我们把各样本均值与样本总均值进行比较,从中找出偏离样本总均值最大者,则停止该流水线并将其图案亮度调整到样本总均值,能够使所染色衣料的图案亮度尽可能保持一致。
统计学课后习题答案_(第四版)4.5.7.8章

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学贾俊平_第四版课后习题答案第七章

7.11 (1) 解:已知n=50,1a -=0.9522,ss x z xz nn a aæö-×+×ç÷èø=81.822981.8229101.491.966,101.491.9665050æö-´+´ç÷èø= (100.89,101.91)(2)解:已知n=50,1a -=0.95,2z a =00.0225z =1.96,样本比率p=(50-5)/50=0.9 则食品合格率的95%的置信区间:()()2211,p p p p p zp z nna aæö--ç÷-×+×ç÷èø=()()0.910.90.910.90.9 1.91.966,0.9 1.91.9665050æö---´+´ç÷èø=(0.8168,0.9832)7.22 (1)由题知,该题为大样本,方差已知,则有21m m -的95%的置信区间为:176.12100201001696.1)2325()(2221212/21±=+´±-=+±-n s n s z x x a即(0.824,3.176)(2m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n ntxxpa 即(—2.64,6.64) (3)由题知,该题为小样本,方差不同, 则有21m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.64,6.64) (4)由题知,该题为小样本,样本量不等,方差相等,则合并估计量为()()713128524211212222112==-+-+-=n n s n s n s p 则有21m m -的95%的置信区间为:()()02.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.02,6.02) ,2z a =00.0225z =1.96。
统计学第四版第七章课后题最全答案

配对号
来自总体A得样本
来自总体B得样本
1
2
3
4
2
5
10
8
0
7
6
5
(1)计算A与B各对观察值之差,再利用得出得差值计算与。
=1、75,=2、62996
(2)设分别为总体A与总体B得均值,构造得95%得置信区间。
解:小样本,配对样本,总体方差未知,用t统计量
均值=1、75,样本标准差s=2、62996
(2)已知:E=0、1,=0、8,=0、05,=1、96
应抽取得样本量为:=≈62
7.20
(1)构建第一种排队方式等待时间标准差得95%得置信区间。
解:估计统计量
经计算得样本标准差=3、318
置信区间:
=0、95,n=10,==19、02,==2、7
==(0、1075,0、7574)
因此,标准差得置信区间为(0、3279,0、8703)
(3)已知=0、01,=2、58
由于n=100为大样本,所以总体均值得99%得置信区间为:
=812、58*813、096,即(77、94,84、096)
7、5(1)已知=3、5,n=60,=25,=0、05,=1、96
由于总体标准差已知,所以总体均值得95%得置信区间为:
=251、96*250、89,即(24、11,25、89)
7、4(1)已知n=100,=81,s=12, =0、1,=1、645
由于n=100为大样本,所以总体均值得90%得置信区间为:
=811、645*811、974,即(79、026,82、974)
(2)已知=0、05,=1、96
由于n=100为大样本,所以总体均值得95%得置信区间为:
统计学(第四版)课后题答案

者比平均分数高 出 1 个标准差,而在 B 项测试中只高出平均分数 0.5 个标准差,由于 A 项 测试的标准化值高于 B 项测试,所以 A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值 Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。
-15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计 60 (3)直方图(略) 。 2.9 (1)直方图(略) 。 (2)自学考试人员年龄的分布为右偏。 2.10(1)茎叶图如下
A班 数据个数 树 叶 树茎 B班 树叶 数据个数பைடு நூலகம்
0 3 59 2 1 4 4 0448 4 2 97 5 122456677789 12 11 97665332110 6 011234688 9 23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 (2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分 布比 A 班分散, 且平均成绩较 A 班低。 2.11(略) 。 2.12(略) 。 2.13(略) 。 2.14(略) 。 2.15箱线图如下: (特征请读者自己分析)
2 4.1 (1)200。 (2)5。 (3)正态分布。 (4) (100 1) 。
4.2 (1)32。 (2)0.91。 4.3 0.79。 4.4 (1) x 25 ~ N (17,2 2 ) 。 (2) x100 ~ N (17,1) 。 4.5 (1)1.41。 (2)1.41,1.41,1.34。 4.6 (1)0.4。 (2)0.024 。 (3)正态分布。 4.7 (1)0.050,0.035,0.022,016。 (2)当样本量增大时,样本比例的标准 差越来越小。 4.8 (1) (2)E=4.2; (3) (115.8,124.2) 。 x 2.14 ; 4.9 (87819,121301) 。 4.10(1)81±1.97; (2)81±2.35; (3)81±3.10。 4.11(1) (24.11,25.89) ; (2) (113.17,126.03) ; (3) (3.136,3.702) 4.12(1) (8687,9113) ; (2) (8734 ,9066) ; (3) (8761,9039) ; (4) (8682, 9118) 。 4.13(2.88,3.76) ;(2.80,3.84);(2.63,4.01)。 4.14(7.1,12.9) 。 4.15(7.18,11.57) 。 4.16(1) (148.9,150.1) ; (2)中心极限定理。 4.17(1) (100.9,123.7) ; (2) (0.017,0.183) 。 4.18(15.63,16.55) 。 4.19(10.36,16.76) 。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第四章 抽样分布与参数估计7.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3 周的时间里选取 49 名顾客组成了一个简单随机样本。
(1) 假定总体标准差为 15 元,求样本均值的抽样标准误差。
15x=2.143n 49(2) 在 95%的置信水平下,求边际误差。
xt x ,由于是大样本抽样, 因此样本均值服从正态分布,因此概率度 t= z2因此,xtxz2 xz 0.025x =1.96 × 2.143=4.2(3) 如果样本均值为 120 元,求总体均值的 95%的置信区间。
置信区间为:xx , xx= 120 4.2,120 4.2 =( 115.8, 124.2)7.4 从总体中抽取一个n=100 的简单随机样本 ,得到 x =81 , s=12。
要求:22大样本,样本均值服从正态分布:xN,或 xNsn,n置信区间为: xz 2s z 2s ,s=12 =1.2 , xnnn100(1) 构建 的 90%的置信区间。
z 2=z0.05=1.645 ,置信区间为: 81 1.6451.2, 811.6451.2 =( 79.03, 82.97)(2) 构建的 95%的置信区间。
z 2 = z 0.025 =1.96 ,置信区间为: 81 1.961.2, 81 1.96 1.2 =( 78.65,83.35)(3) 构建 的 99%的置信区间。
z 2 = z 0.005 =2.576 ,置信区间为: 81 2.576 1.2, 81 2.576 1.2 =( 77.91, 84.09)7.7 某大学为了解学生每天上网的时间,在全校7 500 名学生中采取重复抽样方法随机抽取36 人,调查他们每天上网的时间,得到下面的数据(单位:小时 ):3.3 3.1 6.2 5.8 2.34.15.4 4.5 3.2 4.4 2.0 5.4 2.66.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.81.54.71.41.22.93.52.40.53.6 2.5求该校大学生平均上网时间的置信区间,置信水平分别为90%, 95%和 99%。
解:(1)样本均值x =3.32 ,样本标准差 s=1.61 ;(2)抽样平均误差:x =s重复抽样:=1.61/6=0.268n nx =N n s N n 1.61750036不重复抽样:N1n N1=75001n36=0.268 ×0.995=0.268 × 0.998=0.267( 3)置信水平下的概率度:1=0.9, t= z2 = z0.05 =1.6451=0.95 , t= z 2 =z0.025=1.961=0.99 , t= z 2 =z0.005=2.576( 4)边际误差(极限误差):x txz2x1=0.9,x t x z 2x =z0.05x重复抽样:xz2x = z0.05x =1.645 × 0.268=0.441不重复抽样:x z2x=z0.05x =1.645 ×0.267=0.4391=0.95 ,x t x z2x=z0.025x重复抽样:x z2x=z0.025x =1.96 ×0.268=0.525不重复抽样:x z2x=z0.025x=1.96 × 0.267=0.5231=0.99 ,x t x z2x =z0.005x重复抽样:x z2x=z0.005x =2.576 ×0.268=0.69不重复抽样:x z2x=z 0.005x=2.576 × 0.267=0.688( 5)置信区间:x x , x x1=0.9,重复抽样: x x , x x = 3.32 0.441, 3.32 0.441 =( 2.88, 3.76)不重复抽样:x x, x x= 3.320.439, 3.320.439 =( 2.88, 3.76 )1=0.95 ,重复抽样:x x , x x= 3.320.525, 3.320.525 =( 2.79, 3.85)不重复抽样:x x, x x= 3.320.441, 3.320.441 =(2.80 ,3.84 )1=0.99 ,重复抽样:x x , x x= 3.320.69, 3.320.69=( 2.63, 4.01)不重复抽样:x x, x x= 3.320.688, 3.320.688 =( 2.63, 4.01 )7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16 个人组成的一个随机样本,他们到单位的距离(单位: km) 分别是:103148691211751015916132假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:小样本,总体方差未知,用t 统计量t xt n1 sn均值 =9.375 ,样本标准差 s=4.11置信区间:x t 2 n 1st 2 n 1s , xn n1=0.95 , n=16, t2n 1= t0.02515=2.13t 2 n 1st 2 n 1sx, xnn=9.375 2.134.11, 9.375 2.134.1116=( 7.18, 11.57)167.11某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。
现从某天生产的一批产品中按重复抽样随机抽取50 包进行检查,测得每包重量(单位: g) 如下:每包重量( g)包数96~98298~1003100~10234102~1047104~1064合计50已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量的 95%的置信区间。
解:大样本,总体方差未知,用z 统计量z xN 0,1 sn样本均值 =101.4 ,样本标准差s=1.829置信区间:z 2s sx, x z2nn1=0.95 ,z2=z0.025=1.96x z 2szs , x2n n= 101.4 1.961.829,101.41.961.829,101.91 )=( 100.895050(2) 如果规定食品重量低于l00g 属于不合格,确定该批食品合格率的95%的置信区间。
解:总体比率的估计大样本,总体方差未知,用z 统计量zpN0,1 p 1 pn样本比率 =( 50-5 ) /50=0.9置信区间:p zp1p, p zp1p2n2n1=0.95 ,z2=z0.025=1.96p zp1p, p zp1p2n2n= 0.9 1.960.910.9, 0.9 1.960.910.9=( 0.8168, 0.9832)50507.13一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18 个员工。
得到他们每周加班的时间数据如下(单位:小时 ):62117207081629 381211921251516假定员工每周加班的时间服从正态分布。
估计网络公司员工平均每周加班时间的90%的置信区间。
解:小样本,总体方差未知,用t 统计量t x1t nsn均值 =13.56 ,样本标准差 s=7.801置信区间:t 2 n 1s sx, x t 2 n 1n n1=0.90 , n=18, t 2n 1 = t 0.05 17=1.7369x t 2 n 1s s , x t 2 n 1n n= 13.56 1.73697.801,13.56 1.73697.801)=( 10.36,16.75 18187.15在一项家电市场调查中.随机抽取了电视机。
其中拥有该品牌电视机的家庭占为 90%和 95%。
解:总体比率的估计200 个居民户,调查他们是否拥有某一品牌的23%。
求总体比例的置信区间,置信水平分别大样本,总体方差未知,用z 统计量pN 0,1zp 1pn样本比率 =0.23置信区间:p1p p 1pp z2n , p z2n1=0.90 ,z2=z0.025=1.645p zp1 p, pp1p2nz 2n=0.23 1.6450.2310.230.2310.23, 0.23 1.645200 200=(0.1811, 0.2789)1=0.95 ,z2=z0.025=1.96p 1pp 1ppz2, pz 2nn= 0.231.960.23 10.23,0.230.23 10.232001.96200 = ( 0.1717 ,0.2883 )7.20顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。
为此,某银行准备采取两 种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队 方式是:顾客在三个业务窗口处列队三排等待。
为比较哪种排队方式使顾客等待的时间 更短,银行各随机抽取10 名顾客,他们在办理业务时所等待的时间 ( 单位:分钟 )如下:方式 16.5 6.6 6.7 6.87.1 7.3 7.4 7.7 7.7 7.7方式 24.25.45.86.26.77.77.78.59.310要求:(1) 构建第一种排队方式等待时间标准差的 95%的置信区间。
解:估计统计量n 1 S2~22n 1经计算得样本标准差 s 22 =3.318置信区间:n 1 S 2n221 S2 n 12 2n1211=0.95 , n=10,2 n 1 = 2 9 =19.02 ,2 2 n 1 =2 9 =2.72 0.02510.975n1S 2n1 S 29 0.22729 0.2272 =(0.1075, 0.7574 )22n, 2 n 1=19.02,1122.7因此,标准差的置信区间为( 0.3279, 0.8703)(2) 构建第二种排队方式等待时间标准差的 95%的置信区间。
解:估计统计量n 1 2S22~ n 1经计算得样本标准差 s 12 =0.2272置信区间:n2n 21 S 21 S2n 12 2 n 1211=0.95 , n=10,2 n 1 = 2 =19.02 ,2 n2=2.720.0259121 =0.9759n1 2n 29 3.318 9 3.318S1 S =( 1.57 , 11.06)22n ,2 n1=,2.71 1219.02因此,标准差的置信区间为( 1.25, 3.33)(3) 根据 (1) 和(2) 的结果,你认为哪种排队方式更好?第一种方式好,标准差小!7.23 下表是由 4 对观察值组成的随机样本。
配对号 来自总体 A 的样本 来自总体 B 的样本1 2 0 2 5 7 3 10 6 485(1) 计算 A 与 B 各对观察值之差,再利用得出的差值计算d 和 s d 。