统计学第四版第七章课后题最全答案
统计学贾俊平第四版第七章课后答案目前最全

7.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。
(1) 样本均值的抽样标准差x σ等于多少?(2) 在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σ=n σ=405=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =nα/2σZ =1.96×0.7906=1.5496。
7.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
x nσ=49==2.143 (2)在95%的置信水平下,求边际误差。
x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。
置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2) 7.37.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。
要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:2x z x z n n αα⎛-+ ⎝n 100=1.2 (1)构建μ的90%的置信区间。
2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。
2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。
统计学课后习题答案(第四版)贾俊平(第4、5、7、10章)

《统计学》第四版 第四章练习题答案众数:M o =1O;中位数:中位数位置=n+1/2=5.5 , M e =10 ;平均数:(2) Q L 位置=n/4=2.5, Q L =4+7/2=5.5 ; Q u 位置=3n/4=7.5 , Q u =12(4) 4.2 和 M O =23。
将原始数据排序后,计算中位数的位置为:中位数位置=n+1/2=13,第13个位置上的数值为23,所以中位数为 M e =23(2)Q L 位置=n/4=6.25, Q L ==19 ; Q u 位置=3n/4=18.75,Q u =26.5茎 叶 频数 5 5 1 6 6 7 8 3 71 3 4 8 85(3)第一种排队方式: 离散程度大于第二种排队方式。
(4 )选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方 式。
_ Z X i4.4 ( 1)X8223/30=274.14.1 ( 1 ) 二X i X =n96.9,6 102' (X i-X ) _156.4 42n -1, 9由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
(1)从表中数据可以看出,年龄出现频数最多的是 19和23,故有个众数,即 M O =19(3)⑶平均数-A =600/25=24,标准差—(XLX)\ n —1210626.6525-1n(4) 偏态系数SK=1.08,峰态系数K=0.77(5) 分析:从众数、中位数和平均数来看,网民年龄在 23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数 1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
(1)茎叶图如下: 大于 4.3 —2'(X 一 X ) 4.080.714nn -1■ 8由于两种排队方式的平均数不同,所以用离散系数进行比较。
(2) X 二一^ =63/9=7, S = ■■n中位数位置=n+1/2=15.5 , M e=272+273/2=272.5(2) Q L位置=n/4=7.5, Q L==(258+261)/2=259.5 ; Q u 位置=3n/4=22.5 , Q u=(284+291)/2=287.5' (^-X ^ /3002-7 = 21.17 I n —1 \ 30—12100 +3000 +15004.5 (1)甲企业的平均成本=总成本/总产量=-2100 3000---- + ----- 15 20乙企业的平均成本=总成本/总产量=3255150015006255=18.293255 1500 1500 342____ + _____ + _____152030原因:尽管两个企业的单位成本相同, 但单位成本较低的产品在乙企业的产量中所占比重较 大,因此拉低了总平均成本。
统计学原理 第七章课后习题及答案

第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)21.2 2(3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
应用统计学(第四版) 第7章案例题目及答案

应用统计学(第四版)第7章案例题目及答案案例分析题一个纺织品制造商收到一个很大的用于制作制服的衣料订单,这些衣料由4条不同的染色流水线进行染色,每条流水线每天生产的衣料数量大致相同。
通常,如果订单数量不是很大,只会用到一条流水线来完成订单,因为这样衣料的图案亮度会控制得较好,而不同流水线染色的图案亮度总会有些差异。
但是这个订单很大,要同时用到4条流水线,这时候需要通过使所有生产的衣料的图案亮度的方差最小化来尽可能使图案保持一致。
最近,顾客抱怨图案亮度的差异太大了。
因此决定对4条流水线生产的衣料图案亮度进行方差分析检验。
从每条流水线随机抽取样本并测量亮度,测量值在0~100之间,数据如下表所示。
要求:(1) 在 =0.05的显著性水平下进行检验并给出你的结论。
(2) 哪两条流水线染色的衣料的平均亮度有明显的不同?(3) 在生产过程中停止某一流水线进行亮度调整的成本很高,如果只能将一条流水线停下来调整,应该调整哪一条呢?应该将其调整到多少亮度值才能使所染色的衣料的图案尽可能保持一致?答案P207四、案例分析因F=10.590967> F crit=2.7826004或P-value=1.526E-05<α=0.05,拒绝原假设H0,即不同流水线对衣料图案的亮度有显著影响。
(2)利用Fisher最小显著差异(LSD)方法进行多重比较,可判断哪些均值间有显著差异。
t分布的自由度为n-k=56-4=52,所以/20.025(52)t tα==2.0066,MSE=6.2109,有关样本均值差的绝对值及相应的LSD计算结果如下表所示:判断:若均值差绝对值大于相应的LSD就拒绝H0,表明它们之间衣料平均亮度有显著差异;否则不拒绝H0,不能认为它们之间有显著差异。
因此,根据上表计算结果判断如下:流水线1和2,流水线1和3,流水线2和4,流水线3和4它们之间衣料的图案的平均亮度有明显的不同。
(3)我们把各样本均值与样本总均值进行比较,从中找出偏离样本总均值最大者,则停止该流水线并将其图案亮度调整到样本总均值,能够使所染色衣料的图案亮度尽可能保持一致。
第四版统计学课后习题答案

第四版统计学课后习题答案《统计学》第四版统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学贾俊平_第四版课后习题答案第七章

7.11 (1) 解:已知n=50,1a -=0.9522,ss x z xz nn a aæö-×+×ç÷èø=81.822981.8229101.491.966,101.491.9665050æö-´+´ç÷èø= (100.89,101.91)(2)解:已知n=50,1a -=0.95,2z a =00.0225z =1.96,样本比率p=(50-5)/50=0.9 则食品合格率的95%的置信区间:()()2211,p p p p p zp z nna aæö--ç÷-×+×ç÷èø=()()0.910.90.910.90.9 1.91.966,0.9 1.91.9665050æö---´+´ç÷èø=(0.8168,0.9832)7.22 (1)由题知,该题为大样本,方差已知,则有21m m -的95%的置信区间为:176.12100201001696.1)2325()(2221212/21±=+´±-=+±-n s n s z x x a即(0.824,3.176)(2m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n ntxxpa 即(—2.64,6.64) (3)由题知,该题为小样本,方差不同, 则有21m m -的95%的置信区间为:()()64.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.64,6.64) (4)由题知,该题为小样本,样本量不等,方差相等,则合并估计量为()()713128524211212222112==-+-+-=n n s n s n s p 则有21m m -的95%的置信区间为:()()02.42112212212/21±=÷÷øöççèæ+-+±-n n s n n tx x p a 即(—2.02,6.02) ,2z a =00.0225z =1.96。
统计学原理 第七章课后习题及答案
第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。
(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。
(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。
(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。
(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。
(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。
(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。
(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。
(1)21.2 2(3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。
(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。
(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。
统计学第四版第七章课后题最全答案
配对号
来自总体A得样本
来自总体B得样本
1
2
3
4
2
5
10
8
0
7
6
5
(1)计算A与B各对观察值之差,再利用得出得差值计算与。
=1、75,=2、62996
(2)设分别为总体A与总体B得均值,构造得95%得置信区间。
解:小样本,配对样本,总体方差未知,用t统计量
均值=1、75,样本标准差s=2、62996
(2)已知:E=0、1,=0、8,=0、05,=1、96
应抽取得样本量为:=≈62
7.20
(1)构建第一种排队方式等待时间标准差得95%得置信区间。
解:估计统计量
经计算得样本标准差=3、318
置信区间:
=0、95,n=10,==19、02,==2、7
==(0、1075,0、7574)
因此,标准差得置信区间为(0、3279,0、8703)
(3)已知=0、01,=2、58
由于n=100为大样本,所以总体均值得99%得置信区间为:
=812、58*813、096,即(77、94,84、096)
7、5(1)已知=3、5,n=60,=25,=0、05,=1、96
由于总体标准差已知,所以总体均值得95%得置信区间为:
=251、96*250、89,即(24、11,25、89)
7、4(1)已知n=100,=81,s=12, =0、1,=1、645
由于n=100为大样本,所以总体均值得90%得置信区间为:
=811、645*811、974,即(79、026,82、974)
(2)已知=0、05,=1、96
由于n=100为大样本,所以总体均值得95%得置信区间为:
统计学(第四版)课后题答案
者比平均分数高 出 1 个标准差,而在 B 项测试中只高出平均分数 0.5 个标准差,由于 A 项 测试的标准化值高于 B 项测试,所以 A 项测试比较理想。 3.10 通过标准化值来判断,各天的标准化值如下表 日期 周一 周二 周三 周四 周五 周六 周日 标准化值 Z 3 -0.6 -0.2 0.4 -1.8 -2.2 0 周一和周六两天失去了控制。
-15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计 60 (3)直方图(略) 。 2.9 (1)直方图(略) 。 (2)自学考试人员年龄的分布为右偏。 2.10(1)茎叶图如下
A班 数据个数 树 叶 树茎 B班 树叶 数据个数பைடு நூலகம்
0 3 59 2 1 4 4 0448 4 2 97 5 122456677789 12 11 97665332110 6 011234688 9 23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6 0 10 000 3 (2)A 班考试成绩的分布比较集中,且平均分数较高;B 班考试成绩的分 布比 A 班分散, 且平均成绩较 A 班低。 2.11(略) 。 2.12(略) 。 2.13(略) 。 2.14(略) 。 2.15箱线图如下: (特征请读者自己分析)
2 4.1 (1)200。 (2)5。 (3)正态分布。 (4) (100 1) 。
4.2 (1)32。 (2)0.91。 4.3 0.79。 4.4 (1) x 25 ~ N (17,2 2 ) 。 (2) x100 ~ N (17,1) 。 4.5 (1)1.41。 (2)1.41,1.41,1.34。 4.6 (1)0.4。 (2)0.024 。 (3)正态分布。 4.7 (1)0.050,0.035,0.022,016。 (2)当样本量增大时,样本比例的标准 差越来越小。 4.8 (1) (2)E=4.2; (3) (115.8,124.2) 。 x 2.14 ; 4.9 (87819,121301) 。 4.10(1)81±1.97; (2)81±2.35; (3)81±3.10。 4.11(1) (24.11,25.89) ; (2) (113.17,126.03) ; (3) (3.136,3.702) 4.12(1) (8687,9113) ; (2) (8734 ,9066) ; (3) (8761,9039) ; (4) (8682, 9118) 。 4.13(2.88,3.76) ;(2.80,3.84);(2.63,4.01)。 4.14(7.1,12.9) 。 4.15(7.18,11.57) 。 4.16(1) (148.9,150.1) ; (2)中心极限定理。 4.17(1) (100.9,123.7) ; (2) (0.017,0.183) 。 4.18(15.63,16.55) 。 4.19(10.36,16.76) 。
统计学(贾俊平四版)七练习题详细答案
第七章 练习题参考答案7.1 (1)已知σ=5,n=40,x =25,α=0.05,z205.0=1.96样本均值的抽样标准差σx=nσ=79.0405=(2)估计误差(也称为边际误差)E=z 2αnσ=1.96*0.79=1.557.2(1)已知σ=15,n=49,x =120,α=0.05,z205.0=1.96(2)样本均值的抽样标准差σx=nσ==4915 2.14估计误差E=z 2αnσ=1.96*=4915 4.2(3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=120±1.96*2.14=120±4.2,即(115.8,124.2)7.3(1)已知σ=85414,n=100,x =104560,α=0.05,z205.0=1.96由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=104560±1.96*=10085414104560±16741.144即(87818.856,121301.144)7.4(1)已知n=100,x =81,s=12,α=0.1,z 21.0=1.645由于n=100为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=81±1.645*=1001281±1.974,即(79.026,82.974)(2)已知α=0.05,z205.0=1.96由于n=100为大样本,所以总体均值μ的95%的置信区间为:ns x z 2α±=81±1.96*=1001281±2.352,即(78.648,83.352)(3)已知α=0.01,z201.0=2.58由于n=100为大样本,所以总体均值μ的99%的置信区间为:ns x z 2α±=81±2.58*=1001281±3.096,即(77.94,84.096)7.5(1)已知σ=3.5,n=60,x =25,α=0.05,z205.0=1.96由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=25±1.96*=60.5325±0.89,即(24.11,25.89)(2)已知n=75,x =119.6,s=23.89,α=0.02,z 202.0=2.33由于n=75为大样本,所以总体均值μ的98%的置信区间为:ns x z 2α±=119.6±2.33*=759.823119.6±6.43,即(113.17,126.03)(3)已知x =3.419,s=0.974,n=32,α=0.1,z21.0=1.645由于n=32为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=3.419±1.645*=3274.90 3.419±0.283,即(3.136,3.702)7.6(1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=0.05,z205.0=1.96由于总体服从正态分布,所以总体均值μ的95%的置信区间为:nx z σα2±=8900±1.96*=155008900±253.03,即(8646.97,9153.03)(2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=0.05,z205.0=1.96虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为:nx z σα2±=8900±1.96*=355008900±165.65,即(8734.35,9065.65)(3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500,α=0.1,z 21.0=1.645虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=8900±1.645*=355008900±139.03,即(8760.97,9039.03)(4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500,α=0.01,z 01.0=2.58虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间为:ns x z 2α±=8900±2.58*=355008900±218.05,即(8681.95,9118.05)7.7 已知:n=36,当α=0.1,0.05,0.01时,相应的z21.0=1.645,z205.0=1.96,z201.0=2.58根据样本数据计算得:x =3.32,s=1.61由于n=36为大样本,所以平均上网时间的90%置信区间为:ns x z 2α±=3.32±1.645*=361.61 3.32±0.44,即(2.88,3.76)平均上网时间的95%置信区间为:ns x z 2α±=3.32±1.96*=361.61 3.32±0.53,即(2.79,3.85)平均上网时间的99%置信区间为:ns x z 2α±=3.32±2.58*=361.61 3.32±0.69,即(2.63,4.01)7.8 已知:总体服从正态分布,但σ未知,n=8为小样本,α=0.05,)(18t05.0-=2.365根据样本数据计算得:x =10,s=3.46 总体均值μ的95%的置信区间为:ns x t α±=10±2.365*=83.4610±2.89,即(7.11,12.89)7.9 已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,)(116t205.0-=2.131根据样本数据计算得:x =9.375,s=4.113从家里到单位平均距离的95%的置信区间为:ns x t α±=9.375±2.131*=144.1139.375±2.191,即(7.18,11.57)7.10 (1)已知:n=36,x =149.5,α=0.05,z205.0=1.96由于n=36为大样本,所以零件平均长度的95%的置信区间为:ns x z 2α±=149.5±1.96*=361.93149.5±0.63,即(148.87,150.13)(2)在上面的估计中,使用了统计中的中心极限定理。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第七章 练习题参考答案(1)已知σ=5,n=40,x =25,α=,z205.0=样本均值的抽样标准差σx=nσ=79.0405= (2)估计误差(也称为边际误差)E=z 2αnσ=*= (1)已知σ=15,n=49,x =120,α=,z205.0=(2)样本均值的抽样标准差σx=nσ==4915估计误差E=z 2αnσ=*=4915(3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα2±=±*=±,即(,)(1)已知σ=85414,n=100,x =104560,α=,z205.0=:由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα2±=±*=10085414±.144即(,)(1)已知n=100,x =81,s=12, α=,z21.0=由于n=100为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=±*=10012±,即(,)(2)已知α=,z205.0=由于n=100为大样本,所以总体均值μ的95%的置信区间为:ns x z 2α±=±*=10012±,即(,)(3)已知α=,z201.0=由于n=100为大样本,所以总体均值μ的99%的置信区间为:…nz 2α±=±*=100±,即(,)(1)已知σ=,n=60,x =25,α=,z205.0=由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα2±=±*=60.53±,即(,)(2)已知n=75,x =,s=, α=,z202.0=由于n=75为大样本,所以总体均值μ的98%的置信区间为:ns x z 2α±=±=759.823±,即(,)(3)已知x =,s=,n=32,α=,z21.0=由于n=32为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=±=3274.90±,即(,)~(1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=,z205.0=由于总体服从正态分布,所以总体均值μ的95%的置信区间为:nx z σα2±=±*=15500±,即(,)(2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=,z05.0=虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为:nx z σα2±=±*=35500±,即(,)(3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=,z21.0=虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=±*=35500±,即(,)(4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=,z201.0=#虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间为:nz 2α±=±*=35±,即(,)已知:n=36,当α=,,时,相应的z21.0=,z05.0=,z201.0=根据样本数据计算得:x =,s=由于n=36为大样本,所以平均上网时间的90%置信区间为:ns x z 2α±=±=361.61±,即(,)平均上网时间的95%置信区间为:ns x z 2α±=±=361.61±,即(,)平均上网时间的99%置信区间为:ns x z 2α±=±=361.61±,即(,):已知:总体服从正态分布,但σ未知,n=8为小样本,α=,)(18t205.0-= 根据样本数据计算得:x =10,s= 总体均值μ的95%的置信区间为:ns x t 2α±=±*=83.46±,即(,)已知:总体服从正态分布,但σ未知,n=16为小样本,α=,)(116t205.0-= 根据样本数据计算得:x =,s=从家里到单位平均距离的95%的置信区间为:ns x t 2α±=±=144.113±即(,)(1)已知:n=36,x =,α=,z205.0=由于n=36为大样本,所以零件平均长度的95%的置信区间为:$ns x z 2α±=±=361.93±即(,)(2)在上面的估计中,使用了统计中的中心极限定理。
该定理表明:从均值为μ、方差为σ2的总体中,抽取了容量为n 的随机样本,当n 充分大时(通常要求30n ≥),样本均值的抽样分布近似服从均值为μ,方差为nσ2的正态分布。
(1)已知:总体服从正态分布,但σ未知,n=25为小样本,α=,)125(201.0-t=根据样本数据计算得:x =,s= 总体均值μ的99%的置信区间为:ns x t 2α±=±=250.871±即(,)已知:总体服从正态分布,但σ未知,n=18为小样本,α=,)118(21.0-t=根据样本数据计算得:x =,s=网络公司员工平均每周加班时间的90%的置信区间为:ns x t 2α±=±=187.8±即(,)¥(1)已知:n=44,p=,α=,z201.0=总体比例π的99%的置信区间为:n p p )1(p z 2-±α=±44)51.01(51.0-±,即(,)(2)已知:n=300,p=,α=,z205.0=总体比例π的95%的置信区间为:n p p )1(p z 2-±α=±300)82.01(82.0-±,即(,)(3)已知:n=1150,p=,α=,,z21.0=总体比例π的90%的置信区间为:n p p )1(p z 2-±α=±1150)48.01(48.0-±,即(,)已知:n=200,p=,α为和时,相应的z1.0=,z205.0=.总体比例π的90%的置信区间为:n p p )1(p z 2-±α=±200)23.01(23.0-±,即(,)总体比例π的95%的置信区间为:n p p )1(p z 2-±α=±200)23.01(23.0-±,即(,)已知:σ=1000,估计误差E=200,α=,z201.0=应抽取的样本量为:Ez 222)(2n σα==200100058.2222⨯=167(1)已知:E=,π=,α=,z204.0=应抽取的样本量为:Ez 2212n )()(ππα-==2.0005.222.401.40)(-⨯⨯=2522(2)已知:E=,π未知,α=,z205.0=>由于π未知,可以使用(因为对于服从二项分布的随机变量,当π取时,其方差达到最大值。
因此,在无法得到总体比例的值时,可以用代替计算。
这样得出的必要样本容量虽然可能比实际需要的容量大一些,但可以充分保证有足够高的置信水平和尽可能小的置信区间)故应抽取的样本量为:Ez 2212n )()(ππα-==4.006.9122.501.50)(-⨯⨯=601(3)已知:E=,π=,α=,z21.0=应抽取的样本量为:Ez 2212n )()(ππα-==.050.645122.5501.550)(-⨯⨯=268(1)已知:n=50,p=32/50=,α=,z205.0=总体中赞成该项改革的户数比例的95%的置信区间为:n p p )1(p z 2-±α=±50)64.01(64.0-±,即(,)(2)已知:E=,π=,α=,z205.0=应抽取的样本量为:Ez 2212n )()(ππα-==.10.96122.801.80)(-⨯⨯≈62—7.20(1)构建第一种排队方式等待时间标准差的95%的置信区间。
解:估计统计量()()2221~1n S n χσ-- 经计算得样本标准差22s = 置信区间:()()()()222222121111n S n S n n αασχχ---≤≤--1α-=,n=10,()21n αχ-=()20.0259χ=,()2121n αχ--=()20.9759χ=()()()()222221211,11n S n S n n ααχχ-⎛⎫-- ⎪ ⎪--⎝⎭=90.227290.2272,19.02 2.7⨯⨯⎛⎫ ⎪⎝⎭=(,) 因此,标准差的置信区间为(,)、(2)构建第二种排队方式等待时间标准差的95%的置信区间。
解:估计统计量()()2221~1n S n χσ-- 经计算得样本标准差21s = 置信区间:()()()()222222121111n S n S n n αασχχ---≤≤--1α-=,n=10,()21n αχ-=()20.0259χ=,()2121n αχ--=()20.9759χ=()()()()222221211,11n S n S n n ααχχ-⎛⎫-- ⎪ ⎪--⎝⎭=9 3.3189 3.318,19.022.7⨯⨯⎛⎫ ⎪⎝⎭=(,) 因此,标准差的置信区间为(,)(3)根据(1)和(2)的结果,你认为哪种排队方式更好 -第一种方式好,标准差小!(1)计算A 与B 各对观察值之差,再利用得出的差值计算d 和d s 。
d =,d s =-(2)设12μμ和分别为总体A 和总体B 的均值,构造12d μμμ=-的95%的置信区间。
解:小样本,配对样本,总体方差未知,用t 统计量d d t =()1t n -均值=,样本标准差s= 置信区间:()()2211d t n d t n αα⎛--+-⎝1α-=,n=4,()21t n α-=()0.0253t =()()2211d t n d t n αα⎛--+- ⎝=1.75 3.182 3.182⎛-+ ⎝=(,)!7.25 从两个总体中各抽取一个12n n ==250的独立随机样本,来自总体1的样本比例为1p =40%,来自总体2的样本比例为2p =30%。
要求: (1)构造12ππ-的90%的置信区间。
(2)构造12ππ-的95%的置信区间。
解:总体比率差的估计大样本,总体方差未知,用z 统计量p p z ---=()0,1N样本比率p1=,p2=置信区间:122122p p z p p z αα⎛ ---+ ⎝1α-=,2z α=0.025z =,122122p p z p p z αα⎛ ---+⎝=0.1 1.645 1.645⎛ -+ ⎝ =(%,%)1α-=,2z α=0.025z =122122p p z p p z αα⎛ ---+⎝=0.1 1.96 1.96⎛ -+ ⎝ =(%,%)要求:构造两个总体方差比21σ/22σ的95%的置信区间。