统计学第四版第七章课后题最全答案

合集下载

《统计学》-第7章-习题答案

《统计学》-第7章-习题答案

第七章思考与练习参考答案1.答:函数关系是两变量之间的确定性关系,即当一个变量取一定数值时,另一个变量有确定值与之相对应;而相关关系表示的是两变量之间的一种不确定性关系,具体表示为当一个变量取一定数值时,与之相对应的另一变量的数值虽然不确定,但它仍按某种规律在一定的范围内变化。

2.答:相关和回归都是研究现象及变量之间相互关系的方法。

相关分析研究变量之间相关的方向和相关的程度,但不能确定变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况;回归分析则可以找到研究变量之间相互关系的具体形式,并可变量之间的数量联系进行测定,确定一个回归方程,并根据这个回归方程从已知量推测未知量。

3.答:单相关系数是度量两个变量之间线性相关程度的指标,其计算公式为:总体相关系数,样本相关系数。

复相关系数是多元线性回归分析中度量因变量与其它多个自变量之间的线性相关程度的指标,它是方程的判定系数2R 的正的平方根。

偏相关系数是多元线性回归分析中度量在其它变量不变的情况下两个变量之间真实相关程度的指标,它反映了在消除其他变量影响的条件下两个变量之间的线性相关程度。

4.答:回归模型假定总体上因变量Y 与自变量X 之间存在着近似的线性函数关系,可表示为t t t u X Y ++=10ββ,这就是总体回归函数,其中u t 是随机误差项,可以反映未考虑的其他各种因素对Y 的影响。

根据样本数据拟合的方程,就是样本回归函数,以一元线性回归模型的样本回归函数为例可表示为:tt X Y 10ˆˆˆββ+=。

总体回归函数事实上是未知的,需要利用样本的信息对其进行估计,样本回归函数是对总体回归函数的近似反映。

两者的区别主要包括:第一,总体回归直线是未知的,它只有一条;而样本回归直线则是根据样本数据拟合的,每抽取一组样本,便可以拟合一条样本回归直线。

第二,总体回归函数中的0β和1β是未知的参数,表现为常数;而样本回归直线中的0ˆβ和1ˆβ是随机变量,其具体数值随所抽取的样本观测值不同而变动。

统计学贾俊平第四版第七章课后答案目前最全

统计学贾俊平第四版第七章课后答案目前最全

7.1从一个标准差为5的总体中抽出一个容量为40的样本,样本均值为25。

(1) 样本均值的抽样标准差x σ等于多少?(2) 在95%的置信水平下,允许误差是多少?解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差x σ=n σ=405=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =nα/2σZ =1.96×0.7906=1.5496。

7.2 某快餐店想要估计每位顾客午餐的平均花费金额。

在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1)假定总体标准差为15元,求样本均值的抽样标准误差。

x nσ=49==2.143 (2)在95%的置信水平下,求边际误差。

x x t σ∆=⋅,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=2z α 因此,x x t σ∆=⋅2x z ασ=⋅0.025x z σ=⋅=1.96×2.143=4.2 (3)如果样本均值为120元,求总体均值 的95%的置信区间。

置信区间为:(),x x x x -∆+∆=()120 4.2,120 4.2-+=(115.8,124.2) 7.37.4 从总体中抽取一个n=100的简单随机样本,得到x =81,s=12。

要求:大样本,样本均值服从正态分布:2,xN n σμ⎛⎫ ⎪⎝⎭或2,s xN n μ⎛⎫⎪⎝⎭置信区间为:2x z x z n n αα⎛-+ ⎝n 100=1.2 (1)构建μ的90%的置信区间。

2z α=0.05z =1.645,置信区间为:()81 1.645 1.2,81 1.645 1.2-⨯+⨯=(79.03,82.97)(2)构建μ的95%的置信区间。

2z α=0.025z =1.96,置信区间为:()81 1.96 1.2,81 1.96 1.2-⨯+⨯=(78.65,83.35)(3)构建μ的99%的置信区间。

应用统计学(第四版) 第7章案例题目及答案

应用统计学(第四版)  第7章案例题目及答案

应用统计学(第四版)第7章案例题目及答案案例分析题一个纺织品制造商收到一个很大的用于制作制服的衣料订单,这些衣料由4条不同的染色流水线进行染色,每条流水线每天生产的衣料数量大致相同。

通常,如果订单数量不是很大,只会用到一条流水线来完成订单,因为这样衣料的图案亮度会控制得较好,而不同流水线染色的图案亮度总会有些差异。

但是这个订单很大,要同时用到4条流水线,这时候需要通过使所有生产的衣料的图案亮度的方差最小化来尽可能使图案保持一致。

最近,顾客抱怨图案亮度的差异太大了。

因此决定对4条流水线生产的衣料图案亮度进行方差分析检验。

从每条流水线随机抽取样本并测量亮度,测量值在0~100之间,数据如下表所示。

要求:(1) 在 =0.05的显著性水平下进行检验并给出你的结论。

(2) 哪两条流水线染色的衣料的平均亮度有明显的不同?(3) 在生产过程中停止某一流水线进行亮度调整的成本很高,如果只能将一条流水线停下来调整,应该调整哪一条呢?应该将其调整到多少亮度值才能使所染色的衣料的图案尽可能保持一致?答案P207四、案例分析因F=10.590967> F crit=2.7826004或P-value=1.526E-05<α=0.05,拒绝原假设H0,即不同流水线对衣料图案的亮度有显著影响。

(2)利用Fisher最小显著差异(LSD)方法进行多重比较,可判断哪些均值间有显著差异。

t分布的自由度为n-k=56-4=52,所以/20.025(52)t tα==2.0066,MSE=6.2109,有关样本均值差的绝对值及相应的LSD计算结果如下表所示:判断:若均值差绝对值大于相应的LSD就拒绝H0,表明它们之间衣料平均亮度有显著差异;否则不拒绝H0,不能认为它们之间有显著差异。

因此,根据上表计算结果判断如下:流水线1和2,流水线1和3,流水线2和4,流水线3和4它们之间衣料的图案的平均亮度有明显的不同。

(3)我们把各样本均值与样本总均值进行比较,从中找出偏离样本总均值最大者,则停止该流水线并将其图案亮度调整到样本总均值,能够使所染色衣料的图案亮度尽可能保持一致。

统计学7-10章课后作业答案

统计学7-10章课后作业答案

第7章 相关与回归分析1、设销售收入x 为自变量,销售成本y 为因变量。

现已根据某百货公司某年12个月的有关资料计算出以下数据(单位:万元):2()425053.73ix x -=∑ 647.88x =2()262855.25iy y -=∑549.8y =()()334229.09iix x y y --=∑(1)拟合简单线性回归方程,并对方程中回归系数的经济意义作出解释。

(2)计算可决系数和回归估计的标准误差。

(3)对回归系数进行显著性水平为5%的显著性检验。

(4)假定下年一月销售收入为800万元,利用拟合的回归方程预测销售成本,并给出置信度为95%的预测区间。

解:(1)定性分析可知,销售收入影响销售成本,以销售收入为自变量,销售成本为因变量拟合线性回归方程i i i y x u αβ=++,采用最小二乘法估计回归参数得:22()()(,)334229.09ˆ0.7863()425053.73ii xix x y y Cov x y x x βσ--===≈-∑∑ˆˆ549.80.7863647.8840.372y x αβ=-=-⨯= 因此,拟合的回归方程为:ˆˆˆ40.3720.7863i i iy x x αβ=+=+ 其中,回归系数β表示自变量每变动一个单位,因变量的平均变量幅度。

在此,表示销售收入每增加1万元,销售成本平均增加0.7863万元。

(2)可决系数22222[()()]334229.090.9998()()425053.73262855.25i i i i x x y y SSR R SST x x y y --===≈-⋅-⨯∑∑∑ (本问接下来的计算不做要求:为计算回归系数的标准误差,根据离差平方和分解,可知:2222222[()()]ˆˆˆˆˆˆ()[()()]()()334229.09262811.68425053.73i i i iiix x y y SSR y y x x x x x x αβαββ--=-=+-+=-=-==∑∑∑∑∑22ˆ()()262855.25262811.6843.57i i SSE SST SSR y y yy =-=---=-=∑∑因此有ˆ()0.0032S β===≈) (3)陈述假设:01:0 :0H H ββ=≠在原假设成立的前提下,构造t 检验统计量245.598t ===在5%的双侧检验显著性水平下,查自由度为10的t 分布表,得临界值0.025(10) 2.228t t =<,因此拒绝原假设。

统计学课后习题答案_(第四版)4.5.7.8章

统计学课后习题答案_(第四版)4.5.7.8章

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。

由于峰态系数为正值,所以为尖峰分布。

4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

第四版统计学课后习题答案

第四版统计学课后习题答案

第四版统计学课后习题答案《统计学》第四版统计课后思考题答案第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计学课后习题答案第七章相关分析与回归分析

统计学课后习题答案第七章相关分析与回归分析

统计学课后习题答案第七章相关分析与回归分析第七章相关分析与回归分析⼀、单项选择题1、相关分析就是研究变量之间得A、数量关系B、变动关系C、因果关系D、相互关系得密切程度2、在相关分析中要求相关得两个变量A、都就是随机变量B、⾃变量就是随机变量C、都不就是随机变量D、因变量就是随机变量3、下列现象之间得关系哪⼀个属于相关关系?A、播种量与粮⾷收获量之间关系B、圆半径与圆周长之间关系C、圆半径与圆⾯积之间关系D、单位产品成本与总成本之间关系4、正相关得特点就是A、两个变量之间得变化⽅向相反B、两个变量⼀增⼀减C、两个变量之间得变化⽅向⼀致D、两个变量⼀减⼀增5、相关关系得主要特点就是两个变量之间A、存在着确定得依存关系B、存在着不完全确定得关系C、存在着严重得依存关系D、存在着严格得对应关系6、当⾃变量变化时, 因变量也相应地随之等量变化,则两个变量之间存在着A、直线相关关系B、负相关关系C、曲线相关关系在着A、正相关关系B、直线相关关系C、负相关关系D、曲线相关关系8、当变量X值增加时,变量Y值都随之增加,则变量X与Y之间存在着A、直线相关关系B、负相关关系C、曲线相关关系D、正相关关系9、判定现象之间相关关系密切程度得最主要⽅法就是A.对现象进⾏定性分析 B、计算相关系数C、编制相关表D、绘制相关图10、相关分析对资料得要求就是A.⾃变量不就是随机得,因变量就是随机得B、两个变量均不就是随机得C、⾃变量就是随机得,因变量不就是随机得D、两个变量均为随机得11、相关系数A、既适⽤于直线相关,⼜适⽤于曲线相关B、只适⽤于直线相关C、既不适⽤于直线相关,⼜不适⽤于曲线相关D、只适⽤于曲线相关12、两个变量之间得相关关系称为A、单相关B、复相关C、不相关D、负相关13、相关系数得取值范围就是A、-1≤r≤1B、-1≤r≤0C、0≤r≤114、两变量之间相关程度越强,则相关系数A、愈趋近于1B、愈趋近于0C、愈⼤于1D、愈⼩于115、两变量之间相关程度越弱,则相关系数A、愈趋近于1B、愈趋近于0C、愈⼤于1D、愈⼩于116、相关系数越接近于-1,表明两变量间A、没有相关关系B、有曲线相关关系C、负相关关系越强D、负相关关系越弱17、当相关系数r=0时,A.现象之间完全⽆关 B、相关程度较⼩B.现象之间完全相关 D、⽆直线相关关系18、假设产品产量与产品单位成本之间得相关系数为-0、89,则说明这两个变量之间存在A、⾼度相关B、中度相关C、低度相关D、显著相关19、从变量之间相关得⽅向瞧可分为A、正相关与负相关B、直线相关与曲线相关C、单相关与复相关D、完全相关与⽆相关20、从变量之间相关得表现形式瞧可分为A、正相关与负相关B、直线相关与曲线相关C、单相关与复相关D、完全相关与⽆相关21、物价上涨,销售量下降,则物价与销售量之间属于B、负相关C、正相关D、⽆法判断22、配合回归直线最合理得⽅法就是A、随⼿画线法B、半数平均法C、最⼩平⽅法D、指数平滑法23、在回归直线⽅程y=a+bx中b表⽰A、当x增加⼀个单位时,y增加a得数量B、当y增加⼀个单位时,x增加b得数量C、当x增加⼀个单位时,y得平均增加量D、当y增加⼀个单位时, x得平均增加量24、计算估计标准误差得依据就是A、因变量得数列B、因变量得总变差C、因变量得回归变差D、因变量得剩余变差25、估计标准误差就是反映A、平均数代表性得指标B、相关关系程度得指标C、回归直线得代表性指标D、序时平均数代表性指标26、在回归分析中,要求对应得两个变量A、都就是随机变量B、不就是对等关系C、就是对等关系D、都不就是随机变量27、年劳动⽣产率(千元)与⼯⼈⼯资(元)之间存在回归⽅程y=10+70x,这意味着年劳动⽣产率每提⾼⼀千元时,⼯⼈⼯资平均A、增加70元B、减少70元C、增加80元D、减少80元固定成本6000元,则总⽣产成本对产量得⼀元线性回归⽅程为:A、y=6+0、24xB、y=6000+24xC、y=24000+6xD、y=24+6000x29、⽤来反映因变量估计值代表性⾼低得指标称作A、相关系数B、回归参数C、剩余变差D、估计标准误差⼆、多项选择题1、下列现象之间属于相关关系得有A、家庭收⼊与消费⽀出之间得关系B、农作物收获量与施肥量之间得关系C、圆得⾯积与圆得半径之间得关系D、⾝⾼与体重之间得关系E、年龄与⾎压之间得关系2、直线相关分析得特点就是A、相关系数有正负号B、两个变量就是对等关系C、只有⼀个相关系数D、因变量就是随机变量E、两个变量均就是随机变量3、从变量之间相互关系得表现形式瞧,相关关系可分为A、正相关B、负相关C、直线相关D、曲线相关E、单相关与复相关4、如果变量x与y之间没有线性相关关系,则A、相关系数r=0B、相关系数r=1C、估计标准误差等于0D、估计标准误差等于15、设单位产品成本(元)对产量(件)得⼀元线性回归⽅程为y=85-5、6x,则A.单位成本与产量之间存在着负相关B、单位成本与产量之间存在着正相关C、产量每增加1千件,单位成本平均增加5、6元D、产量为1千件时,单位成本为79、4元E、产量每增加1千件,单位成本平均减少5、6元6、根据变量之间相关关系得密切程度划分,可分为A、不相关B、完全相关C、不完全相关D、线性相关E、⾮线性相关7、判断现象之间有⽆相关关系得⽅法有A、对现象作定性分析B、编制相关表C、绘制相关图D 、计算相关系数E 、计算估计标准误差8、当现象之间完全相关得,相关系数为A 、0B 、-1C 、1D 、0、5E 、-0、59、相关系数r =0说明两个变量之间就是A 、可能完全不相关B 、可能就是曲线相关C 、肯定不线性相关D 、肯定不曲线相关E 、⾼度曲线相关10、下列现象属于正相关得有A.家庭收⼊愈多,其消费⽀出也愈多B 、流通费⽤率随商品销售额得增加⽽减少D 、⽣产单位产品耗⽤⼯时,随劳动⽣产率得提⾼⽽减少E 、⼯⼈劳动⽣产率越⾼,则创造得产值就越多11、直线回归分析得特点有A 、存在两个回归⽅程B 、回归系数有正负值C 、两个变量不对等关系D 、⾃变量就是给定得,因变量就是随机得E 、利⽤⼀个回归⽅程,两个变量可以相互计算12、直线回归⽅程中得两个变量A 、都就是随机变量B 、都就是给定得变量C 、必须确定哪个就是⾃变量,哪个就是因变量D 、⼀个就是随机变量,另⼀个就是给定变量E 、⼀个就是⾃变量,另⼀个就是因变量13、从现象间相互关系得⽅向划分,相关关系可以分为A 、直线相关B 、曲线相关C 、正相关D 、负相关E 、单相关14、估计标准误差就是A.说明平均数代表性得指标B 、说明回归直线代表性指标C 、因变量估计值可靠程度指标D 、指标值愈⼩,表明估计值愈可靠E 、指标值愈⼤,表明估计值愈可靠15、下列公式哪些就是计算相关系数得公式16、⽤最⼩平⽅法配合得回归直线,必须满⾜以下条件A 、∑(y-y c )=最⼩值B 、∑(y-y c )=0C 、∑(y-y c )2=最⼩值D 、∑(y-y c )2=0E 、∑(y-y c )2=最⼤值17、⽅程y c =a+bx)((...))((.y y n x x n y x xy n r E y y x x y y x x r D L L L r C L L L r B n y y x x r A xx xy xy yy xx xy y x ∑-∑?∑-∑∑?∑-∑=-∑?-∑--∑===--∑=σσA.这就是⼀个直线回归⽅程B、这就是⼀个以X为⾃变量得回归⽅程C、其中a就是估计得初始值D、其中b就是回归系数E、y c就是估计值18、直线回归⽅程y c=a+bx中得回归系数bA.能表明两变量间得变动程度B、不能表明两变量间得变动程度C、能说明两变量间得变动⽅向D、其数值⼤⼩不受计量单位得影响E、其数值⼤⼩受计量单位得影响19、相关系数与回归系数存在以下关系A.回归系数⼤于零则相关系数⼤于零B、回归系数⼩于零则相关系数⼩于零C、回归系数等于零则相关系数等于零D、回归系数⼤于零则相关系数⼩于零E、回归系数⼩于零则相关系数⼤于零20、配合直线回归⽅程得⽬得就是为了A.确定两个变量之间得变动关系 B、⽤因变量推算⾃变量C、⽤⾃变量推算因变量D、两个变量相互推算E、确定两个变量之间得相关程度21、若两个变量x与y之间得相关系数r=1,则A.观察值与理论值得离差不存在B、y得所有理论值同它得平均值⼀致C、x与y就是函数关系D、x与y不相关E、x与y就是完全正相关22、直线相关分析与直线回归分析得区别在于A.相关分析中两个变量都就是随机得;⽽回归分析中⾃变量就是给定得数值,因变量就是随机得B.回归分析中两个变量都就是随机得;⽽相关分析中⾃变量就是给定得数值,因变量就是随机得C、相关系数有正负号;⽽回归系数只能取正值E、相关分析中根据两个变量只能计算出⼀个相关系数;⽽回归分析中根据两个变量只能计算出⼀个回归系数三、填空题1、研究现象之间相关关系称作相关分析。

统计学原理 第七章课后习题及答案

统计学原理 第七章课后习题及答案

第七章 相关和回归一、单项选择题1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。

(1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。

(1)小于0 (2)大于0 (3)等于0 (4)等于13.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。

(1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。

(1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。

(1)严格的关系 (2)不严格的关系(3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示:其相关系数计算出来放在四个备选答案之中,它是( )。

(1)0.29 (2)-0.88 (3)1.03 (4)0.997.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。

(1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2()y y -∑的1.2倍,则相关系数r=( )。

(1)1.2 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。

(1)明显因果关系 (2)自身相关关系(3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。

(1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第七章 练习题参考答案7.1 (1)已知σ=5,n=40,x =25,α=0.05,z05.0=1.96样本均值的抽样标准差σx=n σ=79.0405= (2)估计误差(也称为边际误差)E=z 2αnσ=1.96*0.79=1.55 7.2(1)已知σ=15,n=49,x =120,α=0.05,z05.0=1.96(2)样本均值的抽样标准差σx=nσ==49152.14 估计误差E=z 2αnσ=1.96*=49154.2 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=120±1.96*2.14=120±4.2,即(115.8,124.2)7.3(1)已知σ=85414,n=100,x =104560,α=0.05,z05.0=1.96由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=104560±1.96*=10085414104560±16741.144即(87818.856,121301.144)7.4(1)已知n=100,x =81,s=12, α=0.1,z21.0=1.645由于n=100为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=81±1.645*=1001281±1.974,即(79.026,82.974)(2)已知α=0.05,z205.0=1.96由于n=100为大样本,所以总体均值μ的95%的置信区间为:ns x z 2α±=81±1.96*=1001281±2.352,即(78.648,83.352)(3)已知α=0.01,z201.0=2.58由于n=100为大样本,所以总体均值μ的99%的置信区间为:ns x z 2α±=81±2.58*=1001281±3.096,即(77.94,84.096)7.5(1)已知σ=3.5,n=60,x =25,α=0.05,z05.0=1.96由于总体标准差已知,所以总体均值μ的95%的置信区间为: nx z σα±=25±1.96*=60.5325±0.89,即(24.11,25.89)(2)已知n=75,x =119.6,s=23.89, α=0.02,z202.0=2.33由于n=75为大样本,所以总体均值μ的98%的置信区间为:ns x z 2α±=119.6±2.33*=759.823119.6±6.43,即(113.17,126.03)(3)已知x =3.419,s=0.974,n=32,α=0.1,z21.0=1.645由于n=32为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=3.419±1.645*=3274.90 3.419±0.283,即(3.136,3.702)7.6(1)已知:总体服从正态分布,σ=500,n=15,x =8900,α=0.05,z205.0=1.96由于总体服从正态分布,所以总体均值μ的95%的置信区间为:nx z σα2±=8900±1.96*=155008900±253.03,即(8646.97,9153.03)(2)已知:总体不服从正态分布,σ=500,n=35,x =8900,α=0.05,z205.0=1.96虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的95%的置信区间为:nx z σα2±=8900±1.96*=355008900±165.65,即(8734.35,9065.65)(3)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=0.1,z21.0=1.645虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的90%的置信区间为:ns x z 2α±=8900±1.645*=355008900±139.03,即(8760.97,9039.03)(4)已知:总体不服从正态分布,σ未知, n=35,x =8900,s=500, α=0.01,z201.0=2.58虽然总体不服从正态分布,但由于n=35为大样本,所以总体均值μ的99%的置信区间为:ns x z 2α±=8900±2.58*=355008900±218.05,即(8681.95,9118.05)7.7 已知:n=36,当α=0.1,0.05,0.01时,相应的z21.0=1.645,z205.0=1.96,z201.0=2.58根据样本数据计算得:x =3.32,s=1.61由于n=36为大样本,所以平均上网时间的90%置信区间为:ns x z 2α±=3.32±1.645*=361.61 3.32±0.44,即(2.88,3.76)平均上网时间的95%置信区间为:ns x z 2α±=3.32±1.96*=361.61 3.32±0.53,即(2.79,3.85)平均上网时间的99%置信区间为:ns x z 2α±=3.32±2.58*=361.61 3.32±0.69,即(2.63,4.01)7.8 已知:总体服从正态分布,但σ未知,n=8为小样本,α=0.05,)(18t205.0-=2.365 根据样本数据计算得:x =10,s=3.46 总体均值μ的95%的置信区间为:ns x t 2α±=10±2.365*=83.4610±2.89,即(7.11,12.89)7.9 已知:总体服从正态分布,但σ未知,n=16为小样本,α=0.05,)(116t205.0-=2.131 根据样本数据计算得:x =9.375,s=4.113从家里到单位平均距离的95%的置信区间为:ns x t 2α±=9.375±2.131*=144.1139.375±2.191,即(7.18,11.57)7.10 (1)已知:n=36,x =149.5,α=0.05,z205.0=1.96由于n=36为大样本,所以零件平均长度的95%的置信区间为:ns x z 2α±=149.5±1.96*=361.93149.5±0.63,即(148.87,150.13)(2)在上面的估计中,使用了统计中的中心极限定理。

该定理表明:从均值为μ、方差为σ2的总体中,抽取了容量为n 的随机样本,当n 充分大时(通常要求30n ≥),样本均值的抽样分布近似服从均值为μ,方差为nσ2的正态分布。

7.12 (1)已知:总体服从正态分布,但σ未知,n=25为小样本,α=0.01,)125(201.0-t=2.797 根据样本数据计算得:x =16.128,s=0.871总体均值μ的99%的置信区间为:ns x t 2α±=16.128±2.797*=250.87116.128±0.487,即(15.64,16.62)7.13 已知:总体服从正态分布,但σ未知,n=18为小样本,α=0.1,)118(21.0-t=1.74根据样本数据计算得:x =13.56,s=7.8网络公司员工平均每周加班时间的90%的置信区间为:ns x t 2α±=13.56±1.74*=187.813.56±3.2,即(10.36,16.76)7.14 (1)已知:n=44,p=0.51,α=0.01,z201.0=2.58总体比例π的99%的置信区间为:n p p )1(p z 2-±α=0.51±2.5844)51.01(51.0-=0.51±0.19,即(0.32,0.7) (2)已知:n=300,p=0.82,α=0.05,z205.0=1.96总体比例π的95%的置信区间为:n p p )1(p z 2-±α=0.82±1.96300)82.01(82.0-=0.82±0.04,即(0.78,0.86) (3)已知:n=1150,p=0.48,α=0.1,,z21.0=1.645总体比例π的90%的置信区间为:n p p )1(p z 2-±α=0.48±1.6451150)48.01(48.0-=0.48±0.02,即(0.46,0.5) 7.15 已知:n=200,p=0.23,α为0.1和0.05时,相应的z21.0=1.645,z205.0=1.96总体比例π的90%的置信区间为:n p p )1(p z 2-±α=0.23±1.645200)23.01(23.0-=0.23±0.05,即(0.18,0.28) 总体比例π的95%的置信区间为:n p p )1(p z 2-±α=0.23±1.96200)23.01(23.0-=0.23±0.06,即(0.17,0.29) 7.16已知:σ=1000,估计误差E=200,α=0.01,z201.0=2.58应抽取的样本量为:Ez 222)(2n σα==200100058.2222⨯=1677.17 (1)已知:E=0.02,π=0.4,α=0.04,z204.0=2.05应抽取的样本量为:Ez 2212n )()(ππα-==2.0005.222.401.40)(-⨯⨯=2522(2)已知:E=0.04,π未知,α=0.05,z205.0=1.96由于π未知,可以使用0.5(因为对于服从二项分布的随机变量,当π取0.5时,其方差达到最大值。

因此,在无法得到总体比例的值时,可以用0.5代替计算。

这样得出的必要样本容量虽然可能比实际需要的容量大一些,但可以充分保证有足够高的置信水平和尽可能小的置信区间)故应抽取的样本量为:Ez 2212n )()(ππα-==4.006.9122.501.50)(-⨯⨯=601(3)已知:E=0.05,π=0.55,α=0.1,z21.0=1.645应抽取的样本量为:Ez 2212n )()(ππα-==.050.645122.5501.550)(-⨯⨯=2687.18 (1)已知:n=50,p=32/50=0.64,α=0.05,z205.0=1.96总体中赞成该项改革的户数比例的95%的置信区间为:n p p )1(p z 2-±α=0.64±1.9650)64.01(64.0-=0.64±0.13,即(0.51,0.77) (2)已知:E=0.1,π=0.8,α=0.05,z205.0=1.96应抽取的样本量为:Ez 2212n )()(ππα-==.10.96122.801.80)(-⨯⨯≈627.20(1)构建第一种排队方式等待时间标准差的95%的置信区间。

相关文档
最新文档