北京师范大学统计学课后习题答案

合集下载

统计学课后习题和答案

统计学课后习题和答案

第一章1*.下面的列联表是根据一个小城市的居民教育水平(以获得了高中文凭和没有获得高中文凭分类)和就业状况(以全职和非全职分类)所做出如果原假设即在教育水平和工作状态之间没有联系为真,那么下列哪一个选项表明了获得了高中文凭并且是全职工作的期望值? A.9252157g B. 9282157g C.528292g D. 655292g E. 925282g 1*. Answer :BAnalysis :本题考查二维表中两个变量的独立性,如果原假设独立成立,那么cell “earned at least a high school diploma ”和“ employed full time ”的期望值为:92829282(,)()()157157157157P Earned Employed Total P Earned P Employed Total ===g g g g g g2*.一次实验中,每一个随机样本中的成人都有他的最喜爱的颜色,下表展示了按年龄分组的试验结果。

如果对于颜色的偏好是同年龄组相互独立,下列哪一个选项表明了年龄组30到50岁,喜爱绿色的人数的期望值? A.(99)(108)314 B. (69)(108)314 C. (99)(35)108 D. (35)(108)314 E. (99)(35)3142*. Answer :A Analysis :本题考查二维表中两个变量的独立性,如果两个变量独立,那么cell “aged 30 to 50”和“prefer green ”的期望值为:1089999108(3050,)(3050)()314314314314P green Total P P green Total -=-==g g g g g g 第二章1*.下面的直方图代表了五种不同的数据集的分布,每个都包含28个整数,从1到7,水平和垂直比例对所有图形都是相同的。

下面哪个图代表了有最大标准差的数据集?A. B.C. D.E.2*..这张图是一次统计学考试中40个成绩的累积相对频率直方图,下列哪一个选项可以从这张A.较低的20个分数的差异大于较高的20个分数的差异B.中位数小于50C.60%的学生的分数高于80分D.如果设定及格线是70,那么大多数人没通过这次考试E.这张图的平均水平组是60分,低于这个组的分数出现的频率更高F.1*. Answer:DG.Analysis:本题考查如何判断直方图的spread,显然,图D的标准差是最大的。

北师大统计学基础习题答案5

北师大统计学基础习题答案5

Exercise 51. P201: 4.59.Let 54321Y Y Y Y Y <<<<be the order statistics of a random sample of size n from a distribution with p.d.f. ∞<<=-x e x f x 0,)(,zero elsewhere..Show that 21Y Z =and 242Y Y Z -=are independent. Solution: Since ∞<<=-x e x f x 0,)(, so ∞<<-=-x e x F x 0,1)()()()]()][()()][([!1!1!1!5),(424242424,2y f y f y F y F y F y F y y g -=424422))()(1(120y y y y y y e e e e e e --------= Since 12Z Y =,214Z Z Y +=,11101==J . 22111211212112421)1)(1(120))(1(120),(z z z z z z z z z z z z z e e e e ee eee e z z g ---------------=--=)1(20)()]'([)](1)][([!3!1!5)()(11424322211z z e e y f y F y F y F y g z g ---=-== ⎰⎰∞----∞--==01240121222211)1)(1(120),()(dz e e e e dz z z g z g z z z z222211222205042)1(6)1(201120)|5|4()1(120z z z z z z z z e e e e e e ee----∞-∞----=-⋅=----= Thus, =),(21z z g )()(2211z g z g .So 1Z and 2Z are independent.P274: 6.15. Let X be the mean of a random sample of size n from adistribution that is )9,(μN . Find n such that 90.0)11Pr(=+<<-X X μ, approximately.Solution: Since ~X )9,(n N μ,)1,0(~3)(N X n μ-.90.01)3(2)3|3)(Pr(|)1|Pr(|)11Pr(=-Φ=<-=<-=+<<-nn X n X X X μμμ Thus )3(n Φ=0.95, 645.13=nand 35.24≈n . Because n must be an integer, so n=24 or 25.P275: 6.18. Let 121,,,+n n X X X X be a random sample of size 9 from adistribution that is ),(2σμN .(a) If σis known, find the length of a 95 percent confidence interval for if this interval is based on the random variable.(b) If σis unknown, find the expected value of the length of a 95 percent confidence interval for if this interval is based on the random variable S X /)(8μ-. (c) Compare these two answers. Solution:(a) Since ~991∑==i iXX )9,(2σμN ,thus)1,0(~)(9N X σμ-.Pr(|σμ)(9-X |<1.96)=0.9595.0)96.1)(396.1Pr(=<-<-⇔σμX95.0)396.1396.1Pr(=+<<-⇔σμσX X . The 95 percent confidence interval for μis )396.1,396.1(σσ+-X X and the length of it isσσ31.17598≈ (b) Since σ is unknown, then )8(~)(81/t SX n S X T μμ-=--=975.0)P r (95.01)Pr(295.0))(8Pr(=≤⇒=-≤⇒=<-<-b T b T b S X b μFrom TABLE IV of Appendix B, we know b=2.306, thus95.0)8306.28306.2Pr(=+<<-σμσX X . The 95 percent confidence interval for μ is )8306.2,8306.2(σσ+-X X with the length S L 8612.4=⎰∞-Γ===02342121222)4(183612.4))/9((38612.4)(8612.4)(dx e x x S E S E L E xσσσ)29(22)4(183612.422)4(183612.42)4(183612.429402729402274ΓΓ=Γ=Γ=⎰⎰∞-∞-σσσdy e y dx e x y xThen σ49.1)(≈L E(c) From (a) we know the answer is σ31.1, from (b) we know the answer isσ49.1. The two methods yield results that are in substantial agreement, which shows the length of the confidence interval for μ is almost the same with the parameter σ known or unknown.P279: 6.30.Let two independent random samples, each of size 10, from two normal distributions ),(21σμN and ),(22σμN yield 8.4=x ,64.821=s ,6.5=y ,88.722=s . Find a 95 percent confidence interval for.Solution: Let 1021,,X X X and 1021,,Y Y Y denote, respectively, independent random samples from the two distributions ),(21σμN and),(22σμN , then ~10101∑==i iXX )10,(21σμN and ~10101∑==i iYY )10,(22σμN .)5,(~221σμμ--N Y X .)18(~/)1010(222221χσS S +)18(~9)()()()101101(18)(10)()(222121222121t S S Y X S S Y X T +---=++---=μμμμ.101.295.0)Pr(=⇒=<<-b b T b and95.0))(3)()(3)Pr((2221212221=++-<-<+--S S b Y X S S b Y X μμ So the random intervalis )3101.2)(,3101.2)((22212221S S Y X S S Y X ++-+--. Let 8.4=x ,64.821=s ,6.5=y ,88.722=s , we get a 95 percent confidenceinterval (-3.6,2.0).2. Use Splus or R software to compute the mean, standard deviation, skewness and kurtosis of the following dataset.-0.4292, 0.0064, 0.1181, -0.6282, 2.2010, -1.7623, 0.0921,1.8742, 1.4538, 0.3575, -1.5848, 0.4993, 0.7762, -0.2638, -1.1003, -2.2480, 0.5419, -0.4018, -0.3562, -0.5872. Solution: > x<-c(-0.4292,0.0064,0.1181,-0.6282,2.2010,-1.7623,0.0921,1.8742,1.4538,0.3575,-1.5848,0.4993,0.7762,-0.2638,-1.1003,-2.2480,0.5419,-0.4018,-0.3562,-0.5872) > a=mean(x) > a[1] -0.072065 > b=sd(x) > b[1] 1.143067> c=mean(((x-a)/b)^3) > c[1] 0.1234913> d=mean(((x-a)/b)^4)-3 > d[1] -0.5280221So the mean of the dataset is -0.072065, the standard deviation is 1.143067, the skewness is 0.1234913 and the kurtosis is -0.5280221.3*. P203: 4.73. Let n Y Y Y <<< 21be the order statistics of a random sample of size n from the exponential distribution with p.d.f.∞<<=-x e x f x 0,)(,zero elsewhere..(a) Show that 11nY Z =,))(1(122Y Y n Z --=,))(2(233Y Y n Z --=,…1--=n n n Y Y Z , are independent and that each i Z has the exponential distribution.Solution: Since n y y y n e e e n y y y g ---= 21!),,(21, andn n n Z Z n Zn Z Y n Z n Z Y n Z Y ++-+=-+==-21,,1,12121211 and the Jacobian is!1121111021111011101n n n n n n n n J =---=nn z z z z n z n z n z n z nz n n e e e eee y y y g J z z z g ---++-+--+--=== 2121211)1()1(2121),,(||),,(k z n k k n k k e dz dz dz dz z z z g z g -+-∞∞∞∞==⎰⎰⎰⎰ 11012100),,()(So )()()(),,(221121n n n z g z g z g z z z g = and ∞<<=-k z k k z e z g k 0,)( Which shows that n z z z ,,21are independent and that each i z has the exponential distribution.(b) Demonstrate that all linear functions of n Y Y Y ,,,21 , such as ∑ni i Y a 1, canbe expressed as linear functions of independent random variables. Solution:)())(1())(1(11122112211---++---++--+=+++n n n k k k n n Y Y b Y Y k n b Y Y n b nY b Y a Y a Y a n n Z b Z b Z b +++= 2211. Then ,)2()1(,)1(232121a n b n n b a n b n b =---=-- n n n n n k k k a b a b b a k n b k n b ==-=--+---+)1(,)1()2(,,)()1(,111 . Then n n nk k n n a b k n a a b n a a a b n a a a b =+-++=-++=++=,1,,1,322211So1,11+-+==∑∑==i n a a b Z b Y a ni i ni i i ni i i .Since n Z Z Z ,,,21 are independent, thenn n Z b Z b Z b ,,,2211 are independent. So∑=ni i i Y a 1can be expressed as linearfunctions of independent random variables.P275: 6.19.Let 121,,,+n n X X X X be a random sample of size n+1, n>1, from a distribution that is ),(2σμN . Let n X X ni /1∑= andn X X S ni /)(212-=∑. Find the constant c so that the statisticσ1+-n X X chas a t-distribution. If n=8, determine k suchthat 80.0)Pr(=+<<-kS X kS X μ. The observed interval is ),(ks x ks x +- often called an 80 percent prediction interval for 9X . Solution: )/,(~2n N X σμ,),(~21σμN X n +,),1,0(~21σnn N X X n +-+ ).1(~11)1(1),1(~).1,0(~112212221--⋅+⋅-=-+--+-+++n t SX X n nn n n nS n n X X n nS N nn X X n n n σσχσσTherefore 11+-=n n c . 80.0)9797Pr()Pr()Pr(999=<-=<-=+<<-k S X X k S X X kS X x kS X 60.1,415.197==k k . So k=1.60.。

1 现代心理与教育统计学 课后答案(张厚粲 徐建平著 著) 北京师范大学出版社

1 现代心理与教育统计学 课后答案(张厚粲 徐建平著 著) 北京师范大学出版社

第一章1名词概念(1)随机变量答:在统计学上把取值之前,不能准确预料取到什么值的变量,称为随机变量。

(2)总体答:总体(population)又称为母全体或全域,是具有某种特征的一类事物的总体,是研究对象的全体。

(3)样本答:样本是从总体中抽取的一部分个体。

(4)个体答:构成总体的每个基本单元。

(5)次数是指某一事件在某一类别中出现的数目,又称作频数,用f表示。

(6)频率答:又称相对次数,即某一事件发生的次数除以总的事件数目,通常用比例或百分数来表示。

(7)概率答:概率(probability),概率论术语,指随机事件发生的可能性大小度量指标。

其描述性定义。

随机事件A在所有试验中发生的可能性大小的量值,称为事件A 的概率,记为P(A)。

(8)统计量答:样本的特征值叫做统计量,又称作特征值。

(9)参数答:又称总体参数,是描述一个总体情况的统计指标。

(10)观测值答:随机变量的取值,一个随机变量可以有多个观测值。

2何谓心理与教育统计学?学习它有何意义?答:(1)心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育统计活动规律的一门学科。

具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。

(2)学习心理与教育统计学有重要的意义。

①统计学为科学研究提供了一种科学方法。

科学是一种知识体系。

它的研究对象存在于现实世界各个领域的客观事实之中。

它的主要任务是对客观事实进行预测和分类,从而揭示蕴藏于其中的种种因果关系。

要提高对客观事实观测及分析研究的能力,就必须运用科学的方法。

统计学正是提供了这样一种科学方法。

统计方法是从事科学研究的一种必不可少的工具。

②心理与教育统计学是心理与教育科研定量分析的重要工具。

统计学课后习题答案_(第四版)4.5.7.8章

统计学课后习题答案_(第四版)4.5.7.8章

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。

由于峰态系数为正值,所以为尖峰分布。

4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

北京师范大学统计学导论答案整理版

北京师范大学统计学导论答案整理版

40
练习2.2.11
P
(A1)
N N
1
n
P
( A1 A 2 )
N
N
2
n
P (A1A2
A N 1 )
1 N
n
P ( A 1 A 2 A N 1 A N ) 0
41
练习2.2.11
P(B)
1C1NNN1n
CN2NN2n
(1)N1 1n N
N k01(1)kCNk NNkn
42
练习1.4.1 比如,北京某交通路口某个方向共有4条 汽车道,要研究应设几个直行道、几个 左转弯道、几个右转弯道才能有利于交 通畅通?应调查的变量是每天开往各个 方向的车流量,根据各个时段的车流量 情况设计车道。
1
练习1.4.2 解:不可取。因为这里检查的苹果是方 便样本,不是随机样本,方便样本的代 表性差。 第二页:例1.1.3 注:收集有代表性的数据,是得到正确 结论的基础。
AA 12A 13A23
且A12,A13,A23两两互不相 . 容
37
练习2.2.10 A12 A13={边长为l1的边与某直线相交} A12 A23={边长为l2的边与某直线相交} A23 A13 ={边长为l3的边与某直线相交}
P ( A 1 2 U A 1 3 ) 2 l a 1 ,P ( A 1 2 U A 2 3 ) 2 l a 2 ,P ( A 1 3 U A 2 3 ) 2 l a 3
证明: A B A (B A ) A (B A )B
且 A (B A) B ,A B B
PABP(A)P(BA)B
P(A)P(B)(A)B
25
练习2.2.4 解:A={1,2,3至少出现一个},

统计学课后习题及答案

统计学课后习题及答案

统计学课后习题及答案统计学课后习题及答案统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。

作为学习统计学的学生,课后习题是巩固知识、提高技能的重要途径。

本文将提供一些统计学课后习题及其答案,希望对学习者有所帮助。

1. 描述性统计习题:给定以下一组数据:10, 15, 12, 18, 20, 22, 16, 10, 14, 19。

请计算该组数据的均值、中位数和众数,并解释它们的含义。

答案:均值:计算方法是将所有数据相加,然后除以数据的个数。

对于给定的数据,均值为(10+15+12+18+20+22+16+10+14+19)/10 = 16.6。

中位数:将数据按照从小到大的顺序排列,找出中间的数。

对于给定的数据,中位数为16。

众数:出现频率最高的数。

对于给定的数据,众数为10。

这些统计量可以帮助我们了解数据的集中趋势。

均值是所有数据的平均值,中位数是数据的中间值,众数是出现频率最高的值。

在这个例子中,均值告诉我们这组数据的平均水平是16.6,中位数告诉我们大约一半的数据小于16,一半的数据大于16,众数告诉我们10是这组数据中出现次数最多的数。

2. 概率习题:一个骰子有6个面,每个面上的数字分别是1、2、3、4、5、6。

如果投掷一次骰子,求得到奇数的概率。

答案:奇数的个数为3个,即1、3、5。

骰子的总个数为6个。

所以得到奇数的概率为3/6 = 1/2。

概率是事件发生的可能性。

在这个例子中,奇数的个数是3个,总个数是6个,所以得到奇数的概率是3/6,即1/2。

3. 抽样与估计习题:某市有1000名居民,你希望了解他们对某项政策的态度。

你打算进行一次调查,抽取100名居民进行问卷调查。

这个调查结果能否代表整个市民的态度?为什么?答案:这个调查结果不能代表整个市民的态度。

原因是抽样的方式可能引入抽样误差。

如果抽取的100名居民在某些特征上不具有代表性,比如年龄、性别、职业等,那么调查结果可能会偏离整个市民的态度。

统计学课后习题答案

统计学课后习题答案

第四章 统计描述某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%.试分别计算产量、成本、劳动生产率的计划完成程度. 解产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成%.成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成%.劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成%.某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%,在五年中,该矿实际开采原煤情况如下(单位:万吨)试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间. 解本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成%.(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划. 我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中;(2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)(3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几 解(1)(2)是比例相对数;1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长%.某乡三个村2000年小麦播种面积与亩产量资料如下表:要求:(1)填上表中所缺数字;(2)用播种面积作权数,计算三个村小麦平均亩产量; (3)用比重作权数,计算三个村小麦平均亩产量.解(1)(2))(75.72840013065015082012070011斤=⨯+⨯+⨯==∑∑==k i iki iiff xx(3)两种不同品种的玉米分别在五块地上试种,产量资料如下:已知生产条件相同,对这两种玉米品种进行分析比较,试计算并说明哪一种品种的亩产量更稳定一些解田块总面积总产量平均亩产量=即: 由于是总体数据,所以计算总体均值: 计算表格乙品种下面分别求两块田地亩产量的标准差:要比较两种不同玉米的亩产量的代表性,需要计算离散系数:<甲σv 乙σv ,∴甲品种的亩产量更稳定一些.两家企业生产相同的产品,每批产品的单位成本及产量比重资料如下: 甲企业乙企业试比较两个企业哪个企业的产品平均单位成本低,为什么解∴乙企业的产品平均单位成本更低.某粮食储备库收购稻米的价格、数量及收购额资料如下:要求:(1)按加权算术平均数公式计算稻米的平均收购价格;(2)按加权调和平均数公式计算稻米的平均收购价格.解(1))(02.19000915011元≈==∑∑==k i iki iiff xx (2))(02.190009150400030002000360031502400m H 元≈=++++==∑∑xm x已知我国1995年—1999年末总人口及人口增长率资料:试计算该期间我国人口平均增长率. 解计算过程如下:按照平均增长率的公式可知:1-平均发展速度平均增长率=所以,1995年—1999年期间我国人口平均增长率=96.91-1204861253604≈‰某单位职工按月工资额分组资料如下: 根据资料回答问题并计算: (1)它是一个什么数列(2)计算工资额的众数和中位数;(3)分别用职工人数和人数所占比重计算平均工资.结果一样吗(4)分别计算工资的平均差和标准差. 解(1)是等距分组数列 (2)d f f f f f f L M m m m m m m ⨯-+--+≈+--)()(1110下限公式:即:59.54821000)30134()37134(371345000)()(1110≈⨯-+--+=⨯-+--+≈+--df f f f f f L M m m m m m m(注:用上限公式算出的结果与上述结果相同) (注:用上限公式算出的结果与上述结果相同) (3))(22.5343236107500306500134550037450025350011元≈⨯+⨯+⨯+⨯+⨯==∑∑==k i iki iiff xx (元)2.53434.24%7500 71%.12650078%.56550068%.15450059%.103500x 1111≈⨯+⨯+⨯+⨯+⨯=⋅==∑∑∑∑====ki ki iii k i iki iiff x ff x两者结果一样.(忽略小数点位数的保留对结果造成的影响)(4)平均差 92.65411≈-=∑∑==ki iki iidff x xM标准差 33.923)(12≈-=∑=Nf X XKi i iσ某市甲、乙两商店把售货员按其人均年销售额分组,具体资料如下:要求:(1)分别计算这两个商场售货员的人均销售额; (2)通过计算说明哪个商场人均销售额的代表性大解(1) 423001260011===∑∑==k i iki iiff xX 甲(2)05.1030030300)(12≈=-=∑=Nf X XKi i i甲甲σ >甲σv 乙σv ,∴乙商场销售额的代表性大.第五章 统计抽样袋中装有5只同样大小的球,编号为1,2,3,4,5,从中同时取出3只球,求取出的最大号X 的分布律及其分布函数并画出其图形.解先求X 的分布律:由题知,X 的可能取值为3,4,5,且2345{5}/6/10P X C C ===,∴X 的分布律为:⎪⎪⎭⎫ ⎝⎛10/610/310/1543, 由(){}i i ix xF x P X x p ≤=≤=∑得:设X 的密度函数为求: (1)常数c ;(2)X 的分布函数()F x ; (3){13}P X <≤. 解(1)24241()0(32)018f x dx dx c x dx dx c +∞+∞-∞-∞==+++=⎰⎰⎰⎰(2)当2x ≤时,()00xF x dt -∞==⎰;当24x <<时,22211()()0(32)(310)1818xxF x f t dt dt t dt x x -∞-∞==++=+-⎰⎰⎰当4x ≥时,24241()()0(32)0118xx F x f t dt dt t dt dt -∞-∞==+++=⎰⎰⎰⎰.故分布函数 (3)21{13}=(3)(1)(33310)04/918P X F F <≤-=+⨯--= 随机变量,X Y 相互独立,又(2)XP ,1(8,)4YB ,试求(2)E X Y -和(2)D X Y -.解(2)()2()2222E X Y E X E Y -=-=-⨯=-一本书排版后一校时出现错误处数X 服从正态分布(200,400)N , 求: (1)出现错误处数不超过230的概率;(2)出现错误处数在190~210的概率. 解(200,400)X N(1)200230200(230)()2020X P X P --∴≤=≤ (2) 190200200210200(190210)()202020X P X P ---∴≤≤=≤≤某地区职工家庭的人均年收入平均为12000元,标准差为2000元.若知该地区家庭的人均年收入服从正态分布,现采用重复抽样从总体中随机抽取25户进行调查,问出现样本均值等于或超过12500元的可能性有多大 解对总体而言,2(12000,2000)XN∴样本均值22000(12000,)25xN某商场推销一种洗发水.据统计,本年度购买此种洗发水的有10万人,其中3万6千人是女性.如果按重复抽样方法,从购买者中抽出100人进行调查,问样本中女性比例超过50%的可能性有多大解总体比例 3.6=36%10π=万万(1)(,)p N nπππ-∴即2(0.36,0.048)pN第八章 相关分析和回归分析某店主分析其店面的经营情况时,收集了连续10天的访问量数据(单位:天)和当天营业额数据(单位:元)如下.对以上访问量和营业额数据作相关分析.解相关分析(1)画访问量和营业额数据的散点图,如下所示从图上可以看出,访问量和营业额数据是简单线性正的不完全相关. (2)计算相关系数计算访问量和营业额的简单线性相关系数为,大于,说明访问量和营业额之间存在较高的线性关系.某饮料广告费投入为x,产品销售数量为y,根据收集2年的月度数据 资料,计算得到以下结果:∑=-6546)(2x x i,∑=-5641)(2y y i375=x ,498=y ,6054))((=--∑y y x x i i(1)计算相关系数,并初步判断x 与y 之间的关系; (2)用最小二乘法估计模型回归系数,并写出模型结果; (3)说明所计算的回归系数的经济意义;(4)计算模型可决系数,并用其说明模型的拟合效果. 解最小二乘法的计算(一元)(1)计算相关系数,并初步判断x 与y 之间的关系;计算x 与y 相关系数为r=,说明两者的简单线性相关程度非常高,因此可以初步判断x 与y 呈现线性关系.(2)用最小二乘法估计模型回归系数,并写出模型结果;记模型为:i i x y 10ˆˆˆββ+=,将以上结果代入最小二乘法的计算公式,得到=1ˆβ,=0ˆβ. 因此,产品销售数量为y 对广告费投入为x 的模型为i i x y92484.01852.151ˆ+= (3)说明所计算的回归系数的经济意义;=1ˆβ表示当广告费投入每增加1个单位,产品销售数量会增加个单位. (4)计算模型可决系数,并用其说明模型的拟合效果.由于模型为一元线性回归模型,根据一元线性回归模型中可决系数为模型因变量和自变量简单线性相关系数的平方的关系,可得模型的可决系数R 2=(r)2=2=.可决系数接近1,说明模型拟合的非常好.第九章 统计指数某市场上四种蔬菜的销售资料如下:(1) 根据综合指数编制规则,将上表所缺空格填齐; (2) 用拉氏公式编制四种蔬菜的销量总指数和价格总指数; (3) 用帕氏公式编制四种蔬菜的销量总指数和价格总指数; (4) 建立适当的指数体系,对蔬菜销售额的变动进行因素分析.解 %p q p q L %pq pq L p q 11.1092282431227.1072282390220010001======∑∑∑∑)拉氏:(即 ()⎩⎨⎧+=⨯=元175********.10727.10712.115%%计算表明: 四种蔬菜的销量增长了 %,使销售额增加了 162元;四种蔬菜的价格上长了 %,使销售额增加了175元;两因素共同影响,使销售额增长了%, 销售额增加了337元. 结论:某厂三种产品的产量情况如下表:试分析出厂价格和产量的变动对总产值的影响. 解第一步:计算三个总产值:24200064000101100081350000=⨯+⨯+⨯=∑p q(万元);25080064800101020081500001=⨯+⨯+⨯=∑pq (万元);2637005480011102005.81500011=⨯+⨯+⨯=∑pq (万元);第二步:建立指标体系即⎪⎩⎪⎨⎧-+-=-⨯=)250800263700()242000250800(242000263700250800263700242000250800242000263700 第三步:分析结论.计算结果表明:由于出厂价上涨了%,使总产值增加了8800元;由于产量提高了%,使总产值增加了12900元;两因素共同作用,使总产值上升了%,增加了21700元.若给出题中四种蔬菜的资料如下:(1) 编制四种蔬菜的算术平均指数; (2) 编制四种蔬菜的调和平均指数;(3) 把它们与上题计算的拉氏指数和帕氏指数进行比较,看看有何种关系什么条件下才会有这种关系的呢 (4)解(1)(2) (3)算术平均指数的结果与拉氏指数相等——以基期的总值指标为权数. 调和平均指数的结果与帕氏指数相等——以报告期的总值指标为权数.某地区2005年农副产品收购总额为1 360亿元,2006年比上年的收购总额增长了12%,农副产品价格指数为105%;试考虑:2006年与2005年相比较(1) 农副产品收购总额增长了百分之几农民共增加多少收入 (2)(3) 农副产品收购量增加了百分之几农民增加了多少收入 (4)(5) 由于农副产品收购价格提高了5%,农民又增加了多少收入 (6) 验证以上三者之间有何等关系解已知:农民交售农副产品增加收入亿元, 与去年相比增长幅度为12%; 农副产品收购数量增长 %, 农民增加收入 亿元; 农副产品收购价格上涨 %, 农民增加收入 亿元.显然,有:⎩⎨⎧+=⨯=(亿元)5.727.902.16300.10567.10600.112%%%可见,分析结论是协调一致的.某企业生产的三种产品的有关资料如下:(1) 根据上表资料计算相关指标填入上表(见绿色区域数字); (2) 计算产品产量总指数及由于产量增长而增加的总成本;(3)计算单位成本总指数及由于单位成本变动而增减的总成本.解建立指数体系:结论:计算结果表明:由于产量总指数增加了37%(=%-1),而使总成本增加了37元,由于单位成本总指数下降了%(=%-1),使总成本减少了元.两个因素共同影响使总成本上升了%,增加了元.9.8某商场的销售资料如下:(1)根据上表资料计算相关指标填入上表(见绿色区域数字);(2)计算商品销售量总指数及由于销量变化而增减的销售额;(3)计算商品价格总指数及由于价格变动而增减的销售额.解建立指数体系:计算结果表明:由于商品销量总指数下降了%(=%),而使销售额减少了万元,由于商品价格总指数下降了%(=%),使销售额减少了万元.两个因素共同影响使销售总额下降了%(=%),减少了54万元.某乡力图通过推广良种和改善田间耕作管理来提高粮食生产水平,有关生产情况如下表所示:(1) 该乡粮食平均亩产提高了百分之几由此增产粮食多少吨 (2)(3) 改善田间耕作管理使平均亩产提高多少增产粮食多少吨 (4)(5) 推广良种使平均亩产提高多少增产粮食多少吨 (6)解计算的相关数据(∑∑∑110100110100x f x f x f x f x f x f )见上表中绿色区域数字;从而有:建立指数体系: ⎪⎩⎪⎨⎧-+=-⨯=)()-(10011001假假假假x x x x x x x x x x x x 即 ()()⎪⎩⎪⎨⎧-+-=-⨯=000 657 48000 737 49000 478 46000 657 48000 478 46000 737 4948.40548.417 32.38748.40532.38748.417 即 ()⎩⎨⎧+=⨯=公斤 000 080 1000 179 2000 259 3 %22.102 %69.104%01.107分析结论: 计算结果表明(1)该乡粮食平均亩产提高了%(=%-1),由此增产粮食3 259吨; (2)由于改善田间管理,使平均亩产提高了%,粮食增产2 179吨; (3)由于推广优良品种,使平均亩产提高了%,粮食增产1 080吨.第十章 时间序列分析某公司2009年末有职工250人,10月上旬的人数变动情况是:10月4日新招聘12名大学生上岗,6日有4名老职工退休离岗,8日有3名青年职工应征入伍,同日又有3名职工辞职离岗,9日招聘7名销售人员上岗.试计算该公司10月上旬的平均在岗人数. 解)(25610256010518252516524750212232)7334262(1)334262(2)4262(2)12250(3250人==++++=++++⨯+---+⨯---+⨯-+⨯++⨯==∑∑iii fxf x 答:该公司10月上旬的平均在岗人数为256人. 某银行2009年部分月份的现金库存额资料如下:要求:(1)该时间序列属于哪一种时间序列.(2)分别计算该银行该年第一、二季度和上半年的平均现金库存额. 解(1) 该时间序列属于动态时点时间序列; (2) 第一季度平均现金库存额:)(4803144032520450480250014224321万元==+++=-+++=x x x x x ; 第二季度平均现金库存额:)(5673170032580600550252014227324万元==+++=-+++=x x x x x ; 上半年平均现金库存额:)(52363140625806005505204504802500172 (2)721万元==++++++=-+++=x x x x 某企业08年上半年的产量和单位成本资料如下:试计算该企业08年上半年的产品平均单位成本.解答:该企业08年上半年的产品平均单位成本为元. 某企业有关资料如下,计算该企业一季度人均月销售额.解 该企业一季度月平均销售额:)(33.12331201501003321万元=++=++=a a a a ;该企业一季度月平均职工人数:)(1133211611012021003224321人=+++=+++=b b b b b ; 该企业一季度人均月销售额:)/(091.111333.123人万元===ba c .某市2001~2005年的地区生产总值如下表:(1) 按平均发展速度估计2002~2004年的地区生产总值. (2) 按此5年的平均发展速度预测2008年和2010年的GDP.解(1)2002~2006年泉州市地区生产总值的平均发展速度为:%12.11399316264==v ; 按平均发展速度估计2002~2004年的地区生产总值分别为:11437%)12.113(9931270%)12.113(9931123%12.11399332=⨯=⨯=⨯(将计算结果填入上表绿色区域内);(2)按此5年的平均发展速度预测2008年和2010年的GDP 分别为:2008年地区GDP 预测值)(23541312.116263亿元=⨯=; 2010年地区GDP 预测值)(7.30111312.116265亿元=⨯=.我国某地区2001年~ 2006年税收总额如下:试计算:(1)环比发展速度和定基发展速度; (2)环比增长速度和定基增长速度; (3)增长1%绝对值;(4)用水平法计算平均增长速度;(5)分析表中所列资料反映的趋势特征,拟配合适的趋势模型,并预测2007年该地区的税收收入.解(1)~(3)相关计算结果填入下表(见绿色区域数字):(4) 用水平法计算平均发展速度和平均增长速度:平均发展速度%44.1161644.11404.22821603855====v ; 则平均增长速度%44.161%44.1161=-=-=v ;。

北京师范大学《统计学》课后习题答案

北京师范大学《统计学》课后习题答案
4.二V=0.0850,c=0.0847。
第八章
二、 选择题
1.B;2.A;3.C;4.B;5.D
三、 计算题
1.r =0.9540
2.
2
⑵R=0.8980,表明自变量能解释因变量89.81%左右的变动。
(3)t(l?) =7.2705,t(b?)At0.025(6)=2.4469,斜率系数通过参数显著性检验。
4.(1)630人;(2)647人
第六章
二、 选择题
1. B;2.D
三、 计算题
1.比例相同2.重量为10盎司3.合规定4.无差别5.有影响
第七章
二、计算题
1.(1)设不同年级学生赞成此项教学计划改革的态度比例分别为Pi,原假设和备择假设分
别为:
H0:P1=P2=P3=P4=0.66
H1:P1,P2,P3,P4不全相等
第四章
二、单选题
1.C;2.B;3.B;4.B;5.D;6.C;7.D;8.B;9.A;10.D;11.C;12.D;13.D;14.A;15.B;
16.A;17.C;18.C;19.B;20.C;21.D;22.B;23.C;24.B;25.B;26.B;27.A;28.B;
29.A;30.C;31.B;32.A;33.C
(2)计算得:2=3.0319
(3)查表得(3)=6.2511。由于<^20.1(3),故不能拒绝原假设H。。最后得出结论:
造成的。
2 2
2•计算得贸=1.91"0.05(1),即新推销员的推销业绩与公司期望的平均业绩无明显差别。
3•计算得 护=0.1624£尸0.05(4),即工人的生产水平与其年龄无关。
30.23
260
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
相关文档
最新文档