人大统计学2010、2011年考研真题及简要答案
2011年中国人民大学统计学院804统计学考研真题(回忆版)【圣才出品】

2011年中国人民大学统计学院804统计学考研真题(回忆版)感觉很注重统计思想和方法的考察,题目很不错!一、简答题(50分)1.简述加权最小二乘估计的基本思想。
2.进行主成分分析需是否要知道数据的具体分布,请说明原因。
3.K-均值聚类对比分层聚类,优点在哪里。
4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。
5.简述方差分析和回归分析的异同。
二、已知X与W相互独立(30分)。
1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。
2.W服从正态分布,其期望为零,方差为Ɛ2,Y=b0+b1X+b2X2+W,当X=x时求Y的条件期望。
三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(描述了这六个阶段的具体操作方法)。
(30分)1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正)。
2.指出CPI的调查过程中误差的可能来源。
3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。
4.如果每个阶段的调查都严格按照1-α的置信水平,那么总的置信水平是多少。
四、假设女性和男性读书的语速都服从正态分布。
研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。
请问研究者的方法对吗?为什么?应该怎样验证?(20分)五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程(20分)。
中国人民大学题库答案详解-高等统计

一、多项选择题1. 有关样本的分布,以下陈述正确的是:ABCA. 如果样本X1,…,X n独立同分布来自Gamma分布,= 在大样本下有近似的正态分布;(中心极限定理)B.如果样本X1,…,X n独立同分布来自N(µ,σ2),= 在大样本情况下有精确分布N(µ,σ2/n);(原分布为正态分布)C.如果样本X1,…,X n独立同分布来自N(µ,σ2),即使样本量不大,= 也服从正态分布;(原分布为正态分布)D.如果样本X1,…,X n来自任意分布,在大样本情况下,由X1,…,X n组成的数据有近似的正态分布;(不符合中心极限定理(样本均值))2.有关检验的p值,下面说法正确的是:BCA. 一般为[0,0.1]之间的一个很小的概率;(P值一般[0,1])B. 接受备择假设的最小显著性水平;C. 如果p值小于显著性水平,则拒绝零假设;D. 样本统计量的分布函数。
(P值是概率值不是分布)3. 请问以下哪些方法可以用来判断数据可能背离正态分布:BA. Q-Q图上,如果数据和基线之间几乎吻合;(要利用QQ图鉴别样本数据是否近似于正态分布,只需要看QQ图上的点是否近似的在一条直线附近,而且,该直线的斜率为标准差,截距为均值。
)B. Kolmogrov-Smirnov正态检验中的统计量所对应的p值小于0.05;(P值小于0.05拒绝原假设,即正态分布不成立)C.对数据直方图做光滑后没有发现数据有很大的发散趋势;(通过形状是否为正态钟形来判断)D.χ2拟合优度检验,统计量的值偏小。
(卡方统计量偏小则不拒绝原假设(H0:分布为正态))4.若抽样误差为5,总体标准差为40,如果样本量足够大,正态分布的0.975分位数近似为2,要估计总体均值的95%的置信区间所需要的样本量大概为:B A 156 B 256 C 356 D 456.(n= = 4*1600/25 = 256)5.关于假设检验,给定一组独立同分布的随机样本,给定显著性水平,如下理解正确的是:DA.单边检验拒绝,双边检验一定拒绝;B.双边检验接受,一定有一个单边检验是拒绝的;C.单边检验拒绝,双边检验一定拒绝。
大学《统计学》考研真题答案

一、单项选择题1在抽样推断中,总体参数是一个()。
[中央财经大学2018研]A.随机变量B.已知的量C.统计量D.确定的量【答案】D【解析】参数往往可以决定总体特征,是一个确定的常量,但在实际研究中,由于总体数据通常是未知的,所以参数是未知的,需要研究人员通过统计推断进行估计。
2统计年鉴中2016年全国各大城市的人均家庭收入数据属于()。
[中央财经大学2018研]A.定类数据B.定序数据C.截面数据D.时间序列数据【答案】C【解析】根据所描述现象与时间的关系,统计数据可分为截面数据和时间序列数据。
其中,截面数据是在相同或近似相同的时间点上获得的不同空间的数据,用于描述现象在某一时刻的变化情况。
比如,2020年我国各地区的国内生产总值。
时间序列数据是在不同时间收集到的同一对象的数据,用于描述现象随时间变化的情况。
比如2010~2020年我国的国内生产总值。
3一份研究报告显示,“由1000台手机组成的一个样本表明,国外产手机的价格明显高于国产的手机”。
这一结论属于()[湖南师范大学2018研]A.对样本的描述B.对总体的推断C.对样本的推断D.对总体的描述【答案】B【解析】推断统计指的是从总体中抽取样本,并利用样本数据来推断总体特征的统计方法。
本题通过1000台手机的样本信息,得出“外国产手机的价格明显高于国产的手机”的结论,属于对总体的推断。
4在教学评估中,某省三所高校的等级分别是优秀、良好、及格,则“等级”是()。
[浙江工商大学2017研]A.品质标志B.数量标志C.标志值D.数量指标【答案】A【解析】“等级”属于顺序数据,只能用文字来描述,因此是品质标志,其标志值为“优秀”“良好”“及格”。
5下面不属于描述统计问题的是()。
[山东大学2015研]A.根据样本信息对总体进行的推断B.了解数据分布的特征顺序数据C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据【答案】A【解析】描述统计是通过图表或数学方法,对数据资料进行汇总、整理、分析,并对数据的分布状态、总体特征和随机变量之间关系进行描述的方法。
统计学参考答案2011

中央财经大学2010-2011学年第二学期《统计学》参考答案和评分标准一、单项选择题(选出最为恰当的一项。
每题1分,共20分)。
1A6B11B16D2C7A12B17C3D8B13B18B4C9D14C19C5D10D15B20D 二、多项选择题(至少有一个选项是正确,多选、少选均不得分。
每题2分,共10分)。
1BDE2AD3ABD4ACE5BC三、判断题(每题1分,共10分)。
1×2×3×4√5√6√7×8×9×10√四、计算与案例分析题(共60分)。
1.此次调查的目标总体为全国大学生。
在问卷调查法中仅仅针对部分南方高校进行了调查,显然缺乏代表性。
网络问卷调查部分通过QQ、EMAIL、留言板等方式让各大高校的部分学生网上答卷,未看到问卷和看到但不想答问卷的学生不在调查范围内,显然会降低样本的代表性。
访谈的方式中未说明“随机选择”是如何实现的,很可能是任意选择的,并且只对愿意接受访问人员进行访问,也不能保证调查结果的代表性。
总体来说,本次调查的结果可能是一次成功的案例研究,其调查结果也有一定意义,但如将样本的特征简单扩展到总体则是错误的。
评分标准:能够说明调查属于非概率抽样,抽样方法是非随机的即可得分。
共5分。
83978/1921×100%2.(1)平均增长速度=-1=9.53%。
(3分)(2)2008和2007年相比,价值指数=22698/19524=116.26%,数量指数=3978/3670=108.39%,因此价格指数=116.26%/108.39%=107.26%。
价格上涨了7.26%。
本题可以有不同的计算思路,结果正确即可(3分)3. (1)原假设为总体(高速路或市区)数据服从正态分布;备择假设为不服从正态分布。
两个总体K-S检验的p值均为0.200,大于0.05,因此结论为不能拒绝零假设。
(3分)(2)可以认为两个总体的方差相等,因为在相应的F检验中的p值为0.105大于0.05,说明不能拒绝方差相等的原假设。
2011考研数学一真题及答案解析

2011年全国硕士研究生入学统一考试数学一试题一、选择题:1~8小题,每小题4分,共32分,下列每题给出的四个选项中,只有一个选项符合题目要求,请将所选项前的字母填在答题纸...指定位置上. (1) 曲线234(1)(2)(3)(4)y x x x x =----的拐点是( )(A) (1,0). (B) (2,0). (C) (3,0). (D) (4,0). (2) 设数列{}n a 单调减少,lim 0n n a →∞=,1(1,2,)nn kk S an ===∑ 无界,则幂级数1(1)nn n a x ∞=-∑的收敛域为( )(A) (1,1]-. (B) [1,1)-. (C) [0,2). (D) (0,2]. (3) 设函数()f x 具有二阶连续导数,且()0f x >,(0)0f '=,则函数()ln ()z f x f y =在点(0,0)处取得极小值的一个充分条件是( )(A) (0)1f >,(0)0f ''>. (B) (0)1f >,(0)0f ''<. (C) (0)1f <,(0)0f ''>. (D) (0)1f <,(0)0f ''<.(4) 设40ln sin I x dx π=⎰,4ln cot J x dx π=⎰,40ln cos K x dx π=⎰,则,,I J K 的大小关系是( )(A) I J K <<. (B) I K J <<. (C) J I K <<. (D) K J I <<.(5) 设A 为3阶矩阵,将A 的第2列加到第1列得矩阵B ,再交换B 的第2行与第3行得单位矩阵,记1100110001P ⎛⎫ ⎪= ⎪ ⎪⎝⎭,2100001010P ⎛⎫ ⎪= ⎪ ⎪⎝⎭,则A =( ) (A) 12P P . (B) 112P P -. (C) 21P P . (D) 121PP -. (6) 设1234(,,,)A αααα=是4阶矩阵,*A 为A 的伴随矩阵,若(1,0,1,0)T是方程组0Ax =的一个基础解系,则*0A x =的基础解系可为( )(A) 13,αα. (B) 12,αα. (C) 123,,ααα. (D) 234,,ααα.(7) 设1()F x ,2()F x 为两个分布函数,其相应的概率密度1()f x ,2()f x 是连续函数,则必为概率密度的是( )(A)12()()f x f x . (B)212()()f x F x .(C)12()()f x F x . (D)1221()()()()f x F x f x F x +.(8) 设随机变量X 与Y 相互独立,且()E X 与()E Y 存在,记{}max ,U X Y =,{}min ,V X Y =则()E UV =( )(A)()()E U E V ⋅. (B)()()E X E Y ⋅. (C)()()E U E Y ⋅. (D)()()E X E V ⋅.二、填空题:9~14小题,每小题4分,共24分,请将答案写在答题纸...指定位置上. (9) 曲线0tan (0)4π=≤≤⎰xy tdt x 的弧长s = .(10) 微分方程cos xy y e x -'+=满足条件(0)0y =的解为y = .(11) 设函数2sin (,)1xytF x y dt t =+⎰,则222x y F x ==∂=∂ .(12) 设L 是柱面方程221x y +=与平面=+z x y 的交线,从z 轴正向往z 轴负向看去为逆时针方向,则曲线积分22L y xzdx xdy dz ++=⎰ . (13) 若二次曲面的方程22232224x y z axy xz yz +++++=,经过正交变换化为221144y z +=,则a = .(14) 设二维随机变量(),X Y 服从正态分布()22,;,;0N μμσσ,则()2E XY = .三、解答题:15~23小题,共94分.请将解答写在答题纸...指定的位置上.解答应写出文字说明、证明过程或演算步骤.(15)(本题满分10分)求极限110ln(1)lim()x e x x x-→+.(16)(本题满分9分)设函数(,())z f xy yg x =,其中函数f 具有二阶连续偏导数,函数()g x 可导且在1x =处取得极值(1)1g =,求211x y zx y==∂∂∂.(17)(本题满分10分)求方程arctan 0k x x -=不同实根的个数,其中k 为参数.(18)(本题满分10分)(Ⅰ)证明:对任意的正整数n ,都有111ln(1)1n n n<+<+ 成立. (Ⅱ)设111ln (1,2,)2n a n n n=+++-=,证明数列{}n a 收敛.(19)(本题满分11分)已知函数(,)f x y 具有二阶连续偏导数,且(1,)0f y =,(,1)0f x =,(,)Df x y dxdy a =⎰⎰,其中{}(,)|01,01D x y x y =≤≤≤≤,计算二重积分''(,)xy DI xy f x y dxdy =⎰⎰.(20)(本题满分11分)设向量组123(1,0,1)(0,1,1)(1,3,5)T T T ααα===,,,不能由向量组1(1,1,1)Tβ=,2(1,2,3)T β=,3(3,4,)T a β=线性表示.(I) 求a 的值;(II) 将123,,βββ由123,,ααα线性表示.(21)(本题满分11分)A 为三阶实对称矩阵,A 的秩为2,即()2r A =,且111100001111A -⎛⎫⎛⎫ ⎪ ⎪= ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭.(I) 求A 的特征值与特征向量;(II) 求矩阵A . (22)(本题满分11分)设随机变量X 与Y且{}221P X Y ==.(I) 求二维随机变量(,)X Y 的概率分布; (II) 求Z XY =的概率分布; (III) 求X 与Y 的相关系数XY ρ.(23)(本题满分 11分) 设12,,,n X X X 为来自正态总体20(,)μσN 的简单随机样本,其中0μ已知,20σ>未知.X 和2S 分别表示样本均值和样本方差.(I) 求参数2σ的最大似然估计量2σ∧; (II) 计算2()E σ∧和2()D σ∧.2011年全国硕士研究生入学统一考试数学一试题答案一、选择题:1~8小题,每小题4分,共32分,下列每题给出的四个选项中,只有一个选项符合题目要求,请将所选项前的字母填在答题纸...指定位置上. (1)【答案】(C).【解析】记1111,1,0y x y y '''=-==,2222(2),2(2),2,y x y x y '''=-=-= 32333(3),3(3),6(3),y x y x y x '''=-=-=- 432444(4),4(4),12(4),y x y x y x '''=-=-=- (3)()y x P x ''=-,其中(3)0P ≠,30x y =''=,在3x =两侧,二阶导数符号变化,故选(C).(2)【答案】(C).【解析】观察选项:(A),(B),(C),(D)四个选项的收敛半径均为1,幂级数收敛区间的中心在1x =处,故(A),(B)错误;因为{}n a 单调减少,lim 0n n a →∞=,所以0n a ≥,所以1nn a∞=∑为正项级数,将2x =代入幂级数得1nn a∞=∑,而已知S n =1nkk a=∑无界,故原幂级数在2x =处发散,(D)不正确.当0x =时,交错级数1(1)nn n a ∞=-∑满足莱布尼茨判别法收敛,故0x =时1(1)nn n a ∞=-∑收敛.故正确答案为(C).(3)【答案】(A). 【解析】(0,0)(0,0)|()ln ()|(0)ln (0)0zf x f y f f x∂''=⋅==∂, (0,0)(0,0)()|()|(0)0,()z f y f x f y f y '∂'=⋅==∂故(0)0f '=, 2(0,0)(0,0)2|()ln ()|(0)ln (0)0,zA f x f y f f x∂''''==⋅=⋅>∂22(0,0)(0,0)()[(0)]|()|0,()(0)z f y f B f x x y f y f ''∂'==⋅==∂∂222(0,0)(0,0)22()()[()][(0)]|()|(0)(0).()(0)z f y f y f y f C f x f f y f y f ''''∂-''''==⋅=-=∂ 又22[(0)]ln (0)0,AC B f f ''-=⋅>故(0)1,(0)0f f ''>>. (4)【答案】(B). 【解析】因为04x π<<时, 0sin cos 1cot x x x <<<<,又因ln x 是单调递增的函数,所以lnsin lncos lncot x x x <<. 故正确答案为(B). (5)【答案】 (D).【解析】由于将A 的第2列加到第1列得矩阵B ,故100110001A B ⎛⎫ ⎪= ⎪ ⎪⎝⎭, 即1AP B =,11A BP -=. 由于交换B 的第2行和第3行得单位矩阵,故100001010B E ⎛⎫⎪= ⎪ ⎪⎝⎭, 即2,P B E =故122B P P -==.因此,121A P P -=,故选(D).(6)【答案】(D).【解析】由于(1,0,1,0)T 是方程组0Ax =的一个基础解系,所以(1,0,1,0)0TA =,且()413r A =-=,即130αα+=,且0A =.由此可得*||A A A E O ==,即*1234(,,,)A O =αααα,这说明1234,,,αααα是*0A x =的解.由于()3r A =,130αα+=,所以234,,ααα线性无关.又由于()3r A =,所以*()1r A =,因此*0A x =的基础解系中含有413-=个线性无关的解向量.而234,,ααα线性无关,且为*0A x =的解,所以234,,ααα可作为*0A x =的基础解系,故选(D).(7)【答案】(D). 【解析】选项(D)1122()()()()f x F x f x F x dx +∞-∞⎡⎤+⎣⎦⎰2211()()()()F x dF x F x dF x +∞-∞⎡⎤=+⎣⎦⎰21()()d F x F x +∞-∞⎡⎤=⎣⎦⎰12()()|F x F x +∞-∞=1=.所以1221()()f F x f F x +为概率密度.(8)【答案】(B).【解析】因为 {},,max ,,,X X Y U X Y Y X Y ≥⎧==⎨<⎩ {},,min ,,Y X Y V X Y X X Y ≥⎧==⎨<⎩.所以,UV XY =,于是()()E UV E XY = ()()E X E Y =.二、填空题:9~14小题,每小题4分,共24分,请将答案写在答题纸...指定位置上. (9)【答案】(ln 1.【解析】选取x 为参数,则弧微元sec ds xdx ===所以440sec ln sec tan ln(1s xdx x x ππ==+=+⎰. (10)【答案】sin xy e x -=.【解析】由通解公式得(cos )dx dxx y e e x e dx C --⎰⎰=⋅+⎰(cos )x e xdx C -=+⎰(sin )xe x C -=+.由于(0)0,y =故C =0.所以sin xy e x -=.(11)【答案】4. 【解析】2sin 1()F xyy x xy ∂=⋅∂+, 22222cos sin 2[1()]F y xy xy xy y x xy ∂-⋅=⋅∂+, 故2(0,2)2|4Fx∂=∂. (12)【答案】π.【解析】取22:0,1S x y z x y +-=+≤,取上侧,则由斯托克斯公式得,原式=22SS dydz dzdx dxdy ydydz xdzdx dxdy x y z y xzx∂∂∂=++∂∂∂⎰⎰⎰⎰.因'',1, 1.x y z x y z z =+==由转换投影法得221[(1)(1)1]Sx y ydydz xdzdx dxdy y x dxdy +≤++=⋅-+-+⎰⎰⎰⎰.221(1)x y x y dxdy π+≤=--+=⎰⎰221x y dxdy π+≤==⎰⎰.(13)【答案】1a =.【解析】由于二次型通过正交变换所得到的标准形前面的系数为二次型对应矩阵A 的特征值,故A 的特征值为0,1,4.二次型所对应的矩阵1131111a A a ⎛⎫ ⎪= ⎪ ⎪⎝⎭,由于310ii A λ===∏,故113101111a a a =⇒=.(14)【答案】()22μμσ+.【解析】根据题意,二维随机变量(),X Y 服从()22,;,;0N μμσσ.因为0xy ρ=,所以由二维正态分布的性质知随机变量,X Y 独立,所以2,X Y .从而有()()()()()()22222E XY E X E Y D Y E Y μμμσ⎡⎤==+=+⎣⎦. 三、解答题:15~23小题,共94分.请将解答写在答题纸...指定的位置上.解答应写出文字说明、证明过程或演算步骤.(15)(本题满分10分)【解析】110ln(1)lim[]x e x x x-→+0ln(1)1lim[1].1x x x x e e →+--=2ln(1)limx x xx e→+-=22201()2lim x x x o x x x e→-+-=22201()2lim x x o x x e→-+=12e -=.(16)(本题满分9分) 【解析】[],()z f xy yg x =[][]12,(),()()zf xy yg x y f xy yg x yg x x∂'''=⋅+⋅∂[][]211112,()(,())(,())()zf xy yg x y f xy yg x x f xy yg x g x x y∂'''''=++∂∂ []{}21222(),()()[,()][,()]()g x f xy yg x yg x f xy yg x x f xy yg x g x '''''''+⋅+⋅+. 因为()g x 在1x =可导,且为极值,所以(1)0g '=,则21111121|(1,1)(1,1)(1,1)x y d zf f f dxdy =='''''=++. (17)(本题满分10分)【解析】显然0x =为方程一个实根. 当0x ≠时,令(),arctan xf x k x=-()()22arctan 1arctan xx x f x x -+'=. 令()2arctan 1x g x x x R x =-∈+,()()()222222211220111x x x x g x x x x +-⋅'=-=>+++, 即(),0x R g x '∈>. 又因为()00g =,即当0x <时,()0g x <; 当0x >时,()0g x >. 当0x <时,()'0f x <;当0x >时,()'0f x >.所以当0x <时,()f x 单调递减,当0x >时,()f x 单调递增 又由()00lim lim1arctan x x xf x k k x→→=-=-,()lim lim arctan x x xf x k x→∞→∞=-=+∞, 所以当10k -<时,由零点定理可知()f x 在(,0)-∞,(0,)+∞内各有一个零点; 当10k -≥时,则()f x 在(,0)-∞,(0,)+∞内均无零点.综上所述,当1k >时,原方程有三个根.当1k ≤时,原方程有一个根.(18)(本题满分10分)【解析】(Ⅰ)设()()1ln 1,0,f x x x n ⎡⎤=+∈⎢⎥⎣⎦显然()f x 在10,n⎡⎤⎢⎥⎣⎦上满足拉格朗日的条件,()1111110ln 1ln1ln 1,0,1f f n n n n n ξξ⎛⎫⎛⎫⎛⎫⎛⎫-=+-=+=⋅∈ ⎪ ⎪ ⎪ ⎪+⎝⎭⎝⎭⎝⎭⎝⎭所以10,n ξ⎛⎫∈ ⎪⎝⎭时, 11111111101n n n nξ⋅<⋅<⋅+++,即:111111n n n ξ<⋅<++, 亦即:111ln 11n n n⎛⎫<+< ⎪+⎝⎭. 结论得证.(II )设111111ln ln 23nn k a n n n k==++++-=-∑. 先证数列{}n a 单调递减.()111111111ln 1ln ln ln 1111n n n n k k n a a n n k k n n n n ++==⎡⎤⎡⎤⎛⎫⎛⎫-=-+--=+=-+ ⎪ ⎪⎢⎥⎢⎥+++⎝⎭⎝⎭⎣⎦⎣⎦∑∑,利用(I )的结论可以得到11ln(1)1n n <++,所以11ln 101n n ⎛⎫-+< ⎪+⎝⎭得到1n n a a +<,即数列{}n a 单调递减.再证数列{}n a 有下界.1111ln ln 1ln nnn k k a n n k k ==⎛⎫=->+- ⎪⎝⎭∑∑,()11112341ln 1ln ln ln 1123nnk k k n n k k n ==++⎛⎫⎛⎫⎛⎫+==⋅⋅=+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭∑∏, ()1111ln ln 1ln ln 1ln 0nnn k k a n n n n k k ==⎛⎫=->+->+-> ⎪⎝⎭∑∑.得到数列{}n a 有下界.利用单调递减数列且有下界得到{}n a 收敛.(19)(本题满分11分) 【解析】11''(,)xy I xdx yf x y dy =⎰⎰11'0(,)x xdx ydf x y =⎰⎰()()111'000,|,x x xdx yf x y f x y dy ⎡⎤'=-⎢⎥⎣⎦⎰⎰()11''0(,1)(,)x x xdx f x f x y dy =-⎰⎰.因为(,1)0f x =,所以'(,1)0x f x =.11'0(,)x I xdx f x y dy =-⎰⎰11'0(,)x dy xf x y dx =-⎰⎰111000(,)|(,)dy xf x y f x y dx ⎡⎤=--⎢⎥⎣⎦⎰⎰1100(1,)(,)dy f y f x y dx ⎡⎤=--⎢⎥⎣⎦⎰⎰Dfdxdy =⎰⎰a =.(20)(本题满分11分)【解析】(I)由于123,,ααα不能由123,,βββ线性表示,对123123(,,,,,)βββααα进行初等行变换:123123113101(,,,,,)12401313115a ⎛⎫ ⎪= ⎪⎪⎝⎭βββααα113101011112023014a ⎛⎫ ⎪→- ⎪ ⎪-⎝⎭113101011112005210a ⎛⎫ ⎪→- ⎪ ⎪--⎝⎭. 当5a =时,1231231(,,)2(,,,)3r r ββββββα=≠=,此时,1α不能由123,,βββ线性表示,故123,,ααα不能由123,,βββ线性表示.(II)对123123(,,,,,)αααβββ进行初等行变换:123123101113(,,,,,)013124115135⎛⎫ ⎪= ⎪ ⎪⎝⎭αααβββ101113013124014022⎛⎫ ⎪→ ⎪ ⎪⎝⎭101113013124001102⎛⎫ ⎪→ ⎪ ⎪--⎝⎭1002150104210001102⎛⎫ ⎪→ ⎪ ⎪--⎝⎭, 故112324βααα=+-,2122βαα=+,31235102βααα=+-.(21)(本题满分11分)【解析】(I)由于111100001111A -⎛⎫⎛⎫⎪ ⎪= ⎪ ⎪ ⎪ ⎪-⎝⎭⎝⎭,设()()121,0,1,1,0,1T T αα=-=,则()()1212,,A αααα=-,即1122,A A αααα=-=,而120,0αα≠≠,知A 的特征值为121,1λλ=-=,对应的特征向量分别为()1110k k α≠,()2220k k α≠.由于()2r A =,故0A =,所以30λ=.由于A 是三阶实对称矩阵,故不同特征值对应的特征向量相互正交,设30λ=对应的特征向量为()3123,,Tx x x α=,则13230,0,T T⎧=⎨=⎩αααα即13130,0x x x x -=⎧⎨+=⎩.解此方程组,得()30,1,0Tα=,故30λ=对应的特征向量为()3330k k α≠.(II) 由于不同特征值对应的特征向量已经正交,只需单位化:))()3121231231,0,1,1,0,1,0,1,0T T Tαααβββααα==-====. 令()123,,Q βββ=,则110TQ AQ -⎛⎫⎪=Λ= ⎪ ⎪⎝⎭, TA Q Q =Λ0220122001100010022⎛-⎛⎫ ⎪⎪-⎛⎫ ⎪⎪ ⎪= ⎪⎪ ⎪⎪ ⎪ ⎪⎝⎭ ⎪ ⎪- ⎪ ⎪⎝⎭⎪⎝⎭2200122000000022100010⎛-⎛⎫- ⎪ ⎪⎛⎫⎪ ⎪ ⎪==⎪ ⎪ ⎪⎪ ⎪ ⎪⎝⎭⎪ ⎪⎪ ⎪⎝⎭ ⎪⎝⎭.(22)(本题满分11分)【解析】(I)因为{}221P X Y==,所以{}{}222210≠=-==P X Y P X Y.即{}{}{}0,10,11,00P X Y P X Y P X Y==-=======.利用边缘概率和联合概率的关系得到{}{}{}{}1 0,000,10,13P X Y P X P X Y P X Y====-==--===;{}{}{}11,110,13P X Y P Y P X Y==-==--==-=;{}{}{}11,110,13P X Y P Y P X Y====-===.即(II)Z的所有可能取值为1,0,1-.{}{}111,13P Z P X Y=-===-=.{}{}111,13P Z P X Y=====.{}{}{}101113P Z P Z P Z==-=-=-=.Z XY=的概率分布为(III)因为XYCov XY E XY E X E Yρ-⋅==,其中()()1111010333E XY E Z ==-⋅+⋅+⋅=,()1111010333E Y =-⋅+⋅+⋅=.所以()()()0-⋅=E XY E X E Y ,即X ,Y 的相关系数0ρ=XY . (23)(本题满分 11分)【解析】因为总体X 服从正态分布,故设X的概率密度为202()2()x f x μσ--=,x -∞<<+∞.(I) 似然函数22002211()()22222211()(;)](2)ni i i x n nnx i i i L f x eμμσσσσπσ=-----==∑===∏∏;取对数:222021()ln ()ln(2)22ni i x n L μσπσσ=-=--∑; 求导:22022221()ln ()()22()ni i x d L nd μσσσσ=-=-+∑2202211[()]2()nii x μσσ==--∑.令22ln ()0()d L d σσ=,解得22011()n i i x n σμ==-∑. 2σ的最大似然估计量为02211()ni i X n σμ∧==-∑.(II) 方法1:20~(,)μσi X N ,令20~(0,)i i Y X N μσ=-,则2211n i i Y n σ=∧=∑.2212221()()()()[()]n i i i i i E E Y E Y D Y E Y n σσ=∧===+=∑.2222212221111()()()()n i n i i D D Y D Y Y Y D Y n nnσ∧===+++=∑ 442244112{()[()]}(3)σσσ=-=-=i i E Y E Y n n n. 方法2:20~(,)μσi X N ,则~(0,1)i X N μσ-,得到()2201~nii X Y n μχσ=-⎛⎫= ⎪⎝⎭∑,即()2201ni i Y X σμ==-∑.()()222222011111()n i i E E X E Y E Y n n n n n μσσσσσ=∧⎛⎫⎡⎤=-===⋅= ⎪⎢⎥⎣⎦⎝⎭∑.()()22444022222111112()2n i i D D X D Y D Y n nn n n n μσσσσσ=∧⎛⎫⎡⎤=-===⋅= ⎪⎢⎥⎣⎦⎝⎭∑.。
《统计学》人民大学出版社答案

一、思考题8.7 假设检验依据的基本原理是什么?答:假设检验的基本思想可以用小概率原理来解释。
所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。
也就是说,对总体的某个假设是真实的,那么不利于或不能支持这一假设的事件A在一次试验中是几乎不可能发生的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。
二、练习题8.7某种电元件的寿命x(单位:小时)服从正态分布。
现测得16只元件的寿命如下:159 280 101 212 224 379 179 264222 362 168 250 149 260 485 170问是否有理由认为元件的平均寿命显著的大于225小时(α=0.05)?解:16件元件的平均寿命测得为241.5小时。
标准差为98.7小时。
H0:μ≤225H1:μ>225t=(241.5-225)/(98.7/√16)=0.67当α=0.05时,自由度n-1=11,很容易可以知道拒绝域在右侧,查表得tα(15)=-1.7531由此可以证明,t的值在非拒绝域内,所以不拒绝原假设,没有理由认为元件的平均寿命显著大于225小时。
8.14 某工厂制造螺栓,规定螺栓口径为7.0cm,方差为0.03cm.今从一批螺栓中抽取80个测量其口径,得平均值为6.97cm,方差为0.0375cm。
假定螺栓口径为正态分布,问这批螺栓是否达到规定的要求(α=0.05)?解:σ=√0.03=0.1732H0:μ=7H1:μ≠7Z=(6.97-7)/(0.1732/√80)=-1.5492当α=0.05时,容易得知拒绝域在两侧,查表得临界值Zα/2=±1.96 |Z|<|Zα/2|由此可以证明,Z的值在非拒绝域内,所以不拒绝原假设,这批螺丝达到了规定的要求。
(111a)2011年1月—统计学—统一试题(a卷)中国人民大学贾俊平
4
D. 对于所有的 x 值, 的方差 2 都等于 1
14. 在多元线性回归分析中,如果 t 检验表明回归系数 i 不显著,则意味着( )。
A. 整个回归方程的线性关系显著 B. 整个回归方程的线性关系不显著
C. 自变量 xi 与因变量之间的线性关系可能不显著
D. 自变量 xi 与因变量之间的线性关系可能显著
批该厂生产的产品,但需要一份质检证明报告证明其合格率在 99%以上。(1)如 果是生产厂家自己出示一份质检报告,会提出怎样的备择假设?试说明理由。(2) 如果是销售商亲自抽检,会提出怎样的备择假设?试说明理由。
2. (10 分)从全校学生中随机抽取 200 人组成一个随机样本,根据 95%的置信水平,
统计学期末试题(A 卷)
选择题答题卡:
题号 1
2
3
4
5
6
7
8
9 10
答案
题号 11 12 13 14 15 16 17 18 19 20 答案
一. 单项选择题(每小题 1 分,共 20 分)
1. 指出下面的变量哪一个属于数值型变量( )。
A. 每月的生活费支出 C. 企业所属的行业
B. 产品质量的等级 D. 员工对企业某项改革措施的态度
(2) 取显著性水平 0.05 ,行业对盈利能力是否有显著影响?
(3) 在上面的检验中包含哪些假设?
2. (20 分)为预测城镇居民消费水平(元),选择我国 31 个地区的地区生产总值(亿元)、
消费价格总指数(%)和城镇居民可支配收入(元)作为自变量,经回归得到的有关 结果如下:
对所建立的多元线性回归模型进行评价。
A.置信区间 C.置信水平
B.显著性水平 D.临界值
11年432统计学真题及答案
2011年432统计学真题及答案浙江工商大学2011年硕士研究生入学考试试卷卷招生专业:应用统计硕士考试科目:432统计学总分:考试时间:3小时一. 单项选择题。
为了调查某校学生的购书费用支出,从各年级的学生中分别抽取100名学生,组成样本进行调查,这种抽样方法属于。
A. 简单随机抽样 B. 分层抽样 C. 系统抽样 D. 整群抽样已知某工厂生产的某零件的平均厚度是2厘米,标准差是厘米。
如果已知该厂生产的零件厚度为正态分布,可以判断厚度在厘米到厘米之间的零件大约占。
A. 95% B. 89% C. 68%D. 99%某校大二学生统计学考试的平均成绩是70分,标准差是10分,从该校大二学生中随机抽取100个同学作为样本,则样本均值的数学期望和抽样分布的标准误差分别为。
A. 70,10 B.70,1 C. 70,4 D. 10,10 根据一个具体的样本,计算总体均值的置信水平为90%的置信区间,则该区间。
A. 以90%的概率包含总体均值 B. 有10%的可能性包含总体均值 C. 绝对包含总体均值 D. 绝对包含总体均值或绝对不包含总体均值某企业计划投资2万元的广告费以提高某种新产品的销售量,企业经理认为做了广告可使每天销售量达100吨。
实行此计划9天后经统计知,这9天的日平均销售量为2吨。
假设每天的销售量服从正态分布N(?,?),在??的显著性水平下,检验此2. 3. 4. 5. 项计划是否达到了该企业经理的预计效果,建立的原假设和备择假设为。
A.H0:??100,H1:??100 B. H0:??100,H1:??100C.H0:??100,H1:??100 D.H0:??100,H1:??100 6. 在回归分析中,因变量的预测区间估计是指。
A. 对于自变量x的一个给定值x0,求出因变量y的平均值的区间答案写在答题纸上,写在试卷上无效第 1 页共 6 页 B. 对于自变量x 的一个给定值x0,求出因变量y的个别值的区间 C. 对于因变量y的一个给定值y0,求出自变量x的平均值的区间 D. 对于因变量y的一个给定值y0,求出自变量x的平均值的区间7. 在多元线性回归分析中,如果F检验表明线性关系显著,则意味着。
人民大学《统计学》题库及答案
1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:12中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:23中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:3一、(20分)在2008年8月10日举行的第29届北京奥运会女子10米气手枪决赛中,进入决赛的8名运动员的预赛成绩和最后10枪的决赛成绩如下表:要对各名运动员进行综合评价,使用的统计量有哪些?简要说明这些统计量的用途。
(1)集中趋势:指一组数据向某一中心值靠拢的程度,它可以反映选手射击成绩中心点的位置平均数:一组数据相加后除以数据的个数得到的结果。
若各组数据在组内是平均分布的,则计算的结果还是比较准确的,否则误差会比较大。
(如中国选手发挥很稳定,适合使用平均数判断其成绩)中位数:一组数据排序后处于中间位置上的变量值,但不受极端值的影响。
(如波兰选手大多数成绩比较平均,但有一枪打到8.1,会严重影响其平均值,但不会影响中位数)(2)离散程度:各变量值远离其中心值的程度,它可以反映选手发挥的稳定性标准差:方差的平方根,能够很好的反映出数据的离散程度,若选4中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:45中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:56中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:67中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:78中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:8一、(20分)在金融证券领域,一项投资的的预期收益率的变化通常用该项投资的风险来衡量。
(11-1-A)2011年1月—统计学—统一试题(A卷)中国人民大学贾俊平
B. 750
C. 890
D. 950
为了估计某地区小学生的平均体重, 在该地区的 100 所小学中随机抽取 1000 人进行调 查。在该项调查中,研究者感兴趣的统计量是( A. 该地区小学生的总人数 C. 该地区小学生中肥胖人数的比例 ) 。
B. 该地区所有小学生的平均体重 D. 所抽取的 1000 名小学生的平均体重
B. X3、X2 和 X5 D. X1 和 X4 ) 。
15. 在某行业中随机抽取 15 名员工,得到它们的月收入(单位:元)和性别的数据。其中 用 1 表示男性, 0 表示女性,用月收入作因变量,性别作自变量进行回归,得到的回
20. 进行聚类分析时,要求用于聚类的各变量的取值( A. 应该接近相等 C. 应该有数量级上的较大差异
2
) 。
A. 大于 0 C. 等于 1
对于所有的 x 值, 的方差 都相同 对于所有的 y 值, 的方差 都相同
2
19. 下面是根据 5 个变量进行因子分析得到的旋转后的因子载荷图。由该图可知第一个因 子所概括的变量是( ) 。
对于所有的 x 值, 的方差 都等于 0
2
对于所有的 x 值, 的方差 都等于 1
3
三 . 计算分析题(共 30 分) 1. (10 分)为检验来自不同行业的上市公司盈利能力是否存在显著差异,在三个行业的
上市公司中各随机抽取 6 家上市公司,得到 2008 年每股收益的数据。经方差分析得到 下面的方差分析表( 0.05 ) : 差异源 SS df 组间 组内 总计 25.761 11.110 36.872 2 15 17 MS 12.881 0.741 F 17.390 P-value 0.000124 F crit 3.682
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2010年考研题目
(一)五道问答题(50分)
1.两地区的什么比例(好像是收入的均值吧),运用t检验得出p值为0.132,据此能否得出这两个地区的均值相等的结论?
【分析】首先从前提假设来看,题目中没有给出假设条件,如果用t检验的话,需要的假设条件有
1、两个总体正态分布
2、总体方差未知
3、两个总体的样本独立抽取(否则为匹配样本)
4、小样本(n<30)
5、每一个总体样本内部也相互独立(否则为有限总体情况)
题目中除了假设条件没有以外,还缺少为判断标准的显著水平a,如果a>0.132则还是要拒绝原假设的。
如果还要写可以加上原假设未写明。
2.在参数统计中,卡方分布有哪些应用,并举例说明
【分析】在参数统计中,卡方分布有
时序:检验白噪声的lb统计量、q统计量
检验异方差相关性的Q统计量、lm统计量
GARCH模型六部最后一步检验正态性的偏度峰度服从自由度为2的开放分布;
多元:wills 统计量(就是多元中的F统计量)当不满足n、p的情况时就为卡方分布。
典型相关分析中检验典型相关系数的卡方分布。
多元中两个总体均值的假设检验,只要两个总体中最小的总体的数目趋于无穷则也服从卡方分布。
统计学:单个总体的方差假设检验或者是参数估计也服从卡方分布。
(有人说还有列联分析中拟合优度和独立性检验,不过我认为列联分析根本就不属于参数统计,列联分析是非参数统计的内容,所以这两个不能写入,其实多元中还有一个和马氏距离非常相似的公式也服从卡方分布,但是这台机子上没法打出符号,就请各位童鞋自己注意一下)
3.贝叶斯统计与经典统计的区别
【分析】贝叶斯统计的思想是假如对某一个总体有一定的了解,那么用先验分布来描述这种认识,然后从总体中抽取样本,用样本来修正这种认识得到后验分布,以后的推断通过都通过后验分布进行。
经典统计分描述统计和推断统计,其中描述统计是将数据通过图表进行分析,而推断统计则是直接通过样本来描述总体,并未涉及先验分布。
4.时间序列的弱平稳的含义
【分析】这个题目书上有,就不写了。
5.对于多元回归中的多重共线性的解决方法加以评价
【分析】这个题目书上也有明确的答案,但是要注意多重共线性解决方法中——剔除不重要的变量,要注意使用VIF而不要用特征根因为在特征值都很小的情况下,即使特征根不大也包含多重共线性,而且在使用这个方法的时候要注明,要和分析数据专业上的意义相结合共同决定一个变量是否剔除。
还有在有偏估计中主成分法对多重共线性的解决无能为力。
(二)给出三个运动员10次射击的数据,问哪些统计图图可以表示这些数据,及这些图的适用场合和特点。
用哪些统计量综合分析三个运动员的表现,这些统计量各有什么特点。
(15分)
【分析】这个题还是写一下思路吧,因为这个数据时定量数据,所以一些定性和定序数据的分析方法可以应用其中,比如条形图,帕累托图,对比条形图、环形图。
由于数据不是分组数据,所以可以用茎叶图和箱线图进行分析。
统计量方面,应该有众数、中位数、方差、标准差、极差等等(各位童鞋要多写啊!)
(三)R型聚类与Q型聚类含义?聚类分析与判别分析区别?层次聚类的步骤?(25分)
【分析】R型聚类是对变量进行聚类分析,其方法有相关系数和夹角余弦以及模糊聚类,并且R型聚类得到的相似系数可以和距离相互转化。
Q型聚类是对样本进行聚类分析,其方法有系统聚类法等。
聚类分析与判别分析的区别主要有:
1、判别分析有假设条件,聚类法没有;(这个假设条件要看,这里不写了)
2、判别分析是研究数值型自变量与分类型因变量之间的关系,聚类分析没有。
3、判别分析可以同时分析所有的样本,聚类分析需要分步完成聚类。
关于层级聚类法,其实就是系统聚类法,课本上的知识这里就不赘述了。
(四)消费者认为土豆片平均重量<60g,商家怀疑是运输过程中土豆片碎片沉积造成的。
商家从其最大供应商抽取样品进行检验,H0:均值大于等于60g,H1:均值小于60g,如果得出均值小于60g的结论商家将拒绝该供应商的土豆片并对其起诉。
(15分)
(1)该题中的第一类错误是什么?(2)第二类错误是什么?(3)顾客认为哪类错误比较重要?厂家认为哪类错误比较重要?
【分析】这个,这个就没有必要说了吧
(五)给出x1,x2,...,x7个自变量,要求找出能描述某市各县区经济发展的综合变量,从而分析经济发展的的内在原因。
用什么模型?这种模型对数据有什么要求?模型有哪些假设?如何得到参数估计值?如何根据结果分析该模型?(25分)
【分析】这个用因子分析法,课本上的知识,这里也不赘述了。
(六)银行估计其排队时间,随机抽取了15位顾客进行调查。
得到了一个排队均值的置信区间,请问要计算出均值的置信区间需要什么假设?如何验证数据是否满足这一假设?能不能说这个区间包含均值的真值?为什么?检验得到的p=一个很小的数(好心是10的负十次方),能不能说银行的认识正确?(20分)【分析】这个题也比较简单,在FAN大神的笔记里写的很清楚,大家可以去参考一下。
2011年统计学真题(回忆版)
一、简答题(50分)
1.简述加权最小二乘估计的基本思想。
2.进行主成分分析需是否要知道数据的具体分布,请说明原因。
3.k-均值聚类对比分层聚类,优点在哪里。
4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。
5.简述方差分析和回归分析的异同。
二、已知X与W相互独立(30分)。
1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。
2.W服从正态分布,其期望为零,方差为□2(是表示平方),Y=b0+b1X+b2X2(是表示平方)+W,当X=x时求Y的条件期望。
三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。
(30分)
1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。
2.指出CPI的调查过程中误差的可能来源。
3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。
4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。
四、假设女性和男性读书的语速都服从正态分布。
研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。
请问研究者的方法对吗?为什么?应该怎样验证?(20分)
五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。
(20分)。