中国人民大学805统计学历年真题

中国人民大学805统计学历年真题(2013-2000)

2013年人大805统计学真题

一、证明题:(20分)每题10分

1.袋子里有两种颜色的球红球a个白球b个

第一步从袋子里取出一个球观察其颜色然后丢掉

第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。

证明取出的最后一个球是红球的概率是1/2。

2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。

二、简述:(30分)每题10分

1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。

2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布

3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少?

的矩估计和最

四、X和Y是两个相关的随机变量:

求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分)

五、谈谈你对双因素方差分析的理解和认识。(25分)

六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

2012年人大805统计学真题

一、为研究不同地区与购买汽车的消费价格之间的相关关系,调查得到如下的数据:

对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。

对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。

二、为检验一厂家生产的产品,提出如下的假设检验:H0:u=500,H1: u=! 500 现在抽取了部分的样品进行检验。若检验结果拒绝H0,则意味着什么?若检验结果没有拒绝H0,则又意味着什么?能否恰好取到一组样本证明H0:u=500成立?为什么?若检验的P=0.03,则意味着什么?P值的真实含义是什么?

三、现研究某地区平均GDP与居民消费总额、固定投资、进出口额、年末总人口之间的关系,进行了多元回归分析。题目分别给出了三个表:

表1:整体拟合程度:R,R方,调整的可绝系数。

表2:整体线性关系的F检验

表3:系数的显著性t检验,方差扩大因子VIF(存在多重共线性)

请对上述回归模型进行综合评价。

四、题目中给出了从99年1月到2004年3月某地区各月的销售额的一个时间序列图,该序列图中包含哪些成分?可以用什么方法来分析此模型,并简要叙述可种方法的基本原理。

五、说明距离判别法与贝叶斯判别法的联系。

六、说明大数定律与中心极限定理的内容和应用?

七、在敏感性问题的调查中,为了保证回答者尽量真实回答,采用如下方法:以比例p的人回答敏感性问题

(1):你具有特征A吗?回答结果为是或不是。另外1-p的比例人回答问题

(2):比如你的手机号尾数是奇数吗?回答是的比例为t。

假设总体具有特征A的人数比例为q,样本中回答是的比例为R。

1.试提出q的一个估计。

2.证明该估计是q的一个无偏估计。

求出q的方差的表达式。

2011年人大805统计学真题

一、简答题(50分)

1.简述加权最小二乘估计的基本思想。

2.进行主成分分析需是否要知道数据的具体分布,请说明原因。

3.k-均值聚类对比分层聚类,优点在哪里。

4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。

5.简述方差分析和回归分析的异同。

二、已知X与W相互独立(30分)。

1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。

2.W服从正态分布,其期望为零,方差为?2(是表示平方),Y=b0+b1X+b2X2(是表示平方)+W,当X=x时求Y的条件期望。

三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。(30分)

1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。

2.指出CPI的调查过程中误差的可能来源。

3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。

4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。

四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什么?应该怎样验证?(20分)

五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。(20分)

2010年人大805统计学真题

一)五道问答题(50分)

1.两地区的什么比例,运用均值的t检验,得出这两个地区的均值相等,是否正确,为啥子呢?

2.卡方统计运用在哪方面

3.贝叶斯统计与经典统计的区别

4.时间序列的弱平稳的含义

5.评述多重共线性的解决方法

(二)给出三个运动员10次射击的数据,问用什么图可以表示这些数据?用哪些统计量可以分析这些数据

(三)R型聚类与Q型聚类含义?聚类分析与判别分析区别?层次聚类的步骤?

(四)该题中的第一类错误是什么?第二类错误是什么?顾客认为哪类错误比较重要?厂家认为哪类错误比较重要?

(五)给出x1,x2,...,x7个自变量,要求找出各县区经济发展的内在原因。用什么模型?这种模型对数据有什么要求?模型有哪些假设?如何得到参数估计值?如何分析该模型?(六)如何验证正态分布?能不能说这个区间包含均值的真值?p=一个很小的数,能不能说银行的认识正确?

2009年人大805统计学真题

1.有两个正态总体,均值和方差未知。但已知方差相等,从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49.如何检验第一个总体的均值是否大于第二个总体的均值。

2.在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。

3.周期过程X t=Acos(ωt+ψ),其中频率ω和振幅A都是常数,而相位ψ是一个在区间[-π,π]上服从均匀分布的随机变量,问{ X t}是否平稳?说明原因。

4.把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例,如采用内曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。(假设各层总体单位数量N h都充分大,忽略“有限总体校正系数”)

5.与人大出出版社的21世纪统计学系列教材的《统计学(第二版)》的第四章习题中的第十题是一样的。

6.若有线性回归模型y t=β1+β2X t+εt ,(t=1,2,…,n),其中E(εt)=0;E(εt2)=δ2X t2,E(εtεs)=0(t≠s),问:

(1)该模型是否违背古典线性回归模型的假定,请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

7.测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,药后一小时记录,药后两小时记录。对于不吃药的白鼠,记录时间与统一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果?

8.某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意,100分表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响。

(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。

(2)要采用改分析方法,数据必须满足哪些几本假定?请加以说明。

2008年人大805统计学真题

一、07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。”请你从统计的角度对该报道做简要评论。(10分)

二、经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。(10分)

三、如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型。请你写出模型形式并加以简要说明(10分)

四、食品厂家说:净含量是每袋不低于250g 。但有消费者向消协反映不是250g ,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验(30分)

(1)如果厂家自己检验,你认为提出什么样的原假设和备则假设?并说明理由。

(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备则假设?并说明理由。

(3)消协抽取20袋,如下数据(略了 没抄),得p 值为0.4297,在5.0=α的显著水平下,

检验假设意味着什么?p 值的含义是什么?

(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际

平均重量是否在该区间?为什么?

五、在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。(15分)(1)请具体指明这些假设有哪些?

(2)说明这些假设所发挥的主要作用。

(3)请讨论这些假设最终产生的影响。

六、在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。(15分)

七、叙述贝叶斯判别分析的原理(包括完整的假设)并说明:(30分)

(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?

(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?

八、在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素,(1)以大坝为例,概略说明需考虑的主要因素

(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤(画出框图,并尽量避免过多使用文字)(30分)

2007年人大805统计学真题

一、(20分)下面是一种零件误差的数据(单位:克):

6.1 4.7 6.5 6.2

7.7

6.4 5.5

7.1 6.1 5.3

5.7

6.1 5.3 4.0 4.8

3.2 3.9 1.9

4.9 3.8

5.3 2.6 5.3 5.5 5.8

2.7 6.8 7.4 5.6

3.3

(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法;

(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假

设为总体均值大于4.8克。如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?

二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。请回答以下问题:

(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?

(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?

(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?

三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。但一家研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。

(1)请写出检验的原假设和备择假设;

(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;

(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?

四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?

五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。请问,这样做是否有道理?请加以说明。什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么?

六、(20分)回归模型y=β0+β1x1+β2x2+…+βpxp+ε中的ε一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项作出假定?如果不是,那么在什么情况下需要对误差项作出假定?作什么假定?

七、(25分)对于聚类分析,请回答以下问题:

(1)分层聚类前,需要对什么进行选择?

(2)描述分层聚类分析的详细步骤;

(3)描述K均值(快速)聚类分析的详细步骤。

八、(25分)应用多元线性回归模型y=β0+β1x1+β2x2+…+βpxp+ε,如果一个SPSS回归分析的结果如下表所示:

ANOV A

a. Predictors:(Constant),Beginning Salary

b. Predictors:(Constant),Beginning Salary,Employment Category

则:

(1)表中所用选择自变量的方法可能是什么?

(2)表中的最后一个Sig.如何求得?意义是什么?

(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。

2006年人大805统计学真题

一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:

5.5

6.6 6.7 6.8

7.1 7.3 7.4 7.8 7.8

(1)画出第二种排队方式等待时间的茎叶图;

(2)比较两种排队方式等待时间的离散程度;

(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:

已知食品包重量服从正态分布,要求:

(1)确定该种食品平均重量95%的置信区间;

(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;

(3)利用P值进行检验和利用统计量进行检验有什么不同?

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:

差异源SS df MS F P-value F crit

行列误差总计1.55

3.48

0.14

5.17

4

2

8

14

0.39

1.74

0.02

21.72

97.68

0.000236

0.000002

7.01

8.65

(1)不同的车速对磨损程度是否有显著影响?

(2)不同供应商的轮胎之间磨损程度是否显著差异?

(3)在上面的分析中,你都做了哪些假设?

四、(15分)说明什么条件下适合采取简单随机抽样?

五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。

六、(20分)解释因子模型

X=AF+ε的意义并写出模型的假设。

七、(15分)以下是从《中国统计年鉴-2005》摘引的资料,要求:

单位:元/人

(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。

八、(15分)下表是中国全部国有及规模以上非国有供企业统计的主要指标,要求:(1)设计并计算反映企业经济效益的指标;

(2)对经济效益指标的动态变化状况做简要分析。

2005年人大805统计学真题

一、(15分)一家网吧想了解上网人员的年龄分布状况,随机抽取25人,得到他们的年龄数据如下:

15 19 22 24 30

16 19 22 24 31

17 20 23 25 34

18 20 23 27 38

19 21 23 29 41

(1)画出该组数据的茎叶图;

(2)画出该组数据的箱线图;

(3)根据茎叶图和箱线图说明上网者年龄分布的特征。

二、(15分)设有三个总体的均值分别为:μ1,μ2,μ3。要检验三个总体的均值是否相等(α=0.05),我们为什么不先将它们简单地配对,即H0:μ1=μ2,H0:μ1=μ3,H0:μ2=μ3,,然后分别进行检验,而是采用方差分析的方法?

三、(20分)某城市的餐饮管理协会估计,餐馆的月平均用水量为100吨,一家研究机构认为实际用水量要高于这个数字,该研究机构随机抽取了36家餐馆,记录了每个餐馆的月用水量(单位:吨),经过初步计算得到样本数据的部分描述统计量如下:

平均107

标准误差 4.99

样本标准差29.96

样本方差897.77

(1)确定餐馆月平均用水量95%的置信区间;

(2)餐馆实际月平均用水量在你所建立的置信区间里吗?请说明原因;

(3)如果要检验研究机构的看法是否正确,应该如何建立原假设和备择假设?请谈谈拒绝和不拒绝原假设的含义;

(4)在上面的估计和检验中,你使用了统计中的哪一个重要定理?请简要解释这一定理。

(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)

1、(20分)一家房地产评估公司想对某城市的房地产销售价格(y)与地产评估价值(x1)、房产评估价值(x2)和使用面积(x3)建立一个模型,以便对销售价格做合理预测。为此,收集了15栋住宅的房地产评估数据,经回归得到下面的有关结果(α=0.05):

(1)写出销售价格对地产评估价值、房产评估价值、使用面积的多元线性回归方程,并解释各回归系数的意义;

(2)检验回归方程的线性关系是否显著;

(3)检验各回归系是否显著;

(4)计算多重判定系数R2,并说明它的实际意义;

(5)计算估计标准误差sy,并说明它的实际意义;

(6)你认为使用面积(x3)在预测销售价格时是否有用?试说明理由。

五、(42分)假设一个已知简单总体的全部真实数据列于下表:

(1)绘出散点图;

(2)如果根据Y的数值将总体分成两个子总体,最好的分发是什么?

(3)举例说明上表数据所反映的现象可能是什么?

(4)计算出Y的总体均值Y和总体方差S2;

(5)四种基本抽样方式中最不适合上述总体情形的是哪一种?并说明理由;

(6)对其余三种基本抽样方式,假定n=2,分别列出每一种方式所对应的全部可能样本,并计算样本均值的数学期望和方差;

(7)计算每一种方式在此情形下的设计效应,并说明其意义。

六、(8分)说明抽样里的回归估计与一般回归分析方法的联系与区别。

七、(6分)请解释下面的说法:“生产核算的范围决定了收入分配和收入使用核算的范围”。

八、(9分)A、B两个地区的贫困线均为年收入1000元。A地区有11%的人年收入900元,9%的人年收入200元;B地区有1%的人年收入900元,9%的人年收入500元。

(1)根据上述数据,计算两地区的贫困者比重和贫困深度;(2分)

(2)请根据贫困者比重和贫困深度对两地区贫困状况进行简要的比较分析;(4分)(3)你觉得这两个指标能够准确反映两地区贫困状况的差异吗?如果不能,应当如何改进?(3分)

九、(15分)下面是某国某核算年度的国际收支平衡表(单位:亿元):

(1)在表中括号内填上适当的数字;(3分)

(2)请解释储备资产所对应的-125亿元的含义;(3分)

(3)请根据表中数字分析该国国内生产总值、国民总收入和国民可支配收入三者之间的关系;(6分)

(4)根据表中数字,对于该国当年国内的投融资状况你能得出何种结论?(3分)

2004年人大805统计学真题

本试卷分为两部分,一部分为必答题,计105分,一部分为选答题,计45分。

第一部分必答题

1.(25分)下面是A、B两个班学生的数学考试成绩数据:

A班:

55 76 66 85 75 62 79 73 93 76

67 85 74 61 78 71 92 79 65 83

73 57 77 70 90 75 63 81 73 96

B班:

34 71 56 90 66 48 81 58 96 71

55 85 62 44 79 57 95 68 54 84

61 39 73 57 94 68 51 82 61 100

(1)将两个班的考试成绩用一个公共的茎制成茎叶图,比较两个班考试成绩分布的特点;(2)两个班考试成绩的描述统计量如下,试进行比较分析:

(3)要判断考试成绩是否有离群点,可使用哪些方法?

(4)要判断考试成绩是否服从正态分布,可使用那些描述性方法?

2.(25分)某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每人使用其中的一种方法。通过Excel进行方差分析得到下面的部分结果:

(1)完成上面的方差分析表;

(2)若显著性水平α=0.05,检验三种方法组装的产品数量之间是否有显著性差异;(3)在上面的方差分析中包含了哪些基本假定?

(4)简述多重比较的前提和作用。

3.(20分)一袋中有黑、白两种球,p表示白球所占的比例,待检验假设为

H0:p=1/2;H1:p=1/5。

从袋中任取4个球(放回抽样),当白球数小于2时,拒绝原假设。试给出以下内容:(1)总体及其分布;

(2)样本量n;

(3)拒绝域;

(4)第一类错误的概率。

4.(15分)试举例说明方差分析中效应的意义和用效应如何表达它的数学模型。

5.(20分)试证明正态线性回归模型其回归系数的最大似然估计与最小二乘估计相同。

第二部分选答题(在下面五道题中任选三道题)

6.(15分)下表是中国1992和2002两个年份国民经济核算的部分资料。要求:

(1)根据资料,计算反映经济发展状况的基本总量指标和结构比例指标;

(2)根据计算结果,对10年间中国经济发展特征及其变化予以简要说明。

中国国民经济核算有关资料单位:亿元

7.(15分)2003年7月,中央政府和香港特区政府签定了简称CEPA的《内地与香港关于建立更紧密经贸关系的安排》。其中内容之一是自2004年起,273种香港原产货物进入内地市场实行零关税;内容之二是放宽香港企业对内地投资的限制,包括投资的行业、注册资本数额和资质条件等。可以预见,由此将大大促进香港对内地的贸易和投资活动。

要求:根据上述贸易和投资两方面的内容,应用国际收支平衡表原理,说明中国未来国际收支所产生的影响。(说明:根据目前中国国民经济核算,仍将香港作为“非常住单位”,即作为“境外”看待。)

8.(15分)假定某地区人口和劳动力就业统计数据如下表所示,要求:

(1)计算有关指标,描述该地区人口基本结构状况;

(2)计算有关指标,描述该地区人口变动状况;

(3)计算有关指标,描述该地区劳动就业状况。

单位:万人

9.(15分)对(30)的1000元3年定期寿险,死亡年末给付,保费在两年内每年缴一次。已知预定利率为5%,q30=0.02,q31=0.03,q32=0.04,,假设费用发生在保年初,各年费用为:

年份每份保单每1000元保额占总保费的比例

1 10 2.5 0.10

2 5 1.0 0.05

3 5 1.0 —

赔付处理费发生在死亡年末,每1000保额为10元,假设有退保。计算:

(1)每年总保费;

(2)第一年在总保费下的责任准备金。

10.(15分)某人在25岁时计划每年初存入200元建立个人账户,如果他在60岁退休,存款利率假设恒定为4%。

(1)求退休时个人账户的累计额;

(2)如果个人账户累计额在退休后以固定年金方式在30年内每月领取一次,求每月可以领取的数额。

2003年人大805统计学真题

一、(15分)考虑两个国家之间按GDP进行经济比较。假定在既定汇率水平上,甲国GDP 与乙国GDP之间的比例为1:20。一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么?

二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应用国际收支平衡表原理判断当期国际收支的顺、逆差状况。

三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。要求:

(1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分)(2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。(15分)

四、(30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。公司为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地块二、地块三、地块四。经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05):

(1)将方差分析表中划线部分的数值补齐;(6分)

(2)分析小麦品种对产量的影响是否显著;(4分)

(3)分析不同地块对产量的影响是否显著;(4分)

(4)在产量变动的差异中,被品种所解释的百分比是多少?(3分)

(5)在产量变动的差异中,被地块所解释的百分比是多少?(3分)

(6)上面的分析包含哪些假定?(10分)

五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。某公司从本公司职工中随机抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。公司领导想知道本公司职工是否比其他单位的职工更容易生病。

(1)公司领导感兴趣的原假设和替换假设是什么?(3分)

(2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。(10分)

(zα/2=1.96,zα=1.645,tα/2(45)=2.0141,tα(45)=1.6794)

(3)在假设检验中,P值代表什么含义?(6分)

(4)在本例中,P=0.001说明了什么?(3分)

(5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界

点。(8分)

六、(30分)关于回归分析讨论下列问题:

(1)画出回归建模步骤的流程图;(7分)

(2)简要描述各个步骤的内容;(8分)

(3)设

1?()X X X y β-''=是多元回归方程参数的最小二乘估计,证明21?()()D X X βσ-'=;(8分)

(4)根据21?()()D X X βσ-'=,结合一元线性回归,你能看出对建模有指导意义的什么

信息(7分)

人大统计学考研真题

人大统计学考研历年真题精华版(03-09) https://www.360docs.net/doc/4c1473145.html,

https://www.360docs.net/doc/4c1473145.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

2003-2016年中国人民大学统计学805考研真题集

人大统计学考研历年真题精华版(03- 16)

2016年人大学统计学考研真题(完整版) 1,构造几何分布,标准化的样本空间,取值空间,事件空间。 2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。 3,给出联合分布,求条件分布,和条件概率。 4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。写出详细论证过程。 5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。 7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 三、已知Y1,……,Y n是相互独立的随机变量,且均服从。求的矩估计和最大似然估计,并求他们的均方误差。(25分) 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

人大统计学真题

人大统计学考研历年真题精华版 (03-09) —By fan (声明:这是由fan整理编辑,仅供参考。) https://www.360docs.net/doc/4c1473145.html,

https://www.360docs.net/doc/4c1473145.html, 2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机 样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一个在区间 [-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如 采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随 机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样 的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=,222()t t E x εδ=, ()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一 组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记

人民大学统计学在职题库统计综述答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学 考试科目:统计思想综述 课程代码:123201 考题卷号:1

除不能导致SSE显著减小为止。 逐步回归:结合向前选择和向后剔除,从没有自变量开始,不停向模型中增加自变量,每增加一个自变量就对所有现有的自变量进行考察,若某个自变量对模型的贡献变得不显著就剔除。如此反复, 直到增加变量不能导致SSE显著减少为止。 五、(20分)如果一个时间序列包含趋势、季节成分、随机波动, 适用的预测方法有哪些?对这些方法做检验说明。 可以使用Winter指数平滑模型、引入季节哑变量的多元回归和分解 法等进行预测。 (1)Winter指数平滑模型 包含三个平滑参数,即(取值均在0~1),以及平滑值、趋势项更新、季节项更新、未来第k期的预测值。 L为季节周期的长度,对于季度数据,L=4,对于月份数据,L=12;I为季节调节因子。平滑值消除季节变动,趋势项更新是对趋势值得修正,季节项更新是t期的季节调整因子, 是用于预测的模型。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,而且需要有四个以上的季节周期(4年以上的数据)。 使用Winter 模型进行预测,要求数据至少是按季度或月份收集的,

而且需要有四个以上的季节周期(4年以上的数据)。 (2)引入季节哑变量的多元回归 对于以季度记录的数据,引入3个哑变量 ,其中=1(第1季度)或0(其他季度),以此类推,则季节性多元回归模型表示为: 其中b0是常数项,b1是趋势成分的系数,表示趋势给时间序列带来的影响,b2、b3、b4表示每一季度与参照的第1季度的平均差值。(3)分解预测 第1步,确定并分离季节成分。计算季节指数,然后将季节成分从 时间序列中分离出去,即用每一个时间序列观测值除以相应的季节指数以消除季节性。 第2步,建立预测模型并进行预测。对消除了季节成分的时间序列建立适当的预测模型,并根据这一模型进行预测。 第3步,计算出最后的预测值。用预测值乘以相应的季节指数,得到最终的预测值。

统计学考试题及答案(中国人民大学第六版)

统计学 一、单选 1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计 量是 A 该校学生的总人数 B 该校学生的月月平均生活费支出 C 该校学生的生活费总支出 D 100名学生的月平均生活费支出 2、下列变量中,顺序变量是 A职工人数 B产量 C产品等级 D利润总额 3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位 组成一个样本。这种抽样方式是 A 简单随机抽样 B 分层抽样 C 整群抽样 D 系统抽样 4、指出下面陈述中错误的是 A 抽样误差只存在于概率抽样中 B 非抽样误差只存在于非概率抽样中。 C概率抽样和非概率抽样都存在非抽样误差。 D在普查中存在非抽样误差。 5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图 6、当样本量一定时,置信区间的宽度 A 随置信水平的增大而减小 B随置信水平的增大而增大 C与置信水平的大小无关 D与置信水平的平方根成反比 7、在检验一个正态总体方差时,使用的分布是 A z分布 B t分布 C X 分布 D F分布 8、指出下面陈述中的错误的是 A 抽样误差可以避免 B 抽样误差不可避免 C 非抽样误差可以避免 D 抽样误差可以控制 9、假设检验中,如果计算出的P值越小,说明检验的结果越 A 真实 B 不真实 C 显著 D 不真实 10、双因素方差分析涉及 自变量 A 一个分类型 B 一个数值型 C 两个分类型 D 两个数值型 二、填空题 1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内 2、对于一组具有单峰分布的数据而言,当数据的m m > 时,可判断数据是 (左偏)分布

人大统计学专业课初试题

2003年人大统计学专业课初试题 一、(15分)考虑两个国家之间按GDP进行经济比较。假定在既定汇率水平上,甲国GDP与乙 国GDP之间的比例为1:20。一场金融危机放生之后,如果甲国货币相对乙国货币贬值了50%,那么,在新的汇率水平上,两国GDP之间的比例将变化为1:40。请问:我们能否根据比较结果说甲国的经济发展水平下降了50%?这种比较所包含的统计方法问题是什么? 二、(15分)假定一时期国际收支平衡表上“储备资产变动”一项为正差额100亿元,据此,应 用国际收支平衡表原理判断当期国际收支的顺、逆差状况。 三、(30分)以下是某经济总体1985和2001两年份城镇居民住户部门的调查资料。要求: (1)列表计算各年城镇住户部门的原始收入、可支配收入和最终消费支出;(15分) (2)计算有关指标,比较说明城镇居民住户部门经济活动特征的变化。(15分) 四、(30分)一家种业开发股份公司研究出三个新的小麦品种:品种一、品种二、品种三。公司 为研究不同品种对产量的影响,选择了四个面积相同的地块进行试验,分别为:地块一、地

块二、地块三、地块四。经过试验获得产量数据,经分析得到下面的方差分析表(α=0.05): (1)将方差分析表中划线部分的数值补齐;(6) (2)分析小麦品种对产量的影响是否显著;(4) (3)分析不同地块对产量的影响是否显著;(4) (4)在产量变动的差异中,被品种所解释的百分比是多少?(3) (5)在产量变动的差异中,被地块所解释的百分比是多少?(3) (6)上面的分析包含哪些假定?(10) 五、(30分)统计资料表明,某地区职工年人均病假天数为5.1天。某公司从本公司职工中随机 抽取了46名职工作为样本,测得其平均病假天数为7天,样本标准差为2.5天。公司领导想知道本公司职工是否比其他单位的职工更容易生病。 (1)公司领导感兴趣的原假设和替换假设是什么?(3) (2)若令α=0.05,请用假设检验的方法帮助公司领导作出判断(写清检验步骤,并作示意图)。(10)(zα/2=1.96,zα=1.645,tα/2(45)=2.0141,tα(45)=1.6794)(3)在假设检验中,P值代表什么含义?(6) (4)在本例中,P=0.001说明了什么?(3) (5)用区间估计的方法找出该公司职工病假天数与其他职工病假天数显著不同的临界点。(8) 六、(30分)关于回归分析讨论下列问题: (1)画出回归建模步骤的流程图;(7) (2)简要描述各个步骤的内容;(8) (3)设 1 ?() X X X y β- '' =是多元回归方程参数的最小二乘估计,证明21 ?()() D X X βσ- ' =;(8) (4)由 21 ?()() D X X βσ- ' =,结合一元线性回归,你能看出对建模有指导意义的什么信息(7)

2011年人大考研统计学真题

2011年人大考研统计学真题 感觉很注重统计思想和方法的考察,题目很不错! 一、简答题(50分) 1.简述加权最小二乘估计的基本思想。 2.进行主成分分析需是否要知道数据的具体分布,请说明原因。 3.k-均值聚类对比分层聚类,优点在哪里。 4.题目给出了一个回归分析残差的散点图,有点线性趋势的那种,问据图分析可能出现了什么问题。 5.简述方差分析和回归分析的异同。 二、已知X与W相互独立(30分)。 1.X与W都服从正态分布,且W的期望为零,Y=a+bX+W,求X与Y的联合分布。 2.W服从正态分布,其期望为零,方差为?2(是表示平方),Y=b0+b1X+b2X2(是表示平方) +W,当X=x时求Y的条件期望。 三、CPI是衡量经济发展的重要指标,CPI的计算包括收集数据的四个阶段和确定权数的两个阶段,(他这里描述了这六个阶段的具体操作方法)。(30分) 1.结合调查知识和统计理论说明CPI所属类别(这个有待考证,希望大家来修正~)。 2.指出CPI的调查过程中误差的可能来源。 3.指出这个过程中涉及的调查总体、随机变量及待估总体的特征。 4.如果每个阶段的调查都严格按照1—a的置信水平,那么总的置信水平是多少。 四、假设女性和男性读书的语速都服从正态分布。研究者认为女性读书的语速比男性快,为证明这一点抽取了n1名女性和n2名男性,分别测得他们读书的语速,发现n1名女性的平均语速比n2名男性快,研究者由此得出女性读书的语速比男性快的结论。请问研究者的方法对吗?为什么?应该怎样验证?(20分) 五、题目给出了从2006年1月到2010年6月的商品销售额的时间序列图(有明显线性趋势的),现在想预测2010年下半年的商品销售额,请问用什么应该模型,写出模型的具体形式和模型的建立过程。(20分)

人大统计学真题07-09

2009年人大统计学专业课初试题 一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取 n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值? 二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。 三、周期过程cos()t t X A ω?=+,其中频率ω和振幅A 都是常数,而相位?是一 个在区间[-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。 四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总 体比例。如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。(假设各层总体单位数 量h N 都充分大,忽略“有限总体校正系数”) 五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第 10题是一样的。 六、若有线性回归模型01 (1,2, ,)t t t y x t n ββε=++=,其中()0t E ε=, 222()t t E x εδ=,()0 ()t s E t s εε=≠,则 (1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。 七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为 两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只

喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果? 八、某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意, 100分表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则 (1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。 (2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

2014年中国人民大学应用统计初试复试真题及答案解析

2014年中国人民大学应用统计初试复试真题及答案 解析 1.地区对消费者购买汽车价格的影响,使用什么方法,简要说明。 2.时间序列的指数平滑预测法有哪些?分别适用于哪些场合? 3.(1)置信区间和假设检验之间的关系 (2)用文字表述无偏性 (3)无偏估计的样本均值和相应的置信区间的中点的关系。 4.方差分析 (1)计算F值 (2)根据表格做出统计决策 (3)方差分析的假设 5.多元回归分析(有五问,记不清了) (1)t值如何计算 (2)本例的模型拟合优度如何,如何度量 (3)R2和adjustedR2各是什么? (4)P值的含义 中国人民大学招收硕士研究生复试工作管理办法 复试工作是进一步考察考生专业能力和综合素质是否符合硕士研究生(以下简称硕士生)培养要求的重要环节,是选拔优秀人才的重要依据之一,在研究生人才选拔中具有重要作用。各学院应切实重视这项工作,积极探索和完善复试办法。为做好此项工作,特制定本办法。 一、复试原则 复试工作要自始至终贯彻科学选拔、公平公正、全面考察、客观评价、公开透明、严谨严密的原则,坚决抵制各种不正之风。 各学院对拟录取的硕士生必须进行复试,复试合格方可录取。

我校实行差额复试,差额复试比例在120%以上。生源充足的学院可进一步扩大差额复试比例。 二、复试工作管理 我校硕士生入学考试复试工作实行二级管理。学校研究生招生委员会负责制定我校硕士生复试规则和各学科的复试基本要求;各学院依据学校复试要求,负责确定本学院复试名单,制定本学院的复试办法并报学校研究生招生办公室(以下简称研招办)备案。 学院须成立硕士生复试工作领导小组,组长由主管研究生工作的院长担任,成员包括相关专业的学科带头人、学术骨干、硕士生导师。 学院硕士生复试工作领导小组负责组织对本学院拟接收的校内和校外推荐免试生以及统考硕士生的复试工作,具体职责如下职责: 1、根据教育部规定和我校硕士生复试工作管理办法,负责制定本学院具体的硕士生复试办法。 2、严格复试工作人员管理,遴选责任心强、学术水平高、品行端正的人员参与复试工作。 3、负责按专业成立硕士生复试小组,复试小组成员应是我校在职的硕士生导师,人数应不少于五人,组长一人,组员四人或四人以上,按小组另安排记录员一名。 4、负责组织召开所有复试教师工作会议,进行复试工作培训,使复试教师了解复试办法、明确复试要求和工作责任、掌握复试方法,保证质量。 5、负责对所有复试工作人员进行保密工作教育。复试工作人员须对试题、答案及评分标准、复试小组名单、考生分组情况、考生成绩、考生个人信息等保密。 6、负责组织本学院的专业综合课和外语笔试试题的命制、专业课和综合素质面试试题的命制、外语口语听力试题的命制、对同等学力加试科目试题的命制。 7、负责制定本学院的综合素质面试和外语面试的实施方案,认真制定面试评分标准、考核指标。 8、负责审核各专业复试小组的复试记录和复试结果,复试记录和复试结果须妥存备查。 9、负责对参加复试而未录取考生的必要解释和遗留问题的处理。

中国人民大学432-统计学考研参考书目、考研真题、复试分数线新

中国人民大学432-统计学考研参考书目、考研真题、复试分 数线 432-统计学课程介绍

中国人民大学考研复试分数线 学术学位: 学科门类政治、外语、专一(数学)、专二、总分 01哲学50509090330↓ 02经济学55559090360 03法学50↓50↓9090350 04教育学5050180330↓ 05文学55559090350 06历史学5050180335↑ 07理学45459090300 08工学45459090300 09医学5050180↑300 12管理学50↓50↓9090350↓ 13艺术学45459090330 专业学位: 专业学位政治、外语、专一、专二、总分备注

02经济类专业学位 (金融、应用统计、税务、国际商 务、保险、资产评估) 50509090340 035101法律(非法学)50509090340↓ 035102法律(法学)50509090330 0352社会工作50509090330 0453汉语国际教育50509090315↓ 0552新闻与传播55559090355↓ 0651文物与博物馆4545180↑320 0852软件工程45458080300 0951农村与区域发展50509090300 1251工商管理 100↓50170↓未通过提前面试 同教育部A类分数线通过提前面试1252公共管理115↑50180↑ 1253会计 12060225↑全日制 120↑50205↑非全日制 1255图书情报12055↓195↓ 1351艺术 40↓40↓9090325↑ 注: 1、各学院可根据生源情况上调复试基本要求。差额复试比例120%以上。 2、不符合教育部复试基本要求者不予录取。 3、向外校调剂工作待教育部公布全国硕士研究生复试分数线后进行。 4、“援藏计划”、“少数民族高层次骨干人才计划”、“单独考试”考生复试基本要求根据教育部相 关政策另行确定,考生可向相关院系或研招办咨询。 5、参加“大学生志愿服务西部计划”、“三支一扶计划”(支农、支教、支医和扶贫)、选聘高校毕业 生到村任职”和“农村义务教育阶段学校教师特设岗位计划”等项目服务期满的考生和普通高等学校应届毕业生应征入伍服务义务兵役退役后的考生,三年内参加全国硕士研究生招生考试,享受初试总分加分并在同等条件下优先录取的政策。请符合政策的考生于3月12日前直接联系我校研招办并出具相关证明材料,我校根据教育部最新文件及名单审核考生资格。

中国人民大学805统计学历年真题

中国人民大学805统计学历年真题(2013-2000) 2013年人大805统计学真题 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 的泊松分布, 昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布 3.设走进某商店的顾客数是均值为50的随机变量。又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。再设任一顾客所花的钱数和进入该商店的总人数相互独立。试问该商店一天的平均营业额是多少? 的矩估计和最 四、X和Y是两个相关的随机变量: 求证var(Y) = E(var(Y|X)) + var(E(Y|X)) 并谈谈你对它的理解和应用。(25分) 五、谈谈你对双因素方差分析的理解和认识。(25分) 六、一元线性回归中有三个检验:线性相关检验,回归方程显著性检验以及X的回归系数的检验,谈谈你对它们的理解和它们之间的关系。(25分)

2012年人大805统计学真题 一、为研究不同地区与购买汽车的消费价格之间的相关关系,调查得到如下的数据: 对于以上的数据可以用什么统计图表分析,并说明这些图表的用途。 对于以上的数据可以用什么统计方法分析,并说明这些方法的用途。 二、为检验一厂家生产的产品,提出如下的假设检验:H0:u=500,H1: u=! 500 现在抽取了部分的样品进行检验。若检验结果拒绝H0,则意味着什么?若检验结果没有拒绝H0,则又意味着什么?能否恰好取到一组样本证明H0:u=500成立?为什么?若检验的P=0.03,则意味着什么?P值的真实含义是什么? 三、现研究某地区平均GDP与居民消费总额、固定投资、进出口额、年末总人口之间的关系,进行了多元回归分析。题目分别给出了三个表: 表1:整体拟合程度:R,R方,调整的可绝系数。 表2:整体线性关系的F检验 表3:系数的显著性t检验,方差扩大因子VIF(存在多重共线性) 请对上述回归模型进行综合评价。 四、题目中给出了从99年1月到2004年3月某地区各月的销售额的一个时间序列图,该序列图中包含哪些成分?可以用什么方法来分析此模型,并简要叙述可种方法的基本原理。 五、说明距离判别法与贝叶斯判别法的联系。 六、说明大数定律与中心极限定理的内容和应用? 七、在敏感性问题的调查中,为了保证回答者尽量真实回答,采用如下方法:以比例p的人回答敏感性问题 (1):你具有特征A吗?回答结果为是或不是。另外1-p的比例人回答问题 (2):比如你的手机号尾数是奇数吗?回答是的比例为t。 假设总体具有特征A的人数比例为q,样本中回答是的比例为R。 1.试提出q的一个估计。 2.证明该估计是q的一个无偏估计。

人大统计学作业答案

79、【104308】(单项选择题)设连续型随机变量X 的分布函数是)(X F ,密度函数是)(x p , 则对于任意实数α,有= =)(αX P ()。 A.)(X F B.)(x p C.0 D.以上都不对 【答案】C 80、【150761】(单项选择题)设6.0,1,4===XY DY DX ρ,则)23(Y X D -为()。 A.40 B.9.10 C.25.6 D.17.6 【答案】B 81、【104317】(简答题)正态分布概率密度函数的图形有何特点? 【答案】 正态分布概率密度函数()x f 的图形有以下特点: ①()0≥x f ,即整个概率密度曲线都在x 轴上方。 ②曲线()x f 关于μ=x 对称,并在μ=x 处达到最大值 ()σπμ21 = f 。 ③曲线的随缓程度由σ决定,σ越大,曲线越平缓;σ越小,曲线越陡峭。 ④当x 趋于无穷时,曲线以x 轴为其渐近线。 由以上特性可见,正态分布的概率密度曲线()x f 是一条对称的钟形曲线。 82、【104318】(简答题)一事件A 的概率0)(=A P ,能否肯定事件A 是不可能事件?为什 么? 【答案】不能肯定A 是不可能事件。 不可能事件是指在同一组条件下每次试验都一定不出现的事件。而0)(=A P ,并不能肯定A 就是不可能事件。例如在闭区间[]1,0上随意投掷一点,显然该区间上任一点都可能被碰上,但每一点发生的概率都为0,因此概率为0的事件不一定都是不可能事件。 83、【104319】(简答题)常见的随机变量分为哪两种类型?各自都包含哪些常见的分布? 【答案】常见的随机变量分为离散型随机变量和连续型随机变量。 离散型随机变量包括均匀分布、0-1分布、二项分布、泊松分布。 连续型随机变量包括均匀分布、正态分布。正态分布衍生卡方分布、t 分布、F 分布。 84、【104313】(填空题)甲、乙、丙三人参加同一项考试,及格的概率分别为%70,%60, %90,则三人均及格的概率为_____;三个人都不及格的概率为_____;至少有一个人及格的概 率为_____;至少有一个人不及格的概率为_____。 【答案】0.378;0.012;0.988;0.622,(37.8%)( 1.2%)(98.8%)( 62.2%) 85、【104314】(填空题)正态分布的概率密度函数曲线为一对称钟形曲线,曲线的中心 由_____决定,曲线的陡峭程度由_____决定。

2019人大应用统计第一名经验贴

2019人大应用统计第一名经验贴 总分第一名。 准备时间 一月下旬到三月:初步看了英语数学 三月到四月:定下目标,期间也在备考 四月到七月初:由于大三暑假前还有课所以备考的时间是课余时间及周末 七月初到考前:暑假以后就是全天学习,每天早上八点或七点半到晚上十一点、十二月以后每天早上六点半到晚上十一点(起床背政治) 数学三 基础阶段(二月到六月) 用到的书: 李永乐线代辅导讲义 李正元复习全书 张宇36讲 张宇带你学 另外我还买了高数线代概率论的教材(就是同济版浙大版那个)可是我没来得及看,基础不错的同学可以不看;想学的细一些的可以一看 高数(前期用书:张宇带你学、李正元复习全书、张宇高数18讲) 我从二月底开始看高数,在网上看各种说张宇老师上课比较风趣我就在b站找了张宇18年基础课视频看了,看完下来觉得宇哥讲课很有带动性,确实能学到东西,但是有部分同学反映看完宇哥视频还是不会做题目,如果是这种情况可以试试看汤家凤老师的视频。 我大概看了一个月的张宇的高数基础视频,边看边记笔记,学完一章就做点题目,二月到三月份我用的就是张宇带你学那本书,这本书里会有同济版高等数学的课后习题和解答,还有一些基础题,挺不错的(如果现在才开始数学的同学那就略过张宇带你学吧,直接上李正元复习全书) 四月份的时候,听说汤家凤基础课讲的很好很细致,于是乎我又看了一遍汤老师滴基础课视频,真滴细致、真滴精彩(但是他比较严肃)看汤老师也是边看视频边记笔记。 四月初我还买了李正元的复习全书(是李正元不是李永乐),李正元的题目大多是难题,我觉得如果数学三越来越难,做点难题是比较有帮助的。 六月份我开始写张宇的高数十八讲,一个月差不多能写完;复习全书的高数部分我从四月写到六月,俩月写完高数部分(我没有看张宇的十八讲视频,我只看了他的高数基础班视频) 划重点:张宇和汤家凤各有各的特色,不同的学生有不同的选择,如果你的数学基础不错,

人大统计学作业答案解析

★统计学(第二版)(ZK007B) 第一章总论 1、【104134】(单项选择题)某市分行下属三个支行的职工人数分别为2200人、3000人、1800人,这三个数字是()。 A.标志 B.指标 C.变量 D.变量值 【答案】D 2、【104137】(单项选择题)统计一词的三种涵义是()。 A.统计活动、统计资料、统计学 B.统计活动、统计调查、统计学 C.统计调查、统计整理、统计分析 D.统计指标、统计资料、统计学 【答案】A 3、【104143】(单项选择题)一项调查表明,北京市大学生每学期在网上购物的平均花费是500元,他们选择在网上购物的主要原因是“价格实惠”,则“大学生在网上购物的原因”是()。 A.分类型变量 B.顺序型变量 C.数值型变量 D.定距变量 【答案】A 4、【104147】(单项选择题)一家研究机构从IT从业者中随机抽取800人作为样本进行调 70回答他们的月收入在5000元以上,则月收入是()。 查,其中% A.分类型变量 B.顺序型变量 C.数值型变量 D.定距变量 【答案】C 5、【104149】(单项选择题)一家研究机构从IT从业者中随机抽取800人作为样本进行调 40的人回答他们的消费支付方式是信用卡,则消费支付方式是()。 查,其中% A.分类型变量 B.顺序型变量 C.数值型变量 D.定距变量

【答案】A 6、【104156】(单项选择题)绝对不可能发生的事件发生的概率是()。 A.0 B.1.0 C.5.0 D.1 【答案】A 7、【104160】(单项选择题)必然会发生的事件发生的概率是()。 A.0 B.1.0 C.5.0 D.1 【答案】D 8、【104161】(单项选择题)抛掷一枚均匀的硬币,出现正面的概率是()。 A.0 B.1.0 C.5.0 D.1 【答案】C 9、【104176】(简答题)统计数据可以划分为哪几种类型?分别举例说明。 【答案】统计数据按照所采用计量尺度的不同可划分为三种类型。一种是数值型数据,是指用数字尺度测量的观察值。例如,每天进出海关的旅游人数,某地流动人口的数量等。数值型数据的表现就是具体的数值,统计处理中的大多数都是数值型数据;另一种是分类型数据,是指对数字进行分类的结果,例如人口按性别分为男、女两类,受教育程度也可以按不同类别来区分;再一种是顺序型数据,是指数据不仅是分类的,而且类别是有序的,例如满意度调查中的选项有“非常满意”,“比较满意”,“比较不满意”,“非常不满意”,等。在这三类数据中,数值型数据由于说明了事物的数量特征,因此可归为定量数据,分类型数据和顺序型数据由于定义了事物所属的类别,说明了事物的品质特征,因而可统称为定性数据。 10、【104173】(填空题)参数是描述_____特征的概括性数字度量。 【答案】总体 11、【104174】(填空题)统计量是描述_____特征的概括性数字度量。 【答案】样本 12、【145091】(填空题)根据计量尺度的不同,可将数据划分为三种类型:_____、_____和_____。 【答案】数值型数据;分类型数据;顺序型数据

高等统计学考题-人大精简版

一、多项选择题(每题4分,一共20分,每题要求:选择正确答案,对选择或未选答案进 行简要而清晰的原因解释。将答案填写在答题纸上,填写在试题上无效。得分规则:选对 并对答案解释合理,得4分;没有对未选答案解释最多得2分;漏选得1分,选错可参考 解释酌情给分;不选得0分) 1.有关样本的分布,以下陈述正确的是:ABC A. 如果样本X 1,…,X n 独立同分布来自Gamma 分布,∑==n i i X n X 1 1在大样本下有近似的 正态分布; 【对。满足中央极限定理条件】 B.如果样本X 1,…,X n 独立同分布来自N (2 ,σμ),∑==n i i X n X 1 1在大样本情况下有精确 分布N (n /,2 σ μ); 【对。独立同分布正态随机变量的均值仍是正态分布,方差值符合中央极限定理】 C.如果样本X 1,…,X n 独立同分布来自N (2 ,σμ),即使样本量不大,∑==n i i X n X 1 1也服 从正态分布; 【对。独立同分布正态随机变量的均值仍是正态分布】 D.如果样本X 1,…,X n 来自任意分布,在大样本情况下,由X 1,…,X n 组成的数据有近似的正态分布; 【错。如果X 1,…,X n 强相关,则不成立;即使i.i.d 情况下也不是任意的数据组成方式都是正态分布】 2.有关检验的p 值,下面说法正确的是:C A. 一般为[0,0.1]之间的一个很小的概率; 【错。p 值是计算得出的概率,取值0-1之间】 B. 接受备择假设的最小显著性水平; 【错。接受备择假设说法不准确】 C. 如果p 值小于显著性水平,则拒绝零假设; 【对。符合假设检验规则】 D. 样本统计量的分布函数。 【错。p 值根据检验统计量分布函数计算得出】

人大版统计学 习题加答案第四章 假设检验

第四章 假设检验 填空(5题/章),选择(5题/章),判断(5题/章),计算(3题/章) 一、 填空 1、在做假设检验时容易犯的两类错误是 和 2、如果提出的原假设是总体参数等于某一数值,这种假设检验称为 ,若提出的原假设是总体参数大于或小于某一数值,这种假设检验称为 3、假设检验有两类错误,分别是 也叫第一类错误,它是指原假设H0是 的,却由于样本缘故做出了 H0的错误;和 叫第二类错误,它是指原假设H0是 的, 却由于样本缘故做出 H0的错误。 4、在统计假设检验中,控制犯第一类错误的概率不超过某个规定值α,则α称为 。 5、 假设检验的统计思想是小概率事件在一次试验中可以认为基本上是不会发生的,该原理称为 。 6、从一批零件中抽取100个测其直径,测得平均直径为5.2cm ,标准差为1.6cm ,想知道这批零件的直径是否服从标准直径5cm ,在显著性水平α下,否定域为 7、有一批电子零件,质量检查员必须判断是否合格,假设此电子零件的使用时间大于或等于1000,则为合格,小于1000小时,则为不合格,那么可以提出的假设为 。(用H 0,H 1表示) 8、一般在样本的容量被确定后,犯第一类错误的概率为α,犯第二类错误的概率为β,若减少α,则β 9、某厂家想要调查职工的工作效率,用方差衡量工作效率差异,工厂预计的工作效率为至少制作零件20个/小时,随机抽样30位职工进行调查,得到样本方差为5,试在显著水平为0.05的要求下,问该工厂的职工的工作效率 (有,没有)达到该标准。 KEY: 1、弃真错误,纳伪错误 2、双边检验,单边检验 3、拒真错误,真实的,拒绝,取伪错误,不真实的,接受 4、显著性水平 5、小概率事件 6、1.25>2 1α-z

人大应用统计432考研经验

432统计学考研经验 mi 2015年6月4日 写经验帖的初衷是为了感谢考研以来诸多前辈给予的帮助,并且给和曾经的我一样迷茫的你们指明方向。可以说,没有fan的笔记,没有历年真题,就没有正确的方向。努力是个人因素,方法思路都是他们给的。 从准备时间上来说,没有长短的区别。从年初开始准备,和从年中开始准备,只要肯付出,结果都会令人满意。当然了,如果差两个月才开始复习,是态度不端正,所以,各位至少要保证有两个月的夯实基础的时间,一个月巩固,一个月提高。 下面进入正题,不要迷茫,踏踏实实的开始,日以继日夜以继夜的坚持会让前方越来越明朗。初试是第一关。从不怎么需要长时间的政治说起,市面上资料很多,大家都是有辨别能力的人,抓住一两本资料,从十月底开始看就行。肖秀荣的资料最多,一千题难度稍大,选择题背风中劲草的核心要点也是很好的选择。但是肖秀荣在论述题的地位是无可撼动的。我是每天早上会给政治半小时,晚上快结束自习的时候半小时,从十一月份晚上加到一个小时,十二月份保证每天晚上看一个半小时。这些时间里做什么呢?一半选择,一半论述题。刚开始总是很痛苦的,坚持一段时间后看熟了资料,不仅打牢了基础,而且信心倍增。政治在最后一个月,十二月中旬的时候,肖秀荣的四套题从选择到大题,都要做到烂熟于心。今年出了肖秀荣论述题的原题。另外,我建议做一做往年真题。做真题的好处是做完之后对答案的时候茅塞顿开,不仅对选择题的难度有把握,还能整理大题的答题思路和模式。今年很多人死在政治上,很多吃亏在论述题的灵活性。另外做真题的时间是在把基础知识牢牢掌握之后,不用太认真做,记住目的是为了熟悉真题。 英语让不少人头疼,不管你之前基础是厚是薄,如果没达到看英文作品速度和质量上毫无压力,都会在这里遇到困难。解决这一科,就要日复一日 1

人大805统计学真题

15年真题 1.一1000住户的小区,每户人家没车的概率0.1,有一辆车的概率0.7,有两辆车的概率0.2,问应该设多少停车位才能有95%以上的概率使小区的每辆车都有车位。 2. 证明多元回归分析中最小二乘估计具有最小方差线性无偏性。 3. 有一件什么事抽了100个人,分别给出了其中没有投诉,投诉一次,两次,三次,大于等于四次的具体人数,用卡方拟合检验判断其是否符合均值为1的泊松分布。再假设确实服从泊松分布,求泊松分布参数的极大似然估计。 4. 假设检验中的p值指什么,用p值和用统计量进行检验有什么不同,再举例说明为什么假设检验不能证明原假设的正确性。 5. A袋中有编号1到n的n个红球,B袋中有n个篮球,每次从A中取出一个球后再从B 中取一个球放入A中(若B中取完则只取A),问A中取出的最后一个球为红球的概率。 6. 从五个正态总体中一共抽取五组样本,有一张表给出了每组样本的样本容量以及偏差平方和,假设这五个正态总体具有相同的方差,求方差95%的置信区间。 7. 现要研究位置(居民区商业区某某区)和竞争者数量(0 1 2 3)对销售额的大小有无影响,给出具体的做法。 14年真题 1.证明概率的题,和13年真题差不多,比13年简单,方法也差不多 2.计算某条件分布为二元正态分布 3.半道证明依概率收敛,剩下半道我记不清了 4.利用统计思想证明下面一个积分,被积函数我记不清了,积分最后是dx1dx2...dxn,我觉得这是这次最恶心的一道题,无从下手,大家可以上网找找类似的 5.写出广义似然比检验量,并利用此检验量检验下面的假设,一道假设检验的题,检验内容不难,关键是要知道广义似然比检验量是什么 6.统计决策中的风险函数和损失函数是什么,剩下半道好像还有点贝叶斯的什么函数我记不太清了 7.最大似然估计和贝叶斯后验估计的区别和联系 8.写出列联表检验全部过程 9.普通的一个假设检验,应该是两总体均值情况中,两个总体方差均未知,样本量为10的近似t检验 2013年人大统计学、精算学专业课试题(回忆版) 一、证明题:(20分)每题10分 1.袋子里有两种颜色的球红球a个白球b个 第一步从袋子里取出一个球观察其颜色然后丢掉 第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。 证明取出的最后一个球是红球的概率是1/2。 2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。 二、简述:(30分)每题10分 1.设昆虫在树叶上产卵数X服从参数为file:///C:/DOCUME~1/ADMINI~1/LOCALS~1/Temp/ksohtml/wps_clip_image-18111.png的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。 2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布

人大统计学作业答案解析

★统计学(第二版)(ZK007B) 第一章总论 1、【104134】(单项选择题)某市分行下属三个支行得职工人数分别为人、人、人,这三个数字就是( )、 A.标志 B。指标 C。变量 D.变量值 【答案】D 2、【104137】(单项选择题)统计一词得三种涵义就是( )、 A、统计活动、统计资料、统计学 B.统计活动、统计调查、统计学 C.统计调查、统计整理、统计分析 D、统计指标、统计资料、统计学 【答案】A 3、【104143】(单项选择题)一项调查表明,北京市大学生每学期在网上购物得平均花费就是元,她们选择在网上购物得主要原因就是“价格实惠”,则“大学生在网上购物得原因”就是( )。 A、分类型变量 B.顺序型变量 C、数值型变量 D.定距变量 【答案】A 4、【104147】(单项选择题)一家研究机构从IT从业者中随机抽取人作为样本进行调查,其中回答她们得月收入在元以上,则月收入就是( )。 A.分类型变量 B、顺序型变量 C。数值型变量 D.定距变量 【答案】C 5、【104149】(单项选择题)一家研究机构从IT从业者中随机抽取人作为样本进行调查,其中得人回答她们得消费支付方式就是信用卡,则消费支付方式就是( )、 A.分类型变量 B。顺序型变量 C、数值型变量 D、定距变量 【答案】A 6、【104156】(单项选择题)绝对不可能发生得事件发生得概率就是( )。 A. B、 C. D.

【答案】A 7、【104160】(单项选择题)必然会发生得事件发生得概率就是( )、 A。 B. C。 D. 【答案】D 8、【104161】(单项选择题)抛掷一枚均匀得硬币,出现正面得概率就是( )、A. B。 C。 D. 【答案】C 9、【104176】(简答题)统计数据可以划分为哪几种类型?分别举例说明。 【答案】统计数据按照所采用计量尺度得不同可划分为三种类型。一种就是数值型数据,就是指用数字尺度测量得观察值。例如,每天进出海关得旅游人数,某地流动人口得数量等。数值型数据得表现就就是具体得数值,统计处理中得大多数都就是数值型数据;另一种就是分类型数据,就是指对数字进行分类得结果,例如人口按性别分为男、女两类,受教育程度也可以按不同类别来区分;再一种就是顺序型数据,就是指数据不仅就是分类得,而且类别就是有序得,例如满意度调查中得选项有“非常满意”,“比较满意”,“比较不满意”,“非常不满意",等。在这三类数据中,数值型数据由于说明了事物得数量特征,因此可归为定量数据,分类型数据与顺序型数据由于定义了事物所属得类别,说明了事物得品质特征,因而可统称为定性数据。10、【104173】(填空题)参数就是描述_____特征得概括性数字度量。 【答案】总体 11、【104174】(填空题)统计量就是描述_____特征得概括性数字度量。 【答案】样本 12、【145091】(填空题)根据计量尺度得不同,可将数据划分为三种类型:_____、_____与_____、 【答案】数值型数据;分类型数据;顺序型数据 第二章数据得搜集 13、【104177】(单项选择题)下列哪一项不就是数据得直接来源( )。 A、普查 B、二手数据 C、统计报表 D、抽样调查 【答案】B 14、【104178】(单项选择题)数据得间接来源有( )、 A、普查 B、实验数据 C.二手数据 D。抽样调查 【答案】C

相关文档
最新文档