人民大学2003-2009年统计学考研真题

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人大统计学考研历年真题精华版(03-09)

2009年人大统计学专业课初试题

一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机

样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值?

二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。

三、周期过程cos()t t X A ωϕ=+,其中频率ω和振幅A 都是常数,而相位ϕ是一个在区间

[-π,π]上服从均匀分布的随机变量。问{t X }是否平稳?说明原因。

四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如

采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随

机抽样有相同的估计量方差。(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”)

五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样

的。

六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=,

()0 ()t s E t s εε=≠,则

(1)该模型是否违背古典线性回归模型的假定?请简要说明。 (2)如果对该模型进行估计,你会采用什么方法?请说明理由。

七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一

组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果?

八、某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意,100分表示非

常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则

(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。

(2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

2008年人大统计学专业课初试题

一、(10分)07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中

低收入的家庭是指低于中位数的家庭。”请你从统计的角度对该报道做简要评论。

二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?

请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。

三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立

什么样的预测模型?请你写出模型形式并加以简要说明。

四、(30分)食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消

协据此要求厂家自检,同时消协也从中随机抽取20袋检验。

(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由;

(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由;

(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?

(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?

五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。

(1)请具体指明这些假设有哪些?

(2)说明这些假设所发挥的主要作用;

(3)请讨论这些假设最终产生的影响。

六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并

不包括整群抽样,请说明你赞同与否并详列理由。

七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:

(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?

(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?

八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许

多因素。

(1)以大坝为例,概略说明需考虑的主要因素;

(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。(画出框图,并尽量避免过多使用文字)

2007年人大统计学专业课初试题

一、(20分)下面是一种零件误差的数据(单位:克):

6.1 4.7 6.5 6.2

7.7

6.4 5.5

7.1 6.1 5.3

5.7

6.1 5.3 4.0 4.8

3.2 3.9 1.9

4.9 3.8

5.3 2.6 5.3 5.5 5.8

2.7 6.8 7.4 5.6

3.3

(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,

5.728882)。请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能

不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法;

(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?

二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进

行抽样调查。请回答以下问题:

(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?

(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?

(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?

三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。但

一家研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。

(1)请写出检验的原假设和备择假设;

(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;

(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?

四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有

90%”,那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?

五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第

二次主成分分析,以得到更加精确的结果。请问,这样做是否有道理?请加以说明。什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么?

六、(20分)回归模型y=β0+β1x1+β2x2+…+βp x p+ε中的ε一定是随机误差吗?如果回答

相关文档
最新文档