人大统计学考研真题

合集下载

中国人民大学432-统计学考研参考书目、考研真题、复试分数线

中国人民大学432-统计学考研参考书目、考研真题、复试分数线

中国人民大学432-统计学考研参考书目、考研真题、复试分数线432-统计学课程介绍中国人民大学考研复试分数线学术学位:学科门类政治、外语、专一(数学)、专二、总分01哲学50509090330↓02经济学5555909036003法学50↓50↓909035004教育学5050180330↓05文学5555909035006历史学5050180335↑07理学4545909030008工学4545909030009医学5050180↑30012管理学50↓50↓9090350↓13艺术学45459090330专业学位:专业学位政治、外语、专一、专二、总分备注02经济类专业学位(金融、应用统计、税务、国际商务、保险、资产评估)50509090340035101法律(非法学)50509090340↓035102法律(法学)505090903300352社会工作505090903300453汉语国际教育50509090315↓0552新闻与传播55559090355↓0651文物与博物馆4545180↑3200852软件工程454580803000951农村与区域发展505090903001251工商管理100↓50170↓未通过提前面试同教育部A类分数线通过提前面试1252公共管理115↑50180↑1253会计12060225↑全日制120↑50205↑非全日制1255图书情报12055↓195↓1351艺术40↓40↓9090325↑注:1、各学院可根据生源情况上调复试基本要求。

差额复试比例120%以上。

2、不符合教育部复试基本要求者不予录取。

3、向外校调剂工作待教育部公布全国硕士研究生复试分数线后进行。

4、“援藏计划”、“少数民族高层次骨干人才计划”、“单独考试”考生复试基本要求根据教育部相关政策另行确定,考生可向相关院系或研招办咨询。

5、参加“大学生志愿服务西部计划”、“三支一扶计划”(支农、支教、支医和扶贫)、选聘高校毕业生到村任职”和“农村义务教育阶段学校教师特设岗位计划”等项目服务期满的考生和普通高等学校应届毕业生应征入伍服务义务兵役退役后的考生,三年内参加全国硕士研究生招生考试,享受初试总分加分并在同等条件下优先录取的政策。

2003-2016年中国人民大学统计学805考研真题集

2003-2016年中国人民大学统计学805考研真题集

人大统计学考研历年真题精华版(03- 16)2016年人大学统计学考研真题(完整版)1,构造几何分布,标准化的样本空间,取值空间,事件空间。

2,X、Y为随机变量,给出条件分布,对于任意y,E(X|Y<=y) = E(X|Y>y),那么X与Y是否独立?写出详细论证过程。

3,给出联合分布,求条件分布,和条件概率。

4,X与Y是相互独立的随机变量,请给出一个充分条件,当X和Y各自服从什么分布时X-Y与X+Y相互独立,如果不存在请说明理由。

写出详细论证过程。

5,求一个密度函数的方差的极大似然估计,并求它的Fisher信息量。

6,异方差性和自相关是什么,检测方法,加权最小二乘法原理与实际步骤。

7,证明多元回归系数的估计量是无偏估计,是最小方差线性无偏估计。

8,多元线性回归,因变量均值与每个自变量间为二次函数关系,根据相互独立的n个样本预测因变量值。

2013年人大805统计学真题一、证明题:(20分)每题10分1.袋子里有两种颜色的球红球a个白球b个第一步从袋子里取出一个球观察其颜色然后丢掉第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。

证明取出的最后一个球是红球的概率是1/2。

2.证明n维正态随机向量的各分量相互独立的充要条件是互不相关。

二、简述:(30分)每题10分1.设昆虫在树叶上产卵数X服从参数为的泊松分布,而只有树叶上有卵时才能判断是否有昆虫。

在又设观察到的虫卵数Y,P(Y=i)=P(X+i|X>0),求P(Y为偶数)和E(Y)。

2. 2n+1个独立同分布样本,分布函数是F(x) 求中位数x(n+1)的分布3.设走进某商店的顾客数是均值为50的随机变量。

又设这些顾客所花的钱数是相互独立、均值为100元的随机变量。

再设任一顾客所花的钱数和进入该商店的总人数相互独立。

试问该商店一天的平均营业额是多少?三、已知Y1,……,Y n是相互独立的随机变量,且均服从。

统计学考研专业试题及答案

统计学考研专业试题及答案

统计学考研专业试题及答案一、选择题1. 在统计学中,描述数据集中趋势的度量是:A. 方差B. 标准差C. 均值D. 众数答案:C2. 以下哪个是正态分布的特点?A. 均值等于中位数B. 均值等于众数C. 均值小于中位数D. 均值大于众数答案:A3. 以下哪个统计量不是度量数据离散程度的?A. 方差B. 标准差C. 均值D. 四分位数间距答案:C二、填空题4. 假设检验中的两类错误是________和________。

答案:第一类错误;第二类错误5. 样本均值的抽样分布服从正态分布的条件是样本容量足够大,即n≥______。

答案:30三、简答题6. 请简述中心极限定理的内容。

答案:中心极限定理指出,即使原始总体分布不是正态分布,只要样本容量足够大,样本均值的分布将趋近于正态分布。

7. 描述性统计和推断性统计的区别是什么?答案:描述性统计主要关注数据的收集、组织、描述和展示,以提供对数据集的直观理解。

推断性统计则利用样本数据来推断总体的特征,包括参数估计和假设检验。

四、计算题8. 假设有一个总体均值为μ=100,标准差为σ=15。

从这个总体中随机抽取一个样本容量为n=36的样本,样本均值为x̄=102。

请计算并判断样本均值是否显著不同于总体均值。

答案:首先计算样本标准误差(SE),SE = σ/√n = 15/√36 =2.5。

然后计算z值,z = (x̄ - μ)/SE = (102 - 100)/2.5 = 0.8。

由于z值在标准正态分布的临界值范围内(例如,对于α=0.05,z临界值为±1.96),我们不能拒绝原假设,即样本均值不显著不同于总体均值。

五、论述题9. 论述总体参数估计的两种方法:点估计和区间估计,并给出它们的区别。

答案:点估计是指用样本统计量来估计总体参数的单个值。

它提供了一个具体的数值作为总体参数的估计。

而区间估计则提供了一个范围,在这个范围内总体参数有一定的置信水平(如95%)被认为包含在内。

人大统计学考博试题汇总10-12

人大统计学考博试题汇总10-12

为了了解总体特征,通过对总体抽样得到代表总体的样本,信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量。

统计量的分布称为抽样分布。

10年统计理论与应用一、名词解释典型相关,脸谱图,多元正态分布的密度函数二、二元条件分布四、抽样:列举复杂样本的方差计算方法,第二问是事后分层抽样五、总体比例的区间估计与假设检验六、Logistic回归:好似是S-PLUS软件或者SAS跑出来结果让根据结果写方程及分析七、企业经济统计:列举很多统计指标,让你根据这些指标写出你想分析什么问题,采用什么方法,能得出什么结论。

统计学一、X服从参数为a的泊松分布,a服从参数为b的伽马分布,问X的混合分布是什么?二、先验分布和后验分布的关系三、写出常用的三种非参数统计方法四、当因变量不服从正态分布时,如何建模?A对数正态分布B二项分布C二点分布D泊松分布五、以前考过的原题:关于抽样中整群抽样和随机抽样调查家庭电脑拥有量的一个案例1.有一组数据,考虑建立伽马函数和正态分布函数,如何判断所建立的函数能够更好地反映原始数据的信息2.区间估计和假设检验的区别和联系3.矩估计和极大似然估计的特点、以及据估计在什么情况下不适用4.是一道方差分析的题,具体不记得了,根据题意要求写出如何判断是否存在显著性差异,〔个人感觉不是很难〕5.显著性检验中,利用统计量检验和利用p至检验有什么不同6.谈谈对bayes方法的理解统计理论:总共是8道,前几年统计理论分A.B卷,现在不分了,前面60分必做,后面选做题100分,从中选择40分就可以了。

1.〔1〕什么是抽样分布,抽样分布与假设检验的关系〔2〕什么是多重共线性,如何识别多重共线性2.是高等数理统计中的一道题,本人做的不好,后来听其他同学说不是很难。

大致是给出一个密度函数和两个统计量T1 和T2〔具体形式不记得了,不是很难〕〔1〕证明T1 和T2 无偏〔2〕如何判断T1 和T2 的有效性〔3〕假设T=cmax(….)〔括号里面的东西不记得了〕,如何确定常数c,使得T的方差到达最小。

人民大学《统计学》题库及答案

人民大学《统计学》题库及答案

1中国人民大学接受同等学历人员申请硕士学位考试试题招生专业:统计学考试科目:统计思想综述课程代码:123201 考题卷号:1一、(20分)随机抽取20块手机电池,测得其使用寿命数据如下(单位:小时):10089939981007101110021013999100899598399510009771015101099810051011996列出描述上述数据所适用的统计图形,并说明这些图形的用途。

直方图:直观的展示一组数据(电池使用寿命)的分布情况。

箱线图:直观反映原始数据(电池寿命)的数据分布的特征,如偏态,是否有离群点。

二、(20分)方差分析中有哪些基本假定?这些假定中对哪个假定的要求比较严格?1、方差分析有3个基本假定:(1)正态性:每个总体都应服从正态分布,即对于因子的每一个水平,其观测值是来自正态分布总体的简单随机样本;(2)方差齐性:各个总体的方差必须相同;(3)独立性:每个样本数据是来自因子各水平的独立样本2、对独立性要求比较严格,独立性得不到满足会对方差分析结果有较大影响,对正态性和方差齐性的要求相对比较宽松。

三、(20分)某种食品每袋的标准重量是100克,从该批食品中抽取一个随机样本,检验假设100:0H ,1001H 。

(1)如果拒绝0H ,你的结论是什么?,如果不拒绝0H ,你的结论是什么?(2)能否得到一个样本能够证明该食品的平均重量是100克?请说明理由。

(3)如果由该样本得到的检验的03.0P ,你的结论是什么?0.03这个值是犯第Ⅰ类错误的概率,是实际算出来的显著性水平,你怎样解释这个P 值?(1)拒绝0H :该种食品每袋的平均重量不是100g不拒绝0H :提供的样本不能证明该种食品每袋的平均重量不是100g(2)不能,样本得出的结论只能是拒绝或不拒绝原假设,并不能直接确定原假设为真(3)结论:若给定显著性水平为0.05,则可以拒绝原假设,认为该食品每袋的平均重量不是100克;但若给定显著性水平为0.01,则不能拒绝原假设P 值:如果该种食品每袋的平均重量是100g ,样本结果会像实际观测那样极端或更极端的概率仅为0.03四、(20分)在建立多元线性回归模型时,通常需要对自变量进行筛选。

2007年中国人民大学805统计学考研真题

2007年中国人民大学805统计学考研真题

2007年人大统计学专业课初试题参考解答一、(1)①需假定总体是正态总体。

②不能用数据证明。

数据至多只能检验该数据的分布是否接近正态分布,而不能从理论上证明或肯定它一定就来自正态分布总体,即正态性检验不能提供不拒绝正态性原假设的结论。

③不是。

该区间是确定的区间,要么覆盖真实总体均值,要么不覆盖,没有概率可言。

它是置信度为95%的随机置信区间的一个样本实现,后者才是以95%的概率覆盖真实总体均值。

(2)①需假定:总体服从正态分布;总体方差未知;样本量较小(一般 30)。

②不能。

“接受零假设”的说法是不妥的,否则就得负责任的给出犯第二类错误的概率,而该检验的备选假设是“总体均值>4.8克”,据此是无法算出此概率的。

所以只能说,在显著水平为0.05时利用该数据进行检验不足以拒绝零假设,不拒绝不等同于接受。

二、(1)不是。

因为只有员工看到并愿意答复电子邮件时才有机会进入样本,所以每个员工入样的概率并不一样,这其实是一种非概率抽样。

(2)①不对。

不说实话只是产生响应误差的原因之一,而被调查者与调查者两方面的因素,都有可能导致响应误差。

调查者不当的引导或者问卷设计不科学或者被调查者知识的局限性,都可能使被调查者对要回答的问题的理解产生偏差,这时候即使他(她)说了“实话”,也会产生响应误差,因为这不是我们想要的“实话”。

另外,拒绝回答也是一种重要原因。

②随机误差是不可以避免的,因为它是由抽样的随机性造成的,是客观的。

(3)整体来说是不独立的。

因为同一个网络公司员工加班时间一般是不独立的,而不同网络公司员工加班时间一般是独立的。

三、(1)令自驾车上班人数比例为π,由于不能轻易否定原结论,则检验假设为:01:30%:30%H H ππ≥⎧⎨<⎩ (2)①令样本量为n ,其中驾车上班人数为X ,假定X 服从二项分布(,0.3)B n ,X 的样本值为0x ,则00{}{0}{1}{}p P X x P X P X P X x =≤==+=++=L 值②检验统计量0~(0,1)H Z N =。

人大805统计学真题

人大805统计学真题

15年真题1.一1000住户的小区,每户人家没车的概率0.1,有一辆车的概率0.7,有两辆车的概率0.2,问应该设多少停车位才能有95%以上的概率使小区的每辆车都有车位。

2. 证明多元回归分析中最小二乘估计具有最小方差线性无偏性。

3. 有一件什么事抽了100个人,分别给出了其中没有投诉,投诉一次,两次,三次,大于等于四次的具体人数,用卡方拟合检验判断其是否符合均值为1的泊松分布。

再假设确实服从泊松分布,求泊松分布参数的极大似然估计。

4. 假设检验中的p值指什么,用p值和用统计量进行检验有什么不同,再举例说明为什么假设检验不能证明原假设的正确性。

5. A袋中有编号1到n的n个红球,B袋中有n个篮球,每次从A中取出一个球后再从B 中取一个球放入A中(若B中取完则只取A),问A中取出的最后一个球为红球的概率。

6. 从五个正态总体中一共抽取五组样本,有一张表给出了每组样本的样本容量以及偏差平方和,假设这五个正态总体具有相同的方差,求方差95%的置信区间。

7. 现要研究位置(居民区商业区某某区)和竞争者数量(0 1 2 3)对销售额的大小有无影响,给出具体的做法。

14年真题1.证明概率的题,和13年真题差不多,比13年简单,方法也差不多2.计算某条件分布为二元正态分布3.半道证明依概率收敛,剩下半道我记不清了4.利用统计思想证明下面一个积分,被积函数我记不清了,积分最后是dx1dx2...dxn,我觉得这是这次最恶心的一道题,无从下手,大家可以上网找找类似的5.写出广义似然比检验量,并利用此检验量检验下面的假设,一道假设检验的题,检验内容不难,关键是要知道广义似然比检验量是什么6.统计决策中的风险函数和损失函数是什么,剩下半道好像还有点贝叶斯的什么函数我记不太清了7.最大似然估计和贝叶斯后验估计的区别和联系8.写出列联表检验全部过程9.普通的一个假设检验,应该是两总体均值情况中,两个总体方差均未知,样本量为10的近似t检验2013年人大统计学、精算学专业课试题(回忆版)一、证明题:(20分)每题10分1.袋子里有两种颜色的球红球a个白球b个第一步从袋子里取出一个球观察其颜色然后丢掉第二步从袋子里再取出一个球,若和上一次取出的球颜色不同,则放回,回到第一步;若和上一次取出的球颜色相同,则丢掉,重复第二步。

2019年人大统计学考研题目(回忆版)

2019年人大统计学考研题目(回忆版)

2010年考研题目(p.s试题来自于网上,如有错误恳请包涵)(一)五道问答题(50分)1.两地区的什么比例(好像是收入的均值吧),运用t检验得出p值为0.132,据此能否得出这两个地区的均值相等的结论?【分析】首先从前提假设来看,题目中没有给出假设条件,如果用t检验的话,需要的假设条件有 1、两个总体正态分布2、总体方差未知3、两个总体的样本独立抽取(否则为匹配样本)4、小样本(n<30)5、每一个总体样本内部也相互独立(否则为有限总体情况)题目中除了假设条件没有以外,还缺少为判断标准的显著水平a,如果a>0.132则还是要拒绝原假设的。

如果还要写可以加上原假设未写明。

2.在参数统计中,卡方分布有哪些应用,并举例说明【分析】在参数统计中,卡方分布有时序:检验白噪声的lb统计量、q统计量检验异方差相关性的Q统计量、lm统计量GARCH模型六部最后一步检验正态性的偏度峰度服从自由度为2的开放分布;多元:wills 统计量(就是多元中的F统计量)当不满足n、p的情况时就为卡方分布。

典型相关分析中检验典型相关系数的卡方分布。

多元中两个总体均值的假设检验,只要两个总体中最小的总体的数目趋于无穷则也服从卡方分布。

统计学:单个总体的方差假设检验或者是参数估计也服从卡方分布。

(有人说还有列联分析中拟合优度和独立性检验,不过我认为列联分析根本就不属于参数统计,列联分析是非参数统计的内容,所以这两个不能写入,其实多元中还有一个和马氏距离非常相似的公式也服从卡方分布,但是这台机子上没法打出符号,就请各位童鞋自己注意一下) 3.贝叶斯统计与经典统计的区别【分析】贝叶斯统计的思想是假如对某一个总体有一定的了解,那么用先验分布来描述这种认识,然后从总体中抽取样本,用样本来修正这种认识得到后验分布,以后的推断通过都通过后验分布进行。

经典统计分描述统计和推断统计,其中描述统计是将数据通过图表进行分析,而推断统计则是直接通过样本来描述总体,并未涉及先验分布。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

人大统计学考研历年真题精华版(03-09)2009年人大统计学专业课初试题一、有两个正态总体,均值和方差未知,但已知方差相等。

从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。

如何检验第一个总体的均值是否大于第二个总体的均值?二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。

三、周期过程cos()t t X A ωϕ=+,其中频率ω和振幅A 都是常数,而相位ϕ是一个在区间[-π,π]上服从均匀分布的随机变量。

问{t X }是否平稳?说明原因。

四、把一个总体分为三层,各层的权重和预估的比例见下表。

待估计的参数为总体比例。

如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单随机抽样有相同的估计量方差。

(假设各层总体单位数量h N 都充分大,忽略“有限总体校正系数”)五、与人大出版社21世纪统计学系列教材之《统计学》(第二版)第四章习题第10题是一样的。

六、若有线性回归模型01 (1,2,,)t t t y x t n ββε=++= ,其中()0t E ε=,222()t t E x εδ=,()0 ()t s E t s εε=≠,则(1)该模型是否违背古典线性回归模型的假定?请简要说明。

(2)如果对该模型进行估计,你会采用什么方法?请说明理由。

七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。

第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。

每对白鼠中随机抽取一只喂以实验的安眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。

对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。

假定40只白鼠的初始活动状态相同。

请详细阐述你用何种方法分析安眠药的效果?八、某大学从教师中抽取一个随机样本进行满意度调查。

1分表示非常不满意,100分表示非常满意。

数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。

(2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。

2008年人大统计学专业课初试题一、(10分)07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。

”请你从统计的角度对该报道做简要评论。

二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。

三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型?请你写出模型形式并加以简要说明。

四、(30分)食品厂家说:净含量是每袋不低于250g。

但有消费者向消协反映不是250g,消协据此要求厂家自检,同时消协也从中随机抽取20袋检验。

(1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由;(2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由;(3)消协抽取20袋,数据如下(略),得p值为0.4297,在α=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。

(1)请具体指明这些假设有哪些?(2)说明这些假设所发挥的主要作用;(3)请讨论这些假设最终产生的影响。

六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。

七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素。

(1)以大坝为例,概略说明需考虑的主要因素;(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。

(画出框图,并尽量避免过多使用文字)2007年人大统计学专业课初试题一、(20分)下面是一种零件误差的数据(单位:克):6.1 4.7 6.5 6.27.76.4 5.57.1 6.1 5.35.76.1 5.3 4.0 4.83.2 3.9 1.94.9 3.85.3 2.6 5.3 5.5 5.82.7 6.8 7.4 5.63.3(1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。

请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法;(2)对于该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。

如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。

能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。

请回答以下问题:(1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么?(2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的?(3)这些员工的加班时间是否独立?如果不是,原因可能是什么?三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。

但一家研究机构则认为自驾车上班的人数比例达不到这一水平。

为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。

(1)请写出检验的原假设和备择假设;(2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。

对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件;(3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著?四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?一个负责任的调查报告应该给什么有关信息?五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。

请问,这样做是否有道理?请加以说明。

什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么?六、(20分)回归模型y=β0+β1x1+β2x2+…+βp x p+ε中的ε一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项作出假定?如果不是,那么在什么情况下需要对误差项作出假定?作什么假定?七、(25分)对于聚类分析,请回答以下问题:(1)分层聚类前,需要对什么进行选择?(2)描述分层聚类分析的详细步骤;(3)描述K均值(快速)聚类分析的详细步骤。

八、(25分)应用多元线性回归模型y=β0+β1x1+β2x2+…+βp x p+ε,如果一个SPSS回归分析的结果如下表所示:a. Predictor s:(Constant),Beginning Salaryb. Predictor s:(Constant),Beginning Salary,Employment Category则:(1)表中所用选择自变量的方法可能是什么?(2)表中的最后一个Sig.如何求得?意义是什么?(3)请给出该表最后一个F所表示的统计量服从F分布所需要的假定条件,并对该统计量服从F分布予以证明。

2006年人大统计专业课初试题一、(20分)某银行为缩短到银行办理业务等待的时间,准备采用两种排队方式进行试验:一种是所有顾客都进入一个等待队列;另一种是顾客在三个业务窗口处列队三排等待。

为比较那种排列方式使顾客等待的时间更短,两种排队方式各随机抽取9名顾客,得到第一种排队方式的平均等待时间为7.2分钟,标准差为1.97分钟,第二种排队方式的等待时间(单位:分钟)如下:5.56.6 6.7 6.87.1 7.3 7.4 7.8 7.8(1)画出第二种排队方式等待时间的茎叶图;(2)比较两种排队方式等待时间的离散程度;(3)如果让你选择一种排队方式,你会选择哪一种?试说明理由。

二、(20分)某企业生产的袋装食品采用自动打包机包装,每袋标准重量为100克。

现从某天生产的一批产品中按重量重复抽样方式随机抽取50包进行检查,测得每包重量(单位:克)如下:已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量95%的置信区间;(2)如果厂家认为每袋食品重量不低于100克,请写出检验的原假设和备择假设;(3)利用P值进行检验和利用统计量进行检验有什么不同?(z0.05=1.645,z0.025=1.96,t0.05=1.69,t0.025=2.03)三、(20分)一家汽车制造商准备购进一批轮胎,考虑的因素主要有轮胎供应商牌和耐磨程度。

为了对耐磨程度进行测试,分别在低速(40公里/小时),中速(80公里/小时),高速(120公里/小时)下进行测试。

根据对5家供应商抽取的轮胎随机样本对轮胎在行驶1000公里后磨损程度进行试验,在显著水平α=0.01下得到的有关结果如下:差异源SS df MS F P-value F crit行列误差总计1.553.480.145.17428140.391.740.0221.7297.680.0002360.0000027.018.65(1)不同的车速对磨损程度是否有显著影响?(2)不同供应商的轮胎之间磨损程度是否显著差异?(3)在上面的分析中,你都做了哪些假设?四、(15分)说明什么条件下适合采取简单随机抽样?五、(25分)说明回归模型的假设以及当这些假设不成立时的应对方法。

六、(20分)解释因子模型X=AF+ε的意义并写出模型的假设。

七、(15分)以下是从《中国统计年鉴-2005》摘引的资料,要求:(1)根据国民经济收入分配核算原理,说明居民人均收入低于人均GDP水平的原因;(2)计算各指标的动态变动率(不考虑价格变化),对其结果予以简要分析。

相关文档
最新文档