2021应用统计硕士统计学考研专硕真题库
2021应用统计硕士统计学考研专硕真题库
1 选择题考研真题解析
以下关于参数和统计量的说法正确的是()。
A.总体参数是随机变量
B.样本统计量都是总体参数的无偏估计量
C.对一个总体参数进行估计时,统计量的表达式是惟一的
D.样本统计量是随机变量
【答案】D~~~~
【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要了解的总体的某种特征值,研究者所关心的参数通常有总体平均数、总体标准差、总体比例等;由于总体数据通常是不知道的,所以参数是一个未知的常数。在对总体参数进行估计时,可以采用最小二乘估计、极大似然估计等估计方法,不同方法得到的估计量可能不同,也不一定具有无偏性的性质。统计量是用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一个量,是样本的函数;由于抽样是随机的,因此统计量是随机变量。
13.关于有常数项的一元线性回归方程,以下正确的是()。
A.判定系数等于自变量和因变量的相关系数
B.判定系数等于自变量和因变量相关系数的平方
C.自变量和因变量相关系数等于判定系数正的平方根
D.修正的判定系数等于自变量和因变量相关系数的平方
【答案】B~~~~
【解析】在一元线性回归中,自变量和因变量的相关系数实际上是判定系数的平方根,且它与回归系数的符号一致。
14.如果Y关于X的回归方程为,而且这个回归方程的,则x 与y之间的相关系数()。
A.r=1
B.r=-1
C.r=0.9
D.r=-0.9
【答案】D~~~~
【解析】在一元线性回归中,自变量和因变量的相关系数实际上是判定系数的平方根。
由y=2-x知,x与y是负相关的,所以其相关系数为-0.9。
15.95%置信水平的区间估计中95%的置信水平是指()。
A.总体参数落在一个特定的样本所构造的区间内的概率为95%
B.总体参数落在一个特定的样本所构造的区间内的概率为5%
C.在用不同的样本构造的总体参数的多个区间中,包含总体参数的区间比例为95%
D.在用不同的样本构造的总体参数的多个区间中,包含总体参数的区间比例约为95%
【答案】C~~~~
【解析】如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%的区间不包含总体参数的真值,那么用该方法构造的区间称为置信水平为95%的置信区间?
16.关于单因素方差分析中的F检验()。
A.拒绝域在F分布曲线的右侧
B.F统计量的样本观测值可能为负值
C.拒绝域在F分布曲线的左侧和右侧
D.以上表述都不对
【答案】A~~~~
【解析】在单因素方差分析中,若,则拒绝原假设H0;若,则不能拒绝原假设H0。
17.在假设检验中,如果所计算出的P值越小,说明检验的结果()。A.越显著
B.越不显著
C.越真实
D.越不真实
【答案】A~~~~
【解析】P值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了,根据小概率原理,则有理由拒绝原假设;P值越小,拒绝原假设的理由就越充分。18.某商场2008年12月的商品销售额为100万元,该月的季节指数等于125%(乘法模型),在消除季节因素后该月的销售额为()。
A.80万元
B.100万元
C.125万元
D.以上都不对
【答案】A~~~~
【解析】计算出季节指数后,将各实际观察值除以相应的季节指数,即可将季节性成分从时间序列中分离出去。即。
19.在一次问卷调查中要求被调查者直接填写出个人的民族、婚姻状况、居住地的邮政编码、年龄和收入。以下说法不正确的是()。
A.民族是定性变量
B.邮政编码是定量变量
C.年龄的计量尺度是定比尺度
D.收入数据是定量数据
【答案】B~~~~
【解析】变量分为定性变量和定量变量。定性变量是指观测的个体只能归属于几种互不相容类别中的一种,一般是用非数字来表达其类别的变量。定量变量是指可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅能分类而且能测量出来具体大小和差异的变量。定距尺度也称等距尺度或区间尺度,是一种不仅能将变量(社会现象)区分类别和等级,而且可以确定变量之间的数量差别和间隔距离的方法。定比尺度也称比例尺度或等比尺度,是一种除有定距尺度的全部性质之外,还能测量不同变量(社会现象)之间的比例或比率关
系的方法;以定比尺度测量的数据具有绝对零点。由于邮政编码只是对应于行政区域的一个标签,其数值并没有实际意义,故它是定性变量。
20.下列指数中属于质量指数的是()。
A.消费者价格指数
B.销售量指数
C.GDP增长率
D.销售额指数
【答案】A~~~~
【解析】数量指标指数是反映数量指标变动程度的相对数,如商品销售量指数、工业产品产量指数等,数量指标通常采用实物计量单位。质量指数指标是反映品质指标变动程度的相对数,如产品价格指数、产品单位成本指数等,质量指标通常采用货币计量单位。
二.简答题(本题包括1~5题共5个小题,每小题10分,共50分)。1.简述假设检验的过程。
答:假设检验的过程如下:
(1)根据所研究问题的要求提出原假设(或称为零假设、无效假设)和备择假设;确定显著性水平,显著性水平为作假设检验时犯第一类错误的概率。(2)选择合适的检验方法,构造适当的检验统计量,确定统计量的分布,并代入样本数据计算在原假设成立条件下它的数值。
(3)根据计算出的检验统计量观测值,查阅统计表,确定相对应的值;将值与显著性水平比较,若,则拒绝H 0,接受H1;若,则不能拒绝H0。
2.请给出你所知道的概率抽样的组织方式。
答:概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
调查的实践中经常采用的概率抽样方式有以下几种:
(1)简单随机抽样。简单随机抽样指从包括总体N个单位的抽样框中随机地、逐个地抽取n个单位作为样本,每个单位入样的概率是相等的;
(2)分层抽样。分层抽样是指将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体的目标量进行估计;
(3)整群抽样。整群抽样是指首先将总体中若干个单位合并为组,这样的组称为群,抽样时直接随机抽取一个群,然后对中选群中的所有单位全部实施调查;(4)系统抽样。系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位;
(5)多阶段抽样。采用类似整群抽样的方法,首先抽取群,但并不是调查群内的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽样;这里,群是初级抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推广,使抽样的段数增多,就称为多阶段抽样。
3.在盒子图(箱线图)的作图中,会使用哪些描述指标。
答:箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据
的一种方法,它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息,特别可以用于对几个样本的比较。故箱线图使用的描述指标有:最小值、第一四分位数、中位数、第三四分位数与最大值。
4.下列调查问卷中的提问都有问题,请修改。
(1)您和您爱人是否对现有住房满意?
(2)您最近一次是几点上班的?
(3)绝大多数喝过明光牛奶的人都认为它口味纯正,您认为是这样的吗?答:(1)您对现有住房满意吗?您爱人呢?
(2)您最近一次是几点离开家去上班的?
(3)您认为明光牛奶的口味纯正吗?
5.如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的概率是不是0.05×0.05=0.0025?为什么?
答:不是。
显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。当两个事件相互独立时:
(1)
当两个事件不相互独立时:
(2)
记事件A为小明是左撇子,事件B为小明的弟弟是左撇子。显然小明是左撇子和他弟弟是左撇子这两个事件不相互独立,所以选择第二个公式计算小明和他弟弟都是左撇子这个事件的概率。
三.计算与分析题(本题包括1~3题共3个小题,第1题10分,第2、3题30分,共70分)
1.离散型随机变量X的概率分布率如下。
(1)确定概率分布率中a的值。
(2)试给出随机变量X的分布F(x)。
(3)计算随机变量X的均值和方差。
解:(1)根据离散型随机变量的概率分布列的正则性,即可知:
得。
(2)当时,;
当时,;
当时,;
当时,;
当时,。
所以随机变量的分布为:
(3)
1.网站把调查问卷刊登在网页上,然后由感兴趣的网民自行填写。对于此类调查,以下说法正确的是()。
A.这是简单随机抽样
B.这是方便抽样
C.这是雪球抽样
D.这是全面调查
【答案】B~~~~
【解析】B项,方便抽样是指调查过程中由调查员依据方便的原则,自行确定入抽样本的单位。A项,简单随机抽样是指从总体N个单位中任意抽取n 个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式;C项,滚雪球抽样是指先随机选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查对象,往往用于对稀少群体的调查;D项,全面调查是指国家统计系统和各个业务部门为了定期取得系统的、全面的基本统计资料,按一定的要求和表式自上而下统一布置,自下而上提供资料的一种统计调查方法。
2.随机变量X的方差为2,随机变量Y=2X,那么Y的方差是()。A.1
B.2
C.4
D.8
【答案】D~~~~
【解析】由于,故
3.某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集方式是()。
A.面访
B.深度访谈
C.计算机辅助电话调查
D.邮寄调查
【答案】C~~~~
【解析】C项,计算机辅助电话调查是利用现代化电脑程控通讯设备进行的随机电话访问方式,采用这种访问调查方式,具有调查内容客观真实、保密性强、访问效率高等特点。A项,面访即调查者直接走访被调查者,当面听取被调查者的意见,可以比较全面、深入,能获得大量真实的研究资料,但这种方法容易使研究结论带有主观成分;B项,深度访谈是一种无结构的、直接的、一对一的访问形式。最常应用于探测性调查,但是这种访谈方法所得的资料难以进行统计处理和定量分析,而且特别耗费时间,使得访谈的规模受到较大的限制;D 项,邮寄调查法,是指将事先设计好的调查问卷,通过邮政系统寄给被调查者,由被调查者根据要求填写后再寄回,是市场调查中一种比较特殊的调查方法。这种调查方法的调查周期通常比较长,时效性差。
将调查对象划分为若干类,然后从每一类中随机抽取若干单位进行观察,这称为()[浙江工商大学2019研]
A.等距抽样
B.整群抽样
C.类型抽样
D.纯随机抽样
【答案】C~~~~
【解析】类型抽样也称为分层抽样,是将总体单位按其属性特征分成若干类或层,然后在每一类或层中独立地随机抽取样本单位,各层中抽取的样本构成总体样本。等距抽样也称为系统抽样;纯随机抽样也称为简单随机抽样。
3某机构十分关心小学生每周看电视的时间。该机构随机抽取300名小学生家长对他们的孩子每周看电视的时间进行了估计。结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。该机构搜集数据的方式是()。[山东大学2018研]
A.概率抽样调查
B.观察调查
C.实验调查
D.公开发表的资料
【答案】A~~~~
【解析】概率抽样是根据一个已知的概率来抽取样本单位,也就是说,哪个单位被抽中与否不取决于研究人员的主观意愿,而是取决于客观的机会,即概率。因此,哪个单位被抽中与否完全是随机的。题中该机构抽取的300名小
学生家长是随机的,每个小学生的家长都有被抽到的概率,因此该机构搜集数据的方式是概率抽样。
4为了解大学生的消费状况,一学生社团通过微信朋友圈投放调查问卷,并邀请收到问卷的同学在自己的朋友圈内分享问卷。关于这种调查方式,以下说法正确的是()。[中央财经大学2018研]
A.使用的抽样方式是简单随机抽样
B.使用的抽样方式是配额抽样
C.使用的抽样方式是非概率抽样
D.这种调查不是抽样调查
【答案】C~~~~
【解析】非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。题中的调查方式属于非概率抽样中的滚雪球抽样。
5为了快速了解北京居民对空气污染问题的态度,最适合的数据收集方式是()。[中央财经大学2018研]
A.面访
B.电话调查
C.邮寄问卷
D.座谈会
【答案】B~~~~
【解析】电话调查是指调查人员通过打电话的方式向被调查者实施调查。电话调查的最大特点是速度快,能够在很短的时间内完成调查。而面访、邮寄问卷、座谈会的调查周期都比较长。
6某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。物业管理部门利用最初的居民户登记名单进行抽样,但现在的小区中,原有的一些居民户已经搬走,同时有些是新入住的居民户。由此造成的误差属于()。[中央财经大学2018研]
A.随机误差
B.抽样框误差
C.计量误差
D.无回答误差
【答案】B~~~~
【解析】抽样框误差是指由于抽样框的不完善性造成的统计推断错误。在概率抽样中需要根据抽样框抽取样本。一个好的抽样框应该是:抽样框中的单位和研究总体中的单位有一一对应的关系。现在的小区中,原有的一些居民户已经搬走,同时有些是新入住的居民户,这时,抽样框中的单位与研究总体的单位就不存在一一对应的关系,使用这样的抽样框抽取样本就会出现抽样框误差。7下面哪一个表述是错误的?()[湖南师范大学2018研]
A.抽样误差只存在于概率抽样中
B.无论是概率抽样还是非概率抽样都存在非抽样误差
C.在全面调查中也存在非抽样误差
D.非抽样误差只存在于非概率抽样中
【答案】D~~~~
【解析】抽样误差是一种随机误差,是概率抽样所特有的误差;非抽样误差则不同,无论是概率抽样、非概率抽样,还是在全面调查或非全面调查中,都有可能产生非抽样误差。
8为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是()。[山东大学2017研;对外经济贸易大学2017研;山东师范大学2018研]
A.简单随机抽样
B.整群抽样
C.系统抽样
D.分层抽样
【答案】C~~~~
【解析】系统抽样是将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。所以将学生排序后,每隔50名学生抽一名进行调查,属于系统抽样。
应用统计学试题及答案解析
北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%
6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间
卫生统计学 考研
卫生统计学 (Health Statistics) 课程编号:学分数 5 周学时 4 课程性质:医学基础课 预修课程: 教学目的:掌握研究设计方法、基本的统计原理和方法,并能够将其应用于居 民健康状况研究、医疗卫生研究和医学科研。通过本课程的教学,帮助学生培养透过偶然现象探测事物内在规律的思维能力,使学生能应用统计的思维分析方法,有效地开展各项医疗卫生工作和研究工作。 基本内容:研究设计、基本统计原理、常用的统计推断方法 基本要求:学生应按本大纲具体要求,掌握统计学基本原理、常用的统计分析 方法和科学的研究设计方法。能够进行合理地研究设计,科学地搜集、整理、分析数据资料,作出合理推断,能够理论联系实际,分析解决实际问题。 教学用书:倪纵瓒主编《卫生统计学》,人民卫生出版社,2001年1月 教学内容、要求和课时安排: 一、绪论(学时数:2) 教学内容 卫生统计学的内容,统计工作的步骤,统计资料的类型,统计中的几个基本概念,学习卫生统计学应注意的问题。 教学要求 1.掌握:统计中的几个基本概念:随机现象,概率,总体,样本,抽样误 差,统计资料的类型。 2.熟悉:统计工作的一般步骤。 3.了解卫生统计学的主要内容,学习过程中应该注意的问题。 二、计量资料的描述(学时数:6+2) 教学内容 1.计量资料的频数表、图 2.计量资料的统计描述指标 集中趋势:均数,几何均数,中位数,百分位数; 离散趋势:极差和四分位数间距,方差和标准差,变异系数3.正态分布的概念和特征,正态曲线下面积分布规律,正态分布的应用,对数正态分布。 教学要求 1.掌握:计量资料的频数表。常用集中趋势指标的意义及适用范围。正态 分布曲线下的面积分配规律。 2.熟悉:常用集中趋势、离散趋势指标的计算方法。正常值范围的意义和 制定方法。
应用统计学试题和答案分析
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数
= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )
卫生统计学 案例版丁元林课后思考题答案
第一章:ECDBB 第二章:BDABC 第三章:DEBCD AEA 第四章:DCCDD DCBD 第五章:DCBDB AEEEC 第六章:CBEDC DDDDA 第七章:ACCBB DACEA 第八章:ABCDD BDADB 第九章:DDBCD AEA 第十章:BDCCE BDAEA 第十一章:CAEDC DBCCD 第十二章:BCAEE BA 第十三章:DDBCC BCDE 第十四章:无 第十五章:无 第十六章:无 第十七章:DBABC BDE 第十八章:无 第十九章:BDCDC CCADC 《卫生统计学》思考题参考答案 第一章绪论 1、统计资料可以分为那几种类型?举例说明不同类型资料之间是如何转换的? 答:(1)1定量资料(离散型变量、连续型变量)、2无序分类资料(二项分类资料、无序多项分类资料)、3有序分类资料(即等级资料);(2)例如人的健康状况可分为“非常好、较好、一般、差、非常差”5个等级,应归为等级资料,若将该五个等级赋值为5、4、3、2、1,就可按定量资料处理。 2、统计工作可分为那几个步骤? 答:设计、收集资料、整理资料、分析资料四个步骤。 3、举例说明小概率事件的含义。 答:某人打靶100次,中靶次数少于等于5,那么该人一次打中靶的概率≤0.05,即可称该人一次打中靶的事件为小概率事件,可以视为很可能不发生。 第二章调查研究设计 1、调查研究有何特点? 答:(1)不能人为施加干预措施 (2)不能随机分组 (3)很难控制干扰因素 (4)一般不能下因果结论 2、四种常用的抽样方法各有什么特点? 答:(1)单纯随机抽样:优点是操作简单,统计量的计算较简便;缺点是当总体观察单位数量庞大时,逐一编号繁复,有时难以做到。 (2)系统抽样:优点是易于理解、操作简便,被抽到的观察单位在总体中分布均匀,抽样误差较单纯随机抽样小;缺点是在某些情况下会出现偏性或周期性变化。 (3)分层抽样:优点是抽样误差小,各层可以独立进行统计分析,适合大规模统计;缺点是事先要进行分层,操作麻烦。
应用统计学试题及答案
应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】
二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为分;乙班平均分为75分,标准差为分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|
应用统计学练习题(含答案)
应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。
A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学
应用统计学:参数估计习题及答案
简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公
顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差
应用统计学试题和答案
《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的置 信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值围是 。 7、设总体X ~) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号。每小题1分,共14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( ) ①、x > e M >o M ②、x
《应用统计学》练习试题和答案解析
《应用统计学》本科 第一章导论 一、单项选择题 1.统计有三种涵义,其基础就是( )。 (1)统计学 (2)统计话动 (3)统计方法 (4)统计资料 2.一个统计总体( )。 (1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标 3.若要了解某市工业生产设备情况,则总体单位就是该市( )。 (1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备 4.某班学生数学考试成绩分刷为65分、71分、80分与87分,这四个数字就是( )。 (1)指标 (2)标志 (3)变量 (4)标志值 5.下列属于品质标志的就是( )。 (1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资 6.现要了解某机床厂的生产经营情况,该厂的产量与利润就是( )。 (1)连续变量 (2)离散变量 ()3前者就是连续变量,后者就是离散变量 (4)前者就是离散变量,后者就是连续变量 7.劳动生产率就是( )。 (1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标 8.统计规律性主要就是通过运用下述方法经整理、分析后得出的结论( )。 (1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法 9.( )就是统计的基础功能。 (1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能 10.( )就是统计的根本准则,就是统计的生命线。 (1)真实性 (2)及时件 (3)总体性 (4)连续性 11.构成统计总体的必要条件就是( )。 (1)差异性 (2)综合性 (3)社会性 (4)同质性 12.数理统计学的奠基人就是( )。 (1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔 13.统汁研究的数量必须就是( )。 (1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量 14.数量指标一般表现为( )。 (1)平均数 (2)相对数 (3)绝对数 (1)众数 15.指标就是说明总体特征的.标志则就是说明总体单位特征的,所以( )。 (1)指标与标志之同在一定条件下可以相互变换 (2)指标与标志都就是可以用数值表示的 (3)指标与标志之间不存在戈系 (4)指标与标志之间的关系就是固定不变的 答案:一、1(2) 2(4)3(4)4(4)5(2)6(4)7(2)8(2)9(3)10(1)11(4)12(3)13(2)14(3)15(1) 二、1× 2× 3√ 4× 5√ 6× 7√ 8× 9√ 10× 11× 12× 二、判析题 l.统计学就是一门研究现象总体数量方面的方法论科学,所以它不关心、也不考虑个别现象的数量特征。 ( ) 2.三个同学的成绩不同.因此仃在三个变量 ( ) 3.统计数字的具体性就是统讣学区别于数学的根本标志。 ( ) 4.统计指标体系就是许多指标集合的总称。 ( ) 5.一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。( ) 6.统计研究小的变异就是指总体单位质的差别。 ( ) 7.社会经济统计就是在质与量的联系中.观察与研究社会经济现象的数量方面。( ) 8.运用大量观察法必须对研究对象的所有单位进行观察调查。( )
应用统计学试题
2009年天津大学工程硕士应用统计学试卷 姓名 学号 班级 一、简答题(30分,每题5分) 1.统计学表示变异(分散)程度的特征数有哪些? 2.服从两点分布设总体X ),1(p b ,其中p 是未知参数,521,,X X X 是来自X 的简单随机样本。是指出21X X +,i i X 5 1min ≤≤,p X 25+之中哪些是统计量,哪些不是统计量,为什么? 3. 若)9,4(~F F ,则F /1服从什么分布? 4. 假设检验的基本依据是什么? 5. 假设检验中的两类错误是指哪两类错误? 6. 回归分析适合研究哪类问题? 二、(15分).,,5)4,12(51X X N 的样本中随机抽一容量为 在总体 的概率;值之差的绝对值大于 )求样本均值与总体均 (11 {}.15),,,,max(254321>X X X X X P )求概率( 三、(15分)一种新型减肥方法自称其参加者在第一个星期平均能减去至少8斤体重。由40名使用了该种方法的个人组成一个随机样本,其减去体重的样本均值为7斤,样本标准差为3.2。 a .α=0.05时,拒绝规则是什么? b .你对该减肥说明方法的结论是什么? c .p 值为多少? 四、(15分)正态总体),(2σμN 的密度函数为 2 2 2) (21),;(σ μσ πσμ--= x e x f 从该总体抽取随机样本n X X X ,,21 。 (1)求σμ,的极大似然估计量σμ ?,?; (2)证明所求的μ ?是总体均值的最佳无偏估计量。 五、(15分)为了检验三家工厂生产的机器加工一批原料所需的平均时间是否相同,某化学公司得到了关于加工原料所需时间的数据如下表所示。利用这些数据检验三家工厂加工一批原料所需平均时间是否相同。(α=0.05,26.4)9,2(05.0=F )
应用统计学试题和答案分析
六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数: