2014统计学的试卷与答案详解
2014统计学试卷与答案

2014统计学试卷与答案一、填空题(每空1分,计10分)1、统计指标包括 、计算方法、空间限制、时间限制、具体数值和计量单位6个要素。
2、无论采用何种调查方法进行调查,首先都要制定 。
3、质量指标是反映 的指标。
4、8名队员的身高(单位:CM )由低到高排序为:181,182,182,183,184,185,186,186,身高的中位数是 CM 。
5、假定中国和美国的国民年龄方差相同,现在各自重复随机抽样获取1%的公民来分别估计两个国家国民的平均年龄,其他条件相同的情况下,哪个国家国民平均年龄的估计误差会较小一些 。
6、变量之间完全相关,则其相关系数为 。
7、若逐期增长量每年相等且为正数,则各年的环比发展速度是年年 。
(上升,不变,下降)。
8、回归分析中OLS (普通最小二乘法)的原理是 。
9、编制综合指数的特点是 。
10、拉氏指数是把同度量因素的时间固定在 的一种综合指数形式。
二、判断题(每题1分,计10分,请填入“√”或“⨯”)( )1、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来;( )2、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确;( )3、凡是离散型变量都适合编制单项式数列; ( )4、任何变量数列都存在众数;( )5、如果o e m m x <<,则变量分布为左偏; ( )6、判定系数越大,估计标准误就越大;( )7、正相关是指两个变量的数量变动方向都是上升的;( )8、统计的本质就是关于为何统计,统计什么和如何统计的思想; ( )9、两个总量指标时间数列相对比得到的时间数列一定是相对数时间数列;( )10、同度量因素在起到同度量的同时,还具有一定的权数作用。
三、单项选择题(每题1分,计10分) 1、统计学的研究对象是( )。
A 、各种现象的内在规律 B 、各种现象的数量方面 C 、统计活动过程 D 、总体与样本的关系2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( )。
2014年7月高等教育自学考试 00974《统计学原理》试题及答案

2014年7月高等教育自学考试统计学原理试卷及答案(课程代码 00974)一、单项选择题(本大题共20小题,每小题1分,共20分) 1.构成统计总体的每一个别事物,称为 CA .调查对象B .调查单位C .总体单位D .填报单位 2.对事物进行度量,最精确的计量尺度是A A .定比尺度 B .定序尺度 C .定类尺度D .定距尺度3.《中华人民共和国统计法》对我国政府统计的调查方式做的概括中指出,调查方式的主体是C A .统计报表 B .重点调查 C .经常性抽样调查 D .周期性普查4.是非标志的成数p 和q 的取值范围是D A .大于零 B .小于零 C .大于1 D .界于0和1之间5.在经过排序的数列中位置居中的数值是A A .中位数 B .众数 C .算术平均数 D .平均差6.确定中位数的近似公式是AA .d f S fL mm ⨯-+-∑12B .d L ⨯∆+∆∆+211C .∑∑⋅ffx D .∑-)(x x7.反映现象在一段时间内变化总量的是BA .时点指标B .时期指标C .动态指标D .绝对指标 8.重置抽样与不重置抽样的抽样误差相比AA .前者大B .后者大C .二者没有区别D .二者的区别需要其他条件来判断9.如果总体内各单位差异较大,也就是总体方差较大,则抽取的样本单位数A A .多一些 B .少一些 C .可多可少D .与总体各单位差异无关10.进行抽样调查时,样本对总体的代表性受到一些可控因素的影响,下列属于可控因素的是D A .样本数目 B .样本可能数目 C .总体单位数 D .样本容量 11.在12个单位中抽取4个,如果进行不重置抽样,样本可能数目M 为B A .412 B .!8!4!12 C .12×4 D .12412.方差是各变量值对算术平均数的A A .离差平方的平均数 B .离差平均数的平方根 C .离差平方平均数的平方根D .离差平均数平方的平方根13.估计标准误差是反映_____的指标。
2013-2014年《统计学原理》试题及答案

2013年统计学原理真题一、单项选择题(本大题共20小题,每小题1分,共20分) 1.统计有三种涵义,其中统计工作的成果是 ( D ) A .统计学 B .统计工作 C .统计方法D .统计资料2.对事物进行度量,最粗略的计量尺度是 ( C )A .定比尺度B .定序尺度C .定类尺度D .定距尺度 3.统计的根本职能是 ( B )A .参与决策B .收集、整理和提供信息C .发布统计资料D .统计咨询 4.反映现象在一段时间变化总量的统计指标是 ( B ) A .时点指标 B .时期指标 C .动态指标 D .绝对指标 5.反映同类事物数量特征一般水平的统计指标是 ( C ) A .绝对指标 B .相对指标 C .平均指标 D .数量指标 6.已知两个总体平均水平相等,但标准差不等,则 ( C ) A .标准差大,平均数代表性也大 B .标准差小,平均数代表性也小 C .标准差大,平均数代表性小 D .两者没有联系7.成数的标准差的取值范围是 ( D )A .[-0.5, 1]B .[0.5, 1]C .[-0.5, 0.5]D .[0, 0.5]8.在抽样调查中,由于偶然性因素影响,使样本指标与总体指标之间出现绝对离差,它是 ( A ) A .抽样误差 B .抽样平均误差 C .标准差 D .平均差9.进行抽样时,如果每一群体之内的单位相似程度较高,而群体与群体之间的差异较大,适宜采用的抽样组织形式是 ( C )A .简单随机抽样B .等距抽样C .类型抽样D .整群抽样 10.进行整群抽样时,应尽量保证 ( A ) A .群与群之间差异较小,而群内差异较大 B .群与群之间差异较大,而群内差异较小C .群与群之间差异较小,而群内差异也较小D .群与群之间差异较大,而群内差异也较大11.“最可能出现”的抽样误差是 ( C )A .极差B .抽样极限误差C .抽样平均误差D .系统性误差 12.相关分析与回归分析,在是否区分自变量和因变量问题上 ( A ) A .前者不必区分,后者需要区分 B .前者需要区分,后者不需区分 C .两者都需区分D .两者都无需区分13.相关关系描述的是事物之间的 ( B )A .因果关系B .非确定性数量对应关系C .互为因果关系D .相互影响关系 14.在确定回归直线的参数时,比较准确的方法是 ( B ) A .截距法 B .最小平方法 C .半数平均法 D .积差法 15.较常用的时间数列分析模型是 ( C )A .Y=T+C+S+IB .Y=T+(C ×S ×I ) C .Y=T ×C ×S ×ID .Y=T ×C ×S+I16.使用移动平均法对线性趋势进行分析,能起到的作用主要是 ( A )A .平滑作用B .移动作用C .平均作用D .加总作用17.1999~2002年某地区农产品收购价格指数分别是96%、97% 、96.8%、95.6%,则四年间平均价格指数的计算方法为( C ) A .4956.0968.097.096.0+++B .4956.0968.097.096.0⨯⨯⨯C .4956.0968.097.096.0⨯⨯⨯D .1956.0968.097.096.04-⨯⨯⨯18.某企业2001—2006年各年销售额(单位:万元)分别为:1500、1620、1720、1860、1990、2020,则该期间销售额年平均增长速度为 ( A ) A .5.1% B .6.1% C .105.1%D .106.1%19.“指数”有不同的涵义,反映复杂总体数量变动的相对数是 ( D ) A .通用指数 B .抽象指数 C .广义指数 D .狭义指数20.已知劳动生产率可变构成指数为134.2%,职工人数结构影响指数为96.3%,则劳动生产率固定结构指数(A )A .139.36%B .129.23%C .115.25%D .37.9%二、多项选择题(本大题共5小题,每小题2分,共10分) 21.统计的职能有 ( ABC )A .信息职能B .咨询职能C .监督职能D .分析职能 E. 决策职能 22.绝对指标的计量单位主要有 ( ABCD )A .实物单位B .自然单位C .价值单位D .劳动单位 E. 无名数单位 23.抽样调查的主要特点有 ( ABC ) A .用样本推断总体B .按随机原则抽选调查单位C .调查前可以计算和控制抽样误差D .调查目的在于了解总体基本情况E. 抽样调查误差可以克服24.工人工资y (元)依劳动生产率x (千元)的回归方程为y=10+70x ,这意味着,如果劳动生产率 (DE ) A .等于1000元,则工人工资为70元 B .每增加1000元,则工人工资平均增长80元 C .不变,则工人工资为80元 D .每增加1000元,则工人工资平均提高70元 E. 减少500元,则工人工资平均减少35元25.在直线趋势方程bt a y t +=中,t y 代表直线趋势值,其余各符合的意义是 ( BCDE )A .a 等于原动态数列的最末水平B .a 代表趋势直线的起点值C .b 为趋势直线的斜率D .t 代表时间变量E. b 是每增加一个单位时间,现象平均增加的值三、判断改错题(本大题共6小题,每小题2分,共12分)26.调查工作的时间限制指的是调查数据的所属时间。
2014年统计分析概论考试试题及答案解析

统计分析概论考试试题及答案解析一、单选题(本大题4小题.每题1.0分,共4.0分。
请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。
)第1题对事物之间客观存在的必然的依存关系,以及在较长一段时间内事物发展变化的模式进行的分析称为( )。
A 状态分析B 前景分析C 规律分析D 数学分析【正确答案】:C【本题分数】:1.0分【答案解析】[解析] 各项统计分析活动无非是对客观现象的状态、规律及前景进行分析和研究。
从统计意义上讲,客观现象的状态是指一定时间、地点、条件下的规模、水平、速度及各种关系;规律是指事物之间客观存在的必然的依存关系,以及在较长一段时间内事物发展变化的模式;前景是指客观现象未来可能的状态。
第2题统计工作过程一般包括四个阶段,其中有三个阶段是占有资料,说明“是什么”、“怎么样”的问题,则此三个阶段分别是( )。
A 统计设计、统计调查、统计整理B 统计设计、统计整理、统计分析C 统计工作、统计资料、统计整理D 统计设计、统计工作、统计分析【正确答案】:A【本题分数】:1.0分【答案解析】[解析] 统计工作过程一般包括以下四个阶段:①统计设计;②统计调查;③统计整理;④统计分析。
统计工作过程的前三个阶段是占有资料,说明“是什么”、“怎么样”的问题,是统计分析的前提。
而统计分析则是运用资料,回答“为什么”、“怎样解决”的问题,是在前几个阶段工作的基础上,通过分析达到对研究对象更为深刻的认识,是提供研究成果的最后阶段。
第3题2008年奥运会中,假设用1代表中国,2代表日本,3代表美国,则这种计量水平称为 ( ) 。
A 列名水平B 顺序水平C 间隔水平D 比率水平【正确答案】:A【本题分数】:1.0分【答案解析】[解析] 计量水平从低到高划分为:①列名水平;②顺序水平;③间隔水平;④比率水平。
列名水平是四种计量水平中最低的一种计量水平,它表现为用一些数字或符号将资料进行简单的排列或分组。
2014年统计指数考试试题及答案解析

统计指数考试试题及答案解析一、单选题(本大题13小题.每题1.0分,共13.0分。
请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。
)第1题我国零售物价指数的编制是采用( )方法。
A 个体指数B 综合指数C 平均数指数D 固定权数平均指数【正确答案】:D【本题分数】:1.0分【答案解析】[解析] 零售物价指数的编制是采用固定权数计算的加权算术平均指数,计算公式为:式中,K为个体指数或各层次的类指数,w为各层次零售额比重权数。
p第2题在具有两个贸易市场上报告期和基期某种水果价格和销量资料条件下,要计算该种水果销量的平均变动,应采用( )形式计算。
A 加权算术平均数指数B 加权调和平均数指数C 数量指标综合指数D 质量指标综合指数【正确答案】:C【本题分数】:1.0分【答案解析】[解析] 要计算该种水果销量的平均变动,应采用数量指标综合指数,其计算公式为:第3题平均指数是计算总指数的一种形式,它是在( )的基础上编制总指数的一种方法。
A 总指数B 个体指数C 数量指数D 质量指数【正确答案】:B【本题分数】:1.0分【答案解析】[解析] 平均指数是计算总指数的一种形式,它是在个体指数的基础上编制总指数的一种方法,即先计算出个体指数,然后对其进行加权平均计算总指数,以测定总体现象的平均变动程度。
第4题某地区某年多种工业产品成本计划完成百分数是一种( )。
A 个体指数B 静态指数C 动态指数D 数量指数【正确答案】:B【本题分数】:1.0分【答案解析】[解析] 静态指数是指反映同类现象的数量在相同时间内不同空间(地区和单位等)的差异程度。
题中,“某年”说明是同一时间,故属于静态指数;“多种”说明属于总指数;“产品成本”说明属于质量指数。
因此,二季度与一季度相比,各房型的价格上涨幅度为100.14%-1=0.14%。
第6题编制数量指标指数一般是采用( )做同度量因素。
2014统计学课后习题答案

4.00 4 . 5677
8.00 5 .
2.00 5 . 59
2.00 6 . 13
4.00 6 . 5678
1.00 7 . 4
Stem width: 10
Each leaf:1 case(s)
第四章统计描述
【4.1】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。试分别计算产量、成本、劳动生产率的计划完成程度。
回答以下问题:
(1)这一研究的总体是什么?
(2)月收入是分类变量、顺序变量还是数值型变量?
(3)对居住环境的满意程度是什么变量?
【解】(1)这一研究的总体是某小区的所有居民。
(2)月收入是数值型变量
(3)对居住环境的满意程度是顺序变量。
第二章统计数据的搜集
【2.1】从统计调查对象包括的范围、调查登记时间是否连续、搜集资料的方法是否相同等方面,对以下统计调查实例分类,并指出各属于那种统计调查方式。
5000-6000
134
56.78
6000-7000
30
12.71
7000以上
10
4.24
总计
236
100.00
根据资料回答问题并计算:
(1)它是一个什么数列?
(2)计算工资额的众数和中位数;
(3)分别用职工人数和人数所占比重计算平均工资。结果一样吗?
(4)分别计算工资的平均差和标准差。
【解】(1)是等距分组数列
【4.6】两家企业生产相同的产品,每批产品的单位成本及产量比重资料如下:
甲企业
批次
单位产品成本(元/台)
2014年统计整理考试试题及答案解析

统计整理考试试题及答案解析一、单选题(本大题13小题.每题1.0分,共13.0分。
请从以下每一道考题下面备选答案中选择一个最佳答案,并在答题卡上将相应题号的相应字母所属的方框涂黑。
)第1题在电子计算机汇总技术中,对调查资料的逻辑审查和计算机技术审查是通过电子计算机的( )来实现。
A 编辑程序B 储存功能C 查看功能D 数据分析功能【正确答案】:A【本题分数】:1.0分【答案解析】[解析] 在电子计算机汇总技术中,对调查资料的逻辑审查和计算机技术审查是通过电子计算机的编辑功能来实现的,计算机的编辑功能又是通过编辑程序来实现的。
第2题对于一份农民个人经营的内陆养鱼场的调查表,按“所属国民经济部门”这一标志,应给以代码( )。
A 1021B 0421C 1024D 0321【正确答案】:B【本题分数】:1.0分【答案解析】[解析] 内陆养鱼属于国民经济行业分类中的大类渔业,其代码是04。
第3题在对某地区粮食产量的统计资料汇总前,发现某一调查单位产量增长或降低幅度过大,有必要进行( )。
A 汇总程序的审核B 全面性审核C 计算技术审核D 逻辑审核【正确答案】:D【本题分数】:1.0分【答案解析】[解析] 逻辑审核是指审查各填报项目是否符合情理。
题中,某一调查单位产量增长或降低幅度过大,就有必要予以查问,进行逻辑审核。
第4题在统计分组表中,频率是指( )。
A 各组的频数相互之比B 各组的单位数C 各组频数与总频数之比D 各组频数与比重之比【正确答案】:C【本题分数】:1.0分【答案解析】[解析] 频数是指总体及各组的单位数,频率是各组频数与总频数之比。
第5题在电子计算机汇总技术中,( )是实现计算机分组汇总功能的关键。
A 汇总程序B 资料C 数据录D 编码。
2014统计学试卷与答案

2014统计学试卷与答案一、填空题(每空1分,计10分)1、统计指标包括 、计算方法、空间限制、时间限制、具体数值和计量单位6个要素。
2、无论采用何种调查方法进行调查,首先都要制定 。
3、质量指标是反映 的指标。
4、8名队员的身高(单位:CM )由低到高排序为:181,182,182,183,184,185,186,186,身高的中位数是 CM 。
5、假定中国和美国的国民年龄方差相同,现在各自重复随机抽样获取1%的公民来分别估计两个国家国民的平均年龄,其他条件相同的情况下,哪个国家国民平均年龄的估计误差会较小一些 。
6、变量之间完全相关,则其相关系数为 。
7、若逐期增长量每年相等且为正数,则各年的环比发展速度是年年 。
(上升,不变,下降)。
8、回归分析中OLS (普通最小二乘法)的原理是 。
9、编制综合指数的特点是 。
10、拉氏指数是把同度量因素的时间固定在 的一种综合指数形式。
二、判断题(每题1分,计10分,请填入“√”或“?”)( )1、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来; ( )2、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确; ( )3、凡是离散型变量都适合编制单项式数列; ( )4、任何变量数列都存在众数;( )5、如果o e m m x <<,则变量分布为左偏; ( )6、判定系数越大,估计标准误就越大;()7、正相关是指两个变量的数量变动方向都是上升的;()8、统计的本质就是关于为何统计,统计什么和如何统计的思想;()9、两个总量指标时间数列相对比得到的时间数列一定是相对数时间数列;()10、同度量因素在起到同度量的同时,还具有一定的权数作用。
三、单项选择题(每题1分,计10分)1、统计学的研究对象是()。
A、各种现象的内在规律B、各种现象的数量方面C、统计活动过程D、总体与样本的关系2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是()。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
2014统计学试卷与答案一、填空题(每空1分,计10分)1、统计指标包括 、计算方法、空间限制、时间限制、具体数值和计量单位6个要素。
2、无论采用何种调查方法进行调查,首先都要制定 。
3、质量指标是反映 的指标。
4、8名队员的身高(单位:CM )由低到高排序为:181,182,182,183,184,185,186,186,身高的中位数是 CM 。
5、假定中国和美国的国民年龄方差相同,现在各自重复随机抽样获取1%的公民来分别估计两个国家国民的平均年龄,其他条件相同的情况下,哪个国家国民平均年龄的估计误差会较小一些 。
6、变量之间完全相关,则其相关系数为 。
7、若逐期增长量每年相等且为正数,则各年的环比发展速度是年年 。
(上升,不变,下降)。
8、回归分析中OLS (普通最小二乘法)的原理是 。
9、编制综合指数的特点是 。
10、拉氏指数是把同度量因素的时间固定在 的一种综合指数形式。
二、判断题(每题1分,计10分,请填入“√”或“⨯”)( )1、数量指标根据数量标志计算而来,质量指标根据品质标志计算而来;( )2、普查是全面调查,抽样调查是非全面调查,所以普查比抽样调查准确;( )3、凡是离散型变量都适合编制单项式数列; ( )4、任何变量数列都存在众数;( )5、如果o e m m x <<,则变量分布为左偏; ( )6、判定系数越大,估计标准误就越大;( )7、正相关是指两个变量的数量变动方向都是上升的;( )8、统计的本质就是关于为何统计,统计什么和如何统计的思想; ( )9、两个总量指标时间数列相对比得到的时间数列一定是相对数时间数列;( )10、同度量因素在起到同度量的同时,还具有一定的权数作用。
三、单项选择题(每题1分,计10分) 1、统计学的研究对象是( )。
A 、各种现象的内在规律 B 、各种现象的数量方面 C 、统计活动过程 D 、总体与样本的关系2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( )。
A 、数量指标 B 、质量指标 C 、数量标志 D 、品质标志3、下列哪个变量不能采用定比计量尺度?( )。
A 、企业职工人数 B 、企业产品产量 C 、企业销售额 D 、企业利润额4、最常用的统计调查方式是( )。
A 、普查 B 、重点调查 C 、抽样调查 D 、科学推算5、如果计算算术平均数的所有变量值都增加100,则方差( )。
A 、增加100 B 、增加10000 C 、不变 D 、不能确定6、假如学生的考试成绩用优秀、良好、中等、及格和不及格来表示,那么全班成绩的水平高低应该用什么平均数来说明?( )A 、可以用算术平均数B 、只能众数C 、可以用众数或中位数D 、只能用中位数7、某企业2012年的产值比2008年增长了200%,则年平均增长速度为( ) A 、4200%B 、%10024-C 、%10034⨯D 、%10034-8、当时期数列分析的目的侧重于研究某现象在各时期发展水平的累计总和时,应采用( )方法计算平均发展速度。
A 、算术平均数B 、调和平均数C 、方程式法D 、几何平均法9、某一时间数列,当时间变量t =1,2,3,…,n 时,得到趋势方程为t y 7238+=,那么若取t=0,2,4,6,8,…时,方程中的b将为()。
A、144B、36C、110D、3410、同样多的货币支出少购买5%的商品,那么商品价格指数是()。
A、95.24%B、105%C、105.26%D、5%四、问答题(计20分)1、总体和样本的概念,及它们之间关系如何?(5分)2、统计数据收集过程中,可能有哪些误差?(5分)3、说明相关分析和回归分析的关系。
(5分)4、简述概率抽样的特点。
(5分)五、计算题(50分),要求列出相关公式或者说明原始数据的代入情况(每问0.5分);最终结果采用准确的数据形式,并且保留小数点后两位(每问0.5分);给出必要的文字说明(每问0.5分)。
每题最多扣2分。
1)请计算并回答A-E数值分别是多少?(3分)2)请说明A、C、E的含义。
(3分)3)请根据表格数据计算平均成绩和方差。
(4分)2、某公司想了解客户对某产品的接受和喜欢程度,利用简单随机抽样选取了100个客户作样本,结果发现喜欢该产品的有81人,请以95.45%的置信水平下。
1)估计该产品受欢迎比例的区间范围;(7分)2)其他条件不变的情况下,极限误差减少为1)中的90%,需要抽取的样本容量是多少?(3分)3、某上市公司季度报告数据如下,请分别计算该上市公司2011年和2012年的平均季度存货周转率和平均季度销售费用率状况。
其中,季度存货周转率(次/季)=季度营业成本/季度平均存货,季度销售费用率(%)=季度销售费用/季度营业收入。
(10分,其中平均季度存货周转率6分和平均季度销售费用率4分)4、根据某地区历年人均年收入(千元)与商品销售额(万元)资料计算的有关数据如下(x 代表人均年收入,y 代表销售额)1191818225603992=====∑∑∑∑xy x y x n 要求:1)建立以商品销售额为被解释变量的直线回归方程,并说明斜率的经济意义。
(8分)2)若2013年人均年收入为6000元,估计2013年该地区的商品销售额。
(2分)5、某企业2012年和2011年销售额及相关价格上涨数据如下表。
试计算:1)三种产品销售量总指数;(3分)2)三种产品销售价格总指数;(3分)4)利用指数体系分析销售额变动的原因。
(4分)答案一、填空题(每空1分,计10分)1、指标名称2、数据收集方案3、总体内在对比关系或总体间对比关系4、183.55、中国6、+1或-17、下降8、使实际值(观测值)与估计值(拟合值)的离差平方和最小9、先综合,后对比10、基期二、判断题(每题1分,计10分)1-5 ⨯⨯⨯⨯√6-10 ⨯⨯√⨯√三、单选题(每题1分,计10分)1-5 B D D C C6-10 C D C B C四、简答题(计20分)1、总体和样本的概念,及它们之间关系如何?(5分)(1分)总体是统计研究的客观对象的全体,是由所有具有某种共同性质的事物所组成的集合体。
(1分)样本是从总体中抽取的一部分个体所组成的集合。
总体和样本的关系主要包括三个方面:(1分)1)总体是所要研究的对象,而样本则是所要观测的对象,样本是总体的代表和缩影;(1分)2)样本是用来推断总体的;(1分)3)总体和样本的角色是可以改变的。
2、统计数据收集过程中,可能有哪些误差?(5分)数据收集过程中,可能存在两种误差:观测性误差和代表性误差。
(1分)观测性误差(登记性误差或调查性误差),是在调查观测的各个环节因工作粗心,或被观测者不愿很好配合而造成的所收集数据与实际情况不符的误差。
观测性误差在全面调查和非全面调查中都会产生。
(1分)代表性误差是在抽样调查中,由于样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。
代表性误差又分为系统性代表性误差和偶然性代表性误差,(1分)系统性代表性误差是指由于抽样框不完善,抽样违反随机原则,被调查者无回答等因素引起的误差;系统性代表性误差通常难以计算和控制。
(1分)偶然性代表性误差是由于抽样的随机性引起的样本结构与总体结构不完全相符,从而产生的估计结果与总体真值不一致的误差;偶然性代表性误差不可避免,但是可以计算和控制。
(1分)抽样调查中的观测性误差和系统性代表性误差统称为非抽样误差,而偶然性代表性误差称为抽样误差。
3、说明相关分析和回归分析的关系。
(5分)(2分)相关分析不必区分自变量(解释变量)和因变量(被解释变量),变量之间是平行关系,而回归分析要根据研究目的确定自变量和因变量,变量之间是因果关系;(1分)相关分析中两个变量都是随机的,而回归分析中,因变量是随机变量,而自变量是非随机的;(1分)回归分析可以得到变量之间关系的方向、强弱程度和具体数量变动关系,而相关分析只能确定变量之间关系的方向和程度。
(1分)回归分析是在相关分析的基础之上,进一步研究现象之间的数量变化规律;4、简述概率抽样的特点。
(5分)概率抽样是按照随机原则抽取样本,即总体中的每个个体都有已知的,非零的概率被抽取到样本中。
特点如下:(1分)1)样本的抽取上,遵循随机原则,即个体是否被抽中不受主观因素的影响,而是由可知的,非零的概率来确定;(1分)2)调查的功能上,以部分推断总体,以样本的观测结果去推断总体的数量特征;(1分)3)推断的手段上,运用概率估计方法,以样本观测结果推断总体不能做出完全精确可靠的推断,只能以一定的概率为保证做出具有一定精度的估计。
(1分)4)推断的理论上,以大数定律和中心极限定理为依据。
只要样本容量足够大,抽样推断就可以以正态分布为依据。
(1分)5)推断的效果上,抽样误差可以计算和控制。
五、计算题(50分),要求列出相关公式或者说明原始数据的代入情况(每问0.5分);最终结果采用准确的数据形式,并且保留小数点后两位(每问0.5分);给出必要的文字说明(每问0.5分)。
每题最多扣2分。
11)请计算并回答A-E 数值分别是多少?(3分) 36.00 33 66.00 35 70.00 2)请说明C 、E 的含义。
(3分)A ,成绩位于区间[70,80)的人数占学生总数的比例为36.00% C ,成绩小于80分的人数占学生总数的比例为66.00% E ,成绩大于等于70分的人数占学生总数的比例为70.00% 3)请根据表格数据计算平均成绩和方差。
(4分)平均成绩=∑(成绩组中值*人数)/∑人数=(55⨯3+65⨯12+…+95⨯7)/50=76.20(分)方差=∑(成绩组中值-平均成绩)2*人数/∑人数=(55-76.2)2⨯3+(65-76.2)2⨯12+…+(95-76.2)2⨯7)/50=122.56答,这个班级50名学生平均成绩是76.20分,方差是122.56。
(平均成绩2分,方差2分) 21)估计该产品受欢迎比例的区间范围;(7分)(1分)简单随机抽样,样本容量为100,大于30,符合中心极限定理的应用条件,即样本成数服从正态分布。
某产品的客户数量应该很大,即总体单位总数N 很大,所以重复抽样和不重复抽样的抽样标准误基本相同,可以看做等同。
(2分)其中n=100,n1=81,那么,样本成数%p 81=,样本方差为)p (p n n--11=0.1555或者153901.)p (p =-,由于总体方差未知,考虑用样本方差替代总体方差计算样本成数的抽样标准误0394010011908101100100111...n )p (p n n )p (SE =⨯⨯⨯-=--=或03920100119081011...n )p (p )p (SE =⨯⨯=-=。