《应用统计学》模拟考试题参考标准答案
应用统计学模拟试题与答案

综合测试题(五)一、单项选择题(每题分,共 18 分)1、社会经济统计学的研究对象是社会经济现象整体的()A、数目特色和客观规律 B 、数目特色和数目关系C、数目关系和认识客体 D 、数目关系和研究方法2、人口普查的检查单位是()A、每一户 B 、所有的户 C 、每个人D、所有的人3、统计分组的要点在于()A、分组标记的正确选择 B 、分组形式的选择C、组限确实定 D 、运用多个标记进行分组,形成一个分组系统4、权数对算术均匀数的影响作用,本质上取决于()A、作为权数的各组单位数占整体单位数比重的大小B、各组标记值占整体标记总量比重的大小C、标记值自己的大小 D 、标记值数目的多少5、有关系数的取值范围是()A、 0≤r ≤1B、 -1<r<1C、 -1 ≤r ≤1 D 、-1 ≤r ≤ 06、总指数的两种计算方式是()A、综合指数和均匀指数 B 、数目指标指数和质量指标指数C、固定构成指数和构造影响指数 D 、个体指数和综合指数7、由组距数列计算算术均匀数时,用组中值代表组内变量的一般水平,有一个假设条件,即()A、各组的次数一定相等 B 、各组变量值一定相等C、各组变量值在本组内呈均匀散布 D 、各组一定是关闭组8、某地域员工样本的均匀薪资=450 元,抽样均匀偏差= 5 元,该地域所有员工均匀薪资落在440- 460 元之间的预计置信度为()A. 2 B . C .39、对整体中的所有或足够多半单位进行检查并以综合研究的方法是()A.大批察看法B.综合指标法C.统计分组法D.归纳推测法10、某地域组织员工家庭生活抽样检查,已知员工家庭均匀每个月每人生活费收入的标准差为12 元,要求抽样检查的靠谱程度为0.9545 ,极限偏差为 1 元,在简单重复抽样条件下,应抽选()A .576 户B .144 户C .100 户D .288 户11、已知变量 X 和 Y 的协方差为- 50,X 的方差为 170,Y 的方差为220,其有关系数为()A. B. - D. –12、倘若销售量上涨5%,销售价钱降落5%,则销售额()A. 没有变化B.有所增添 C.有所减少D.没法判断二、多项选择题(每题2分,共12分)1、社会经济统计学研究对象的特色能够归纳为()A、社会性B、大批性C、整体性D、同质性E、变异性2、统计分组的作用是()A.区分社会经济种类 B.说明整体的基本状况C、研究同类整体的构造D、说明整体特色E、剖析被研究现象整体诸标记之间的联系和依存关系3、以下统计指标中属于总量指标的是()A、人口总数B、商业网点密度C、产品库存量D、人均公民总产值E、出入口总数4、运用于现象发展的水平剖析指标有()A、发展水平B均匀发展水平C、增添量D、均匀增添量E、增添速度5、序时均匀数的计算方法有()A、B、C、D、E、6、在抽样推测中,样本单位数的多少取决于()A、整体标准差的大小B、同意偏差的大小C、抽样预计的掌握程度D、整体参数的大小E、抽样方法和组织形式三、判断题(把“√”或“×”填在题后括号里。
应用统计试题及答案

应用统计试题及答案一、单项选择题(每题2分,共20分)1. 统计学中,用来描述数据集中趋势的量数是()。
A. 方差B. 标准差C. 平均数D. 中位数答案:C2. 在统计学中,一组数据的离散程度可以通过()来衡量。
A. 平均数B. 方差C. 众数D. 极差答案:B3. 以下哪个不是描述数据分布形状的统计量?()A. 偏度B. 峰度C. 平均数D. 标准差答案:C4. 抽样调查中,样本容量的大小对估计的准确性()。
A. 没有影响B. 有正向影响C. 有负向影响D. 影响不确定答案:B5. 以下哪个统计图最适合展示变量间的关系?()A. 条形图B. 折线图C. 散点图D. 饼图答案:C6. 假设检验中,拒绝原假设意味着()。
A. 原假设一定错误B. 有充分证据表明原假设不成立C. 有充分证据表明原假设成立D. 无法确定原假设是否成立答案:B7. 以下哪个统计量不是度量数据的离散程度?()A. 极差B. 方差C. 标准差D. 众数答案:D8. 相关系数的取值范围是()。
A. (-∞, ∞)B. (-1, 1)C. [0, 1)D. (0, ∞)答案:B9. 回归分析中,用于衡量自变量对因变量解释程度的统计量是()。
A. 相关系数B. 回归系数C. 决定系数D. 残差答案:C10. 在方差分析中,F统计量用于检验()。
A. 总体均值是否相等B. 样本均值是否相等C. 总体方差是否相等D. 样本方差是否相等答案:A二、多项选择题(每题3分,共15分)1. 以下哪些是描述数据分布中心的统计量?()A. 平均数B. 中位数C. 众数D. 极差E. 方差答案:ABC2. 以下哪些是描述数据分布形状的统计量?()A. 偏度B. 峰度C. 平均数D. 标准差E. 极差答案:AB3. 以下哪些是描述数据离散程度的统计量?()A. 平均数B. 方差C. 标准差D. 众数E. 极差答案:BCE4. 以下哪些是假设检验的步骤?()A. 建立假设B. 收集数据C. 计算检验统计量D. 确定显著性水平E. 做出决策答案:ABCDE5. 以下哪些是回归分析中常用的诊断方法?()A. 残差图B. 方差膨胀因子C. 相关系数D. 决定系数E. 多重共线性检验答案:ABE三、简答题(每题5分,共10分)1. 请简述什么是置信区间,并说明它在统计推断中的作用。
应用统计学---模拟试题与答案(四)

综合测试题(四)一、单项选择题(每小题1.5分,共18分)1.对某市100个工业企业全部职工的工资状况进行调查,则总体单位是A.每个企业 B.每个职工 C.每个企业的工资总额 D.每个职工的工资水平2.调查某市全部工业企业设备的状况,则调查单位是:A.全部工业企业 B. 每一个工业企业 C. 每一台设备 D. 设备台数3.普查是专门组织的A.一次性全面调查 B. 一次性重点调查C. 经常性全面调查D. 经常性重点调查4.次数分配包括的两个要素是A.按某种标志所分的组和相应频数 B.品质分配数列和变量分配数列C.组距和组中值 D.单项式分组和组距式分组5.某企业计划规定劳动生产率比上年提高5%,实际提高了8%,则该企业的劳动生产率提高计划超额完成A.2.86% B.102.86% C.60% D.160%6.权数对加权算术平均数的影响作用,决定于A.权数本身数值的大小 B.标志值本身数值的大小C.各组标志值占总体标志值比重的大小 D.各组单位数占总体单位数的比重的大小7.对比分析不同水平的变量数列之间标志变异程度,应使用A.全距 B.平均差 C.标准差 D.变异系数8.调查某地区100户家庭,按家庭订购报刊份数分组资料如下:根据上述资料计算的众数为A.1 B. 57 C. 2 D.3. 239.在其它条件不变的情况下,抽样单位数增加一倍,则按重复抽样公式计算的抽样平均误差A.缩小为原来的70.71% B.缩小为原来的一半C.扩大为原来的1.5倍 D.扩大为原来的二倍10.先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽选样本单位的抽样组织形式为A.简单随机抽样 B.类型抽样 C.等距抽样 D.整群抽样11.能够测定变量之间相关关系密切程度的主要方法是A.相关表 B.相关图 C.相关系数 D.定性分析12.在回归分析中,对于没有明显因果关系的两变量A.可给定自变量数值估计因变量的可能性 B.可给定因变量值推出自变量值C.可以都是随机变量 D.可以都是非随机变量二、多项选择题(每小题2分,共12分)1.统计总体的特征是( )A.科学性 B.实用性 C.大量性 D.同质性 E.变质性2.属于调查资料准确性检查对象的误差有 ( )A.计量误差 B.记录误差 C.计算误差 D.抄录误差 E.抽样误差3.下面对抽样调查和重点调查的陈述中,正确的是( )A.两者都是非全面调查 B.两者选取单位都不受主观因素的影响C.两者选取单位都按照随机原则 D.两者选取单位都不受主观因素的影响E.两者都用以推算总体数量特征4.统计表的结构,从内容上看,包括( )A.标题 B. 横栏和纵栏 C. 数字资料 D. 主词 E. 宾词5.用抽样指标估计总体指标,所谓优良估计的标准有( )A、客观性B、无偏性C、一致性D、有效性E、优良性6、设产品的单位成本(元)对产量(百件)的直线回归方程为yc=76-1.85x,这表示( )A、产量每增加100件,单位成本平均下降1.85元B、产量每减少100件,单位成本平均下降1.85元C、产量与单位成本按相反方向变动D、产量与单位成本按相同方向变动E、产量与单位成本按相同方向变动三、判断题(每题2分共10分)1、抽样极限误差总是大于抽样平均误差()2、不知道总体方差或标准差就无法计算抽样误差()3、能计算总量指标的总体必须是有限总体()4、分配数列的实质是把总体单位总量按照总体所分的组进行分配()5、全面调查包括普查和统计报表()四、名词解释1、平均差2、调和平均数3、调查对象4、简单随机抽样五、简答题(每题5分,共10分)1、为什么要计算变异系数?2、简单相关分析与回归分析的区别与联系。
《应用统计学》练习题库参考答案

《应用统计学》练习测试题库一、单项选择题1.统计有三种涵义,其基础是( )。
(1)统计学 (2)统计话动 (3)统计方法 (4)统计资料2.若要了解某市工业生产设备情况,则总体单位是该市( )。
(1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备3.某班学生数学考试成绩分刷为65分、71分、80分和87分,这四个数字是( )。
(1)指标 (2)标志 (3)变量 (4)标志值4.现要了解某机床厂的生产经营情况,该厂的产量和利润是( )。
(1)连续变量 (2)离散变量 ()3前者是连续变量,后者是离散变量 (4)前者是离散变量,后者是连续变量5.( )是统计的基础功能。
(1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能6.( )是统计的根本准则,是统计的生命线。
(1)真实性 (2)及时件 (3)总体性 (4)连续性7.统汁研究的数量必须是( )。
(1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量8.指标是说明总体特征的.标志则是说明总体单位特征的,所以( )。
(1)指标和标志之同在一定条件下可以相互变换 (2)指标和标志都是可以用数值表示的(3)指标和标志之间不存在戈系 (4)指标和标志之间的关系是固定不变的9.对百货商店工作人员进行普查,调查对象是( )。
(1)各百货商店(2)各百货商店的全体工作人员 (3)一个百货商店 (4)每位工作人员10.全国人口普查中,调查单位是( )。
(1)全国人口 (2)每一个人(3)每一户 (4)工人工资11.对某城市工业企业的设备进行普查,填报单位是( )。
(1)全部设备(2)每台设备 (3)每个工业企业 (4)全部工业企业12.某城市拟对占全市储蓄额4/5的几个大储蓄所进行调查,以了解全市储蓄的一般情况,则这种调查方式是( )。
(1)普查(2)典型调查(3)抽样调查(4)重点调查13.统计调查项目是( )。
应用统计学模拟试卷和答案

应用统计学模拟试卷和答案一. 单项选择题(10%, 每小题1分)1、某工人月工资500元,则“工资”是()。
A、数量标志B、品质标志C、质量指标D、数量指标2、现对某企业生产设备的运转情况进行统计调查,则()。
A、调查对象是企业B、调查对象是该企业的全部设备运转情况C、调查对象是该企业每一台设备运转情况D、调查单位是该企业的每一台设备3、某市组织一次物价大检查,要求12月15日至12月30日全部调查完毕,这一调查时间规定的是()。
A、调查时间B、调查期限C、标准时间D、登记时间4、统计表中的主词是指()。
A、表中全部统计资料的内容B、描述研究对象的指标C、各种指标所描述的研究对象D、分布在各栏中的指标数值5、将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为()。
A、动态相对指标B、结构相对指标C、比例相对指标D、比较相对指标6、权数的最根本作用体现在()的变动上。
A、次数B、标志值C、比重D、标志值和次数7、两个总体的平均数不等,但标准差相等,则()。
A、小平均数的代表性大B、大平均数的代表性大C、两个平均数代表性相同D、无法判断代表性大小8、年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y = 10 + 70x,这意味着年劳动生产率每提高1千元,工人工资平均()。
A、增加70元B、减少70元C、增加80元D、减少80元9、变量间相关程度越低,则相关系数的数值( )。
A、越小B、越接近于0C、越接近于– 1D、越接近于110、产品产量报告期比基期增长25%,单位产品成本减少20%,则生产总成本()。
A、增长5%B、增长20%C、减少80%D、没有变动二. 填空题(20%, 每小题1分)1、根据标志的表现不同,可把标志分为两种,其中,(1)是用数值来表现总体单位数量特征的标志,其表现的具体数值称为(2)。
2、按调查登记时间的连续性不同,统计调查分为(3)和(4)两种3、统计调查搜集资料的方法主要有(5)法、(6)法、(7)法和(8)法。
应用统计学模拟试卷及答案

二、单项选择题(每题2分,共30分)1~5:ACBCA 6~10: DCDBC 11~15: BACDD三、计算题(每题15分,共60分) 1、(1)第二种排队时间的平均数:(3分)第二种排队时间的标准差: (3分)(2)1112221.970.277.20.6730.0967x x συσυ======(6分)由于12υυ〉,所以,第一种排队方式的离散程度大于第二种排队方式。
选第二种排队方式,因为其排队的平均等待时间短,且排队时间较为稳定。
(3分) 2、118098.33%12001450103.57%1400118014502630101.15%120014002600======+====+实际进货数(1)第一季度进货计划完成程度(5分)计划进货数实际进货数第二季度进货计划完成程度(5分)计划进货数上半年实际进货数(2)上半年计划完成程度(5分)上半年计划进货数3、4'312071682213526843723(1)2286.2()5(37231207)629()143723(2)132.52%12071132.52%132.52%(3)20228664.38b G G G a a n b n x x x ++++===∆-===-===-=-=⨯=∑年平均发展水平亿元年平均增长水平为:亿元(5分)年平均发展速度(5分)年的销售额应为:3723132.52%亿元。
(5分),8,3.9745 53.94a ytt = =-(2分)4分)(2分)(3分)年开始,。
应用统计学---模拟试题与答案(六)

综合测试题(六)一、单项选择题(每题1.5分,共18分)1、商品销售是是()A、质量指标B、数量指标C、品质标志D、数量标志2、对某社区5000名居民的生活状况进行调查,其总体是()。
A、5000名居民B、每名居民C、每个居民收入D、每个居民生活支出3、某市为了掌握流动人口情况,拟对该市几个流动人口较集中的地区进行调查,这种调查的组织方式是()A、重点调查B、典型调查C、普查D、抽样调查4、全国人口普查,其调查单位是()A、各街乡单位B、各社区单位C、全部人口D、每个城乡居民5、分配数列各组标志值都减少,每组次数都增加1倍,中位数()A、减少B、增加1倍C、增加2倍D、不变6、下列的平均数属于位置平均数的是()A、众数和中位数B、算术平均数C、调和平均数D、几何平均数7、动态数列中各个指标数值不具有可加性的是()A、时点数列B、时期数列C、时期指标D、时期绝对数指标8、相对数动态数列中的各个指标都是()A、绝对数B、相对数C、平均数D、序时平均数9、大数定律证明,随着样本容量n的增加,抽样平均数x()。
A.有远离总体平均数的趋扫势 B.与总体平均数若即若离C.有接近于总体平均数的趋势 D.的数值的固定的10、相关关系是现象间确实存在的,但相关关系数值是()的相关依存关系。
A.不完全确定B.可以确定C.不确定D.无法确定=5元,=6元,则两个企业职工平均工11、已知两个同类型企业职工平均工资的标准差分别为:资的代表性是()A、甲大于乙B、乙大于甲C、一样的D、无法判断12、由组距数列计算算术平均数时,用组中值代表组内变量的一般水平,有一个假定条件,即()A、各组的次数必须相等B、各组变量值必须相等C、各组变量值在本组内呈均匀分布D、各组必须是封闭组二、多项选择题(每题2 分,共12分)1、几何平均数的计算应满足的条件是()A、若干个比率的乘积等于总比率B、若干个比率之和等于总比率C、若干个速度相乘结果是总速度D、相乘的各比率必须是正数E、相乘的各速度不能为负数2、指出下列动态数列属于平均数动态数列的有()A、城乡居民人均粮食产量动态数列B、平均每平方公里人口数动态数列C、劳动生产率动态数列D、产品单位成本动态数列E、职工平均工资动态数列3、用综合指数形式计算的商品销售价格指数,表明了()A、商品销售量的变动幅度B、销售的商品销售品种的变动C、商品销售价格的变动程度D、商品销售价格的变动趋向E、销售价格变动对销售额产生的影响4、平均指数的权数在形式上较灵活,可以采用()为权数。
应用统计学模拟卷答案

2012学年秋季学期《应用统计学》模拟卷答案一、填空题(本大题共 5 小题,每小题 2 分,共 10分)1.统计指标按其反映的数量特点不同可以分为数量指标和质量指标。
2.统计调查根据被研究总体的范围分为全面调查和非全面调查。
3. 根据相关密切程度的判断标准,8.05.0<<r时称为显著相关,18.0<<r时称为高度相关。
4. 重复抽样平均误差的大小与样本单位数成反比关系,与总体标准差成正比关系。
5.总指数的计算方法有综合指数和平均数指数两种。
二、单项选择题(本大题共 10 小题,每小题 2 分,共 20 分)1、权数对算术平均数的影响作用,实质上取决于( A )。
A.作为权数的各组单位数占总体单位数比重的大小B.各组标志值占总体标志总量比重的大小C.标志值本身的大小D.标志值数量的多少2.对某城市工业企业未安装设备进行普查,总体单位是( B )。
A.工业企业全部未安装设备B.工业企业每一台未安装设备C.每一个工业企业的未安装设备D.每一个工业企业3.某市分行下属三个支行的职工人数分别为2200人、3000人、1800人,这三个数字是( D )A、标志B、指标C、变量D、变量值4、对全国货币发行量中占较大比重的几个大地区进行货币发行量调查,这种调查方式属于( D )。
A、普查B、典型调查C、抽样调查D、重点调查5、电站按发电量的分配数列,变量是:(甲)电站个数;(乙)发电量。
汽车按载重量的分配数列,频数是:(丙)汽车数量;(丁)载重量。
( C )。
A 、甲、丙 B、甲、丁 C 、乙、丙D、乙、丁6、单项式分组适合运用于( C )A、连续性数量标志B、品质标志C、离散性数量标志中标志值变动范围比较小D、离散型数量标志中标志值变动范围很大7、总体与总体单位之间的关系是( B )A、固定不变的B、随着研究目的和任务的不同,可以变换位置C、总体是总体单位数量的总和D、总体是由存在数量标志的总体单位构成8、一个统计总体( C )A、只能有一个标志B、可以有多个标志C、可以有多个指标D、只能有一个指标9、置信区间的大小表达了区间估计的( B )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
《应用统计学》模拟考试题参考答案————————————————————————————————作者:————————————————————————————————日期:应用统计学模拟考试题答案得分评阅人一、判断题(共10小题,每小题1分,共10分)请在你认为正确的题号前的括号内划“√”,在你认为错误的题号前的括号内划“×”。
(√)1、在统计调查中,抽样调查因为诸多优点而最经常被采用。
(√)2、按照计量尺度的差异,可以将统计数据分为分类数据、顺序数据和数值型数据三类。
(×)3、抽样误差是抽样调查中可以设法消除的误差。
(×)4、在假设检验中,如果所计算的P值越小,说明检验结果越不显著。
(√)5、不存在趋势的时间序列称为平稳时间序列。
(√)6、拉氏物价指数是以基期的商品交易量作为同度量因素加权的。
(√)7、展示时间序列数据的最佳图形是线图。
(√)8、统计表主要由表头、行标题、列标题、数字资料和表外附加五部分组成。
(×)9、多数情况下,t分布是一个右偏分布。
(×)10、平均数、中位数、众数等都是用来衡量数据离散趋势的。
得分评阅人二、单选题(共10小题,每小题1分,共10分)请将唯一的正确答案选项写在题号前的括号内。
( A)11、下列变量中属于数值型变量的是A、汽车轮胎的直径B、汽车的内燃机类型C、产品等级D、学生生源类别(C)12、以下各种抽样方式中一定属于非随机抽样的方式是:A、简单随机抽样B、等距抽样C、重点抽样D、类型抽样(C )13、下列图形中不能展示分类数据的图是:A、条形图B、饼图C、直方图D、环状图(B)14、经验数据表明某电话订票点每小时接到订票电话的数目X是服从常数为120的泊松分布,请问该订票点每10分钟内接到订票电话数目Y的分布类型是:A、正态分布B、泊松分布C、二项分布D、超几何分布(D)15、下列有关统计分组的一些说法中,错误的是:A、统计分组是指按照某些重要标志把总体分成若干部分的科学分类B、数值型数据的分组的组数主要取决于数据的全距和组距的大小C、统计分组的目的是为了展现总体的内部结构或分布规律D、统计分组只能按照一个标志单独进行(C)16、下面有关相关关系的一些说法错误的是:A、相关关系是一种普遍存在的关系B、简单相关系数是用来定量描述变量之间线性相关程度的C、简单相关系数为零时,说明两个变量之间不存在任何关系D、简单相关系数绝对值越大,两个变量之间的相关程度越密切(B)17、已知一组数据为10,8,7,3,5,6,8,请问这组数据的中位数为 A、8 B、7 C、6.5 D、10(B)18、某样本数据的方差是36,均值是10,则该组数据的离散系数是:A、3.60B、0.60C、1.67D、0.28(D)19、下列有关参数估计的说法错误的是A、参数估计就是利用样本统计量的值来对总体的参数进行估计B、参数估计有点估计和区间估计等形式C、区间估计必须有相应的置信度作为保证D、区间估计的宽度越大说明估计的精确度越高(C)20、下列有关时间序列的说法错误的是:A、长期趋势是指指标值随时间变化呈现出持续的上升或下降的变动B、循环波动是一种周期性变动C、季节变动是指周期为一年上的周期性变动D、不规则变动是没有特定规律的随机变动得分评阅人三、填空题(共10空,每空1分,共10分)21、在假设检验中,如果检验统计量的P值大于给定的显著性水平α,则在做决策时,需要在显著性水平α的情况下,___不能拒绝_原假设。
22、一组数据的最大值是85,最小值是33,中位数是55,众数是42,则该组数据的极差是52 。
23、样本统计量的概率分布称为抽样分布。
24、利用样本统计量的值来估计总体参数的过程称为参数估计。
25、统计分组中,同一组的上组限与下组限之差称为组距。
26、两个变量之间的简单线性相关系数的取值范围为[-1 , 1] 。
27、样本或总体中各不同类别数值之间的比值称为比率。
28、狭义地讲,指数都是衡量多个项目综合变动的相对数。
29、在互联网上主动参与某项调查的网民所构成的样本,称为自愿样本。
30、一元线性回归中,使得残差平方和最小的估计回归系数的方法称为最小二乘法。
得分评阅人四、简答题(共4小题,每小题5分,共20分)31、评价估计量好坏的标准有哪些?答:评价估计量好坏的标准有三个:(1)无偏性。
无偏性是指估计量抽样分布的数学期望等于被估计的总体的参数。
(2分)(2)有效性。
有效性是指对同一总体参数的两个无偏统计量,有更小标准差的估计量更有效。
(2分)(3)一致性。
一致性是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
(1分)32、何谓第II类错误与第Ⅰ类错误?第II类错误也称为取伪错误,指在假设检验操作过程中,当原假设实际上为假,但由于随机性,从总体中抽得的样本所构建的检验统计量值却落在了接受域之内,以致做出不能推翻(可以认为接受)原假设的判断,这样就称为犯了第II 类错误;(2.5分)第Ⅰ类错误是指原假设实际上为真,但作出了拒绝原假设的判断,这样就称为犯了第Ⅰ类错误。
(2.5分)33、什么是二手资料?使用二手资料应该注意什么问题?答:二手资料是指与研究内容相关的已经存在的数据资料,这些资料已经由其他人员搜集整理汇总完毕,以各种形式保存。
研究者可以通过各种渠道获取这些数据,而无需亲自进行调查或做实验获得相关数据。
(2分)研究者在使用二手资料时候需要对资料的真实性、合适性和时效性进行检查,看资料是否符合研究的目的。
(即弄清楚资料的搜集者是谁,为什么目的,在什么时候,怎样搜集,以保证数据的真实性、合适性和时效性)。
(3分)34、请解释总体和样本。
总体就是所研究的全部元素的集合 (2.5分)样本就是从总体中抽取的一部分元素的集合 (2.5分) 得分 评阅人 五、软件应用分析题(共1小题, 14分)1.36、某城市的一家研究机构聘请一位社会学家作一项社会调查,调查的内容涉及到职工每年无故缺勤的天数和职工从家里到工作单位的距离(公里)之间的关系。
选取了10名职工组成一个样本,采集的数据及其经excel 有关方法的处理后的结果如下表:到工作单位的距离 无故缺勤的天数 (公里)到工作单位的距离 无故缺勤的天数 (公里) 1 8 3 5 4 8 6 7 8 610 3 12 5 14 2 14 4 18 2到工作单位的距离(公里)2010无故缺勤的天数98765432134420978xy 3442.00978.8ˆ-= 回归统计Multiple R 0.843121 R Square 0.710854 Adjusted R Square 0.674711 标准误差 1.289415观测值 10方差分析df SS MS F Significance F 回归分析 1 32.69927536 32.69927536 19.66766549 0.002182936 残差 8 13.30072464 1.66259058 总计 9 46Coefficients 标准误差 t StatP-valueIntercept8.097826087 0.808822137 10.01187494 8.4133E-06 到工作单位的距离 -0.344202899 0.077613652 -4.434824178 0.002182936试根据以上数据处理结果,分析:1) 到工作单位的距离x 与无故缺勤的天数y 的简单相关系数是多少?两变量之间呈现怎样的相关关系?(2分)答:相关系数是0.843121;(1分) 两变量之间呈现高度线性负相关(1分)2) 写出y 关于x 的回归方程,并解释回归系数的意义。
(4分)2分回归系数的实际意义: 到单位距离每增加1公里,无故缺勤天数平均减少0.3442天3) 请解释标准误差为 1.289415的含义。
(2分)答:说明用该线性回归方程来估计无故缺勤天数时,观测值与估计值平均相差了1.289415天。
4) 写出判定系数,并解释其意义。
(2分)答:判断系数为71.0854% ,说明在无故缺勤天数的变差中,有71.0854%是由到工作单位的距离决定的。
(或:在无故缺勤天数的变差中,有71.0854%可被 回归方程解释)5) 检验回归方程的显著性 (α =0.05) (2分) 答:H 0:β1=0由于F 检验的P 值为0.00218293远远小于0.05(1分),因此,在显著性水平0.055.344234420978 5.34428*3442.00978.8ˆ=-=y 的情况下,回归方程通过了显著性检验(1分)。
6) 如果有一名职工住在离公司有8公里远的地方,利用在2)中得到的估计的回归方程,求出该职工每年无故缺勤天数的点估计值。
(2分) 得分 评阅人 六、计算分析题(共3小题,每小题12分,共36分)37、某工厂生产某种零件,按照规格该种零件的直径应该为4.5cm ,长期积累的数据资料表明,零件的直径服从正态分布,现在从一批零件中抽得容量为5的样本,测得其直径(单位:cm )分别为4,4.5,5,5.5,6,试根据抽样结果判断零件的平均直径是否符合规定要求,显著性水平α取值为0.05。
注:可能需要使用的值 Z 0.05=1.645, Z 0.025=1.96,236.25=,791.0625.0=t 0.025(4)=2.776, t 0.05(4)=2.132, t 0.025(5) =2.571,t 0.05(5)=2.015解:首先根据题意建立假设:5.40=:μH 5.41≠μ:H 2分样本容量为n=5,通过样本数据计算得到样本均值为: 2分)(5565.555.44cm x =++++=样本方差: 3分625.04)56()55.5()55()55.4()54(1)(22222122=-+-+-+-+-=--=∑=n x xS ni i此时总体为正态分布,且不知道总体方差,样本为小样本,因此需要构建t 检验统计量。
4134.1236.2/791.05.455/5.4t =-=-=S x 3分由于776.24134.1t 776.2<=<-,检验值落在非拒绝域内,因此根据样本数据信息,在0.05的显著性水平下无法拒绝原假设,可以认为该批零件的平均直径符合规定要求。
2分38、某大学4500名学生中,采用简单随机重复抽样抽选20%,调查每月看电影次数,所得资料如下:看电影次数0—2 2—4 4—6 6—8 8—10 学生数的% 9 2140255试以95.45%的可靠性估计该大学学生平均每月看电影次数。
(12分)解1) 4.920.0590.2570.4050.2130.091=⨯+⨯+⨯+⨯+⨯==∑∑fMf x(3分)0194.21)(21=--=∑∑f fx M s (2分)(1) 则120.0060.0*2060.0060.0).20-19000194.2)-10275.022==⨯=⨯=∆===z t Nn n s x x x σσ(( (各2分)下限=80.4120.092.4=-=∆-x x (1分) 上限=04.512.092.4=+=∆+x x (1分)则该大学学生平均每月看电影的次数为(4.80,5.04)次 (1分)3、甲、乙两班同时对《经济数学》课程进行测试,甲班平均成绩为81分,标准差为9.5分;乙班的成绩分组资料如下: 按成绩分组60以下60-7070-80 80-90 90-100 学生人数(人) 41025142计算 1)乙班学生的平均成绩(3分)2)并比较甲、乙两班哪个班的成绩差异更大。