统计学(第三版,袁卫主编)样卷及答案

统计学(第三版,袁卫主编)样卷及答案
统计学(第三版,袁卫主编)样卷及答案

统计学第三版袁卫编辑课后答案

统计学 第一章 1.什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。 2.简要说明统计数据的来源 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品 (2)变量:口味(如可用10分制表示) (3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。 (4)从匹配样本的观察值中推断两品牌口味的相对好坏。 第二章、统计数据的描述 思考题 1描述次数分配表的编制过程 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2.解释洛伦兹曲线及其用途 答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。 3. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常

统计学第三版答案

第1章统计和统计数据 第2章 1.1 指出下面的变量类型。 (1)年龄。 (2)性别。 (3)汽车产量。 (4)员工对企业某项改革措施的态度(赞成、中立、反对)。 (5)购买商品时的支付方式(现金、信用卡、支票)。 详细答案: (1)数值变量。 (2)分类变量。 (3)数值变量。 (4)顺序变量。 (5)分类变量。 1.2 一家研究机构从IT从业者中随机抽取1000人作为样本进行 调查,其中60%回答他们的月收入在5000元以上,50%的人回答他 们的消费支付方式是用信用卡。 (1)这一研究的总体是什么?样本是什么?样本量是多少? (2)“月收入”是分类变量、顺序变量还是数值变量? (3)“消费支付方式”是分类变量、顺序变量还是数值变量? 详细答案: (1)总体是“所有IT从业者”,样本是“所抽取的1000名IT从业者”,样本量是1000。 (2)数值变量。 (3)分类变量。 1.3 一项调查表明,消费者每月在网上购物的平均花费是200元, 他们选择在网上购物的主要原因是“价格便宜”。

(1)这一研究的总体是什么? (2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值变量? 详细答案: (1)总体是“所有的网上购物者”。 (2)分类变量。

1.4 某大学的商学院为了解毕业生的就业倾向,分别在会计专业 抽取50人、市场营销专业抽取30、企业管理20人进行调查。 (1)这种抽样方式是分层抽样、系统抽样还是整群抽样? (2)样本量是多少? 详细答案: (1)分层抽样。 (2)100。 第2章用图表展示数据

(3)帕累托图如下: (4)饼图如下: 2.2 为确定灯泡的使用寿命(单位:小时),在一批灯泡中随机抽取100只进行测试,所得数据如下:

统计学课后习题答案(袁卫)

统计学课后习题答案(袁卫、庞皓、曾五一、贾俊平)第三版 第1章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 2.试举出日常生活或工作中统计数据及其规律性的例子。 3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)描述推断。 答:(1)总体:最近的一个集装箱内的全部油漆; (2)研究变量:装满的油漆罐的质量; (3)样本:最近的一个集装箱内的50罐油漆; (4)推断:50罐油漆的质量应为4.536×50=226.8 kg。 4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求: (1)描述总体; (2)描述研究变量; (3)描述样本; (4)一描述推断。 答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型;

统计学教材课后答案 第三版 袁卫 庞皓 曾五一 贾俊平主编

第四章、参数估计 1.简述评价估计量好坏的标准 答:评价估计量好坏的标准主要有:无偏性、有效性和相合性。设总体参数θ的 估计量有1?θ和2?θ,如果()1?E θθ=,称1?θ是无偏估计量;如果1?θ和2 ?θ是无偏估计量,且()1?D θ小于() 2?D θ,则1?θ比2?θ更有效;如果当样本容量n →∞,1?θθ→,则1?θ是相合估计量。 2.说明区间估计的基本原理 答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间,使该区间包含总体参数的概率为置信水平。置信水平反映估计的可信度,而区间的长度反映估计的精确度。 3.解释置信水平为95%的置信区间的含义 答:总体参数是固定的,未知的,置信区间是一个随机区间。置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。 4.简述样本容量与置信水平、总体方差、允许误差的关系 答:以估计总体均值时样本容量的确定公式为例:()22/22 z n E ασ= 样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。 练习题: ●1. 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 σ5=0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2Z 6×0.7906=1.5496。 ●2. 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σ15=2.1429

(2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E =α/2Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 ±α/2x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3. 解:⑴计算样本均值x :将上表数据复制到Excel 表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x =3.316667, ⑵计算样本方差s :删除Excel 表中的平均值,点击自动求值→其它函数→STDEV →选定计算数据列→确定→确定,得到s=1.6093 也可以利用Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到: ∑2 i (x -x )=90.65 再对总和除以n-1=35后,求平方根,即为样本方差的值 。 ⑶计算样本均值的抽样标准误差: 已知样本容量 n =36,为大样本, 得样本均值的抽样标准误差为 x σ s 1.6093⑷分别按三个置信水平计算总体均值的置信区间: ① 置信水平为90%时: 由双侧正态分布的置信水平1-α=90%,通过2β-1=0.9换算为单侧正态分 布的置信水平β=0.95,查单侧正态分布表得 α/2Z =1.64, 计算得此时总体均值的置信区间为 ±α/2s x Z 7±1.64×0.2682= 3.75652.8769 可知,当置信水平为90%时,该校大学生平均上网时间的置信区间为(2.87,3.76)小时; ② 置信水平为95%时:

最新《统计学》答案_第三版

第2章 统计数据的描述——练习题 ●2. 解:(1)要求对销售收入的数据进行分组, 全部数据中,最大的为152,最小的为87,知数据全距为152-87=65; 为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分; 为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式; 按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也 可以用Excel 进行排序统计(见Excel 练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列; 将各组企业数除以企业总数40,得到各组频率,填入表中第三列; 在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的 向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。 整理得到频数分布表如下: ●13. 因为女生的离散系数为 V= s x =550 =0.1 男生体重的离散系数为 V= s x =560 =0.08 对比可知女生的体重差异较大。 (2) 男生:x = 602.2公斤公斤=27.27(磅),s =2.25公斤 公斤=2.27(磅); 女生:x = 2.250公斤公斤=22.73(磅),s =2.25公斤 公斤 =2.27(磅); (3)68%; (4)95%。 14 解:(1)应采用离散系数,因为成年人和幼儿的身高处于不同的水平,采用标准差比较

不合适。离散系数消除了不同组数据水平高低的影响,采用离散系数就较为合理。 (2)利用Excel 进行计算,得成年组身高的平均数为172.1,标准差为4.202,从而得: 成年组身高的离散系数:024.01 .1722 .4== s v ; 又得幼儿组身高的平均数为71.3,标准差为2.497,从而得: 幼儿组身高的离散系数: 2.497 0.03571.3 s v = =; 由于幼儿组身高的离散系数大于成年组身高的离散系数,说明幼儿组身高的离散程度相对较大。 第四章参数估计 (1) ●1. 解:已知总体标准差σ=5,样本容量n =40,为大样本,样本均值x =25, (1)样本均值的抽样标准差 x σσ5 =0.7906 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×0.7906=1.5496。 ●2. 解:(1)已假定总体标准差为σ=15元, 则样本均值的抽样标准误差为 x σσ15 =2.1429 (2)已知置信水平1-α=95%,得 α/2Z =1.96, 于是,允许误差是E = α/2 σ Z 6×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为 ±α/2 σ x Z 0±4.2=124.2115.8 可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。 ●3. 解:⑴计算样本均值x :将上表数据复制到Excel 表中,并整理成一列,点击最后数据下面空格,选择自动求平均值,回车,得到x =3.316667, ⑵计算样本方差s :删除Excel 表中的平均值,点击自动求值→其它函数→STDEV →选定计算数据列→确定→确定,得到s=1.6093 也可以利用Excel 进行列表计算:选定整理成一列的第一行数据的邻列的单元格,输入“=(a7-3.316667)^2”,回车,即得到各数据的离差平方,在最下行求总和,得到: ∑ 2i (x -x )=90.65

袁卫《统计学》笔记和典型题(含历年真题)详解(数据与统计学)【圣才出品】

第1章数据与统计学 1.1 复习笔记 一、统计数据与统计学 1.统计学的概念 统计学是研究如何搜集数据、整理数据、分析数据,以便从中做出正确推断的认识方法论科学。实际上,它是一门方法论的科学而不是实质性科学。 2.统计学和统计数据的关系 统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。离开了统计数据,统计方法乃至统计学就失去了其存在的意义。 二、统计学的产生与发展 最早的统计是作为国家重要事项的记录,从统计的产生和发展过程来看,可以把统计学划分为三个时期:一是统计学的萌芽时期,主要有国势学派和政治算术学派;二是统计学的近代时期,主要有数理统计学派和社会统计学派;三是统计学的现代期,主要表现为统计学吸收数学营养的程度越来越迅速;统计学向其他学科领域渗透的能力越来越强;统计学的应用日趋广泛和深入,所发挥的功效日益增强。 三、统计学的分科

1.描述统计和推断统计 描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。推断统计主要有两种类型,即参数估计和假设检验。 2.理论统计和应用统计 理论统计是指统计学的数学原理。由于现代统计科学用到了几乎所有的数学知识,要成为优秀的统计工作者就必须经过严格的数学训练,特别是从事统计理论和方法研究的人员就必须有很好的数学基础。 四、统计数据的种类与来源 1.数据的种类 数据的种类按性质可以分为:(1)定位的数据;(2)定性的数据;(3)定量的数据;(4)定时的数据。 数据的种类按表现形式可以分为:(1)结构型数据;(2)非结构型数据。 2.数据的来源 统计数据来源于直接组织的调查、观察和科学试验,称之为第一手数据或直接的数据;或者来源于已有的数据,称之为第二手数据或间接的数据。 五、统计数据的质量 1.抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差。这种误差虽然不可避免,但是可以控制。 2.非抽样误差是相对于抽样误差而言的,是指除了抽样误差之外的,由于其他原因引起的样本观察值与总体真值之间的差异。非抽样误差特别是其中的系统偏差是可以避免,但

袁卫《统计学》配套题库【课后习题】(时间序列分析与预测)【圣才出品】

第8章时间序列分析与预测 思考题 1.联系实际举出三个时间序列的例子,并分别判断这些时间序列的性质。 答:(1)已知某人2010年全年的月收入时间序列,如表8-1所示。此时间序列各个不同时期的指标值是可以相加的,这属于时期指标时间序列。 表8-1 某人2010年全年各月收入(单位:元) (2)2003~2009年某省城镇总人口数时间序列,如表8-2所示。此时间序列各个时点的指标值是不能相加的,这属于时点指标时间序列。 表8-2 2003~2009年某省城镇总人口数(单位:万人) (3)某厂全体职工2004~2010年间各年的人均年收入时间序列,如表8-3所示。此时间序列的各个指标值也不能够直接相加,这属于平均指标时间序列。 表8-3 某厂全体职工2004~2010年间各年的人均年收入(单位:元) 2.时间序列有哪些速度分析指标?它们之间的关系是什么? 答:(1)时间序列的速度分析指标有发展速度和增长速度。

①时间序列中报告期水平与基期水平之比,称为发展速度,说明现象报告期水平较基期水平的相对发展程度。其计算公式为: 发展速度=报告期水平/基期水平=x t/x0 ②由增长量与基期水平对比可计算增长速度,说明报告期水平较基期水平增长的相对程度。起计算公式为: 增长速度=增长量/基期水平=(报告水平-基期水平)/基期水平 (2)发展速度与增长速度之间的关系为: 增长速度=发展速度-1 3.为什么平均发展速度要用几何平均法计算?计算平均发展速度的几何平均法的特点是什么? 答:(1)平均发展速度是各期环比发展速度的序时平均数,通常采用几何平均法去计算。这是由于现象发展的总速度并不等于各期环比发展速度之和,而是等于各期环比发展速度的连乘积,所以各期环比发展速度的序时平均数,不能在速度代数和基础上按算术平均方法去计算,而只能在速度连乘积基础上按几何平均法去计算。 (2)用几何平均法计算平均发展速度的特点是着眼于期末水平,不论中间水平变化过程怎样,只要期末水平确定,对平均发展速度的计算结果没有影响。或者说用几何平均法计算平均发展速度隐含着一个假定:从时间序列的最初水平出发,以计算的平均发展速度代替各期的环比发展速度,计算出的期末水平与实际的期末水平相一致。所以,计算平均发展速度的几何平均法也称为“水平法”。 4.甲企业近四年产品销售量分别增长了9%、7%、8%、6%,乙企业这四年产品的次

统计学(第三版袁卫_庞皓_曾五一_贾俊平主编)各章节课后习题答案

附录1:各章练习题答案 第1章 绪论(略)第2章 统计数据的描述 2.1 (1) 属于顺序数据。(2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率%B 2121C 3232D 1818E 1515合计1001002.2 (1)频数分布表如下: 40个企业按产品销售收入分组表 按销售收入分组(万元)企业数(个)频率(%)向上累积向下累积企业数频率企业数频率100以下100~110110~120120~130130~140140以上591274312.522.530.017.510.07.55142633374012.535.065.082.592.5100.04035261473100.087.565.035.017.57.5合计40100.0———— (2) 某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业111127.527.5

一般企业落后企业9922.522.5合计40100.0 某百货公司日商品销售额分组表 (万元)25~3030~3535~4040~4545~5046159610.015.037.522.515.0合计40100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)660~67055670~68066680~6901414690~7002626700~7101818710~7201313720~7301010730~74033740~75033合计100100 (3)茎叶图如下: 6518 6614568 67134679 6811233345558899

袁卫《统计学》(第3版)章节题库-数据与统计学(圣才出品)

第三部分章节题库 第1章数据与统计学 一、单项选择题 1.被马克思誉为“政治经济学之父,在某种程度上也是统计学的创始人”的是()。 A.布莱斯·帕斯卡 B.威廉·配第 C.费马 D.约翰·格朗特 【答案】B 【解析】布莱斯·帕斯卡和费马是古典概率论的奠基人;约翰·格朗特是人口统计的创始人。 2.统计学的两大分类是()。 A.统计资料的收集和分析 B.理论统计和运用统计 C.统计预测和决策 D.描述统计和推断统计 【答案】D 3.下列不属于描述统计问题的是()。

A.根据样本信息对总体进行的推断 B.了解数据分布的特征 C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据 【答案】A 【解析】描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法;推断统计是研究如何利用样本数据来推断总体特征的统计方法。 4.下列叙述中,采用推断统计方法的是()。 A.用饼图描述某企业职工的学历构成 B.反映大学生统计学成绩的条形图 C.一个城市在1月份的平均汽油价格 D.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计果园中橘子的平均重量 【答案】D 【解析】推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。由题可知,根据36个橘子的平均重量估计果园中橘子的平均重量属于推断统计方法。 5.如果一个样本因人故意操纵而出现偏差,这种误差属于()。 A.抽样误差 B.非抽样误差 C.设计误差

D.实验误差 【答案】B 【解析】非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,人为干扰造成的误差,调查中由于被调查者不回答产生的误差等。 6.下列说法错误的是()。 A.抽样误差只存在于概率抽样中 B.非抽样误差只存在于非概率抽样中 C.无论是概率抽样还是非概率抽样都存在非抽样误差 D.在全面调查中也存在非抽样误差 【答案】B 【解析】抽样误差是由于抽样的随机性引起的样本结果与总体真值之间的误差;非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。抽样误差是一种随机误差,只是存在于概率抽样中,非抽样误差则不同,无论是概率抽样、非概率抽样,或是在全面性调查中,都有可能产生非抽样误差。 7.指出下面的说法哪一个是错误的?() A.抽样误差是可以避免的 B.非抽样误差是可以避免的 C.抽样误差是不可避免的 D.抽样误差是可以控制的

统计学第三版(袁卫、庞浩)课后习题答案

各章练习题答案 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: 40个企业按产品销售收入分组表 按销售收入分组(万元)企业数 (个) 频率 (%) 向上累积向下累积 企业数频率企业数频率 100以下100~110 110~120 120~130 130~140 140以上 5 9 12 7 4 3 12.5 22.5 30.0 17.5 10.0 7.5 5 14 26 33 37 40 12.5 35.0 65.0 82.5 92.5 100.0 40 35 26 14 7 3 100.0 87.5 65.0 35.0 17.5 7.5 合计40 100.0 ————(2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)

650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 (3)茎叶图如下: 65 1 8 66 1 4 5 6 8 67 1 3 4 6 7 9 68 1 1 2 3 3 3 4 5 5 5 8 8 9 9 69 0 0 1 1 1 1 2 2 2 3 3 4 4 5 5 6 6 6 7 7 8 8 8 8 9 9 70 0 0 1 1 2 2 3 4 5 6 6 6 7 7 8 8 8 9 71 0 0 2 2 3 3 5 6 7 7 8 8 9 72 0 1 2 2 5 6 7 8 9 9 73 3 5 6 74 1 4 7 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1)茎叶图如下: A班 树茎B班 数据个数树叶树叶数据个数 0 3 59 2 1 4 4 0448 4 2 97 5 122456677789 12 11 97665332110 6 011234688 9 23 98877766555554443332100 7 00113449 8 7 6655200 8 123345 6 6 632220 9 011456 6

袁卫 曾五一 贾俊平统计学第五版课后习题 答案

各章练习题答案第2章统计数据的描述 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0

合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5 670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1)茎叶图如下:

统计学名词解释汇总袁卫版

统计学名词解释 统计学:是收集、处理、分析、解释数据并从数据中得出结论的科学。 统计学方法:描述统计和推断统计;理论统计和应用统计。 统计数据的来源:第一手数据(直接数据);第二手数据(间接数据)。 基本概念: 总体(人们研究的所有基本单位总和) 变量(总体中个体单位所具有的特征) 样本(总体的一部分) 统计数据类型: 按采取计量尺度,分类数据(定性)、顺序数据(定性)、数值型数据(定量);按统计数据收集方法,观测数据、实验数据; 按被描述对象与时间关系,截面数据、时间序列数据(动态数据) 变量分类: 分类变量,顺序变量,数值型变量; 随机变量(某次试验结果的数值性描述),非随机变量; 经验变量,理论变量。 离散型变量和连续型变量 离散型变量,只能取有限个数值; 连续型变量,取一个或多个区间中任何值; 均值:亦数学期望,是随机变量所有可能取值的一个加权平均 参数估计:用样本统计量去估计总体的参数 估计量:用来估计总体参数的统计量的名称 点估计:用样本估计量的值作为总体参数的估计值 区间估计:在点估计的基础上,给出总体参数估计的一个范围 置信区间: 在区间估计中,由样本统计量所构造的总体参数的估计区间; 置信系数:置信区间中包含总体参数真值的次数所占的比率

评价估计量的标准:无偏性、有效性、一致性; 假设:对总体参数的具体数值所作的陈述;假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设假设是否成立的过程。 方差分析:检验多个总体均值是否相等的统计方法 数据的预处理包括哪些内容? 数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。 直方图和条形图有什么区别? ①条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组 频数,矩形的高度表示每一组的频数或频率,宽度表示组距, ②直方图各矩形连续排列,条形图分开排列, ③条形图主要展示分类数据,直方图主要展示数值型数据。 ④茎叶图和直方图相比有什么优点? 茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。一组数据的分布特征可以从哪几方面进行测度: 一是分布的集中趋势,反映数据向其中心靠拢或聚集的程度; 二是分布的离散程度,反映各数据远离其中心值的趋势; 三是分布的形状,反映数据分布偏斜程度和峰度。 简述众数、中位数、平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。 均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。 为什么要计算离散系数第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。

统计学(第三版)课后习题答案

附录1:各章练习题答案 2.1 (1)属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频率)频率% A1414 B2121 C3232 D1818 E1515 合计100100 (3)条形图(略) 2.2 (1)频数分布表如下: (2)某管理局下属40个企分组表 按销售收入分组(万元)企业数(个)频率(%) 先进企业良好企业一般企业落后企业11 11 9 9 27.5 27.5 22.5 22.5 合计40 100.0 2.3 频数分布表如下: 某百货公司日商品销售额分组表 按销售额分组(万元)频数(天)频率(%) 25~30 30~35 35~40 40~45 45~50 4 6 15 9 6 10.0 15.0 37.5 22.5 15.0 合计40 100.0 直方图(略)。 2.4 (1)排序略。 (2)频数分布表如下: 100只灯泡使用寿命非频数分布 按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2 660~670 5 5

670~680 6 6 680~690 14 14 690~700 26 26 700~710 18 18 710~720 13 13 720~730 10 10 730~740 3 3 740~750 3 3 合计100 100 直方图(略)。 2.5 (1)属于数值型数据。 (2)分组结果如下: 分组天数(天) -25~-20 6 -20~-15 8 -15~-10 10 -10~-5 13 -5~0 12 0~5 4 5~10 7 合计60 (3)直方图(略)。 2.6 (1)直方图(略)。 (2)自学考试人员年龄的分布为右偏。 2.7 (1 (2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。 2.8 箱线图如下:(特征请读者自己分析)

袁卫《统计学》配套题库【课后习题】(统计指数)【圣才出品】

第9章统计指数 思考题 1.统计指数与数学上的指数函数有何不同?广义指数与狭义指数有何差异? 答:与数学上的“指数函数”不同,统计学中的指数是一种对比性的分析指标,可以反映不同时间(时期、时点)或不同空间(国家、地区、部门、企业等)现象水平的数量对比关系,以及现象的实际水平与计划(规划或目标)水平的数量对比关系。在经济分析的各个领域,指数工具都获得了广泛应用,因此,统计指数常常也被称为“经济指数”。 指数有广义和狭义之分。广义地讲,任何两个数值对比形成的相对数都可以称为指数;狭义地讲,指数是用于测定多个项目在不同场合下综合变动的一种相对数。从指数理论和方法上看,指数所研究的主要是狭义的指数。 2.与一般相对数比较,总指数所研究的现象总体有何特点? 答:一般相对数是考察总体中个别现象或个别项目的数量对比关系的指数;总指数是考察整个总体现象的数量对比关系的指数。它与一般相对数的区别不仅在于考察范围不同,还在于考察方法不同。总指数不能简单地沿用一般相对数的计算分析方法,也不一定能够具备一般相对数的某些直观分析性质。 3.有人认为,不同商品的销售量是不同度量的现象,因为它们的计量单位可以不同;而不同商品的价格则是同度量的现象,因为它们的计量单位相同,都是货币单位。这种看法是否正确?为什么?

答:这种看法是不完全正确的。 在统计学中,一般把相乘以后使得不能直接相加的指标过渡到可以直接相加的指标的那个因素,叫做同度量因素。同度量因素作为对比指标的媒介转化因素必须是一个水平相对固定的因素(即在同一综合指数的分子和分母中具有相同的水平),否则,它就不是同度量因素,而成为另一个对比指标了。不同商品的销售量是不同度量的现象,不仅因为它们的计量单位可以不同,而且直接加总的结果也没有实际经济意义。而不同商品的价格由于直接加总的结果没有实际意义,所以它也是不同度量的现象。 4.总指数有哪两种基本编制方式?它们各自有何特点? 答:总指数的编制有综合指数的编制和平均指数的编制两种方式。 综合指数是由两个总量指标对比形成的指数,凡是一个总量指标可以分解为两个或者两个以上的因素指标时,将其中一个或一个以上的因素固定下,仅观察其中一个因素指标的变动程度,这样编制出来的总指数称为综合指数。被固定的因素指标称为同度量因素。被研究的因素指标称为指数化指标。综合指数的特点是“先综合,后对比” 平均指数是从个体指数出发来编制总指数,也就是先算出各种产品或商品的数量指标或质量指标的个体指标,然后进行加权平均计算。是编制总指数的一种重要形式。包括加权算术平均数指数和加权调和平均数指数。平均指数的特点是“先对比,后综合” 5.有人认为,在编制价格指数时,采用帕氏公式计算得到的结果“现实经济意义”较强,因而不能采用拉氏公式。对此,你有何看法? 答:这种观点是不正确的。 因为帕氏价格指数的分子与分母之差,即∑p1q1-∑p0q1=∑(p1-p0)q1能够表明计

统计学名词解释汇总情况 袁卫版

统计学名词解释 统计学:是收集、处理、分析、解释数据并从数据中得出结论的科学。 统计学方法:描述统计和推断统计;理论统计和应用统计。 统计数据的来源:第一手数据(直接数据);第二手数据(间接数据)。 基本概念: 总体(人们研究的所有基本单位总和) 变量(总体中个体单位所具有的特征) 样本(总体的一部分) 统计数据类型: 按采取计量尺度,分类数据(定性)、顺序数据(定性)、数值型数据(定量);按统计数据收集方法,观测数据、实验数据; 按被描述对象与时间关系,截面数据、时间序列数据(动态数据) 变量分类: 分类变量,顺序变量,数值型变量; 随机变量(某次试验结果的数值性描述),非随机变量; 经验变量,理论变量。 离散型变量和连续型变量 离散型变量,只能取有限个数值; 连续型变量,取一个或多个区间中任何值; 均值:亦数学期望,是随机变量所有可能取值的一个加权平均 参数估计:用样本统计量去估计总体的参数 估计量:用来估计总体参数的统计量的名称 点估计:用样本估计量的值作为总体参数的估计值 区间估计:在点估计的基础上,给出总体参数估计的一个围 置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间; 置信系数:置信区间中包含总体参数真值的次数所占的比率 评价估计量的标准:无偏性、有效性、一致性; 假设:对总体参数的具体数值所作的述;

假设检验:先对总体参数提出某种假设,然后利用样本信息判断假设假设是否成立的过程。 方差分析:检验多个总体均值是否相等的统计方法 数据的预处理包括哪些容? 数据审核(完整性和准确性;适用性和实效性),数据筛选和数据排序。 直方图和条形图有什么区别? ①条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积 表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距, ②直方图各矩形连续排列,条形图分开排列, ③条形图主要展示分类数据,直方图主要展示数值型数据。 ④茎叶图和直方图相比有什么优点? 茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。一组数据的分布特征可以从哪几方面进行测度: 一是分布的集中趋势,反映数据向其中心靠拢或聚集的程度; 二是分布的离散程度,反映各数据远离其中心值的趋势; 三是分布的形状,反映数据分布偏斜程度和峰度。 简述众数、中位数、平均数的特点和应用场合。 众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。 均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。 为什么要计算离散系数。

统计学第三版课后答案

统计学第三版答案 第一章 1.什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。 2.简要说明统计数据的来源 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品 (2)变量:口味(如可用10分制表示) (3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。 (4)从匹配样本的观察值中推断两品牌口味的相对好坏。 第二章、统计数据的描述 思考题 1描述次数分配表的编制过程 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2.解释洛伦兹曲线及其用途 答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。 3. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 4 怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分, 具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统

袁卫《统计学》(第3版)课后习题-数据与统计学(圣才出品)

第二部分课后习题 第1章数据与统计学 1.什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。 统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。离开了统计数据,统计方法乃至统计学就失去了其存在的意义。 2.试举出日常生活或工作中统计数据及其规律性的例子。 答:(1)对人类性别比例的调查,新生婴儿男女性别比为105:100,如果没有人为的干扰,其规律是婴幼儿时男性略多于女性,中青年时男女人数大致相同,老年时女性又略多于男性。 (2)施肥量与粮食产量之间的数量关系的调查研究,其规律性为某种粮食作物的产量会随某种施肥量的增加而增加。当开始增加施肥量时,产量增加较快。以后增加同样的施肥量,粮食产量的增加量逐渐减少。当施肥量增加到一定数值量,产量不再增加。这时如果再增加肥料,产量反而会减少。 (3)商品广告费用与销售额的关系的调查,其规律性为,随着广告费用的增加,商品的知名度和销售额会相应增加。

3.简要说明统计数据的来源。 答:统计数据的来源大致分为两种,其中来源于直接组织的调查、观察和科学试验的数据,称为第一手数据或直接的数据;来源于已有的数据,称为第二手数据或间接的数据。 4.获取直接统计数据的渠道主要有哪些? 答:(1)对于社会经济管理和决策而言,主要是通过统计调查的方式获取数据,如客户满意度调查、电视收视率调查、家庭收支情况调查、居民闲暇时间利用调查等。 (2)在自然科学和工程的研究领域,通常是通过科学实验的方法获得研究的统计数据。 5.简要说明抽样误差和非抽样误差。 答:(1)抽样误差是利用样本推断总体时产生的误差;抽样误差对任何一个随机样本来讲都是不可避免的。但它又是可以计量的,并且是可以控制的。在坚持随机原则的条件下,一般来讲,样本量越大,抽样误差就越小。 (2)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。非抽样误差在普查、抽样调查中都可能发生。显然,从理论上看,这类误差是可以避免的。 6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536kg。要求:

相关文档
最新文档