《统计学》课后习题答案

合集下载

统计学第五版课后习题答案(完整版)

统计学第五版课后习题答案(完整版)

统计学(第五版)课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。

1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经验变量和理论变量。

1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。

统计学课后题答案_吴风庆_王艳明

统计学课后题答案_吴风庆_王艳明

《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。

统计学课后习题答案(高等教育出版社)

统计学课后习题答案(高等教育出版社)

判断统计着眼于事物的整体,不考虑个别事物的数量特征。

(×)一个人口总体的特征,可以用人口总数、年龄、性别、民族等概念来反应。

(×)凡是以绝对数形式出现均为数量指标,以相对数和平均数形式出现是质量指标。

(√)变异是统计的前提条件,没有变异就用不着统计了。

(√)男性是品质标志,(×)统计设计就是要从纵横两个方面对整个统计工作作出考虑和安排。

(√)从理论、认识顺序上讲,统计设计是完整的统计工作开始阶段。

(√)对统计工作各个环节的考虑和安排是指统计工作实际进行的各个阶段。

(×)一个统计指标体系之间若干指标必须是在口径时间空间方法等方面相互联系。

(√)统计指标体系按其说明问题不同可分为专项研究用、基层单位、经济与社会发展的(√)统计调查的任务是搜集总体的原始资料。

(×)统计调查方案的首要问题是确定调查任务与目的,其核心是调查表。

(√)在统计调查方案中,时间指调查资料所属的时间,期限指调查工作的期限。

(√)调查对象是调查项目的承担者。

(×)重点调查所选择的重点指这些单位的被研究的标志总量占总数的绝大部分。

(×)抽样调查是非全面调查中最有科学根据的方法,唯一它适用于完成任何调查任务。

(×)标志变动程度指标与平均数代表性成正比关系。

(×)反应总体各单位标志值的离散程度只能用相对数,不能用绝对数。

(×)标志变异指标中,平均差最好,(×)如果根据组距式分组资料计算全距,则计算公式为:全距=最高组下限-最低组下限(×)标准差是总体中各单位标志值与算术平均数的离差平方的算术平均数的平方根(√)标准差的实质和平均差基本相同,也是各个标志值对其算术平均数的平均距离。

(√)填空题统计设计是统计工作的第一阶段,是根据统计研究目的和研究对象的特点对统计工作的各个方面和各个环节所做的全面安排部署。

统计设计按研究对象包括的范围分为整体设计和专项设计。

统计学第五版课后题答案李金昌

统计学第五版课后题答案李金昌

统计学第五版课后题答案李金昌第1章绪论 1 .试述数据、数据库、数据库系统、数据库管理系统的概念。

答:( l )数据( Data ) :叙述事物的符号记录称作数据。

数据的种类存有数字、文字、图形、图像、声音、正文等。

数据与其语义就是不可分的。

解析在现代计算机系统中数据的概念就是广义的。

早期的计算机系统主要用作科学计算,处置的数据就是整数、实数、浮点数等传统数学中的数据。

现代计算机能够存储和处置的对象十分广为,则表示这些对象的数据也越来越繁杂。

数据与其语义就是不可分的。

500 这个数字可以表示一件物品的价格是 500 元,也可以表示一个学术会议参加的人数有 500 人,还可以表示一袋奶粉重 500 克。

( 2 )数据库( DataBase ,缩写 DB ) :数据库就是长期储存在计算机内的、存有非政府的、可以共享资源的数据子集。

数据库中的数据按一定的数据模型非政府、叙述和储存,具备较小的冗余度、较低的数据独立性和易扩展性,并可向各种用户共享资源。

( 3 )数据库系统( DataBas 。

Sytem ,缩写 DBS ) :数据库系统就是所指在计算机系统中导入数据库后的系统形成,通常由数据库、数据库管理系统(及其开发工具)、应用领域系统、数据库管理员形成。

解析数据库系统和数据库就是两个概念。

数据库系统就是一个人一机系统,数据库就是数据库系统的一个组成部分。

但是在日常工作中人们常常把数据库系统缩写为数据库。

期望读者能从人们讲话或文章的上下文中区分“数据库系统”和“数据库”,不要引发混为一谈。

( 4 )数据库管理系统( DataBase Management sytem ,简称 DBMs ) :数据库管理系统是位于用户与操作系统之间的一层数据管理软件,用于科学地组织和存储数据、高效地获取和维护数据。

DBMS 的主要功能包含数据定义功能、数据压低功能、数据库的运转管理功能、数据库的创建和保护功能。

解析 DBMS 就是一个大型的繁杂的软件系统,就是计算机中的基础软件。

《统计学》课后习题参考答案(刘后平成都理工大学)

《统计学》课后习题参考答案(刘后平成都理工大学)
依下限公式计算确定众数=652.63 元 (3)分布特征是左偏态分布。
9. x= =6309 .52(元) V
即该工业局全员劳动生产率为 6309.52 元。
10. 平均收益率 4 104 .5% 102 .1% 125 .5% 101 .9% 1 8.0787 % 11.计算如下:
表示。质量指标是反映社会经济现象发展相对水平或工作质量的统计指标,用相对数或平均
数表示。两者的关系表现为:它们从不同角度反映总体的综合数量特征。数量指标是计算质
量指标的基础,而质量指标往往是相应的数量指标进行对比的结果。
第二章
一、单项选择题
1.B 2.A 3.C 4.C 5.A 6.A 7.B 8.B 9.C 10.A 11.B
练习题参考答案
第一章
一、单项选择题
1.C 2.D 3.B 4.D 5.B 6.B 7.B 8.A
二、多项选择题
1.ABE 2.ABCDE 3.ACE 4.BCE 5.BCE 6.ACD 7.BDE 8.ACD 9.ABCD
三、判断题
1.× 2.× 3.√ 4.√ 5.× 6.√ 7.√
四、简答题
1.两者的区别主要表现在:①说明对象不同。统计指标说明的是总体的特征,而标志则
16A
第四章
一、单项选择题 1.C 2.B 3.D 4.D 5.D 6.D 7.C 8.B 9.C 10.A 11.C 12.D 13.B 14.B 15.B 16.D 17.D 18.B 19.C 20.C 21.A 22.A 23.C 24.C 25.D 26.C 27.B 28.B 29.C 30.B 31.D 32.A
1 5%
分比 =
100% 101.94%
103%

统计学课后习题答案_(第四版)_贾俊平

统计学课后习题答案_(第四版)_贾俊平

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。

4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。

将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。

由于标准差较大,说明网民年龄之间有较大差异。

从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。

由于峰态系数为正值,所以为尖峰分布。

4.3 (1(2)==∑nxx i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。

第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。

(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。

4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

《统计学》课后练习题答案

《统计学》课后练习题答案
4.用Excel汇总第二季度中三个月份的资料,用()功能。(知识点3.3答案:B)
A.透视表B.合并计算C.单变量求解D.分类汇总
5.小张收集了1957-2007年中国GDP的数据,如果要反映这50年我国生产发展的趋势,用什么图形最为合适?()(知识点3.5答案:D)
A.直方图B.散点图C.饼图D.折线图
37
பைடு நூலகம்33.6
130-140
12
10.9
103
93.6
19
17.3
140-150
5
4.5
108
98.2
7
6.4
150-160
2
1.8
110
100.0
2
1.8
合计
110
100




A.树苗高度低于110厘米的占总数的39.1%B.树苗高度低于110厘米的占总数的84.5%
C.树苗高度高于130厘米的有19棵D.树苗高度高于130厘米的有103棵
第二章数据的收集与整理
2.1数据的来源
2.2统计调查方案设计
2.3调查方法
2.4调查的组织方式:普查、抽样调查、重点调查、典型调查
2.5抽样的组织方式:简单随机抽样、系统抽样、分层抽样、整群抽样
2.6数据的审定:误差
2.7数据的分组
2.8.编制次数分布表:频数(次数)、频率
习题
一、单项选择题
1.小吴为写毕业论文去收集数据资料,()是次级数据。(知识点:2.1答案:C)
A.指标B.标志C.变量D.标志值
8.以一、二、三等品来衡量产品质地的优劣,那么该产品等级是()。(知识点:1.7答案:A)
A.品质标志B.数量标志C.质量指标D.数量指标

统计学课后第一章习题答案

统计学课后第一章习题答案

第1章导论1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度.经估计,森林公园生长着25000颗成年松树,该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。

该研究的总体是()A、250颗成年松树 B、公园中25000颗成年松树C、所有高于60英尺的成年松树D、森林公园中所有年龄的松树2、某森林公园的一项研究试图确定成年松树的高度。

该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。

该研究所感兴趣的变量是()A、森林公园中松树的年龄B、森林公园中松树的数量C、森林公园中松树的高度D、森林公园中数目的种类3、推断统计的主要功能是()A、应用总体的信息描述样本B、描述样本中包含的信息C、描述总体中包含的信息D、应用样本信息描述总体4、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育.这一叙述是()的结果A、定性变量B、试验 C、描述统计 D、推断统计5、一名统计学专业的学生为了完成其统计学作业,在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。

在该生的作业中,他应该将此数据报告来源于()A、试验B、实际观察 C、随机抽样D、已发表的资料6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。

他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。

该研究的目的是为了改善公司餐厅的现状。

这种数据的收集方式可以认为是()A、观察研究B、设计的试验C、随机抽样D、全面调查7、下列不属于描述统计问题的是()A、根据样本信息对总体进行的推断B、感兴趣的总体或样本C、图、表或其他数据汇总工具D、了解数据分布特征8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。

该研究人员感兴趣的总体是()A、该大学的所有学生B、所有的大学生C、该大学所有的一年级新生D、样本中的200名新生9、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章:数据与统计学思考与练习:思考题:1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。

统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。

2.试举出日常生活或工作中统计数据及其规律性的例子。

3.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。

间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。

4.获取直接统计数据的渠道主要有哪些?5.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。

非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。

抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。

6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。

因此,他们开始检查供货商的集装箱,有问题的将其退回。

最近的一个集装箱装的是2 440加仑的油漆罐。

这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。

装满的油漆罐应为4.536 kg。

要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。

答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。

7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。

这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。

假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。

要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。

答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。

第二章、统计数据的描述思考与练习思考题1.描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。

按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。

按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。

统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。

2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。

洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。

3.说明基尼系数的含义和用途基尼系数,或译坚尼系数,是20世纪初意大利经济学家基尼,根据劳伦茨曲线所定义的判断收入分配公平程度的指标。

是比例数值,在0和1之间,是国际上用来综合考察居民内部收入分配差异状况的一个重要分析指标。

国际上常用基尼系数定量测定社会居民收入分配的差异程度。

4.一组数据的分布特征可以从哪几个方面进行测度?答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。

常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。

5.怎样理解均值在统计中的地位?答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。

受极端数值的影响是其使用时存在的问题。

6.对于比率数据的平均,为什么采用几何平均?答:比率数据往往表现出连乘积为总比率的特征,不同于一般数据的和为总量的性质,由此需采用几何平均。

7.简述众数、中位数和均值的特点和应用场合。

答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。

众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。

8.标准差和方差反映数据的什么特征?9.举出均值和标准差应用的例子。

10.为什么要计算离散系数?答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标。

11.描述茎叶图和箱线图的画法,并说明它们的用途。

练习题1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。

服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。

调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。

解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。

(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A 14 14B 21 21C 32 32D 18 18E 15 15合计100 100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题2.1)。

即得到如下的条形图:2.某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。

解:(1)要求对销售收入的数据进行分组,全部数据中,最大的为152,最小的为87,知数据全距为152-87=65;为便于计算和分析,确定将数据分为6组,各组组距为10,组限以整10划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值87可能落在最小组之下,最大值152可能落在最大组之上,将最小组和最大组设计成开口形式;按照“上限不在组内”的原则,用划记法统计各组内数据的个数——企业数,也可以用Excel 进行排序统计(见Excel练习题2.2),将结果填入表内,得到频数分布表如下表中的左两列;将各组企业数除以企业总数40,得到各组频率,填入表中第三列;在向上的数轴中标出频数的分布,由下至上逐组计算企业数的向上累积及频率的向上累积,由上至下逐组计算企业数的向下累积及频率的向下累积。

整理得到频数分布表如下:40(2)按题目要求分组并进行统计,得到分组表如下:某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.03.某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。

解:全部数据中,最大的为49,最小的为25,知数据全距为49-25=24;为便于计算和分析,确定将数据分为5组,各组组距为5,组限以整5的倍数划分;为使数据的分布满足穷尽和互斥的要求,注意到,按上面的分组方式,最小值24已落在最小组之中,最大值49已落在最大组之中,故将各组均设计成闭口形式;按照“上限不在组内”的原则,用划记法或用Excel统计各组内数据的个数——天数,(见Excel练习题2.3)并填入表内,得到频数分布表如下表中的左两列;将各组天数除以总天数40,得到各组频率,填入表中第三列;得到频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~50 46159610.015.037.522.515.0合计40 100.0直方图:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→柱形图→选择子图表类型→完成。

即得到如下的直方图:(见Excel练习题2.3)4.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。

相关文档
最新文档