统计书后习题答案讲解
统计学课后习题参考答案

第一章复习思考题与练习题:一、思考题1.统计的基本任务是什么?2.统计研究的基本方法有哪些?3.如何理解统计总体的基本特征。
4.试述统计总体和总体单位的关系。
5.标志与指标有何区别何联系。
二、判断题1、社会经济统计的研究对象是社会经济现象总体的各个方面。
()2、在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。
()3、总体单位是标志的承担者,标志是依附于单位的。
()4、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
()5、全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的()。
三、单项选择题1、社会经济统计的研究对象是()。
A、抽象的数量关系B、社会经济现象的规律性C、社会经济现象的数量特征和数量关系D、社会经济统计认识过程的规律和方法2、某城市工业企业未安装设备普查,总体单位是()。
A、工业企业全部未安装设备B、工业企业每一台未安装设备C、每个工业企业的未安装设备D、每一个工业3、标志是说明总体单位特征的名称,标志有数量标志和品质标志,因此()。
A、标志值有两大类:品质标志值和数量标志值B、品质标志才有标志值C、数量标志才有标志值D、品质标志和数量标志都具有标志值4、统计规律性主要是通过运用下述方法经整理、分析后得出的结论()。
A、统计分组法B、大量观察法C、综合指标法D、统计推断法5、指标是说明总体特征的,标志是说明总体单位特征的,所以()。
A、标志和指标之间的关系是固定不变的B、标志和指标之间的关系是可以变化的C、标志和指标都是可以用数值表示的D、只有指标才可以用数值表示答案:二、 1.× 2.× 3.√ 4.× 5.×三、 1.C 2.B 3.C 4.B 5.B第三章一、复习思考题1.什么是平均指标?平均指标可以分为哪些种类?2.为什么说平均数反映了总体分布的集中趋势?3.为什么说简单算术平均数是加权算术平均数的特例?4.算术平均数的数学性质有哪些?5.众数和中位数分别有哪些特点?6.什么是标志变动度?标志变动度的作用是什么?7.标志变动度可分为哪些指标?它们分别是如何运用的?8.平均数与标志变动度为什么要结合运用?二、练习题(教材第四章P108课后习题答案)1.某村对该村居民月家庭收入进行调查,获取的资料如下:按月收入分组(元)村民户数(户)500~600 600~700 700~800 800~900 900以上20 30 35 25 10合计120 要求:试用次数权数计算该村居民平均月收入水平。
统计学第五版课后习题答案(完整版)

统计学(第五版)课后习题答案(完整版)第一章思考题1.1什么是统计学统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。
1.2解释描述统计和推断统计描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。
推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。
1.3统计学的类型和不同类型的特点统计数据;按所采用的计量尺度不同分;(定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述;(定性数据)顺序数据:只能归于某一有序类别的非数字型数据。
它也是有类别的,但这些类别是有序的。
(定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。
统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。
实验数据:在实验中控制实验对象而收集到的数据。
统计数据;按被描述的现象与实践的关系分;截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。
时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。
1.4解释分类数据,顺序数据和数值型数据答案同1.31.5举例说明总体,样本,参数,统计量,变量这几个概念对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。
1.6变量的分类变量可以分为分类变量,顺序变量,数值型变量。
变量也可以分为随机变量和非随机变量。
经验变量和理论变量。
1.7举例说明离散型变量和连续性变量离散型变量,只能取有限个值,取值以整数位断开,比如“企业数”连续型变量,取之连续不断,不能一一列举,比如“温度”。
统计学经典完全版课后习题及参考答案全

③ 学生身高
④ 学生成绩
② 说明总体单位特征的名称 ④ 不能用数值表示
③ 统计指标
④ ②和③
③ 工资总额
④ 产品数
/search?word=ourhome888
13、属于数量指标的是( ① 粮食总产量 ③ 人均粮食生产量 14、属于质量指标的是( ① 货物周转量 ③ 年末人口数 15、质量指标( )。 ① 不能用数值来反映 ③ 必需用数值来反映
3、反映现象之间数量对比关系的统计指标叫做( 4、统计研究对象的特点可以概括为( 5、统计的认识过程可以看成是从( 6、统计总体的基本特征是( )、( )性、( )认识到( )和(
四、思考题
1、“统计”一词有哪几种涵义?它们之间是怎样的关系? 2、怎样理解统计研究对象的数量方面? 3、正确理解统计指标和标志的关系? 4、什么是数量指标和质量指标?举例说明。 5、统计研究中使用的统计方法主要有哪几种?
)。
18、若对我国居民家庭收支情况进行调查,合适的调查方式为( ① 普查 ② 重点调查 ③ 典型调查
19 、我国定期取得有关国民经济和社会发展情况的统计资料,目前采用的基本调查组织形式是( ① 普查 ② 统计报表 ③ 典型调查 ④ 抽样调查 20 、2000 年我国进行的第五次全国人口普查是( )。 ① 重点调查 ② 典型调查 ③ 一次性调查
② 包含单位较多的单位 ④ 单位不加限制的总体 )。 ② 无限总体 ④ 属性总体 )来决定。 ② 事物的内在联系 ④ 统计研究的目的 )。
8、以下岗职工为总体,观察下岗职工的性别构成,此时的标志是( ① 男性职工人数 ② 女性职工人数 ③ 下岗职工的性别 ④ 性别构成 9、下面属于品质标志的是( )。 ① 学生年龄 ② 学生性别 10、标志是( )。 ① 说明总体特征的名称 ③ 都能用数值表示 11、统计学上变量是指( )。 ① 品质标志 ② 数量标志 12、下面属于连续变量的是( )。 ① 工厂数 ② 职工人数
统计学课后习题答案_(第四版)4.5.7.8章

《统计学》第四版 第四章练习题答案4.1 (1)众数:M 0=10; 中位数:中位数位置=n+1/2=5.5,M e =10;平均数:6.91096===∑nxx i(2)Q L 位置=n/4=2.5, Q L =4+7/2=5.5;Q U 位置=3n/4=7.5,Q U =12 (3)2.494.1561)(2==-=∑-n i s x x (4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
4.2 (1)从表中数据可以看出,年龄出现频数最多的是19和23,故有个众数,即M 0=19和M 0=23。
将原始数据排序后,计算中位数的位置为:中位数位置= n+1/2=13,第13个位置上的数值为23,所以中位数为M e =23(2)Q L 位置=n/4=6.25, Q L ==19;Q U 位置=3n/4=18.75,Q U =26.5(3)平均数==∑nx x i600/25=24,标准差65.612510621)(2=-=-=∑-n i s x x(4)偏态系数SK=1.08,峰态系数K=0.77(5)分析:从众数、中位数和平均数来看,网民年龄在23-24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以,偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
4.3 (1(2)==∑nx x i63/9=7,714.0808.41)(2==-=∑-n i s x x (3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:v 1=1.97/7.2=0.274;v 2=0.714/7=0.102.由于v 1>v 2,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
4.4 (1)==∑nx x i8223/30=274.1中位数位置=n+1/2=15.5,M e =272+273/2=272.5(2)Q L 位置=n/4=7.5, Q L ==(258+261)/2=259.5;Q U 位置=3n/4=22.5,Q U =(284+291)/2=287.5(3) 17.211307.130021)(2=-=-=∑-n i s x x4.5 (1)甲企业的平均成本=总成本/总产量=41.193406600301500203000152100150030002100==++++乙企业的平均成本=总成本/总产量=29.183426255301500201500153255150015003255==++++原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
统计学课后习题及答案

统计学课后习题及答案统计学课后习题及答案统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。
作为学习统计学的学生,课后习题是巩固知识、提高技能的重要途径。
本文将提供一些统计学课后习题及其答案,希望对学习者有所帮助。
1. 描述性统计习题:给定以下一组数据:10, 15, 12, 18, 20, 22, 16, 10, 14, 19。
请计算该组数据的均值、中位数和众数,并解释它们的含义。
答案:均值:计算方法是将所有数据相加,然后除以数据的个数。
对于给定的数据,均值为(10+15+12+18+20+22+16+10+14+19)/10 = 16.6。
中位数:将数据按照从小到大的顺序排列,找出中间的数。
对于给定的数据,中位数为16。
众数:出现频率最高的数。
对于给定的数据,众数为10。
这些统计量可以帮助我们了解数据的集中趋势。
均值是所有数据的平均值,中位数是数据的中间值,众数是出现频率最高的值。
在这个例子中,均值告诉我们这组数据的平均水平是16.6,中位数告诉我们大约一半的数据小于16,一半的数据大于16,众数告诉我们10是这组数据中出现次数最多的数。
2. 概率习题:一个骰子有6个面,每个面上的数字分别是1、2、3、4、5、6。
如果投掷一次骰子,求得到奇数的概率。
答案:奇数的个数为3个,即1、3、5。
骰子的总个数为6个。
所以得到奇数的概率为3/6 = 1/2。
概率是事件发生的可能性。
在这个例子中,奇数的个数是3个,总个数是6个,所以得到奇数的概率是3/6,即1/2。
3. 抽样与估计习题:某市有1000名居民,你希望了解他们对某项政策的态度。
你打算进行一次调查,抽取100名居民进行问卷调查。
这个调查结果能否代表整个市民的态度?为什么?答案:这个调查结果不能代表整个市民的态度。
原因是抽样的方式可能引入抽样误差。
如果抽取的100名居民在某些特征上不具有代表性,比如年龄、性别、职业等,那么调查结果可能会偏离整个市民的态度。
统计学课后习题答案完整版

统计学课后习题答案 HEN system office room 【HEN16H-HENS2AHENS8Q8-HENH1688】第四章 统计描述【】某企业生产铝合金钢,计划年产量40万吨,实际年产量45万吨;计划降低成本5%,实际降低成本8%;计划劳动生产率提高8%,实际提高10%。
试分别计算产量、成本、劳动生产率的计划完成程度。
【解】产量的计划完成程度=%5.112100%4045100%=⨯=⨯计划产量实际产量即产量超额完成%。
成本的计划完成程=84%.96100%5%-18%-1100%-1-1≈⨯=⨯计划降低百分比实际降低百分比即成本超额完成%。
劳动生产率计划完=85%.101100%8%110%1100%11≈⨯++=⨯++计划提高百分比实际提高百分比即劳动生产率超额完成%。
【】某煤矿可采储量为200亿吨,计划在1991~1995年五年中开采全部储量的%,试计算该煤矿原煤开采量五年计划完成程度及提前完成任务的时间。
【解】本题采用累计法:(1)该煤矿原煤开采量五年计划完成=100%⨯数计划期间计划规定累计数计划期间实际完成累计 =75%.12610210253574=⨯⨯ 即:该煤矿原煤开采量的五年计划超额完成%。
(2)将1991年的实际开采量一直加到1995年上半年的实际开采量,结果为2000万吨,此时恰好等于五年的计划开采量,所以可知,提前半年完成计划。
【】我国1991年和1994年工业总产值资料如下表:要求:(1)计算我国1991年和1994年轻工业总产值占工业总产值的比重,填入表中; (2)1991年、1994年轻工业与重工业之间是什么比例(用系数表示)? (3)假如工业总产值1994年计划比1991年增长45%,实际比计划多增长百分之几?1991年轻工业与重工业之间的比例=96.01.144479.13800≈;1994年轻工业与重工业之间的比例=73.04.296826.21670≈(3)%37.251%)451(2824851353≈-+即,94年实际比计划增长%。
医学统计学课后习题答案解析

医学统计学第一章 绪论答案名词解释:(1) 同质与变异:同质指被研究指标的影响因素相同,变异指在同质的基础上各观察单位(或个体)之间的差异。
(2) 总体和样本:总体是根据研究目的确定的同质观察单位的全体。
样本是从总体中随机抽取的部分观察单位。
(3) 参数和统计量:根据总体个体值统计算出来的描述总体的特征量,称为总体参数,根据样本个体值统计计算出来的描述样本的特征量称为样本统计量。
(4) 抽样误差:由抽样造成的样本统计量和总体参数的差别称为抽样误差。
(5) 概率:是描述随机事件发生的可能性大小的数值,用p 表示(6) 计量资料:由一群个体的变量值构成的资料称为计量资料。
(7) 计数资料:由一群个体按定性因数或类别清点每类有多少个个体,称为计数资料。
(8) 等级资料:由一群个体按等级因数的级别清点每类有多少个体,称为等级资料。
是非题:1. ×2. ×3. ×4. ×5. √6. √7. ×单选题:1. C2. E3. D4. C5. D6. B第二章 计量资料统计描述及正态分布答案名词解释:1. 平均数 是描述数据分布集中趋势(中心位置)和平均水平的指标2. 标准差 是描述数据分布离散程度(或变量变化的变异程度)的指标3. 标准正态分布 以μ服从均数为0、标准差为1的正态分布,这种正态分布称为标准状态分布。
4. 参考值范围 参考值范围也称正常值范围,医学上常把把绝大多数的某指标范围称为指标的正常值范围。
填空题:1. 计量,计数,等级2. 设计,收集资料,分析资料,整理资料。
3. σμχ-=u (变量变换)标准正态分布、0、1 4. σ± σ96.1± σ58.2± 68.27% 95% 99%5. 47.5%6.均数、标准差7. 全距、方差、标准差、变异系数8. σμ96.1± σμ58.2±9. 全距 R10. 检验水准、显著性水准、0.05、 0.01 (0.1)11. 80% 90% 95% 99% 95%12. 95% 99%13. 集中趋势、离散趋势14. 中位数15. 同质基础,合理分组16. 均数,均数,μ,σ,规律性17. 标准差18. 单位不同,均数相差较大是非题:1. ×2. √3. ×4. ×5. ×6. √7. √8. √9. √ 10. √11. √ 12. √ 13. × 14. √ 15. √ 16. × 17. × 18. × 19. √ 20. √21. √单选题:1. B2. D3. C4. A5. C6. D7. E8. A9. C 10. D11. B 12. C 13. C 14. C 15. A 16. C 17. E 18. C 19. D 20. C21. B 22. B 23. E 24. C 25. A 26. C 27. B 28. D 29. D 30. D31. A 32. E 33. D 34. A 35. D 36. D 37. C 38. E 39. D 40. B41. C 42. B 43. D 44. C 45. B问答题:1.均数﹑几何均数和中位数的适用范围有何异同?答:相同点,均表示计量资料集中趋势的指标。
统计学基础课后全部详细答案与讲解

统计学第一至四章答案第一章一、思考题1. 统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。
统计方法可分为描述统计和推断统计。
2.统计数据的分类:按计量尺度:分类数据、顺序数据和数值型数据按获取数据的方式:观测数据和实验数据按数据与时间的关系:截面数据和时间序列数据特点:分类数据各类别之间是平等的并列关系,各类别之间的顺序可以任意改变;顺序数据的分类是有序的;数值型数据说明的是现象的数量特征,是定量数据;观测数据是通过调查或观测而收集到的数据,是在没有对事物进行人为控制的条件下得到的;实验数据是在实验中控制实验对象而收集到的数据;截面数据也称静态数据,描述的是现象在某一时刻的变化情况;时间序列数据也称动态数据,描述的是现象随时间的变化情况。
3.对武昌分校的全体教师进行工资调查,那么全体教师就是总体,从中抽取五十名教师进行调查,这五十名教师的集合就是样本,全体教师工资的总体平均值和总体标准差等描述特征的数值就是参数,五十名教师工资的样本平均值和样本标准差等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说教师的工资。
4.有限总体:指总体的范围能够明确确定,而且元素的数目是有限可数的。
例如:武昌分校10 级金融专业学生无限总体:指总体所包含的元素是无限的、不可数的。
例如:整个宇宙的星球5.变量可分为分类变量、顺序变量、数值型变量。
同时数值型变量可分为离散型变量和连续型变量。
6.离散型变量只能取有限个值,而且其取值都以整位数断开,可以一一列举,例如“产品数量” 、“企业数”。
连续型变量的取值指连续不断的,不能一一列举。
例如“温度” 、“年龄”。
二、练习题1.(1)数值型变量(2)分类变量(3)数值型变量(4)顺序变量(5)分类变量2.(1)这一研究的总体是 IT 从业者,样本是从 IT 从业者中抽取的1000 人,样本量是 1000(2)“月收入”是数值型变量(3)“消费支付方式”是分类变量3.(1)这一研究的总体是所有的网上购物者(2)“消费者在网上购物的原因”是分类变量第二章一、思考题1:答: 1: 普查的特点:①:普查通常是一次性的或周期性的;②:普查一般需要规定统一的调查时间;③:普查的数据一般比较准确; 4:普查的使用范围比较狭窄,只能调查一些最基本的、特定的现象。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章绪论思考题1. 什么是统计学?请简要说明一下它的发展过程。
统计学是关于数据搜集、整理、归纳、分析的方法论科学。
统计学的发展主要经历了三个阶段:(1) 17世纪中叶至18世纪,统计学的产生和形成阶段;(2) 18世纪末至20世纪中叶,统计推断方法和理论体系确立的阶段;(3) 20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的阶段。
2. 统计学、统计数据,以及统计活动之间有什么关系?统计活动直接影响统计数据的数量和质量;统计学是统计实践活动的理论概括,同时,它又用理论和方法研究分析统计实践活动,统计学和统计活动是理论与实践的关系。
3. 统计学的研究方法有哪些,它们有怎样的关系?并举例说明。
主要方法有两个:(1) 描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2) 推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。
由于现实问题中,要获得总体数据存在很大的难度,能够获得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它已成为统计学的核心内容。
当然,描述统计的重要性不可忽略,通过它得到可靠的统计数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得出符合实际情况的结论。
4. 简要说明总体、样本、变量的概念。
总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素;样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素;变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。
5. 简述SPSS统计软件的特点和应用领域。
⑴特点:第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置、点击功能按钮来完成,不需要用户记忆大量的操作命令。
菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。
第二,具有完善的数据转换接口,可以方便地和Windows其他应用程序进行数据共享和交换。
可以读取Excel、FoxPro、Lotus等电子表格和数据库软件产生的数据文件,可以读取ASCII数据文件。
第三,提供强大的程序编辑能力和二次开发能力,方便高级用户完成更为复杂的统计分析任务的需要,具有丰富的内部函数和统计功能。
第四,附带丰富的数据资料实例和完善的使用指南,为用户学习掌握软件的使用方法提供更多的方便。
软件启动后,用户可直接上网访问SPSS公司主页获得更多的帮助和信息。
(2)应用领域:社会科学、自然科学、经济管理、商业金融、医疗卫生、体育运动等。
6. SPSS软件的数据编辑器包括哪些内容?(1) 标题栏,显示当前工作文件名称。
(2) 主菜单栏,排列SPSS的所有菜单命令。
(3) 工具栏,排列系统默认的标准工具图标按钮,此栏图标按钮可以通过单击View菜单的Toolbars命令选择隐藏、显示或更改。
(4) 状态栏,状态栏位于SPSS窗口底部,它反映了工作状态。
当用户将光标置于不同的区域时或者进行不同的操作时将显示不同的内容。
(5) 数据编辑栏,用户通过键盘输入的数据首先显示在这里。
(6) 数据显示区域。
它是一个二维的表格,编辑确认的数据都将在这里显示,其中每一个矩形格为单元格(Cell),其中边框加黑的单元格称为选定单元格。
数据显示区域的左边缘排列观测量序号,上边缘排列要定义的各变量名。
7. 调查表明,顾客每周花在某超市蛋糕的平均费用是30元,他们选择经常购买蛋糕的主要原因是该蛋糕味道很好。
要求:(1) 总体是什么?(2) 该项研究所使用的方法是描述统计方法还是推断统计方法?(1) 总体是所有的购买蛋糕的顾客;(2) 推断统计方法。
第二章数据整理和描述思考题1. 获取统计数据有哪两种途径?一种是直接向调查对象搜集反映调查单位的统计数据,一般称为原始数据或第一手数据;另一种是搜集已经加工、整理过的、说明总体现象的数据,一般称为次级数据或第二手数据。
2. 统计数据的搜集有哪几种方法?直接观察法、访问法、报告法、问卷法。
3. 对统计数据进行搜集时,有哪几种组织方式?普查、抽样调查、重点调查、典型调查。
4. 什么是数据分组?数据分组的方式有哪几种?(1) 统计数据分组是根据统计研究目的,按某一标志将数据分别列入不同的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。
(2) 统计数据分组可以按品质标志分组和按数量标志分组。
(一)按品质标志分组就是按照事物的性质和属性特征进行分组。
一般来言,按品质标志分组的操作比较容易,分组也相对稳定。
如人口按性别分组、职工按文化程度分组等;(二)按数量标志分组,就是按照事物的数量特征进行分组。
例如,企业按职工人数、产值、产量等标志分组,人口按年龄分组等。
5. 简述组距、组限、组数与组中值的含义以及它们的计算方法。
(1)组距是指各组中最大变量值与最小变量值之差,用i表示。
计算方法为:i=R/n, 其中,n表示组数,R表示变量最大值与最小值之差(即全距);(2) 组限是指限定各组组距的数值。
各组的较大值称上限,较小值称下限;(3) 组数是指数据被分成的组个数。
计算方法为:n =1 3.322 lg N式中:n表示组数;N表示变量值个数;(4)组中值是上限到下限之间的中点数值,其计算公式为:组中值=(上限+下限)126. 向上积累和向下积累的数据有什么区别?累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。
(1)向上累计频数(或频率),通常是指由变量值小的组向变量值大的组依次累计;(2)向下累计频数(或频率),通常是指由变量值大的组向变量值小的组依次累计。
7. 什么是频数分布?试描述频数分布表的编制过程。
(1)分布数列是指在统计分组的基础上,将总体的所有单位按一定标志分组整理,并按一定顺序排列,形成总体单位在各组的分布;(2)一、确定变量数列的形式。
根据变量的类型和变量值的多少及现象本身的特点确定是编制单项数列还是编制组距数列。
二、组距式变量数列编制方法:计算全距、确定组数、确定组距、确定组限、计算组中值、计算累计频数和累计频率。
8. 对统计数据进行描述时,有哪几种统计图表表达方式?有统计表和统计图,其中统计图包括:直方图、折线图、曲线图。
9. 直方图和折线图有什么区别和关系?折线图可以在直方图的基础上,将直方图的每个长方形的顶端中点用折线连点而成。
如果不绘直方图,也可以用组中值与频数求出坐标点,连接而成。
它们与横轴围成的区域面积相等。
10. 请举出自己实际生活中的一组数据,对它进行分组,然后绘制直方图、折线图以及箱线图,分析该组数据的结构特征。
略练习题1.某地区7月份的气温数据(单位:摄氏度)如下:2831 32 29 31 33 30 32 34 2932 30 3838 37 39 34 3636 33 3430 37 36 32 38 3530 34 3535(1)对以上数据进行适当的分组;⑵绘制直方图,说明该城市气温分布的特点。
解: (1)频数分布如下:[28,30)3;[30,32)6;[32,34)6[34,36) 7;[36,38) 5;[38,40)4;(2)直方图略。
从直方图可以看出,该地区7月份气温集中在34~36摄氏度的天数最多,其次多的时间集中在30~32摄氏度或32~34摄氏度。
2.某人的家位于城市的A地,工作单位位于城市的B地,为了确定A、B两地的车程,他记录了60天(来回共乘车120次)内往返于A、B两地所花的时间(单位:分钟),所得数据如下:(2) 以组距10进行等距分组,编制频数分布表,并绘制直方图。
解:⑴略(2)频数分布表如下:[80,90) 10,[90,100) 37,[100,110) 33,[110,120) 25,[120,130)15; 直方图略。
(2) 计算出累积频数和累积频率。
(3) 绘制直方图和折线图。
解:(1)、(2)⑶略。
4.为评价某餐馆服务质量,随机调查了120个顾客对它的评价。
评价服务质量的等级分为(2) 绘制条形图,找出对该餐馆评价等级的分布。
解:(1)频率分布表如下:(1) 对该校四年级学生的成绩绘制直方图;(2) 根据直方图分析四年级学生的成绩分布特点。
解:(1)略;(2) 左偏分布。
6.为了确定灯泡的使用寿命(单位:h),在一批灯泡中随机抽取100只进行测试,所得结果如下:(2) 以10为组距进行等距分组,构建频率分布表;(3) 根据分组数据绘制茎叶图和箱线图,说明数据分布的特点。
解: (1)略;(2)⑶略。
第三章 数据特征的度量思考题1. 数据分布的特征可以从哪些方面进行度量和描述?(1) 数据集中程度度量的常用方法有均值(算术平均数) 、调和平均数、几何平均数、众数、中位数。
(2) 数据离散程度的测度方法,常用的有极差、内距、标准差及离散系数。
2. 简述中位数、四分位数、十分位数的概念,并举例说明。
中位数是将顺序排列的统计数据从中间分成相等的两部分; 四分位数就是将排序后的数据4等分的三个数值,每部分包含25%的数据,其中中间的四分位数就是中位数,其余两项分别为下四分位数( Q i )和上四分位数(Q 3);十分位数和百分位数分别是将排序后的数据10等分和100等分的数值。
3. 简述众数、中位数和均值的特点和关系。
(1)关系:当数据呈对称分布时,均值、中位数、众数必定相等,即有 当数据呈左偏分布时,均值小于中位数且小于众数,即有 当数据呈右偏分布时,均值大于中位数且大于众数,即有 (2) 特点:均值是根据所有数据计算的一般水平代表值,数据信息的提取足够充分,特别是当用样本信息估计总体特征时,均值就更显示其良好的特征。
因而在统计数据分析中均值起着很重要的作用。
众数、中位数虽然数据信息利用不够充分, 但当数据有极端值出现时,中位数的优势就显现了。
4. 简述内距、极差、标准差的概念,并举例说明。
(1) 内距:又称为四分位数差,是指上四分位数和下四分位数之差,通常用 Q d 表示;(2) 极差:也称全距,它是一组数据的最大值与最小值之差;在组距式数列中,极差可以是最高组的上限与最低组下限之差; (3) 标准差:也称均方差,是各数据和均值离差平方平均数的平方根。
5. 什么是离散系数?为什么要计算离散系数?x :: Me :: Mo ; X Me Mo ;(1)常用的离散系数主要有标准差系数, 也称均方差系数,它是数据的标准差与其相应的均值之比;(2)原因:总体和样本的离散程度除了受变量值之间的离散程度影响外, 还受变量值本身水平高低的影响,因此,在比较不同总体和样本的离散程度时,应消除由于变量值 水平不同或计量单位不同带来的影响。