第3章 累计频数(频率)分布图
统计学原理-统计整理

统计整理的意义
统计调查所搜集的反映个体量的原始资料是分散 的,不是集中的;是零碎的,不是系统的。根据这 些资料。人们难以从总体上分析和认识现象的数量 表现。
至于某些已经加工的综合资料,则往往由于资料在 分组方法、总体范围或指标涵义、口径、计算方法 等方面不同,而不能满足统计分析的要求,也必须 先通过统计整理,才能据以从总体上分析社会经济 现象的数量表现,
一、统计分组的意义和作用
统计分组的作用
⒈区分社会经济现象的类型-类型分组 ⒉研究现象的内部结构-结构分组 ⒊分析现象之间的依存关系-分析分组
某地区2008年底各类工业企业数 按所有制性质分组 企业数(个) 比重(%) 全民所有制企业 集体所有制企业 3204 1286 64.08 25.72
私营企业 中外合资企业 外商独资企业
二、统计分组的要求和方法
统计分组的方法
2、按品质标志和数量标志分组
经调查 ,某地年末货币流通量为 15.3亿元,比上年增加 4.5亿元。
按地区分组 甲县 乙县 丙县 丁县 合计 上期 36000 24000 28000 20000 108000 本期 52000 34000 41000 26000 153000 增减% 44.4 41.7 46.7 30.0 41.7
第三节 变量数列
一、变量数列的概念 分 类
品质标志数列
数量标志数列
连续型变量数列
离散型变量数列 单项数列 组距数列 等距数列 异距数列
按品质标志分组—品质数列,一般是单项式分组
某班学生的性别构成情况 按性别分组 男 女 合计 绝对数人数 30 10 40 比重(%) 75 25 100
某厂第二季度工人平均日产量 工人数 绝对数 比重(%) 10 15 30 40 20 115 8.7 13.0 26.1 34.8 17.4 100
第三章 统计整理

第三章统计整理一、名词解释数据分组次数分布 (频数分布) 单变量分组组距分组组距组限组中值次数(频数)频率向上累积频数(或频率)向下累计频数(或频率)统计表二、填空1.每个组只有一个变量值的分配数列叫________,各组组距不相等的组距列叫________。
2、在组距数列中,说明总体单位数值变化界限的数值称为_____ ,各组上限与下限之间的中点数值称为_________。
3、在变量数列中,各组单位数称_______,各组单位数占总体单位总数的比重称________。
4、数据分组的原则有和____________。
5、对总体进行统计分组关键在于。
三、选择1.统计资料按数量标志分组后,处于每组两端的数值叫 ( )。
A.组距 B.组数 C.组限 D.组中值2.统计表中的主词是指 ( )A.统计表的横行标题 B.统计表的纵栏标题 C.统计表所要说明的总体 D.说明总体的统计指标3.数据整理的步骤一般为()()()()()()。
(排序)A.数据的预处理 B.编制统计数列和统计表 C.选择标志对总体进行分组 D.数据汇总E.计算和汇总 F.统计复查4.下列各项中按数量标志分组的有()()()()()。
A.人口按年龄分组 B.企业产品按合格与不合格分组C.人口按性别分组 D.家庭按月收入分组E.企业按年产值分组 F.人口按文化程度分组5.构成分配数列的两个基本要素是()()()()()。
A.组数的多少 B.各组组距大小 C.统计分组 D.各组标志值的大小E.各组次数大小 F.分配在各组的单位数6.统计表从形式上看,它是由()()()()()构成的。
A.总标题B.纵栏标题C.横行标题 D.主词E.指标数值 F.宾词第四章指标一、名词解释总体单位总数总体标志总量时期指标时点指标实物指标价值指标劳动指标算术平均数权数调和平均数几何平均数中位数众数标准差标准差系数二、简答1、简述时期指标和时点指标的概念、特点。
统计学贾俊平第三章课后答案

一、思考题3.1数据的预处理包括数据审核,数据筛选,数据排序,数据透视表。
3.2分类数据整理:频数分布表(频数,比例,百分比,比率)图示方法:条形图,对比条形图,帕累托图,饼图。
顺序数据的整理:频数分布表(累计频数,累计频率)图示方法:环形图。
3.3数值型数据的分组方法是组距分组,步骤:1.确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,组数一般为5≤K ≤152.确定组距:组距(Class Width)是一个组的上限与下限之差,可根据全部数据的最大值和最小值及所分的组数来确定,即组距=( 最大值 - 最小值)÷ 组数3.统计出各组的频数并整理成频数分布表3.4直方图和条形图区别:1.条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的2.直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或百分比,宽度则表示各组的组距,其高度与宽度均有意义3.直方图的各矩形通常是连续排列,条形图则是分开排列4.条形图主要用于展示分类数据,直方图则主要用于展示数值型数据3.5绘制线图应该注意的问题:一般情况下,纵轴数据下端应从“0”开始,以便于比较。
数据与“0”之间的间距过大时,可以采取折断的符号将纵轴折断3.6饼图和环形图的不同:饼图只能显示一个总体各部分所占的比例,环形图则可以同时绘制多个样本或总体的数据系列,每一个样本或总体的数据系列为一个环。
3.7茎叶图与直方图相比的优点与各自的应用场合:直方图可观察一组数据的分布状况,但没有给出具体的数值;茎叶图既能给出数据的分布状况,又能给出每一个原始数值,保留了原始数据的信息。
直方图适用于大批量数据,茎叶图适用于小批量数据3.8鉴别图表优劣的准则有:3.9制作统计表时应注意的问题:二、练习题3.1为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别为:A.好;B.较好;C.一般;D.较差;E.差。
统计学原理 第三章 数据整理与显示

4.数量(变量)分组
如,企业按产值分组
按数量标志进行的分组。
100万元以下 100 ~ 500 500 ~ 1000 1000万元以上
单项式分组 数量(变量)分组 组距式分组
单项式分组: 在变量分组中, 一个组只有一个变量值。
如,居民家庭按子女数分组: 0 1 2 3 单项式分组适用于变量值变化范围不大、不同变量值个数 较少的离散型变量的场合。
10
22
20
22
30
27
主要步骤:数据------数据透视表------布局
EXCELL应用:单项式分组及汇总 日产量 22 23 24 25 26 工人人数 6 8 10 1 3 比重 20.00% 26.67% 33.33% 3.33% 10.00%
27
总计
2
30
6.67%
100.00%
主要步骤:数据------数据透视表------布局
600 ~ 700 700 ~ 800 800 ~ 1200 1200 ~1500
组 限 重 叠
499以下 500 ~ 999 1000 ~ 1999 2000 ~ 2999 3000及以上
组 限 不 重 叠
组限的划 分方法
不重叠组限(只适用于离散型变量) 重叠组限(适用于连续型变量和离散型变量)
当为重叠组限时,交叉组限值遵循 “上限不在其内”的原则。
它适用于变量值变化范围较大、不同变量值个数较多 的离散型变量及连续型变量的情形。
组距式分组最为常见,进行分组涉及以下几个问题
(1)组限及划分方法
(2)组距与组数 (3)等距分组与不等距分组 (4)组中值
组距式分组的组限及划分方法
每组起点值称为上限,终点值称为下限。 工人按工资分组: 企业按人数分组:
第三章 统计整理(第3、4节)

2.组距数列的编制
组距数列:指每个组的变量值用一个区间来表现的变量数列。
编制条件:
变量是连续变量; 或:总体单位数较多变量不同取值个数也较多的离散变量。 编制步骤:
(1)将变量按由小到大的顺序排列,以看出变量值变动的范围大小 ,并确定全距。 全距=最大变量值-最小变量值
@2012 SIE Management Engineer System
5
第三章 统计整理
二、分类数列的种类
(一)品质数列
根据品质标志分组形成的分配数列叫品质分配数列,简称品质数列。
(二)变量数列
根据数量标志分组形成的分配数列称为变量分配数列,简称变量数列 。
@2012 SIE Management Engineer System
6
第三章 统计整理
三、变量数列的种类
13
第三章 统计整理
(2)确定组距和组数。 等距数列:变量值变动区间的长度相等。 异距数列:变量值变动区间的长度不完全相等。
确定组距的原则:
要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍 (3)确定组限及组限的表式方法。 (4)计算频数,编制变量数列。
日产量/件 20 21 22 23 24 25 26 合计 工人数/人 3 5 6 4 3 2 1 24 比重/% 12.5 20.8 25.0 16.7 12.5 8.3 4.2 100.0
@2012 SIE Management Engineer System
12
第三章 统计整理
100以下
第三节 次数分布

2220.00 2140.00 1980.00 1880.00 2380.00 1740.00
2360.00 1960.00 2060.00 2120.00 1700.00 2120.00 2020.00 2100.00 1920.00 2100.00 2140.00 2420.00 2100.00 1900.00 2120.00 2560.00 2220.00 2020.00
3.折叠法--就是将所有调查表中需要汇 总的项目和数值折在边上,一张接一张地 叠在一起进行汇总计算的方法。
4.卡片法--就是将每个总体单位需要汇 总的项目和数值摘录到事先准备好的卡片 上,然后根据卡片进行分组和汇总计算的 方法。
(二)机械汇总法
用计算机进行统计汇总的步骤:
1. 明确所要编制的程序的目的,即确定程序 要完成些什么功能。 2. 进行技术准备工作,就是要掌握准备采 用的电子计算机语言。 3.进行可行性分析。
变量数列(见表3-4) 。
品质分布数列实例
变量分布数列实例
次数分布曲线
图3—1 某地区商业企业销售收入次数分布曲线图
四、变量数列的编制
(一)将原始资料按数值大小依次排列 (二)确定组数(k)和组距(i) (三)确定组限和组限的表示方法
(二)确定组数(k)和组距(i)
k=1+3.322logn [公式3—1]
(2)确定组数和组距
在Excel内
(3)编制变量数列
五、累计频数(频率)数列
1、向上累计频数(频率)数列——列出
各组的上限,依次从变量值低的组向变量 值高的组累计频数(频率)到本组止的各 组频数所组成的数列。 2、向下累计频数(频率)数列——列出 各组的下限,依次从变量值高的组向变量 值低的组累计频数(频率)到本组止的各 组频数所组成的数列。
统计学原理(第三章)

3.4数据资料的展示
3.4.1定类数据的展示 3.4.2定序数据的展示 3.4.3定距数据的展示 3.4.4定比数据的展示
3.4.1定类数据的展示
1)条形图:适合于展示分类型数据 条形图是用宽度相同的条形的长短来表 示数据的变动。 2)圆形图:适合于展示结构型数据 又称饼图,是用圆形及圆内扇形的面积 来表示数值大小的图形。
品质数列 分配数列 变量数列 组距数列 不等距数列 单项数列 等距数列
3.3.1分配数列
品质数列:按品质标志分组后,再按一定顺序排列, 所组成的数列。如表3-2所示。
表3-2 某商学院新生按专业分组表
按专业分组 金融学 会计学 工程管理 工商管理 国际贸易 财务管理
人数(人) 56 55 50 58 54 40
1)钟型分布 2)U型分布 3)J型分布
钟型分布
钟型分布又叫正态分布,其特征是“两头 小,中间大”,分布曲线图宛如一口古钟。
钟型分布的类型
对称的钟型分布 非对称的钟型分布
U型分布
U型分布的特征是“两头大,中间小”, 分布曲线图宛如英文字母U。
J型分布
J型分布的特征是“一边大,一边小”,分 布曲线图宛如英文字母J。 1)正J型分布:次数与变量值同向变化 2)反J型分布:次数与变量值反向变化
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
3.3.1分配数列
不等距数列 表3-7 某企业职工月收入分组
按月收入分组 人数(人) 频率(%)
500以下
500—800 800—1000 1000—1500 1500以上
10
15 25 12 8
统计学-数据的图表展示分析

2021/3/25
表3-4 不同类型的饮料和顾客性别的频数分布表
也称为列联表或交叉表
2021/3/25
SPSS生成频数分布表
第一步:选择【Analyze】 【Descriptive Statistics-Frequencies】 进入主题对话框
第二步:将“饮料类型”或“顾客性别” 选入【Variable】;选中【Display Frequencies tables】。
2021/3/25
数据的整理与显示
(基本问题)
1. 要弄清所面对的数据类型,因为不同类型的 数据,所采取的处理方式和方法是不同的
2. 对定类数据和定序数据主要是做分类整理 3. 对定距数据和定比数据则主要是做分组整理 4. 适合于低层次数据的整理和显示方法也适合
于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据
第三章 数据的图表展示
3.1 数据的预处理 3.2 用图表展示定型数据 3.3 用图表展示定量数据 3.4 合理使用图表
2021/3/25
不同原因引起的寿命损失
原因
寿命减少天 数
未结婚(男性) 3 500
惯用左手
3 285
吸香烟(男性) 2 250
未结婚(女性) 1 600
30%超重
1 300
20%超重
第二步:选中数据清单中的任意单元格,并选择【数据】 菜单中的【数据透视表和数据透视图】,弹出对话框如图3-7 所示。然后根据需要选择“数据源类型”和“报表类型”。这里我 们选用【Microsoft Office Excel数据列表或数据库】和【数据 透视表】 ,单击下一步,探出对框如图3-8所示 图 3-7
700
600