统计学 数据的整理及图表展示
统计学第3章统计数据整理与显示

2013-11-21
本 章 内 容
第一节 统计数据整理概述 第二节 统计分组与频数分布数列
第三节 统计数据的显示
第四节
2013-11-21
EXCEL在数据整理应用示例
第一节 统计数据整理概述
一、统计数据整理的含义与要求
二、统计数据整理的步骤
三、统计数据的预处理
2013-11-21
一、统计数据整理的含义与要求
个体企业 其它企业
70~80分 (中等) 80~90分 (良好) 90~100分(优秀)
2013-11-21
统计分组是在总体内部进行的一种定性分类,把 总体划分为一个个性质不同,范围更小的总体。
统计分组有两个方面的含义,即:
是“分” 即将总体区分为性质 不同的若干组成部分
统计 分组
是“合” 即将性质相同的总 体单位合为一组
每一组中的最大变量值称为上限,每组最小变量值
称为下限。
重叠组限 在统计时 遵循“上 限不在内” 的原则。
工人按工资分组:
600 700 800 1200 ~ 700 ~ 800 ~ 1200 ~ 1500
企业按人数分组:
1 ~ 499 500 ~ 999 1000 ~ 2999 3000 ~ 3499
(4)按数量标志分组
数量标志分组,即变量分组。 例如, 按考分分组(分) 60以下 用数量来 60 ~ 70 表示各组 70 ~ 80 性质上的 80 ~ 90 差别 90 ~ 100 注意:第一,明确分组的目的,. 即通过数量的变化来区 分各组质的差别,而不是单纯的数量差别。 第二,采用适当的分组形式, 即要以什么样的数量作 为划分标准。是单项式或是组距式?如果是组距式分
2013-11-21
统计学-第3章 数据的图表展示 学习指导

第3章(数据的图表展示)学习指导(一)数据的预处理数据预处理包括审核、筛选和排序。
1.对不同渠道取得的数据在审核内容和方法上有所不同。
直接调查取得的原始数据从完整性和准确性上去审核。
二手数据除审核其完整性和准确性外,还要审核其适用性和时效性。
2.数据的筛选包括两个方面:一是剔除错误数据;二是剔除不符合特定条件的数据。
3.数据排序是按一定的顺序将数据进行排列,以便发现数据的特征和趋势。
(二)品质数据的整理与显示品质数据的整理是对数据进行分类,计算出每一类别的频数、频率或比例、比率,并用图形进行显示。
(三)数值型数据的整理与显示品质数据的整理与显示方法都适用于数据型数据的整理与显示,但数据型数据还有一些特定的方法,而且这些方法不适用于品质数据。
(四)统计表统计表是用于显示统计数据的基本工具,由表头、行标题、列标题、数字资料以及表外附注组成。
概念练习一)单项选择题1、统计整理阶段最关键的问题是( )。
A、对调查资料的审核;B、统计分组;C、统计汇总;D、编制统计表。
2、统计分组的关键在于( )。
A、分组标志的正确选择;B、按品质标志分组;C、运用多个标志进行分组,形成一个分组体系;D、分组形式的选择。
3、某管理局对其所属企业的生产计划完成百分比采用如下分组,请指出哪项是正确的( )。
A、80-89%B、80%以下90-99%80.1-90%100-109%90.1-100%110%以上100.1-110%C、90%以下D、85%以下90-100%85-95%100-110%95-105%110%以上105-115%4、在进行组距式分组时,凡遇到某单位的标志值刚好等于相邻两组上下限的数值时,一般是( )。
A、将此值归人上限所在组;B、将此值归人下限所在组;C、将此值归人上限所在组或下限所在组均D、另行分组。
5、划分离散变量的组限时,相邻两组的组限( )。
A、必须是间断的;B、必须是重叠的;C、即可以是间断的,也可以是重叠的;D、应当是相近的。
统计学第三章 统计数据的整理

汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
统计学 第三章 数据的图表展示

等距分组表(上下组限重叠)
等距分组表(上下组限间断)
等距分组表(使用开口组)
1 数据分组
2
数值型数据的 图示
直方图和折线图
分组数据—直方图和折线图
Excel
分组数据—直方图(histogram)
用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布 本质上是用矩形的面积来表示频数分布 在直角坐标中,用横轴表示数据分组,纵轴表 示频数或频率,各组与相应的频数就形成了一 个矩形,即直方图
右边就是记录的原始数据分类数据整理频数分布表例题分析?用宽度相同的条形的高度或长短来表示各类别数据的图形?有单式条形图复式条形图等形式?主要用于反映分类数据的频数分布?绘制时各类别可以放在纵轴称为条形图也可以放在横轴称为柱形图columnchart15111216可口可乐旭日升冰茶百事可乐汇源果汁露露品牌不同品牌饮料的频数分布分类数据的图示对比条形图sidebysidebarchart?分类变量在不同时间或不同空间上有多个取值?对比分类变量的取值在不同时间或不同空间上的差异或变化趋势电脑品牌电脑品牌一季度一季度二季度二季度联想联想256256468468ibmibm285285397397康柏康柏247247328328戴尔戴尔563563688688分类数据的图示对比条形图例题分析电脑销售量的对比条形图256285247563468397328688100200300400500600700800联想ibm康柏戴尔电脑品牌一季度二季度分类数据的图示帕累托图paretochart不同品牌饮料的帕累托图111216可口可乐旭日升冰茶百事可乐露露汇源果汁品牌?按各类别数据出现的频数多少排序后绘制的柱形图?主要用于展示分类数据的分布分类数据的图示帕累托图paretochart?也称圆形图是用圆形及圆内扇形的角度来表示数值大小的图形?主要用于表示样本或总体中各组成部分所占的比例用于研究结构性问题?绘制圆形图时样本或总体中各部分所占的百分比用圆内的各个扇形角度表示这些扇形的中心角度按各部分数据百分比乘以360分类数据的整理与图示顺序数据的整理与图示累积频数cumulativefrequencies
统计学原理-数据的整理

向下累积 户数 (户) 300 279 180 102 38 — 百分比 (%) 100.0 93.0 60.0 34.0 12.7 —
பைடு நூலகம்
提取甲 乙百分比 及回答 类别共 3列 列
非常不满 不满意 一般 满意 非常满意 合计
主要是分组整理 三,数值型数据的整理与显示(主要是分组整理 数值型数据的整理与显示 主要是分组整理)
– 完整性审核
检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全
– 准确性审核
检查数据是否真实反映客观实际情况,内容是否符合实际 检查数据是否真实反映客观实际情况, 检查数据是否有错误,计算是否正确等 检查数据是否有错误, 审核数据准确性的方法
– 逻辑检查 从定性角度,审核数据是否符合逻辑,内容是否合理, 从定性角度,审核数据是否符合逻辑,内容是否合理, 各项目或数字之间有无相互矛盾的现象 主要用于对定类数据和定序数据的审核 – 计算检查 检查调查表中的各项数据在计算结果和计算方法上有无 错误 主要用于对定距和定比数据的审核
单变量值分组表
(实例)
表 某车间50名工人日加工零件数分组表
零件数 (个)
107 108 110 112 113 114 115 117 118
频数 (人)
1 2 1 2 1 1 1 3 3
零件数 (个)
119 120 121 122 123 124 125 126 127
频数 (人)
1 2 1 4 4 3 2 2 3
主要是分类整理 二,品质数据的整理与显示(主要是分类整理 品质数据的整理与显示 主要是分类整理)
一.分类数据的整理与显示 基本过程 分类数据的整理与显示(基本过程 分类数据的整理与显示 基本过程)
统计学分类数据的整理表格

在统计学中,分类数据(也称为定性数据或品质数据)通常通过表格进行整理。
这种表格通常称为频数分布表或交叉表。
以下是分类数据整理表格的示例:
在上述示例中,表格列出了分类变量和各个类别的频数和频率。
频数表示落在某一特定类别中的数据个数,而频率则表示频数与总数据量的比值。
除了频数和频率外,表格还可以包括其他统计量,如比率、比例、标准差等,具体取决于分析的目的和需求。
这些统计量可以用于描述数据的分布、中心趋势、离散程度等特征。
第三章图表法(学生版)

MBA
基础课程
编制频数分布表的步骤
确 定 组 数
确 定 组 距
计 算 频 数
编 制 表 格
1 - 30
MBA
频数分布表的编制
(实例)
•
•
基础课程
例:某移动公 司有50名大客 户。他们月使 用移动业务支 出见右侧数据 (单位:元) 。试编制频数 分布表。
•
•
•
417 507 708 533 610 634 712 513 337 415
下 限:一个组的最小值 上 限:一个组的最大值 组 距:上限与下限之差 组中值:下限与上限之间的中点值
组中值=
下限值+上限值
2
1 - 37
MBA
等距分组表
(上下组限重叠)
基础课程
某移动公司大客户月使用移动业务支出分组表 频数 频率 月支出 累计频数 累计频率 (人) (%) (元) (人) (%)
MBA
基础课程
第二节 用图表法描述品质数据
一、品质数据的整理
二、品质数据的展示
MBA
基础课程
品 质 数 据 的 整 理
整理过程
确定分类标志 将数据归类 计算各类别中的数 据个数(频数) 制作频数分布表 用图形展示数据
MBA
基础课程
数据整理中计算的指标
数据类型和指标
2.
绘制时,各类别可以放在纵轴,称 其他 为条形图,也可以放在横轴,称为 柱形图
3.
条形图和柱形图有单式、复式等形
1999 2002
3
to 5 years
式
MBA
基础课程
用EXCEL制作的条形图
第3章 数据的图表展示

2 - 13
统计学
STATISTICS
等组距分组
(步骤)
1. 确定组数:组数的确定应以能够显示数
据的分布特征和规律为目的
2. 确定组距:组距(class width)是一个组的
上限与下限之差,可根据全部数据的最大 值和最小值及所分的组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 3. 统计出各组的频数并整理成频数分布表
2 - 28
统计学
STATISTICS
统计表的设计
1.统计表的常用结构 2.设计统计表的一般规则
2 - 29
统计学
STATISTICS
本章小结
1.数据的预处理 2.品质数据的整理与展示 3.数值型数据的整理与展示 4.合理使用图表
2 - 30
统计学
STATISTICS
作业
1、P78-3.1 2、P79-3.3 3、P79-3.4 4、P82-3.12
2-4
统计学
STATISTICS
3.2 品质数据的整理与展示
统计学
STATISTICS
分类数据的整理与展示
一、图示用数据计算 1.频数:落在某一特定类别或组中的数据个数 2.频数分布:各个类别或组的频数汇总表 3.比例和百分比 4.比率:不同类别数值之间的比值
2-6
统计学
STATISTICS
分类数据的整理与展示
我一眼就看出 来了,周加工 零 件 在 100 ~ 110 之 间 的 人 数最多!
直方图的绘制
12
8
4
0 80 90 100 110 120 130
某车间工人周加工零件直方图 2 - 19
统计学
STATISTICS
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
3.1 数据的预处理 3.2 品质数据的整理与展示 3.3 数值型数据的整理与展示
BG
1
3.1 数据的预处理
1. 数据审核
■ 发现数据中的错误
2. 数据筛选
■ 找出符合条件的数据
3. 数据排序
▪ 发现数据的基本特征 ▪ 升序和降序
BG
2
数据筛选
例3.1 表3-1是8名学生4门课程的考试成绩 数据(单位:分)。试找出
2. 数值型数据的排序
BG
4
分类汇总
根据不同的研究目的,按照某个类别进 行汇总分析。
分类汇总之前要先按分类项排序。
简单分类汇总 多级分类汇总
BG
5
数据透视表
利用数据透视表可以按照研究目的不同, 进行交叉汇总分析,使研究者可以从各种 角度、维度去查看分析数据,从繁杂的数 据中挖掘和整合数据。
BG
6
1. 累积频数:将各有序类别的频数逐级累加 起来得到的频数。
向上累积:从类别顺序的开始一方,向类别 顺序的最后一方累加频数; 向下累积:从类别顺序的最后一方,向类别 顺序的开始一方累加频数。
2. 累积频率:将各类别的百分比逐级累加
BG
23
【例3.5】在一项城市住房问题的研 究中,研究人员在甲乙两个城市 各抽样调查300户,其中的一个问 题是:“您对您家庭目前的住房 状况是否满意?
1.非常不满意;
2.不满意;
3.一般;
4.满意;
5.非常满意。
BG
24
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
户数 百分比 (户) (%)
向上累积 户数 百分比 (户) (%)
向下累积 户数 百分比 (户) (%)
非常不满意 24
8
24 8.0 300 100.0
不满意
108 36 132 44.0 276 92
一般
93 31 225 75.0 168 56
满意
45 15 270 90.0 75
25
非常满意 30
10
300 100.0 30
10
合计
300 100.0 —
—
——
BG
25
回答类别
乙城市家庭对住房状况评价的频数分布
乙城市
户数 百分比 (户) (%)
向上累积 户数 百分比 (户) (%)
2. 主要用于 展示分类 数据的分 布
频数
16
15
12
11
9
9
8
6
4
0 可口可乐 旭日升冰茶 百事可乐
露露
不同品牌饮料的帕累托图
汇源果汁
品牌
BG
18
饼图
1. 饼图:用圆形及圆内扇形的面积来表示 数值大小的图形。
2. 主要用于表示总体中各组成部分所占的 比例,对于研究结构性问题十分有用
3. 在绘制圆形图时,总体中各部分所占的 百分比用圆内的各个扇形面积表示,这 些扇形的中心角度,是按各部分百分比 占3600的相应比例确定的
BG
19
三维饼图
8%
5%
9%
9% 22%
商品广告
47%
服务广告
金融广告
房地产广告
招生招聘广告
其他广告
BG
20
环形图
1. 环形图中间有一个“空洞”,总体中的 每一部分数据用环中的一段表示
2. 环形图与饼图类似,但又有区别
– 饼图只能显示一个总体各部分所占的比例 – 环形图则可以同时绘制多个总体的数据系
列,每一个总体的数据系列为一个环
3. 环形图可用于进行比较研究 4. 环形图可用于展示分类数据和顺序数据
BG
21
13%
7%
10% 8%
15% 21%
33% 36%
31% 26%
非常不满意 不满意 一般 满意 非常满意
图3-4 甲乙两城市家庭对住房状况的评价
BG
22
3.2.2 顺序数据的整理与图示
4.比 率:不同类别数值之间的比值
BG
9
【例3.3】一家市场调查公司为研究不同品牌 饮料的市场占有率,对随机抽取的一家超市 进行调查。调查员随机观察了50名顾客购 买饮料类型及购买者性别,并进行了记录, 如果一个顾客购买某一品牌的饮料,就将这 一饮料的品牌名字记录一次。数据见Excel 表。要求:对饮料类型和顾客性别的分布状 况进行描述分析,求不同品牌饮料的频数分 布、比例和百分比。
BG
12
分类数据的图示 条形图
条形图是用宽度相同的条形的高度 或长短来表示数据多少的图形
Hale Waihona Puke ★ 各类别可以放在纵轴,称为条形图,也 可以放在横轴,称为柱形图
★ 对比条形图(复式条形图): 显示分类 变量在不同时间或不同空间上的差异或 变化
BG
13
其他广告 招生招聘广告
房地产广告 金融广告 服务广告 商品广告
BG
7
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与图示
1. 列出各类别 2. 计算各类别的频数 3. 制作频数分布表 4. 用图形展示
BG
8
分类数据中需要计算的指标
1.频 数:落在各类别中的数据个数 频数分布:把各个类别及落在其中的相应频 数全部列出,并用表格形式表现出来。
2.比 例:某一类别数据占全部数据的比值 3.百分比:将对比的基数作为100而计算的比值
0
5 8 9 9
10
条形图
22
20
30
BG
频数
47
40
50
14
柱形图
50 47
40
30 20 10
22
频数
9
9
8
5
0
商品广告 服务广告 金融广告 房地产广告 招生招聘广告 其他广告
BG
15
复式条形图
BG
16
对比条形图
BG
17
分类数据的图示—帕累托图
1. 按各类别 数据出现 的频数多 少排序后 绘制的柱 形图
[例3.2] 在某大学随机抽取30名学生,调查 他们的性别、家庭所在地、平均月生活费 支出、平均每月购买衣物支出和购买衣物 时所考虑的首选因素等,得到的数据如表32,试建立一个数据透视表,在表的行变量 中给出性别和买衣物的首选因素,在列变 量中给出学生的家庭所在地区,对平均月 生活费和月平均衣物支出进行交叉汇总。
BG
10
方法一:数据透视表方法
• 利用数据透视表功能,进行频数分析。 在数据透视表【布局】对话框中,依次
将“饮料类型”拖到“行”区域以及“数据 ”区域,将“顾客性别”拖到“列”区域。
BG
11
方法二:EXCEL中的函数功能
插入 —— 函数 —— COUNTIF
数一数 COUNT IF要计算某一类别的频数
(1)统计学成绩等于80分的学生 (2)数学成绩最高的前三名学生,英语成绩
最低的三名学生 (3)统计学成绩在80-90之间的学生 (4)四门课程成绩都大于70分的学生
BG
3
数据排序
1. 分类数据的排序
▪ 字母型数据,排序有升序降序之分,但习
惯上用升序
▪ 汉字型数据,可按汉字的首位拼音字母排
列,也可按笔画排序,其中也有笔画多少 的升序降序之分