应用统计学第三章图表法

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

月支出(元) 频数( 人)
529 1 533 1 539 1 610 1 612 1 617 1 618 1 624 1 626 1 627 1 628 1 633 1
月支出(元)
634 708 712 721 724 725 734 808 822
频数( 人)
1 1 1 1 1 1 1 1 1
经济类管理类
24%
15% 12%
44% 18%
40%
29% 30%
12%
1999
2002
3 to 5 years
经济类管理类 基础课程
数据类型与图示
数据类型与图示
品质数据
数量数据
分组数据 分组数据 原始数据 时序数据 多元数据
条柱圆 直 折 茎 箱
线

形形形 方 线 叶 线

图图图 图 图 图 图


经济类管理类
某城市330名用户每月手机话费支出的频数分布
用 户 数

向上累积
率 用户数 频率
(个) (%) (个)
(%)
向下累积
用户数 频率 (个) (%)
100元以内 101-200元 201-300元 301-500元 501-600元 601-1200元 1501元以上
161 48.8 114 34.6 29 8.8 14 4.3 6 1.8 4 1.2 2 0.6
Fixed network revenue mix
Other
Data and Internet
15% 6% 9%
Voice 70%
11% 7% 21%
61%
10% 10%
Other Wholesale
40% Data and Internet
40% Voice
1999
2002
3 to 5 years
基础课程 三、数据的排序——发现数据的基本特征
1. 按一定顺序将数据排列,以 发现一些明显的特征或趋势, 找到解决问题的线索
2. 排序有助于对数据检查纠错, 以及为重新归类或分组等提 供依据
3. 在某些场合,排序本身就是 分析的目的之一
4. 排序可借助于计算机完成
经济类管理类 基础课程
一、数据的整理
1-3
经济类管理类 统计数据为什么要用图表描述? 基础课程
1、原始数据反映个体特征,庞大而杂乱,单从原始数 据中无法得到总体特征和数量规律
2、图表描述的结果能反映样本分布特征 3、图表描述的结果可用于研究变量之间的关系
经济类管理类 基础课程
用图表法描述数据的一般过程
数据的预处理 数据的描述
数据审核 数据筛选 数据排序
24%
值大小的图形
3. 这些扇形的中心角度,是按各部
15%
分百分比占3600的相应比例确定 24%
9% 5%
28%

4%
10% 33%
经济类管理类 基础课程
品质数据的图示─环形图 (Doughnut Pie )
1. 环形图可用于进行比较研究 2. 环形图有若干个圆环,总体中的
每一部分数据用环中的一段表示
627 523
520 628
529 522
517 518
526 518
423 527
528 724
539 725
522 808
633 612
519 435
624 721
某移动公司大客户月使用移动业务支出分组表
月支出 (元)
频数 (人)
频率 (%)
累计频数 累计频率
(人)
(%)
300~400
3
6
3
6
400~500 10
实例2:定序数据的频数分布表
【 例 3.2】 在 一 项 关 于用户移动业务支出
情况的调查中,研究
人员在某城市抽样调 查 了 330 名 移 动 用 户 ,对其中的一个问题
:“手机话费一个月
多少钱?”设了七个 选项:
1、100元以内 2、 101-200元 3、201-300元 4、301-500元 5、501-600元 6、601-1200元 7、1501元以上
基础课程 品质数据的图示─条形图(Bar Graph)
1. 在表示品质数据的分布时,条形信图息查询
是用条形图的高度或长短来表示收发各E-Mail
阅读网络新闻
类别数据的频Leabharlann Baidu或频率
在线学习
12.3% 6.7%
采购与订货 5.5%
2. 绘制时,各类别可以放在纵轴,称 其他 4.5%
为条形图,也可以放在横轴,称为
经济类管理类
基础课程
第三章 用表格法和图形法
描述统计数据
1-1
经济类管理类
基础课程
第三章 用表格法和图形法
描述统计数据
第一节 数据的预处理 第二节 品质数据的整理和描述 第三节 数值型数据的整理和描述 第四节 统计表
1-2
经济类管理类
基础课程
学习目标
1. 了解数据预处理的内容和目的 2. 掌握品质数据整理和描述的方法 3. 掌握数量数据整理和描述的方法 4. 用Excel作频数分布表和分布图 5. 合理使用统计表
应弄清楚数据的来源、数据的口径以及 有关的背景材料 确定这些数据是否符合自己分析研究的 需要
应尽可能使用最新的统计数据
确认是否有必要做进一步的加工整理
经济类管理类 基础课程
审核数据准确性的方法
计算检查——主要用于对数量数据的审核
A省 B省 … 国内漫游出访通话量 8 12 … 国内漫游来访通话量 10 7 …
3. 环形图与圆形图类似,但又有区 别
圆形图只能显示一个总体各 部分所占的比例
环形图则可以同时绘制多个 总体的数据系列,每一个总 体的数据系列为一个环
15% 12%
44% 18%
40%
29% 30%
12%
经济类管理类 基础课程
第三节 用图表法描述数量数据
一.频数分布表的编制
二、数量数据的展示 三、频数分布的类型
从定性角度,审核数据是否符合逻辑,内容是 否合理,各项目或数字之间有无相互矛盾的现象
经济类管理类 基础课程
二、数据的筛选——处理数据中的错误
数据错误
能能 能否纠正 不能
纠正错误 筛选数据
• 剔除不符合要求或有明显错误的数据 • 将符合某种特定条件的数据筛选出来,而不符合特定条 件的数据予以剔出
经济类管理类
基础课程
组距分组
(要点)
1. 将变量值的一个区间作为一组
2. 适合于连续变量
~
3. 适合于变量值较多的情况
~
4. 必须遵循“不重不漏”的原则 ~
5.
可采用等距分组,也可采用不 等距分组
~
~
1 - 35
经济类管理类
基础课程
组距分组
(步骤)
1. 确定组数:组数的确定应以能够显示数据的分布特 征和规律为目的。在实际分组时,可以按 Sturges 提 出的经验公式来确定组数K:
经济类管理类 基础课程
一、数据的审核
原始数据
完整性审核
检查应调查的单位或个体是否有遗漏 所有的调查项目或指标是否填写齐全
准确性审核
检查数据是否真实地反映了客观实际
情况,内容是否符合实际 检查数据是否有错误,计算是否正确等
经济类管理类 基础课程
一、数据的审核
第二手数据
适用性审核 时效性审核
1. 要弄清所面对的数据类型,因为不 同类型的数据,所采取的处理方式 和方法是不同的
2. 对品质数据主要是做分类整理 3. 对数量数据主要是做分组整理 4. 适合于低层次数据的整理和显示方
法也适合于高层次的数据;但适合 于高层次数据的整理和显示方法并 不适合于低层次的数据
经济类管理类 基础课程
第二节 用图表法描述品质数据
将将将落各对各在类比类各别的别类的基的别频数频中率作数数(为百 1分00比逐而据)级计的逐累算个级加的数累比加值
经济类管理类
基础课程 实例1:定类数据的频数分布表
【例3.1】某市移动公司为 研究移动数据业务集团客 户的行业分布状况,搜集 了该城市90个集团客户的 客户资料。将其所属行业 分为下列类别: 1.金融(银行证券保险) 2.政府,工商、税务 3.制造业 4.教育科研 5.交通运输 6.批发零售 7.公用事业 8.旅游酒店
• 417 507
• 708 533
• 610 634
• 712 513
• 337 415
822 324 529 539 617 430 522 725
431 425 517 522 626 422 518 808
618 523 526 633 527 323 518 612
734 627 423 519 520 523 527 435
柱形图
3. 条形图和柱形图有单式、复式等形
1999
2002

37.6% 33.5%
3 to 5 years
经济类管理类 基础课程
用EXCEL制作的条形图
旅游酒店
10
公用事业
2
批发零售
9
交通运输
9
教育科研
11
制造业
32
政府,工商、税务
5
金融(银行证券保险)
12
经济类管理类 基础课程
柱形图的应用—— Fixed revenue evolution
数据整理 数据展示
发现数据中的错误 处理数据中的错误 发现数据基本特征
品质数据:分类 数量数据:分组 用图表展示数据
经济类管理类 基础课程
本章内容
第一节 数据的预处理 第二节 用图表法描述品质数据 第三节 用图表法描述数量数据
经济类管理类 基础课程
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序
经济类管理类
基础课程
单变量值分组表
(实例)
月支出(元) 频数(人 )
323 1 324 1 337 1 414 1 415 1 417 1 422 1 423 1 425 1 430 1 431 1 435 1
1 - 34
月支出(元) 频数(人)
439 1 507 1 513 1 517 1 518 2 519 1 520 2 522 2 523 2 526 1 527 2 528 1
K=1 +
Log(n) Log(2)
经济类管理类
基础课程
频数分布表的编制
1 - 28
经济类管理类
基础课程
频数分布表反映 数量数据分布特征
417 507
708 533
610 634
712 513
337 415
822 617 431 626 618 527 734 520 414 439
1 - 29
324 430
425 422
523 323
20
13
26
500~600 19
38
32
64
600~700 10
20
42
84
700~800
6
12
48
96
800~900
2
4
50
100
合计
50
100
——
——
经济类管理类
基础课程
编制频数分布表的步骤
















1 - 30
经济类管理类
基础课程
频数分布表的编制
(实例)
例:某移动公 司有50名大客 户。他们月使 用移动业务支 出见右侧数据 (单位:元) 。试编制频数 分布表。
合计 324 289
Something Wrong !!!
检查调查表中的各项数据在计算结果和计算方 法上有无错误
经济类管理类 基础课程
审核数据准确性的方法
逻辑检查——主要用于对品质数据的审核
姓名 余小姐 罗先生 吴女士
性别 女 男 女
地址 香洲区 香洲 香州
不,他们住在 三个区!
他们住在同一 区
STATISTICA
161 48.8 275 83.3 304 92.1 318 96.4 324 98.2 328 99.4 330 100.0
330 100.0
169 51.2
55
16.6
26
7.8
12
3.6
6
1.8
2
0.6
合计
330 100 —



经济类管理类 基础课程
19%
32%
二、数据的展示
10% 15%
一、品质数据的整理 二、品质数据的展示
经济类管理类 基础课程
品质数据的整理
整理过程
确定分类标志
将数据归类






计算各类别中的数 据个数(频数) 制作频数分布表
用图形展示数据
经济类管理类 基础课程
数据整理中计算的指标
数据类型和指标
定类数据
频数 频率
定序数据
累计频数 累计频率
指标含义
2007年上半年中国移动增值业务占运营总收入的25.2% ,中国电信非话业 务收入占比34.5%
经济类管理类 品质数据的图示─圆形图(Pie
基础课程
Graph)
1. 圆形图也称饼图,主要用于表示 总体中各组成部分所占的比例, 19% 对于研究结构性问题十分有用
10% 15%
2. 用圆及圆内扇形的面积来表示数 32%
移动数据业务集团客户行业类型的频数分布
行业类型
客户数(户) 频率(%)
金融(银行证券保险) 政府,工商、税务 制造业 教育科研 交通运输 批发零售 公用事业 旅游酒店
12 13.3
5
5.6
32 35.6
11 12.2
9 10.0
9 10.0
2
2.2
10 11.1
合计
90 100
经济类管理类 基础课程
414 520 528 624 439 628 724 721
1 - 31
经济类管理类
基础课程
分组方法
分组方法
单变量值分组
1 - 32
组距分组 等距分组 异距分组
经济类管理类
基础课程
单变量值分组
(要点)
1. 将一个变量值作为一组
2. 适合于离散变量

3. 适合于变量值较少的情况


1 - 33
相关文档
最新文档