统计学数据的图表展示课件
合集下载
统计图表PPT课件

分型分度及疗效 单纯性 慢性气管炎 喘息性 慢性气管炎
分
度别 重 中 轻
重中轻
度
例数 136 54 31
93 56 33
疗
指标 治愈显效好转无效治愈显效好转无效
效
例数 60 98 51 12 23 83 65 11
小计 % 合计
95%
5% 94.4
94%
6%
-
9
原表标题过繁,主谓语安排不当,标目重复,层次太 乱,小计与合计意义不明确,可修改如下表:
78.410.6
体力活动
2.10.2
2.10.1
2.10.2
2.30.3
体重指数
23.13.2
24.03.5
24.83.1
25.83.1
吸 烟 率 (%)
70.8
69.4
70.7
71.1
<0.05 <0.5 <0.39 <0.08 <0.01 <0.41
吸烟量(支/天) 饮 酒 率 (%)
81
102
4(253 人 )
P值
X S
% X S
% X S
% X S
%
年 龄 (岁 )
35.26.5
37.06.3
36.56.8
37.86.5
收 缩 压 (mmHg) 120.713.4
121.213.2
121.113.2
120.412.8
舒 张 压 (mmHg) 78.810.2
77.910.5
78.211.0
152
152
<0.001
52.3
55.5
53.1
52.8 <0.13
统计学 第 2章 数据的图表展示

一、统计表的构成
1、 表头(表号、总标题)
2、行标题
3、列标题
4、数字资料
5、表外附加(注解说明或表脚)
二、统计表编制的基本要求
科学、实用、简练、美观
三、统计表种类 人口数字
全球人口 70亿
1、按用途分: 中国人口 13亿
印度人口 12亿 美国人口 3亿
调查表、汇总表、分析表
2、按时间和空间属性分: 日本人口 1.3亿 时间表、空间表、时空表 3、按分组情况分: 简单表:未分组的数据表。 简单分组表:单变量分组的数据表。 并行分组表:多变量分组并行排列的数据表。 交叉分组表(列联表):多变量分组交叉排 列的数据表。
8、数字要如实填写,不能用“同左”
文字表示;
9、合计应放在最后一行。
表2—2
2011~2012年中南商场部分商品销售统计表
计 量 单 位
件 台 吨
商 品 名 称
甲 乙 丙
销售额 (万元) 2011年 2012年 2011年 2012年
(1) 3000 50 800 (2) 3000 60 1000 (3) 30 500 160 (4) 27 540 180
20 18.23
18
16
14
13.65
GDP
12 10.71 10 8.75 8 2000年 2001年 2002年 9.59
(3)计量单位 若全表的计量单位一样,则放在 表外的右上角; 若全表计量单位不一样,则各行 的计量单位,专设一个计量单位栏; 各列计量单位,放在列标题(指标名 称)的左方或下方,并用圆括号括起 来。
4、表脚 填表人、填表时间、资料来源、变量 注解(计算方法、计算口径)等。
5、如果有多张表,则要编表号。 练习: 指出下表中的错误,并将其改正 为一张规范的统计表
1、 表头(表号、总标题)
2、行标题
3、列标题
4、数字资料
5、表外附加(注解说明或表脚)
二、统计表编制的基本要求
科学、实用、简练、美观
三、统计表种类 人口数字
全球人口 70亿
1、按用途分: 中国人口 13亿
印度人口 12亿 美国人口 3亿
调查表、汇总表、分析表
2、按时间和空间属性分: 日本人口 1.3亿 时间表、空间表、时空表 3、按分组情况分: 简单表:未分组的数据表。 简单分组表:单变量分组的数据表。 并行分组表:多变量分组并行排列的数据表。 交叉分组表(列联表):多变量分组交叉排 列的数据表。
8、数字要如实填写,不能用“同左”
文字表示;
9、合计应放在最后一行。
表2—2
2011~2012年中南商场部分商品销售统计表
计 量 单 位
件 台 吨
商 品 名 称
甲 乙 丙
销售额 (万元) 2011年 2012年 2011年 2012年
(1) 3000 50 800 (2) 3000 60 1000 (3) 30 500 160 (4) 27 540 180
20 18.23
18
16
14
13.65
GDP
12 10.71 10 8.75 8 2000年 2001年 2002年 9.59
(3)计量单位 若全表的计量单位一样,则放在 表外的右上角; 若全表计量单位不一样,则各行 的计量单位,专设一个计量单位栏; 各列计量单位,放在列标题(指标名 称)的左方或下方,并用圆括号括起 来。
4、表脚 填表人、填表时间、资料来源、变量 注解(计算方法、计算口径)等。
5、如果有多张表,则要编表号。 练习: 指出下表中的错误,并将其改正 为一张规范的统计表
统计学基础(第三章统计数据整理与展示)PPT课件

• (三)两种方式的比较
– 两种整理形式优缺点互补,实际中常常结合运用, 称为综合整理,即对一些最基本的统计指标实行 逐级整理,另一方面又将全部原始资料实行集中 整理。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
三、统计整理的步骤
• 1.设计和编制统计资料的整理方案。 • 2.审核统计资料。
第一节 统计整理的
统计分组 分配数列 统计表和统计图
• 案例分析
• 思考与练习
E-mail::
第三章 统计数据整理与展示
第三章>>第E-一ma节il::
第三章 统计数据整理与展示
一、统计整理的意义
• 概念
– 统计整理,是指根据统计研究的目的,将 统计调查所搜集到的原始资料进行科学的 分类和汇总,或对已初步加工的资料进行 再加工,使之系统化、条理化,成为能够 反映现象总体特征的综合资料的工作过程。
1980年
GDP 100 第一产业 3.2 第二产业 75.7 第三产业 21.1
1990年 100 4.3 63.8 31.9
1996年 1997年 100 100
2.5 2.3 54.5 52.2 43.0 45.5
3·研究总体现象之间的依存关系
例:中国农民家庭按收入分组的恩格尔系数(1984年)
• 5.编制统计图表。
– 以统计表、统计图的形式简明扼要地表现统计整 理的结果。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
第三章E>-m>a第il::二节
第三章 统计数据整理与展示
什么是统计分组?
根据现象的特点和统计研究的目的要求, 按照某个(或几个)标志把总体划分为若干 不同性质的组,称为统计分组。
– 两种整理形式优缺点互补,实际中常常结合运用, 称为综合整理,即对一些最基本的统计指标实行 逐级整理,另一方面又将全部原始资料实行集中 整理。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
三、统计整理的步骤
• 1.设计和编制统计资料的整理方案。 • 2.审核统计资料。
第一节 统计整理的
统计分组 分配数列 统计表和统计图
• 案例分析
• 思考与练习
E-mail::
第三章 统计数据整理与展示
第三章>>第E-一ma节il::
第三章 统计数据整理与展示
一、统计整理的意义
• 概念
– 统计整理,是指根据统计研究的目的,将 统计调查所搜集到的原始资料进行科学的 分类和汇总,或对已初步加工的资料进行 再加工,使之系统化、条理化,成为能够 反映现象总体特征的综合资料的工作过程。
1980年
GDP 100 第一产业 3.2 第二产业 75.7 第三产业 21.1
1990年 100 4.3 63.8 31.9
1996年 1997年 100 100
2.5 2.3 54.5 52.2 43.0 45.5
3·研究总体现象之间的依存关系
例:中国农民家庭按收入分组的恩格尔系数(1984年)
• 5.编制统计图表。
– 以统计表、统计图的形式简明扼要地表现统计整 理的结果。
第三章E>-m>a第il::一节
第三章 统计数据整理与展示
第三章E>-m>a第il::二节
第三章 统计数据整理与展示
什么是统计分组?
根据现象的特点和统计研究的目的要求, 按照某个(或几个)标志把总体划分为若干 不同性质的组,称为统计分组。
统计图表 ppt课件

合计
重
中
136 54
93
56
229 110
轻 合计
31
221
33
182
64
403
•ppt课件
•15
表6 复方猪胆胶囊对不同类型老年慢性气管炎的疗效
类型 单纯型慢性气管炎 喘息型慢性气管炎
合计
临床治愈 显效
60
98
23
83
83
181
好转 51 65 116
无效 12 11 23
•ppt课件
•16
第二节 统计图
××
××
总 标 目(单位)
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ××. ××
┋ ┋ ××. ××
备注:
•ppt课件
•10
表2 某地1995年流行性脑脊髓膜炎不同病型病死 率与病情轻重的关系
病型
菌血型 脑型 混合型 合计
轻 病人 死亡 病死率 数 人数 (%)
•ppt课件
•20
表7 某市某年肠道各区传染病发病率
市区 Ⅰ Ⅱ Ⅲ Ⅳ
发病率(%) 4.5 2.4 3.9 3.1
•ppt课件
•21
表8 某地某年三种疾病男女死亡率比较(1/10万)
死因 呼吸系统 脑血管病 恶性肿瘤
男 164.2 119.0 138.4
女 160.8 110.9 80.7
•ppt课件
•横标目 横标目位于表左侧, 是统计表所要叙述的主语, 它说明同一横行•p数pt课字件的意义。
•线条 包括顶线、标 目线、合计线和底线,
重
中
136 54
93
56
229 110
轻 合计
31
221
33
182
64
403
•ppt课件
•15
表6 复方猪胆胶囊对不同类型老年慢性气管炎的疗效
类型 单纯型慢性气管炎 喘息型慢性气管炎
合计
临床治愈 显效
60
98
23
83
83
181
好转 51 65 116
无效 12 11 23
•ppt课件
•16
第二节 统计图
××
××
总 标 目(单位)
纵标目
纵标目
××. ×× ××. ××
×. ×× ×. ××
┋ ┋ 合计
┋ ┋ ×××
┋ ┋ ×××
┋ ┋ ××. ××
┋ ┋ ××. ××
备注:
•ppt课件
•10
表2 某地1995年流行性脑脊髓膜炎不同病型病死 率与病情轻重的关系
病型
菌血型 脑型 混合型 合计
轻 病人 死亡 病死率 数 人数 (%)
•ppt课件
•20
表7 某市某年肠道各区传染病发病率
市区 Ⅰ Ⅱ Ⅲ Ⅳ
发病率(%) 4.5 2.4 3.9 3.1
•ppt课件
•21
表8 某地某年三种疾病男女死亡率比较(1/10万)
死因 呼吸系统 脑血管病 恶性肿瘤
男 164.2 119.0 138.4
女 160.8 110.9 80.7
•ppt课件
•横标目 横标目位于表左侧, 是统计表所要叙述的主语, 它说明同一横行•p数pt课字件的意义。
•线条 包括顶线、标 目线、合计线和底线,
专题复习:统计图表ppt-人教版课件

20
第(2)题,结合材料信息:条件为地形平坦, 符合条件为“1”,不符合条件为“0”,同一小 方格内占有面积比例较大的属性作为评估对象, 按上题原理将图1中的地形空间资料图进行编码, 可得下图。题干中要求“地形、河流两项资料的 综合评估”,需将图2中的②与下图进行叠加,叠 加后可得图3中的甲和乙都为“1”,符合要求, A 项正确。
16
17
(1)图2是四幅“河流” 资料的评估值图,其中 正确的是( B )
A.① B.② C.③ D.④ 18
(2)根据地形、河流两项资料的综合评估,图3 中适合布局工厂的地点是( A )
A.甲、乙 C.乙、丁
B.乙、丙
D.甲、丙
19
解析: 第(1)题,从材料中获取信息:条件为 距河流1km范围内,符合条件为“1”,不符合条 件为“0”,同一小方格内占有面积比例较大的属 性作为评估对象;按材料要求可以判断出河流流 经的方格都为1,而河流经过某些方格的交点处以 1km为半径画圆,可以得知某些方格虽然没有河流 经过,但是大部分面积距离河流1km范围内,这些 方格也算1。将图1中河流空间资料图进行编码, 可得② ,B项正确。
8
三、结构图的判读技巧
结构图一般从以下几个方面判读: 1.归纳总结地理事物的结构特征。要做到这 一点,必须仔细看图例或图中的文字说明,了解该 图反映的是哪些地理项目,认识结构图的组成要素、 各要素的比例及其大小关系,进而归纳总结。 2.对地理事物结构特征进行分析评价,并提 出相应对策。 3.采用对比法对地理事物的结构进行对比分析。
21
该组试题以地理信息技术实际应用为背景,考 查考生获取信息和绘图分析(图形转换)的能力,难 度系数不高。试题材料较新颖,考查了GIS在城市 规划中的应用,知识基础应用性强,需要灵活运用 地理信息系统中的图层叠加原理,是一组设计优秀 的实践探究试题,属近年高考的新题型。
第(2)题,结合材料信息:条件为地形平坦, 符合条件为“1”,不符合条件为“0”,同一小 方格内占有面积比例较大的属性作为评估对象, 按上题原理将图1中的地形空间资料图进行编码, 可得下图。题干中要求“地形、河流两项资料的 综合评估”,需将图2中的②与下图进行叠加,叠 加后可得图3中的甲和乙都为“1”,符合要求, A 项正确。
16
17
(1)图2是四幅“河流” 资料的评估值图,其中 正确的是( B )
A.① B.② C.③ D.④ 18
(2)根据地形、河流两项资料的综合评估,图3 中适合布局工厂的地点是( A )
A.甲、乙 C.乙、丁
B.乙、丙
D.甲、丙
19
解析: 第(1)题,从材料中获取信息:条件为 距河流1km范围内,符合条件为“1”,不符合条 件为“0”,同一小方格内占有面积比例较大的属 性作为评估对象;按材料要求可以判断出河流流 经的方格都为1,而河流经过某些方格的交点处以 1km为半径画圆,可以得知某些方格虽然没有河流 经过,但是大部分面积距离河流1km范围内,这些 方格也算1。将图1中河流空间资料图进行编码, 可得② ,B项正确。
8
三、结构图的判读技巧
结构图一般从以下几个方面判读: 1.归纳总结地理事物的结构特征。要做到这 一点,必须仔细看图例或图中的文字说明,了解该 图反映的是哪些地理项目,认识结构图的组成要素、 各要素的比例及其大小关系,进而归纳总结。 2.对地理事物结构特征进行分析评价,并提 出相应对策。 3.采用对比法对地理事物的结构进行对比分析。
21
该组试题以地理信息技术实际应用为背景,考 查考生获取信息和绘图分析(图形转换)的能力,难 度系数不高。试题材料较新颖,考查了GIS在城市 规划中的应用,知识基础应用性强,需要灵活运用 地理信息系统中的图层叠加原理,是一组设计优秀 的实践探究试题,属近年高考的新题型。
统计学数据的图表展示ppt课件

条圆环 直 折 茎 箱
线
形形形 方 线 叶 线
图图图 图 图 图 图
图
雷 达 图
39
3.4 合理使用图表
3.4.1 鉴别图形优劣的准则
有对图形的统 计描述和文字 说明
服务于一个明确 的目的
强调数据间的比较
好图
显示数据 让读者的注意力集 中在图形内容上
避免歪曲
40
3.4.2 统计表的设计
1997~1998年城镇居民家庭抽样调查资料
41
30
(2)箱线图
将一组数据从大到小排列,分别计算出他的上边
缘,上四分位数,中位数,下四分位数,下边缘
,还有一个异常值。
X最小值 QL 中位数 QU
X最大值
4 6 8 10 12
图3-9 简单箱线图
31
分布的形状与箱线图
QL 中位数 QU
QL 中位数 QU
QL 中位数 QU
左偏分布
对称分布
不同分布的箱线图
某车间50名工人日加工零件数分组表
按零件数分组
频数(人)
频率(%)
110以下
3
6
110~114
5
10
115~119
8
16
120~124
14
28
125~129
10
20
130~134
6
12
135以上
4
8
合计
50
100
28
3.3.2 数值型数据的图示
1.分组数据:直方图
用矩形的宽度和高度来表示频数分布的图形,实际 上是用矩形的面积来表示各组的频数分布
35
4.多变量数据的图示 (1)散点图
统计图表课件ppt

1
9
9
3
6
4
9
4
A. 甲运动员的成绩动员的成绩没有明显的差异
D. 甲运动员的最低得分为0分
练习2.下列哪种统计图没有数据的损失, 所有的原始数据都可以从该图中得到 ( ) A. 条形统计图 B. 茎叶图 C. 扇形统计图 D. 折线统计图
应 用
例3.甲、乙两篮球运动员在上赛季每场比赛的得分如下, 试用茎叶图比较这两位运动员的得分水平. 甲:12, 15, 24, 25, 31, 31, 36, 36, 37, 39, 44, 49, 50. 乙:8, 13, 14, 16, 23, 26, 28, 33, 38, 39, 51.
解:
练习3. P23/练习2.
课堂小结
1.统计图表的类型及特点
2.如何适当选择统计图表进行分析.
通过本节课你获得了什么?还有哪些疑问?
布置作业:习题3练习2、3
应用举例
百分数/(%)
身高/cm
10
40
60
0
20
30
50
150以下
不低170
(c)
150~160
160~170
百分数/(%)
身高/cm
10
40
60
0
20
30
50
160以下
不低160
(a)
百分数/(%)
身高/cm
10
40
60
0
20
30
50
150以下
不低160
(b)
150~160
例2.2001年上海市居民的支出构成情况如下表所示:
医疗保健
交通和通讯
教育文化娱乐服务
9
9
3
6
4
9
4
A. 甲运动员的成绩动员的成绩没有明显的差异
D. 甲运动员的最低得分为0分
练习2.下列哪种统计图没有数据的损失, 所有的原始数据都可以从该图中得到 ( ) A. 条形统计图 B. 茎叶图 C. 扇形统计图 D. 折线统计图
应 用
例3.甲、乙两篮球运动员在上赛季每场比赛的得分如下, 试用茎叶图比较这两位运动员的得分水平. 甲:12, 15, 24, 25, 31, 31, 36, 36, 37, 39, 44, 49, 50. 乙:8, 13, 14, 16, 23, 26, 28, 33, 38, 39, 51.
解:
练习3. P23/练习2.
课堂小结
1.统计图表的类型及特点
2.如何适当选择统计图表进行分析.
通过本节课你获得了什么?还有哪些疑问?
布置作业:习题3练习2、3
应用举例
百分数/(%)
身高/cm
10
40
60
0
20
30
50
150以下
不低170
(c)
150~160
160~170
百分数/(%)
身高/cm
10
40
60
0
20
30
50
160以下
不低160
(a)
百分数/(%)
身高/cm
10
40
60
0
20
30
50
150以下
不低160
(b)
150~160
例2.2001年上海市居民的支出构成情况如下表所示:
医疗保健
交通和通讯
教育文化娱乐服务
统计学课件第3章 数据的图表展示

2
All rights reserved
南审理学院
图表的力量(续)
历史上著名的统计图表
拿破仑的大军团进军俄国
Minard绘制的地图,展现了1812年拿破仑的 大军团进军俄国的路线(上半部分)和撤退 时的气温变化(下半部分)。这一历史事件 中,法军数量的急剧减少以及恶劣的气候条 件一览无遗
法国科学家Étienne-Jules Marey称“该图所 展现出的雄辩对历史学家的笔是一种极大的 挑战”
6
All rights reserved
南审理学院
图表的力量(续)
南丁格尔的极坐标面积图:两幅图分别是1854年和1855年的 军队伤亡人数,一年12个月恰好可以将极坐标分为12等分, 每一瓣代表一个月。图中用颜色标记出了三种死亡原因。
7
All rights reserved
南审理学院
图表的力量(续)
3
All rights reserved
南审理学院
图表的力量(续)
4
All rights reserved
南审理学院
图表的力量(续)
这一史诗般的历史时刻被Charles Joseph Minard转换成了信息视觉化 的先驱作品。1861年,这位法国工程师出版了1812-1813征俄战役中法 国部队连续伤亡图解。这幅1861年出版的信息图,以拿破仑在1812征俄 战役中遭遇的灾难为主题。这幅图使用了好几种二维变量:线条的粗细 表示军队的强弱,数字指示关键转折点的军力。从左到右: ——图像顶端最粗的线条表示最初渡河的422,000人,他们一路深入到俄国 领土,在莫斯科停下来的时候还有100,000人左右。从右到左,他们朝 西走回头路,渡过Niemen河的时候,仅仅剩下10,000。随着大部队和 余部会师(比如在渡贝尔齐纳河之前),图中显示的数字降中也有升。 ——图的下半部分是从右往左看的。它用列氏度(将列氏度乘以1¼可以得到 相应的摄氏度,例如-30°R = −37.5 °C)显示了法国军队从俄国撤退 时的气温变化。从莫斯科的接近0°R(译注:原文此处未写明温度,该 数据由原图推断得出。)到这次灾难性冒险结束时的-30°R。 单纯的作图以非常形象的方式表示出了事件的规模以及在短短几个月里 法国军队每况愈下的过程。这幅地图很实在地告诉我们数据视觉化和图 象的交流的魅力:这幅地图通过各种不同的手段,仅仅用图像就描述出 征俄战役惨败的各项重要数据,以及这场灾难是如何发生的。信息设计 及稍后出现的数据视觉化的长处之一就是它能减少看懂一个特定事件的 来龙去脉所需要的时间,同时还能够更好地突出重点。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第3章 数据的图表展示
数据的预处理 品质数据的整理与展示 数值型数据的整理与展示
合理使用图表
统计学数据的图表展示
1
学习目的和要求
通过本章学习,掌握统计数据的分类及数
据的整理。重点掌握统计分组的方 法和次数分布表的编制。能熟练 运用统计软件对数据进行整理。
统计学数据的图表展示
2
3.1 数据的预处理
8
2.分类数据的图示
(1)条形图
➢是用宽度相同的条形的高度或长短来表示数据变 动的图形
➢条形图有单式、复式等形式
➢在表示定类数据的分布时,是用条形图的高度来 表示各类别数据的频数或频率
例3.3
统计学数据的图表展示
9
(2)帕累托图
不同类别的数据根据其频率降序排列的,并在 同一张图中画出累积百分比图
统计学数据的图表展示
12
3.2.2 顺序数据的整理与图示
1.累积频数和累积频率
累积频数:将各有序类别或组的频数逐级累加所 得到的频数。分:向上累积和向下累积。
累积频率:将各有序类别或组的百分比逐级累加。 分:向上累积和向下累积。
例3.5
统计学数据的图表展示
13
3.3 数值型数据的整理与展示
3.3.1 数据分组 将原始数据按照某种标准分成不同的组别,用于 观察数据的分布特征
(缺下限的开口组) 组中值上限 邻组组距
•
2
统计学数据的图表展示
23
实例
某生产车间50名工人日加工零件数如下(单位: 个)。试采用单变量值对数据进行分组
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
•400—600
•600—800
统计学数据的图表展示
•800以上
18
组距分组
(要点)
☺~ ☺
1. 将变量值的一个区间作为一组
☺~ ☺
2. 适合于连续变量 3. 适合于变量值较多的情况 4. 必须遵循“不重不漏”的原则
☺~ ☺ ☺~ ☺
5. 可采用等距分组,也可采用不等距分组 ☺ ~ ☺
统计学数据的图表展示
分布的实际状况
统计学数据的图表展示
15
统计分组
• ☆基本原则:组内同质性,组间差异性 • ☆ 作用: • (1)划分现象的类型 • (2)表明总体内部的结构及整个结构的类型和特征 • (3)揭示现象间的依存关系
统计学数据的图表展示
16
统计分组的形式
1.按分组标志个数不同
• 1)简单分组:把总体只按一个标志分组
组距=( 最大值 - 最小值)÷ 组数 3. 根据分组整理成频数分布表
统计学数据的图表展示
20
分组中要注意的关键
1.选择分组标志 选择分组标志时,一般应考虑原则:
• 根据研究问题的目的和任务选择分组标志 • 在若干标志中,选择能反映问题本质的标志 • 结合现象所处的历史条件具体情况具体分析 2.划分各组的界限:在分组标志的变异范围内,划定各相 邻组之间的性质界限和数量界限
3
3.1.2 数据筛选
例3.1
3.1.3 数据排序:发现数据的基本特征 • 把定量数据按从大到小或从小到大的顺序排列, • 把定性数据按习惯的文字顺序排列,便于我们研
究其条理
方法:升序和降序
统计学数据的图表展示
4
3.1.4 数据透视表
例3.2
统计学数据的图表展示
5
统计数据类型
定类
定序
定距
定比
品质数据
2)复合分组:对同一总体选择两个或两个以上 标志层叠起来进行分组。例如,可以 同时选择 学科、学制、 性别三个标志对某学院全体在校 学生这个总体 进行分组。
2.按分组标志种类不同
如家庭人
• 1) 品质标志分组
• 2) 数量标志分组
A.单项式分组:即变量的一个取值为一
组,适用于离散型变量,并且变量的取值较少。
19
组距分组(步骤)
1. 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,可以按 Sturges 提出的经验公式来确定组数K
K 1 lg(n) lg(2)
• 确定各组的组距:组距(Class Width)是一个组的上限与下限 之差,可根据全部数据的最大值和最小值及所分的组数来确 定,即
3.1.1 数据审核
检查数据中是否有错误。
完整性 审核
•应调查的单位是否有遗漏 •所有的调查项目是否填写齐全
原始 数据
准确性 审核
二手 数据
时效性
适用性
•来源、口径以及有 关的背景材料 •是否符合自己分析 研究的需要
•应尽可能使用最新 的统计数据
•数据是否有错误 •是否存在异常值
统计学数据的图表展示
用双直角坐标系表示,左边纵坐标表示频数,右 边纵坐标表示频率
统计学数据的图表展示
10
(3)饼图 ➢用圆形及园内扇形的面积来表示数值大小的图形 ➢主要用于表示总体中各组成部分所占的比例,对
于研究结构性问题十分有用
例3.3
统计学数据的图表展示
11
(4)环形图
➢环形图是由两个及两个以上大小不一的饼图叠在 一起,挖去中间的部分所构成的图形
统计学数据的图表展示
21
组距分组
(几个概念)
• 下 限:一个组的最小值 • 上 限:一个组的最大值 • 组 距:上限与下限之差 • 组中值:下限与上限之间的中点值
组中值= 下限值+上限值 2
统计学数据的图表展示
22
•
组中值 下限 上(限 闭口组)
•
2
(缺上限的开口组) •
组中值下限 邻组组距 2
口数分组 1人 2人 3人
4人
5人
统计学数据的图表展示
6人
17
2) 数量标志分组
B组距式分组:即每一组有一个
上限值和一个下限值所形成的区间,
适用于连续性变量,或离散型变量 •按销售额分组(万元)
且变量的取值较多不便一一列举的 情况。
•50以下
•50—200
例:对商店按销售额进行分组
•200—400
分组方法
单பைடு நூலகம்量值分组
组距分组
等距分组 异距分组
统计学数据的图表展示
14
组距分组与不等距分组
(在表现频数分布上的差异)
1. 等距分组
• 各组频数的分布不受组距大小的影响 • 可直接根据绝对频数来观察频数分布的特征和规律
2. 不等距分组
• 各组频数的分布受组距大小不同的影响 • 各组绝对频数的多少不能反映频数分布的实际状况 • 需要用频数密度(频数密度=频数/组距)反映频数
数量数据
统计学数据的图表展示
6
四个测定层次的比较
4
量
功
4
化
3
等 级
2
能 包
3
容
2
1
1
统计学数据的图表展示
7
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与展示 1.频数与频数分布
频数:落在各类别中的数据个数。 频数分布:将各类别及落在其中的相应频数列出,用表格形式表 现出来。 例3.3
统计学数据的图表展示
数据的预处理 品质数据的整理与展示 数值型数据的整理与展示
合理使用图表
统计学数据的图表展示
1
学习目的和要求
通过本章学习,掌握统计数据的分类及数
据的整理。重点掌握统计分组的方 法和次数分布表的编制。能熟练 运用统计软件对数据进行整理。
统计学数据的图表展示
2
3.1 数据的预处理
8
2.分类数据的图示
(1)条形图
➢是用宽度相同的条形的高度或长短来表示数据变 动的图形
➢条形图有单式、复式等形式
➢在表示定类数据的分布时,是用条形图的高度来 表示各类别数据的频数或频率
例3.3
统计学数据的图表展示
9
(2)帕累托图
不同类别的数据根据其频率降序排列的,并在 同一张图中画出累积百分比图
统计学数据的图表展示
12
3.2.2 顺序数据的整理与图示
1.累积频数和累积频率
累积频数:将各有序类别或组的频数逐级累加所 得到的频数。分:向上累积和向下累积。
累积频率:将各有序类别或组的百分比逐级累加。 分:向上累积和向下累积。
例3.5
统计学数据的图表展示
13
3.3 数值型数据的整理与展示
3.3.1 数据分组 将原始数据按照某种标准分成不同的组别,用于 观察数据的分布特征
(缺下限的开口组) 组中值上限 邻组组距
•
2
统计学数据的图表展示
23
实例
某生产车间50名工人日加工零件数如下(单位: 个)。试采用单变量值对数据进行分组
117 122 124 129 139 107 117 130 122 125 108 131 125 117 122 133 126 122 118 108 110 118 123 126 133 134 127 123 118 112 112 134 127 123 119 113 120 123 127 135 137 114 120 128 124 115 139 128 124 121
•400—600
•600—800
统计学数据的图表展示
•800以上
18
组距分组
(要点)
☺~ ☺
1. 将变量值的一个区间作为一组
☺~ ☺
2. 适合于连续变量 3. 适合于变量值较多的情况 4. 必须遵循“不重不漏”的原则
☺~ ☺ ☺~ ☺
5. 可采用等距分组,也可采用不等距分组 ☺ ~ ☺
统计学数据的图表展示
分布的实际状况
统计学数据的图表展示
15
统计分组
• ☆基本原则:组内同质性,组间差异性 • ☆ 作用: • (1)划分现象的类型 • (2)表明总体内部的结构及整个结构的类型和特征 • (3)揭示现象间的依存关系
统计学数据的图表展示
16
统计分组的形式
1.按分组标志个数不同
• 1)简单分组:把总体只按一个标志分组
组距=( 最大值 - 最小值)÷ 组数 3. 根据分组整理成频数分布表
统计学数据的图表展示
20
分组中要注意的关键
1.选择分组标志 选择分组标志时,一般应考虑原则:
• 根据研究问题的目的和任务选择分组标志 • 在若干标志中,选择能反映问题本质的标志 • 结合现象所处的历史条件具体情况具体分析 2.划分各组的界限:在分组标志的变异范围内,划定各相 邻组之间的性质界限和数量界限
3
3.1.2 数据筛选
例3.1
3.1.3 数据排序:发现数据的基本特征 • 把定量数据按从大到小或从小到大的顺序排列, • 把定性数据按习惯的文字顺序排列,便于我们研
究其条理
方法:升序和降序
统计学数据的图表展示
4
3.1.4 数据透视表
例3.2
统计学数据的图表展示
5
统计数据类型
定类
定序
定距
定比
品质数据
2)复合分组:对同一总体选择两个或两个以上 标志层叠起来进行分组。例如,可以 同时选择 学科、学制、 性别三个标志对某学院全体在校 学生这个总体 进行分组。
2.按分组标志种类不同
如家庭人
• 1) 品质标志分组
• 2) 数量标志分组
A.单项式分组:即变量的一个取值为一
组,适用于离散型变量,并且变量的取值较少。
19
组距分组(步骤)
1. 确定组数:组数的确定应以能够显示数据的分布特征和规律为目的。
在实际分组时,可以按 Sturges 提出的经验公式来确定组数K
K 1 lg(n) lg(2)
• 确定各组的组距:组距(Class Width)是一个组的上限与下限 之差,可根据全部数据的最大值和最小值及所分的组数来确 定,即
3.1.1 数据审核
检查数据中是否有错误。
完整性 审核
•应调查的单位是否有遗漏 •所有的调查项目是否填写齐全
原始 数据
准确性 审核
二手 数据
时效性
适用性
•来源、口径以及有 关的背景材料 •是否符合自己分析 研究的需要
•应尽可能使用最新 的统计数据
•数据是否有错误 •是否存在异常值
统计学数据的图表展示
用双直角坐标系表示,左边纵坐标表示频数,右 边纵坐标表示频率
统计学数据的图表展示
10
(3)饼图 ➢用圆形及园内扇形的面积来表示数值大小的图形 ➢主要用于表示总体中各组成部分所占的比例,对
于研究结构性问题十分有用
例3.3
统计学数据的图表展示
11
(4)环形图
➢环形图是由两个及两个以上大小不一的饼图叠在 一起,挖去中间的部分所构成的图形
统计学数据的图表展示
21
组距分组
(几个概念)
• 下 限:一个组的最小值 • 上 限:一个组的最大值 • 组 距:上限与下限之差 • 组中值:下限与上限之间的中点值
组中值= 下限值+上限值 2
统计学数据的图表展示
22
•
组中值 下限 上(限 闭口组)
•
2
(缺上限的开口组) •
组中值下限 邻组组距 2
口数分组 1人 2人 3人
4人
5人
统计学数据的图表展示
6人
17
2) 数量标志分组
B组距式分组:即每一组有一个
上限值和一个下限值所形成的区间,
适用于连续性变量,或离散型变量 •按销售额分组(万元)
且变量的取值较多不便一一列举的 情况。
•50以下
•50—200
例:对商店按销售额进行分组
•200—400
分组方法
单பைடு நூலகம்量值分组
组距分组
等距分组 异距分组
统计学数据的图表展示
14
组距分组与不等距分组
(在表现频数分布上的差异)
1. 等距分组
• 各组频数的分布不受组距大小的影响 • 可直接根据绝对频数来观察频数分布的特征和规律
2. 不等距分组
• 各组频数的分布受组距大小不同的影响 • 各组绝对频数的多少不能反映频数分布的实际状况 • 需要用频数密度(频数密度=频数/组距)反映频数
数量数据
统计学数据的图表展示
6
四个测定层次的比较
4
量
功
4
化
3
等 级
2
能 包
3
容
2
1
1
统计学数据的图表展示
7
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与展示 1.频数与频数分布
频数:落在各类别中的数据个数。 频数分布:将各类别及落在其中的相应频数列出,用表格形式表 现出来。 例3.3
统计学数据的图表展示