统计学数据的图表展示ppt课件
合集下载
章节用图表展示数据 共72页PPT资料

女
28 56.0
56.0
100.0
Total 50 100.0
100.0
2 - 12
统计学 用SPSS生成定性数据的列联表
STATISTICS (第四版)
(Crosstabulation—交叉表)
第1步:选择【Analyze】【Descriptive Statistics-
Crosstabs】进入主对话框
15 100.0% 30.0% 30.0%
50 100.0% 100.0% 100.0%
行 百 分 比
列 百 分 比
统计学
STATISTICS (第四版)
列联表的描述性分析
(例题分析—SPSS)
行百分比
列联表的统计描述
顾客 性别
Total
顾 客 性 别 * 饮 料 类 型 Cr osstabulation
4 36.4% 14.3% 8.0%
6 75.0% 21.4% 12.0%
9 60.0% 32.1% 18.0%
28 56.0% 100.0% 56.0%
T otal 6
100.0% 12.0% 12.0%
10 100.0% 20.0% 20.0%
11 100.0% 22.0% 22.0%
8 100.0% 16.0% 16.0%
用圆形及圆内 扇形的角度来 表示数值大小 的图形,主要 用于表示一个 样本(或总体) 中各组成部分 的数据占全部 数据的比例 用于研究结构 问题
2 - 21
简单饼图
(pie Chart)
统计学
STATISTICS (第四版)
主要用于展
示两个或多 个分类变量 的构成比较, 比如,在男 女分类的基 础上又增加 了饮料类型 的分类。
第二章-统计图表ppt课件

.
示例:小教本011教育统计学单元考试学生成绩频数分布直
方图
16
14
12
50-
10
60-
8
70-
6
80-
90-
4
2
0
.
多边图
多边图表示连续性随机变量次数分布的线性图。 绘制多边形图时,横坐标是以各分组区间组中值表示的连续变量,纵坐 标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐 标标点,连接各点,就成为一条折线。 多边形图与直方图虽然都是以面积表示表示连续性数据的次数分布,但 多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。 如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。 这样就能够对于总体的理论次数分布的分析提供很多有用的信息
.
其他常用的统计图的类型
(2)圆形图 圆形图主要用于描述间断性资料,目的为显示各部分在整体中所占
的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如 百分数)为主。
.
其他常用的统计图的类型
(3)线形图 线形图更多地用于连续资料,凡欲表示两个变量之间的函数关系,
或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的 情形,用线性图表示是较好的方法。
.
示例:小教本011教育统计学单元考试学生成绩频数分
布多边图
.
累加频数分布图
它的画法同次数多边形基本相同,不同点是横坐标为每分组区间的精确上 限或下限,纵坐标是各分组的累加次数,分别标出各个交点,连接各交点 即可画成累加曲线,也叫S型曲线
示例:小教本011教育统计学单元考试学生成绩频
数分布多边图
.
累加频数分布表
示例:小教本011教育统计学单元考试学生成绩频数分布直
方图
16
14
12
50-
10
60-
8
70-
6
80-
90-
4
2
0
.
多边图
多边图表示连续性随机变量次数分布的线性图。 绘制多边形图时,横坐标是以各分组区间组中值表示的连续变量,纵坐 标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐 标标点,连接各点,就成为一条折线。 多边形图与直方图虽然都是以面积表示表示连续性数据的次数分布,但 多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。 如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。 这样就能够对于总体的理论次数分布的分析提供很多有用的信息
.
其他常用的统计图的类型
(2)圆形图 圆形图主要用于描述间断性资料,目的为显示各部分在整体中所占
的比重大小,以及各部分之间的比较。圆形图显示的资料多以相对数(如 百分数)为主。
.
其他常用的统计图的类型
(3)线形图 线形图更多地用于连续资料,凡欲表示两个变量之间的函数关系,
或描述某种现象在时间上的发展趋势,或一种现象随另一种现象变化的 情形,用线性图表示是较好的方法。
.
示例:小教本011教育统计学单元考试学生成绩频数分
布多边图
.
累加频数分布图
它的画法同次数多边形基本相同,不同点是横坐标为每分组区间的精确上 限或下限,纵坐标是各分组的累加次数,分别标出各个交点,连接各交点 即可画成累加曲线,也叫S型曲线
示例:小教本011教育统计学单元考试学生成绩频
数分布多边图
.
累加频数分布表
第三章统计资料的呈现统计图表PPT课件

M 1 2 ex(6 )x(7 )1 24 3 46 4.5 4
註: Min | xi - A| A = Me (中位數)
2021
15
3.1.3 眾數
眾數(mode): 指資料中出現次數最多的數或分組名稱則稱此為眾 數以Mo表示。當數據或名稱各只出現一次時,眾數 便不存在,但因次數可能相同,故眾數可能不唯一。 屬質資料的集中趨勢統計量數,用眾數表示最為適 當。
計算方法 將資料由小到大排序寫成x(1), x(2), …, x(n)
M
ex12(n2x1()n2)
x n
( 1) 2
如果n為奇數 如果n為偶數
2021
14
續例3.1
求12位學生的體重之中位數? 解:
全班12位學生的體重分別為38、46、43、51、54、50、40、 48、39、42、54、35公斤。 將12位學生的體重由小到大排序如下:35,38,39,40, 42,43,46,48,50,51,54,54,因為n=12為偶數,故 中位數為排序第六和第七位數值的平均,即
解:
1 N
N i1
xi
1 384643515450404839425435
12
1 54045
12
x
1 n
n i 1
xi
45
2021
7
例: 平均數
已知樣本資料2,3,5,10,15,若其中有所誤植,15應 為85才正確,問平均數有何變化?
解: 根據誤植的資料,則樣本平均數為(2+3+5+10+15)/15=7; 若將15改為85,則樣本平均值變為21,為原值的三倍。
1
N
N
xi
i 1
註: Min | xi - A| A = Me (中位數)
2021
15
3.1.3 眾數
眾數(mode): 指資料中出現次數最多的數或分組名稱則稱此為眾 數以Mo表示。當數據或名稱各只出現一次時,眾數 便不存在,但因次數可能相同,故眾數可能不唯一。 屬質資料的集中趨勢統計量數,用眾數表示最為適 當。
計算方法 將資料由小到大排序寫成x(1), x(2), …, x(n)
M
ex12(n2x1()n2)
x n
( 1) 2
如果n為奇數 如果n為偶數
2021
14
續例3.1
求12位學生的體重之中位數? 解:
全班12位學生的體重分別為38、46、43、51、54、50、40、 48、39、42、54、35公斤。 將12位學生的體重由小到大排序如下:35,38,39,40, 42,43,46,48,50,51,54,54,因為n=12為偶數,故 中位數為排序第六和第七位數值的平均,即
解:
1 N
N i1
xi
1 384643515450404839425435
12
1 54045
12
x
1 n
n i 1
xi
45
2021
7
例: 平均數
已知樣本資料2,3,5,10,15,若其中有所誤植,15應 為85才正確,問平均數有何變化?
解: 根據誤植的資料,則樣本平均數為(2+3+5+10+15)/15=7; 若將15改為85,則樣本平均值變為21,為原值的三倍。
1
N
N
xi
i 1
统计学数据的图表展示详解演示文稿

符合特定条件的数据予以剔出
2020/11/20
【例3.1 】学生四门课程的成绩数据筛选
表3-1 8名学生考试成绩
2020/11/20
第一步:选择【工具 】菜单,并选择【筛选 】,如果要筛 选出给定条件的数据,可使用【自动筛选 】命令,如图3-1所示:
这时会在第一行出现下拉键头,用鼠标点击箭头会出现如图3-2 所示的结果
2020/11/20
3.1.2 数据的筛选
1. 对审核过程中发现的错误应尽可能予以纠正 2. 当发现数据中的错误不能予以纠正,或者有
些数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选 3. 数据筛选的内容包括:
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除
▪ 将符合某种特定条件的数据筛选出来,而不
其他, 8, 16.00%
果汁, 6, 12.00% 矿泉水, 10, 20.00%
绿茶, 11, 22.00%
图3-16
2020/11/20
定类数据整理—频数分布表 (实例)
【 例 3.4】 为 研究 广 告市 场 的状况,一家广告公司在某 城 市 随 机 抽 取 200 人 就 广 告 问题做了邮寄问卷调查,其 中的一个问题是“您比较关 心下列哪一类广告?”
图2-10
第五步:在上面的【数据透视表和数据透视向 导——布局】对话框中,依次将“性别”和“买衣物 首选因素”拖至左边的“行”区域,将“家庭所在地” 拖至上边的“列”区域,将“平均月生活费”和“月 平均衣物支出”拖至“数据”区域。如图3-11所示。
图3-11根据需要建立【数据透视表和数据透视图向导——布局】
16 0.080 8.0
招生招聘广告 10 0.050 5.0
2020/11/20
【例3.1 】学生四门课程的成绩数据筛选
表3-1 8名学生考试成绩
2020/11/20
第一步:选择【工具 】菜单,并选择【筛选 】,如果要筛 选出给定条件的数据,可使用【自动筛选 】命令,如图3-1所示:
这时会在第一行出现下拉键头,用鼠标点击箭头会出现如图3-2 所示的结果
2020/11/20
3.1.2 数据的筛选
1. 对审核过程中发现的错误应尽可能予以纠正 2. 当发现数据中的错误不能予以纠正,或者有
些数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选 3. 数据筛选的内容包括:
▪ 将某些不符合要求的数据或有明显错误的数
据予以剔除
▪ 将符合某种特定条件的数据筛选出来,而不
其他, 8, 16.00%
果汁, 6, 12.00% 矿泉水, 10, 20.00%
绿茶, 11, 22.00%
图3-16
2020/11/20
定类数据整理—频数分布表 (实例)
【 例 3.4】 为 研究 广 告市 场 的状况,一家广告公司在某 城 市 随 机 抽 取 200 人 就 广 告 问题做了邮寄问卷调查,其 中的一个问题是“您比较关 心下列哪一类广告?”
图2-10
第五步:在上面的【数据透视表和数据透视向 导——布局】对话框中,依次将“性别”和“买衣物 首选因素”拖至左边的“行”区域,将“家庭所在地” 拖至上边的“列”区域,将“平均月生活费”和“月 平均衣物支出”拖至“数据”区域。如图3-11所示。
图3-11根据需要建立【数据透视表和数据透视图向导——布局】
16 0.080 8.0
招生招聘广告 10 0.050 5.0
《统计学》课件-第3章

喜茶 合计
13
16.3
9
11.3
22
27.5
80
100.0
16.3 11.3
27.5 100.0
61.3 72.5
100.0
6
类别数据的图表展示
• 解:接下来,我们可能会猜想不同性别的消费者对于奶茶品牌的偏好是否存在差异? 制作“性别”和“奶茶品牌”两个变量的交叉频数分布表可以帮助我们直观地判断一 下。SPSS生成的(默认)结果如表3-4所示。
表3-7 150名“网约车”司机日营业额频数分布表
有效
200~250 250~300 300~350 350~400 400~450 450~500 500~550 550~600 600~650 650~700 合计
频率 7 12 22 38 29 20 12 5 3 2
150
百分比 4.7 8.0 14.7 25.3 19.3 13.3 8.0 3.3 2.0 1.3
• 其次,确定各组的组距。组距是每一组的区间范围,即组上限与组下 限的差值。如果每一组的组距都相等,称为等距分组,否则为不等距 分组。等距分组是最常见的分组方式,组距可根据全部数据的最大值 和最小值及所分的组数来确定,计算公式为: 组距=(最大值-最小值)÷组数
• 最后,根据区间的划分统计出各组包含的数据个数及相应的比例,制 作频数分布表。
5 10.9% 55.6%
6.3%
9 11.3%
100.0%
11.3%
喜茶 12 35.3% 54.5%
15.0%
10 21.7% 45.5%
12.5%
22 27.5%
100.0%
27.5%
合计 34 100.0% 42.5%
13
16.3
9
11.3
22
27.5
80
100.0
16.3 11.3
27.5 100.0
61.3 72.5
100.0
6
类别数据的图表展示
• 解:接下来,我们可能会猜想不同性别的消费者对于奶茶品牌的偏好是否存在差异? 制作“性别”和“奶茶品牌”两个变量的交叉频数分布表可以帮助我们直观地判断一 下。SPSS生成的(默认)结果如表3-4所示。
表3-7 150名“网约车”司机日营业额频数分布表
有效
200~250 250~300 300~350 350~400 400~450 450~500 500~550 550~600 600~650 650~700 合计
频率 7 12 22 38 29 20 12 5 3 2
150
百分比 4.7 8.0 14.7 25.3 19.3 13.3 8.0 3.3 2.0 1.3
• 其次,确定各组的组距。组距是每一组的区间范围,即组上限与组下 限的差值。如果每一组的组距都相等,称为等距分组,否则为不等距 分组。等距分组是最常见的分组方式,组距可根据全部数据的最大值 和最小值及所分的组数来确定,计算公式为: 组距=(最大值-最小值)÷组数
• 最后,根据区间的划分统计出各组包含的数据个数及相应的比例,制 作频数分布表。
5 10.9% 55.6%
6.3%
9 11.3%
100.0%
11.3%
喜茶 12 35.3% 54.5%
15.0%
10 21.7% 45.5%
12.5%
22 27.5%
100.0%
27.5%
合计 34 100.0% 42.5%
统计图表培训讲义(PPT 68张)

章
各种科学研究的结果大多以数据的形式出现, 这些直接获得的数据称为原始数据或观测数据, 他们纷乱无章,只有经过整理分析才能从中提取 出有用的信息构成规律性的知识。
第一节 数据的初步整理
第二节 次数分布表
第三节 次数分布图
第四节 其他类型的统计图表
第一节 数据的初步整理
一、数据排序
二、统计分组
排列后会使数据之间的某种关系有所显示。
数据排序是整理数据最简单的方法。
排序方法:升序和降序。
不同数据的排序 (一)字符型数据
汉字按拼音或笔画;英文按字母顺序。
(二)数值型数据
排序后可以划分等级,确定名次。
等级的划分要看数据及其所反映的事物本身的 性质和研究目的而定。如智商、身高、跑步时间、 错误次数等。
一、简单次数分布表
简单次数分布表:依据每一个分数值在一列数
据中出现的次数或总计数资料编制成的统计表。
表3 高一班成绩表
性别 男生 女生 合计
n 26 24 50
比较适用于按类别分的计数资料
二、分组次数分布表表的编制
当一列连续性测量数据的数据个数很多,分数的分布范 围又比较大时,就适合使用分组次数分布表了。
统计图的基本内容 1、图题和图号 图题:图的名称 要求简明扼要,字体最大 图号:图的序号 图题和图号之间要空一个汉字 与统计表不同,统计图的标题置于图的正下方
2、图目和图轴
图目:基线上观察对象的内容 类别 名称 时间 成绩 统计量等
横轴(基线):图目内容。
图轴
等距,左→右,小→大 纵轴:频数,百分频数。 等距,0起点,下→上
图形 主要内容 线条最粗
各种科学研究的结果大多以数据的形式出现, 这些直接获得的数据称为原始数据或观测数据, 他们纷乱无章,只有经过整理分析才能从中提取 出有用的信息构成规律性的知识。
第一节 数据的初步整理
第二节 次数分布表
第三节 次数分布图
第四节 其他类型的统计图表
第一节 数据的初步整理
一、数据排序
二、统计分组
排列后会使数据之间的某种关系有所显示。
数据排序是整理数据最简单的方法。
排序方法:升序和降序。
不同数据的排序 (一)字符型数据
汉字按拼音或笔画;英文按字母顺序。
(二)数值型数据
排序后可以划分等级,确定名次。
等级的划分要看数据及其所反映的事物本身的 性质和研究目的而定。如智商、身高、跑步时间、 错误次数等。
一、简单次数分布表
简单次数分布表:依据每一个分数值在一列数
据中出现的次数或总计数资料编制成的统计表。
表3 高一班成绩表
性别 男生 女生 合计
n 26 24 50
比较适用于按类别分的计数资料
二、分组次数分布表表的编制
当一列连续性测量数据的数据个数很多,分数的分布范 围又比较大时,就适合使用分组次数分布表了。
统计图的基本内容 1、图题和图号 图题:图的名称 要求简明扼要,字体最大 图号:图的序号 图题和图号之间要空一个汉字 与统计表不同,统计图的标题置于图的正下方
2、图目和图轴
图目:基线上观察对象的内容 类别 名称 时间 成绩 统计量等
横轴(基线):图目内容。
图轴
等距,左→右,小→大 纵轴:频数,百分频数。 等距,0起点,下→上
图形 主要内容 线条最粗
§13_统计图表(PPT37页)

思考2.什么叫折线统计图? 有什么特点?
金牌/枚
届数
用一定的单位长度表示一定的数量, 根据数量的多少 画出各点. 然后, 把各点用线段顺次连接起来, 形成折线, 用折线的升降来表示数量之间的关系及变化趋势的图形 叫作折线统计图. 折线统计图可以表示一种数量的增减变化情况, 也可以 表示几种数量的相互依存和发展变化的趋势情况.
及服务
健
信
娱乐服务
居住
杂项商品和 服务
39.4%
5.9%
2001年上海 市居民支出 构成情况扇 形统计图
6.2%
7.0%
居住 11.4%
教育文化 娱乐服务
15.9%
10.7%
15.9%
11.4%
3.5%
杂项商品和服务3.5%
食品 39.4%
交通和通信10.7% 医疗保健7.0%
衣着5.9% 家庭设备用品及服务6.2%
茎是指中 间的一列 数,表示 得分的十 位数字
叶就是从 茎的旁边 生长出来 的数,表 示得分的 个位数字
我们通常把上述统计图叫做茎叶图. 优点:①茎叶图上没有信息的损失,所有的原始数 据都可以从这个茎叶图中得到.
②茎叶图可以随时记录,且能随时观察到数 据的一些特征,从而及时对数据进行分析. 缺点:当数据的量很大或有多组数据时不直观、不 清晰.
丁县 13% 丙县 20%
乙县 15%
甲县 52%
解:(1)甲县有300 000×52%=156 000(人);
(2)乙县和丁县共有300 000×(13%+15%)=84 000(人);
(3)甲县和丙县相差300 000×(52%-20%)=96 000(人).
5.在某马拉松比赛中,前30名男运动员的成绩 (单位:分)排列如下: 129,130,130,133,134,135,136,136,138,138, 138,141,141,141,142,142,142,142,143,143, 143,143,143,144,144,145,145,145,145,145. 请用适当的方式把上面的信息表示出来.
应用统计学--第2章数据的图表展示

例如:说明词
员工满意度问卷调查 尊敬的员工:每年我们都对员工进行调查以 有助于我们为您提供最好的工作环境。请花费一 点时间填写如下简短的调查表。对您的回答内容 我们会绝对保密。提前谢谢您对本研究的参与和 支持!
问卷编排顺序
时间顺序 内容顺序,先易后难 类别顺序:静态、行为、态度 先封闭后开放等
例如:
您家里安装了空调吗
安装了
没有安装
目前的工作给我一种成就感。
很同意
同意
很难说 不同意
您的年收入是多少?
2万元以下 2万-3万 3万-4万 4万元以上
非结构型问卷 ✓ 开放型提问
即指所提问题不列出备选答案,答题类型也不作出任何 具体规定,而由被调查者根据自己的想法用文字表达自 己的意见。
例如:
*问卷组织者的行为和态度,不能对被调查者产生引导作用 。
• 问句常用的方式
是否式:用是、否、能、不能表示; 例:这种学习方式是否帮助您解决了学习矛盾?
是( ) 否( ) 选择式:包括类别型、条件型、等距型等; 例:类别型
如:您最喜欢的面对面的教学方式是: 系统讲授( ) 总结归纳( ) 讨论( ) 答疑( ) 辅导( ) 其他( ) 例:等距型 如:学校提供的上网服务适合您的需要吗? 适合( ) 基本适合( ) 一般( ) 基本不适合( ) 不适合( )
列标题
2.2.1 分类数据的整理与图示 2.2.2 数值型数据的整理与图示
1. 要弄清所面对的数据类型
不同类型的数据,采取不同的处理方式和方法
2. 对分类数据和顺序数据主要是作分类整理
3. 对数值型数据则主要是作分组整理
4. 适合于低层次数据的整理和显示方法也适合 于高层次的数据;但适合于高层次数据的整 理和显示方法并不适合于低层次的数据