第2章用图表展示数据

合集下载

应用统计学第2章统计表统计图

应用统计学第2章统计表统计图

对数图可以直观反映时间序列的环比变化趋势
可以在Office图表类型中选择自定义类型中的“对数图” ,也可通过将一般折线图纵轴“坐标轴格式” 中的“刻度” 设为“对数刻度”来绘制对数图。
例:某公司总成本和劳动成本的增长
该公司总成本和劳动成本每年增加相同的数量 ,因而用绝对数据作图时两条线是平行的,不小心 可能会得出劳动成本占总成本固定比例的误解。实 际上第1年占40%,第6年占60%。使用对数图就可以 清晰反映劳动成本有更高的增长率。
“平滑线”复选框,就将折线图转换为曲线图。
⑵经济管理中几种常见的频数分布曲线
①正态分布曲线 ——这是客观事物数量特征上表现得最为普遍的一
类频数分布曲线。 如人的身高、体重、智商,钢的含碳量、抗拉强度
,某种农作物的产量等等。
正态分布曲线
②偏态曲线
——按其长尾拖向哪一方又可分为右偏(正偏)和 左偏(负偏)两类。
1.频数分布表
频数分布表列出了一系列分类数据的频率、总数 或百分比,可以看出不同类别数据间的区别。
表2-1 1 000美元用途的频数分布表
用钱做什么 购买奢侈品、旅游或礼物 向慈善机构捐款 还贷 储蓄 购买必需品 其他
百分比/% 20 2 24 31 16 7
2.条形图
3.圆饼图
4.帕累托图
L = [ 10 × log 10 n ] 茎叶图类似于横置的直方图,但又有区别
直方图可大体上看出一组数据的分布状况,但没有给出 具体的数值 茎叶图既能给出数据的分布状况,又能给出每一个原始 数值,保留了原始数据的信息
未分组数据—茎叶图(茎叶图的制作)
树茎 树叶
数据个数
10 788
3
11 022347778889

统计学 第 2章 数据的图表展示

统计学 第 2章 数据的图表展示
一、统计表的构成
1、 表头(表号、总标题)
2、行标题
3、列标题
4、数字资料
5、表外附加(注解说明或表脚)
二、统计表编制的基本要求
科学、实用、简练、美观
三、统计表种类 人口数字
全球人口 70亿
1、按用途分: 中国人口 13亿
印度人口 12亿 美国人口 3亿
调查表、汇总表、分析表
2、按时间和空间属性分: 日本人口 1.3亿 时间表、空间表、时空表 3、按分组情况分: 简单表:未分组的数据表。 简单分组表:单变量分组的数据表。 并行分组表:多变量分组并行排列的数据表。 交叉分组表(列联表):多变量分组交叉排 列的数据表。
8、数字要如实填写,不能用“同左”
文字表示;
9、合计应放在最后一行。
表2—2
2011~2012年中南商场部分商品销售统计表
计 量 单 位
件 台 吨
商 品 名 称
甲 乙 丙
销售额 (万元) 2011年 2012年 2011年 2012年
(1) 3000 50 800 (2) 3000 60 1000 (3) 30 500 160 (4) 27 540 180
20 18.23
18
16
14
13.65
GDP
12 10.71 10 8.75 8 2000年 2001年 2002年 9.59
(3)计量单位 若全表的计量单位一样,则放在 表外的右上角; 若全表计量单位不一样,则各行 的计量单位,专设一个计量单位栏; 各列计量单位,放在列标题(指标名 称)的左方或下方,并用圆括号括起 来。
4、表脚 填表人、填表时间、资料来源、变量 注解(计算方法、计算口径)等。
5、如果有多张表,则要编表号。 练习: 指出下表中的错误,并将其改正 为一张规范的统计表

第二章 数据的描述性分析 图表展示

第二章 数据的描述性分析 图表展示

例:对学生成绩的分组可以分为0~20分、20~40分、
40~60分、60~80分、80~100组
• 不等距分组 适用于变动很不均匀,且变动幅度大 例:学生成绩分组也可分为0~60(D)、 60~80(C) 80~90(B)、90~100(A) 关键问题:分组数目的确定/组距的确定
3.2.1 数据分组
21
7.0 300 100.0
99
33.0
120
40.0 279
93.0
78
26.0
198
66.0 180
60.0
64
21.3
262
87.3 102
34.0
38
12.7
300
100.0
38
12.7
300 100.0




顺序数据的图示—累计频数分布图
400 累 积 300 户 数 200
(户1)00
根据上述资料编制频数分布表,向上向下累计频数,频率 分布表
居民户月消费品 支出额
751~800 801~850 851~900 901~950 951~1000 1001~1050 1051~1100 1101~1150
合计
频数
1 4 12 18 8 4 1 2 50
频率%
2 8 24 36 16 8 2 4 100
(1)表中数据属于顺序数据
(2)
学历 初中 高中或中专 本科 研究生及以上 合计
频数(人) 13 31 27 29 100
(3) 绘制条形图
学历分布
31
27
29
13
初中
高中或中专
本科
研究生及以上

田间试验与统计方法2 数据类型及其图表展示

田间试验与统计方法2 数据类型及其图表展示
1. 没有调查员协助的情况下由被调查者自己完成调查 问卷;
– 问卷递送方法有:调查员分发、邮寄、网络、媒体
2. 要求调查问卷结构严谨,有清楚的说明; 3. 弱点
– – – – 问卷的返回率比较低; 不适合结构复杂的问卷; 调查周期比较长 ; 数据搜集过程中出现的问题难于及时采取调改措施。
面访式问卷调查
二.试验中的若干问题 三.试验中的统计 四.试验法案例
试验组和对照组
1. 将研究对象分为两组:试验组和对照组; 2. 试验组和随机组的产生应遵循随机原则, 而且应该匹配
– 匹配指对试验单位的背景材料进行分析比 较,将情况类似的每对单位分别随机地分 配到试验组和对照组。
试验中的若干问题
1. 人的意愿
– 群是初级抽样单位,第二阶段抽取的是最终抽样单位。 将该方法推广,使抽样的段数增多,就称为多阶段抽样;
2. 具有整群抽样的优点,保证样本相对集中,节约调 查费用; 3. 需要包含所有低阶段抽样单位的抽样框;同时由于 实行了再抽样,使调查单位在更广泛的范围内展开 4. 在大规模的抽样调查中,经常被采用的方法。
数据的直接来源
(原始数据)
1. 调查数据
– 通过调查方法获得的数据 – 通常是对社会现象而言 – 通常取自有限总体
2. 试验数据
– 通过试验方法得到的数据 – 通常是对自然现象而言 – 也被广泛运用到社会科学中
• 如心理学、教育学、社会学、经济学、管理学等
§3 调查数据
一.概率抽样与非概率抽样
二. 搜集数据的基本方法
– 在相同或近似相同的时间点上收集的数据 – 描述现象在某一时刻的变化情况 – 比如,2002年我国各地区的国内生产总值数据
2. 时间序列数据(time series data)

心理与教育统计学第2章统计图表

心理与教育统计学第2章统计图表

******** * * * *
1 2 3 4 5 6 7 8 9 10 11 12
2.1.1 审核
• 审核是对原始数据进行初步审查与 核实
• 不符合要求的数据主要有三种:缺 失、可疑、失误。
• 缺失:指数据不全或缺项未填;例如一份
资料中未回答的问题占10%以上,或者缺少 关键性资料。
• 可疑:指难以辨认或怀疑其真实性的数据;
2.1.2 数据排序
• 数据排序,就是按照某种标准,对 收集到的杂乱无章的数据进行排列。
• 年龄、性别等 • 数值大小升序或降序排列 • 数据排序是整理数据最简单的方法
2.1.3 统计分组
• 统计分组,根据被研究对象的特征,将 所得数据划分到各个组别中去。
• 分组要以被试对象的本质特征为基础。 • 分类标志要明确,要能包括所有数据
Stem width: 10 Each leaf: 1 case(s)
图2-12 学生身高茎叶图
箱图
100
75%
90
中数 80
25%
70
60
异常值
12
最大值
最小值
图2-13 学生分分数 数箱图
2.2 次数分布表
• 次数分布显示初步整理后一组数据的分布 情况。
• 它能使我们对样本情况有个初步的了解 • 为今后进一步分析和研究问题提供很大方
76.0 77.5 82.0 90.5 81.0 85.5 71.0 80.5 92.5 77.0 88.0 81.0 76.5 67.0 83.0 84.0 84.0 62.0 79.0 72.0 98.0 78.0 78.0 80.0 78.5 76.5 75.0 79.5 86.0 81.5 75.0 84.0 90.0 80.0 86.0 84.5 68.5 71.0 68.0 81.5 79.5 80.5 73.0 93.0 83.0 72.0 68.0 71.0 87.0 78.0 66.0 83.0 87.0 82.5 79.5 80.0 82.0 81.0 86.5 83.5 71.5 83.0 91.0 96.0 75.5 89.0 87.5 69.0 74.0 70.0 77.5 75.0 79.0 79.0 80.5 74.5 77.0 82.5 72.5 73.5 73.5 76.0 88.5 85.0 89.5 78.5 76.0 74.0 98.0 73.0 94.0 79.0 80.0 75.5 83.5 82.0 65.0 74.5 80.0 70.5

试验设计与数据处理第2章试验数据的表图表示

试验设计与数据处理第2章试验数据的表图表示
课后作业
(1)分别做出加药量和剩余浊度、总氮 TN、总磷 TP、CODCr 的变化关系图 (共四张图,要求它们的格式大小一致,并以两张图并列的形式排版到 Word
用Excel做出中下,表注数意据调整带图数形据的点大小的)折;线散点图(1)分别做出加药量和剩余浊度、总 氮总氮TNT、N去总除磷( 率率T2、P、)、C在总OCD一磷OC张r D去T图CP除r中去的率做除变的出率变化加化、关药关C量系系O和图折D浊线C;度r去散(去点除2除图)率率。在的、总一变氮张化T图关N中系去做除折率出线、加散总药点磷量图TP。和去浊除度去除率、
记录表突出原始数据,结果表突出试验结果。
❖ 试验数据不多时,两类表合二为一,不加区别。
将试验数据列成表格,将各变量的数值依照一定的形式和 顺序一一对应起来
(1)试验数据表 ①记录表 试验记录和试验数据初步整理的表格 表中数据可分为三类: ➢ 原始数据 ➢ 中间数据 ➢ 最终计算结果数据
表2-1 离心泵特性曲线测定实验的数据记录表
图14 坐标比例尺对图形形状的影响
解:设2ΔpH=2ΔA=2mm
∵ ΔpH=0.1,ΔA=0.01

横轴的比例尺为 M pH
2mm 2pH
2mm 1(0 mm / 单位pH值) 0.2
纵轴的比例尺为
MA
2mm 2A
2mm 0.01
10(0 mm / 单位吸光度)
2.3 计算机绘图软件在图表绘制中应用
x 0.50 A
E
0.75
xA
1.00
B
0.00
xC
0.25
M

0.50
F
0.25
xB
0.75
xA
0.00

统计图表

统计图表

表号 表号指表的序号,位于表的
左上方,一般以出现的先后顺序 排列。
名称

名称又称标题,是一个表格的名称,应写在表的上 方。标题用语要简练扼要,准确得体,一望即知该 表的内容。

表的序号和标题之间留一个汉字的空格。二者居中
排在顶线的上方,长度不宜超过表的宽度,若标题
字数过多,应转行排列。
标目

标目即分类的项目。标目的好坏决定统计表 的质量,要认真酌定。标目一般在表的上面 一行或左侧一列。如果分类的标志只有一个, 写在表的上行或左列都可以。如果分类的标 志有两个,且二者没有隶属关系,则左列与 上行各一个。如果两个分类标志有隶属关系, 则要放在一个方向(或上面或左侧)分两行 分述。标目确立了数据组织的逻辑,并确定 了栏目下数据栏的性质。


2、数量类别。这是以数据的取值大小为分类标志, 把数据按数值大小以分组或不分组的形式排出一个 顺序来。(等距、比率)
对原始数据排序和分类以后,数量小的就可以直接计算,数量大时再做进一 步分组,编制统计表、统计图为以后的分析打下基础。

三、统计表




1、定义:统计表是用来表达统计指标与被说明 事物之间数量关系的表格。 统计指标:在对数据进行统计分类以后,得到的 各种数量结果称为统计指标。 2、作用:简洁、清晰、准确、一目了然,明显 地反映出事物的全貌及其蕴含的特征,省去冗长 的文字叙述,便于分析、比较、计算和记忆。 3、结构

图题的文字要言简意赅,具有说明性和专指性,使
人一看就能知道该图所要显示的是何事、何物,发 生于何时、何地。如果图示资料比较复杂,这时图
题可用大标题与小标题呈现。图题的字体要与整个
图形的大小相称,一般是图中使用的最大号的文字。

第2章 数据的图表展示 (3)

第2章   数据的图表展示 (3)

矿泉水 碳酸饮料 绿茶 其他 果汁 绿茶 其他 矿泉水
购买者性别的记录。试
为研究不同类型饮料的市场销售情况,一家市场调查公司对随 观察饮料类型和顾
顾客性别 女 男 男 女 男 男 女 女
饮料类型 碳酸饮料 绿茶 矿泉水 矿泉水 碳酸饮料 矿泉水 碳酸饮料 绿茶
男 男 女 女 男 男 男 女 男
果汁 碳酸饮料 矿泉水 其他 碳酸饮料 绿茶 碳酸饮料 其他 矿泉水
问题:
1、表中数据是什么类型的数据? 2、应该用什么方法Biblioteka 分析它? 3、可以直接用来分析吗?
市场调查公司对随机抽取的一家超市进行调查。下表是调查员随机观察 观察饮料类型和顾客性别的分布状况,并进行描述性分析,生成频数分
顾客性别及购买饮料类型
顾客性别 女 男 男 女 男 男 女 男 饮料类型 碳酸饮料 绿茶 其他 碳酸饮料 绿茶 绿茶 碳酸饮料 碳酸饮料
女 男 女 女 女 男 男 女 男
绿茶 矿泉水 绿茶 碳酸饮料 矿泉水 其他 碳酸饮料 果汁 矿泉水
下表是调查员随机观察的50名顾客购买的饮料类型及购买者性别的记录 描述性分析,生成频数分布表。
顾客性别 女 女 女 女 男 女 女 女
饮料类型 其他 碳酸饮料 其他 果汁 绿茶 果汁 碳酸饮料 果汁
男 女 女 女 女 男 女 女
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

chart)
饮料类型
帕累托图
(pareto chart)
1. 按各类别 数据出现 的频数多 少排序后 绘制的柱 形图
2. 用于展示 分类数据 的分布
频数
16
15
12
11 10
886来自40 碳酸饮料
绿茶
矿泉水 饮料类型
其他
果汁
饼图
(pie Chart)
1. 用圆形及圆内扇形
其他 16%
的角度来表示数值
【例】某电脑 公司2008年前 4个月各天的 销售量数据(单 位:台)。生成 一张频数分布
表观察销售额 分布的特征
生成频数分布表
(例题分析)
生成频数分布表
(例题分析)
1. 确定组数:组数的确定应以能够显示数据的分布特征 为目的。在实际分组时,组数一般为5K 15。本例 中由于数据较多,可考虑分为10组
统计学
(第三版)
统计名言 图并没有说谎,是说谎者在画图。
——Benjamin Disraeli
第 2 章 用图表展示数据
2.1 用图表展示定性数据 2.2 用图表展示定量数据 2.3 合理使用图表
学习目标
定性数据的频数分布表 定性数据的图示方法 定量数据的频数分布表 定量数据的图示方法 用Excel和SPSS作频数分布表和图形 合理使用图表
生成频数分布表
(定性数据)
不同类型饮料的频数分布
定性数据的描述统计量
1. 频数(frequency) :落在各类别中的数据个数 2. 比例(proportion) :某一类别数据个数占全
部数据个数的比值 3. 百分比(percentage) :将对比的基数作为100
而计算的比值 4. 比率(ratio) :不同类别数值个数的比值
第 2 章 用图表展示数据
2.1 用图表展示定性数据
2.1.1 生成频数分布表 2.1.2 定性数据的图示
2.1 用图表展示定性数据 2.1.1 生成频数分布表
生成频数分布表
(定性数据)
1.列出各类别 2. 计算各类别的频数 3. 生成频数分布表
☺☺☺ ☺☺
分类 A B C
频数
比例
百分比 比率
第1步:选择【数据】菜单中的【数据透视表和数据透视图】 第2步:确定数据源区域 第4步:在【向导—3步骤之3】中选择数据透视表的输出位置
。然后选择【布局】 第5步:在【向导—布局】对话框中,依次将“分类变量“(这里
是饮料品牌)连续拖放两次:一次拖至左边的“行”区域 ,一次拖至 “数据”区域 第6步:然后单击【确定】,自动返回【向导—3步骤之3】对 话框。然后单击【完成】,即可输出数据透视表
大小的图形,主要
用于表示一个样本 绿茶 (或总体)中各组成 22%
部分的数据占全部
数据的比例
用于研究结构问题
果汁 12%
矿泉水 20%
碳酸饮料 30%
环形图
(doughnut chart)
1. 环形图中间有一个“空洞”,样本或总 体中的每一部分数据用环中的一段表示
2. 与饼图类似,但又有区别
饼图只能显示一个总体各部分所占的比 例
2.1 用图表展示定性数据 2.1.2 定性数据的图示
条形图
(bar Chart)
1. 用 宽 度 相 同 的 16 条形的高度
15
或 长 短 来 表 12 示各类别数
10
11
频数

8
2. 各 类 别 可 放 在
8
6
纵轴,称为
4
条形图,可
以放在横轴, 称为柱形图
0
果汁
矿泉水 碳酸饮料 绿茶
其他
(column
D
E
生成频数分布表
(定性数据)
【例】一家市场调查公 司为研究不同类型饮料 的市场占有率,对随机 抽取的一家超市进行调 查。下面的表是调查员 随 机 观 察 的 50 名 顾 客 购买的饮料类型记录。 生成一张频数分布表, 观察不同类型饮料的销 售分布状况
使用Excel数据透视表数计数
(pivot table)
环形图则可以同时绘制多个样本或总体 的数据系列,每一个样本或总体的数据 系列为一个环
3. 用于结构比较研究
环形图
(doughnut chart)
【例】2006年北京、上海和天津地区按收入法计算 的地区生产总值(按当年价格计算)数据。绘制环形 图比较三个地区的生产总值构成
环形图
(doughnut chart )
3. 统计出各组的频数。每个组的数据满足a<xb(上限 值不在内
注:也可以按 Sturges 提出的经验公式来 确定组数K
男学生更容易逃课吗?
逃课情况

几乎一次不逃
28
1到3次
24
3到5次
6
5次以上
3
其他
1
合计
62

合计
49
77
31
55
4
10
3
6
2
3
89
151
你认为男学生更容易逃课吗?用哪些简单的统计描述支持你的看法?如果 要用图形表现上面的数据,反映男女学生逃课方面的差异、逃课次数的 构成以及男女学生在逃课方面是否具有相似性等等,有哪些图形可供你 选择使用呢?
男学生更容易逃课吗?
➢ 读完四年大学,一次课也没有逃过,这样的学 生恐怕不多。2004年5月,中国人民大学财政金 融学院的3名学生就逃课问题做了一次调查。调 查的对象是财政金融学院的大一,大二,大三 本科生。样本的抽取方式是分层抽样与简单随 机抽样结合,先根据年级划分层次,然后对各 个班级简单随机抽样,共抽取151名学生组成一 个样本,并对每个学生采用问卷调查。问卷内 容包括每周逃课次数、所逃课程的类型(选修 课、专业课等等)和逃课原因等。调查得到的 男女学生每周平均逃课次数的汇总表如下
2. 确定组距:组距(Class Width)是一个组的上限与下 限之差,可根据全部数据的最大值和最小值及所分的 组数来确定,即 组距=( 最大值 - 最小值)÷ 组数 例 如 , 本 例 最 大 值 为 237 , 最 小 值 为 141 , 组 距 =(237-141)÷10 = 9.6 。 为 便 于 计 算 , 组 距 宜 取 5 或 10的倍数,且第一组的下限应低于最小变量值,最 后一组的上限应高于最大变量值,因此组距可取10
北京、上海和天津地区按收入法计算的地区生产总值
31% 25%
36%
32% 36% 44%
16%
15% 17% 14%
18% 16%
劳动者报酬 生产税净额 固定资产折旧 营业盈余
第 2 章 用图表展示数据
2.2 用图表展示定量数据
2.2.1 生成频数分布表 2.2.2 定量数据的图示
2.1 用图表展示定性数据 2.2.1 生成频数分布表
相关文档
最新文档