第3章_数据的图表展示

合集下载

统计学-第三章-数据的图表展示

统计学-第三章-数据的图表展示

3.一般;4.满
意;5.非常满意。 合计
300 100.0 —



顺序数据的频数分布表(例题分析)
回答类别
乙城市家庭对住房状况评价的频数分布
乙城市
户数 百分比 (户) (%)
向上累积
户数 百分比 (户) (%)
向下累积
户数 百分比 (户) (%)
非常不满意 21
不满意
99
一般
78
满意
64
非常满意
7%
10% 8%
15% 21%
33% 36%
31% 26%
甲乙两城市家庭对住房状况的评价
非常不满意 不满意 一般 满意 非常满意
3.3数值型数据的整理与显示
1 数据分组
2
数值型数据的 图示
组距分组(要点)
☺~☺ ☺~☺ ☺~☺ ☺~☺ ☺~☺
1.将变量值的一个区间作为一组 2.适合于连续变量 3.适合于变量值较多的情况 4.需要遵循“不重不漏”的原则 5.可采用等距分组,也可采用不等距分组
等距分组表(上下组限重叠)
等距分组表(上下组限间断)
等距分组表(使用开口组)
1 数据分组
2
数值型数据的 图示
直方图和折线图
分组数据—直方图和折线图
Excel
分组数据—直方图(histogram)
用于展示分组数据分布的一种图形 用矩形的宽度和高度来表示频数分布 本质上是用矩形的面积来表示频数分布 在直角坐标中,用横轴表示数据分组,纵轴表 示频数或频率,各组与相应的频数就形成了一 个矩形,即直方图
分类数据整理—频数分布表(例题分析)
分类数据整理—频数分布表(例题分析)
分类数据整理—频数分布表(例题分析)

统计学各章选择题(有答案)

统计学各章选择题(有答案)

数据的搜集1,二手数据的特点是()A采集数据的成本低,但搜集比较困难B采集数据的成本低,搜集比较容易C数据缺乏可靠性D不适合自己研究的需要2,从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每个元素都有相同的机会被抽中,这样的抽样方式称为()A简单随机抽样B分层抽样C系统抽样D整群抽样3,从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直到抽取n个元素为止,这样的抽样方法称为()A重复抽样B不重复抽样C分层抽样D整群抽样4,一个元素被抽中后不再放回总体,然后再从所剩下的元素中抽取第二个元素,直到抽取n个元素为止,这样的抽样方法称为()A重复抽样B不重复抽样C分层抽样D整群抽样5,在抽取之前先将总体的元素划分为若干类,然后从各个类中抽取一定量的元素组成一个样本,这样的抽样方式称为()A简单随机抽样B分层抽样C系统抽样D整群抽样6,先将总体各个元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。

这样的抽样方式称为()A简单随机抽样B分层抽样C系统抽样D整群抽样7,先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的的所有元素进行观察,这样的抽样方式称为()A简单随机抽样B分层抽样C系统抽样D整群抽样8,为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是()A简单随机抽样B整群抽样C系统抽样D分层抽样9,为了调查某校学生的购书费用支出,从全校中抽取4个班级调查,这种调查方法是()A简单随机抽样B系统抽样C分层抽样D整群抽样10,为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法()A简单随机抽样B整群抽样C系统抽样D分层抽样11,为了调查女性对某种品牌化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。

贾俊平《统计学》(第7版)考研真题与典型题详解-第3章 数据的图表展示【圣才出品】

贾俊平《统计学》(第7版)考研真题与典型题详解-第3章 数据的图表展示【圣才出品】

第3章数据的图表展示一、单项选择题1.对于大批量的数据,最适合描述其分布的图形是()。

[中国海洋大学2018研] A.条形图B.茎叶图C.直方图D.饼图【答案】C【解析】在应用方面,直方图通常适用于大批量数据,茎叶图通常适用于小批量数据。

条形图是用宽度相同的条形的高度或长短来表示数据多少的图形;饼图是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分的数据占全部数据的比例。

2.下面哪个图形保留了原始数据的信息?()[对外经济贸易大学2015研]A.直方图B.茎叶图C.条形图D.箱线图【答案】B【解析】茎叶图是保留并反映原始数据分布的图形,它由茎和叶两部分构成,其图形是由数字组成的。

ACD三项都需要对原始数据进行处理,求得一些测度值之后再作出图形。

3.用于显示时间序列数值型数据,以反映事物发展变化的规律和趋势的图是()。

[重庆大学2013研]A.直方图B.箱线图C.茎叶图D.线图【答案】D【解析】如果数值型数据是在不同时间上取得的,即时间序列数据,则可以绘制线图。

线图主要用于反映现象随时间变化的特征。

4.雷达图的主要用途是()。

[浙江工商大学2011研、安徽财经大学2012样题] A.反映一个样本或总体的结构B.比较多个总体的构成C.反映一组数据的分布D.比较多个样本的相似性【答案】D【解析】雷达图在显示或对比各变量的数值总和时十分有用。

假定各变量的取值具有相同的正负号,则总的绝对值与图形所围成的区域成正比。

此外,利用雷达图也可以研究多个样本之间的相似程度。

5.美国汽车制造商协会想了解消费者购车时的颜色偏好趋势,抽取新近售出的40辆车并记录其颜色种类(黑、白、红、绿、棕)和深浅类型(亮色、偏淡、中等、偏浓);你认为以下展示数据的图表中,哪一种不适合用来处理这一样本数据?()[中山大学2011研]A.散点图B.饼图C.条形图D.频数图【答案】A【解析】散点图是用二维坐标展示两个变量之间关系的一种图形。

《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版

《统计学》(贾俊平第七版)课后题及答案-统计学课后答案第七版

第一章导论1.什么是统计学?统计学是搜集、处理、分析、解释数据并从中得出结论的科学。

2.解释描述统计与推断统计。

描述统计研究的是数据搜集、处理、汇总、图表描述、概括与分析等统计方法。

推断统计研究的是如何利用样本数据来推断总体特征的统计方法。

3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?按照计量尺度可分为分类数据、顺序数据和数值型数据;按照数据的搜集方法,可以分为观测数据和试验数据;按照被描述的现象与实践的关系,可以分为截面数据和时间序列数据。

4.解释分类数据、顺序数据和数值型数据的含义。

分类数据是只能归于某一类别的非数字型数据;顺序数据是只能归于某一有序类别的非数字型数据;数值型数据是按照数字尺度测量的观测值,其结果表现为具体的数值。

5.举例说明总体、样本、参数、统计量、变量这几个概念。

总体是包含所研究的全部个体的集合,样本是从总体中抽取的一部分元素的集合,参数是用来描述总体特征的概括性数字度量,统计量是用来描述样本特征的概括性数字度量,变量是用来说明现象某种特征的概念。

6.变量可分为哪几类?变量可分为分类变量、顺序变量和数值型变量。

分类变量是说明书屋类别的一个名称,其取值为分类数据;顺序变量是说明十五有序类别的一个名称,其取值是顺序数据;数值型变量是说明事物数字特征的一个名称,其取值是数值型数据。

7.举例说明离散型变量和连续型变量。

离散型变量是只能去可数值的变量,它只能取有限个值,而且其取值都以整位数断开,如“产品数量”;连续性变量是可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能一一列举,如“温度”等。

第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关、由别人调查和试验而来、已经存在并会被我们所利用的资料为二手资料。

使用时要评估资料的原始搜集人、搜集目的、搜集途径、搜集时间且使用时要注明数据来源。

2.比较概率抽样和非概率抽样的特点。

举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。

《商务数据分析与应用》第3章数据可视化与分析报告

《商务数据分析与应用》第3章数据可视化与分析报告

《商务数据分析与应用》第3章数据可视化与分析报告在当今数字化时代,商务数据的分析与应用对于企业的成功至关重要。

数据可视化与分析报告是一种有效的方式,可以帮助企业管理者更好地理解和利用企业的数据。

本文将围绕第3章的内容,探讨数据可视化与分析报告的意义、方法和实际应用。

1. 数据可视化的意义数据可视化是将抽象的数据通过图形、图表等形式展示出来的过程。

它的目的是帮助人们更直观地理解数据,发现其中的规律和关联,从而做出更明智的决策。

在商务领域,数据可视化的意义尤为重要。

首先,数据可视化可以帮助企业管理者更好地了解企业的运营情况。

通过呈现关键数据指标的变化趋势,管理者可以迅速发现问题并采取相应的措施。

比如,一家电商企业可以通过可视化报告监控每日订单量的变化,及时调整供应链和推广策略,以优化运营效率。

其次,数据可视化可以激发团队的合作和创新潜力。

在团队会议上使用数据可视化报告,能够帮助团队成员更加清晰地了解各自的工作进展和目标,增强协作意识。

同时,数据的可视化展示也有助于提供新的观点和创意,激发团队成员的创新思维。

最后,数据可视化有助于向利益相关者传递信息。

无论是内部的管理者还是外部的投资者、客户,他们希望能够更直观地了解企业的发展状况。

通过可视化报告,企业可以清晰地展示自身的数据,并向利益相关者传递信息,增加透明度和信任度。

2. 数据可视化的方法数据可视化的方法可以通过图表、地图、仪表盘等形式展示。

下面介绍几种常见的方法:(1)线形图:线形图适用于展示数据之间的趋势和关系。

例如,可以使用线形图展示过去一年销售额的变化情况,帮助管理者了解销售趋势。

(2)柱状图:柱状图适用于展示不同类别之间的比较。

比如,可以使用柱状图比较不同产品的销售额,从而找出销售冠军或者销售不佳的产品。

(3)饼状图:饼状图适用于展示各个部分占总体的比例关系。

例如,可以使用饼状图展示公司利润的构成,以及不同部门对总利润的贡献度。

除了以上几种方法,还可以使用散点图、雷达图等形式进行数据可视化。

《统计学(第7版)》

《统计学(第7版)》
思考与练习 ……………………………………… 314
第14章 指数 ………………………………………… 318
14.1 基本问题 …………………………………… 319 14.2 总指数编制方法 …………………………… 321 14.3 指数体系 …………………………………… 328 14.4 几种典型的指数 …………………………… 332 14.5 综合评价指数 ……………………………… 338
思考与练习 ……………………………………… 340
附录一 术语表 ……………………………………… 344 附录二 用 Excel生成概率分布表 ………………… 351 参考文献………………………………………………… 361
理解统计对每个人都是必要的
统计在许多领域都有应用。在日常生活中,我们也会经常接触到各种统计数据, 比如,媒体报道中使用的一些统计数据、图表等。下面就是统计研究得到的一些结论: 吸烟对健康是有害的;不结婚的男性会早逝10年;身材高的父亲,其子女的身材也较 高;第二个出生的子女没有第一个聪明,第三个出生的子女没有第二个聪明,依此类 推;两天服一片阿司匹林会减少心脏病第二次发作的概率;如果每天摄取500毫升维 生素 C,生命可延长6年;怕老婆的丈夫得心脏病的概率较大;学生在听了莫扎特钢 琴曲10分钟后的推理测试会比他们听10分钟娱乐节目或其他曲目做得更好。这些结 论是正确的吗?你相信这些结论吗?要正确阅读并理解这些数据,就需要具备一些统 计学知识。
2.1 数据的来源 …………………………………… 12 2.2 调查方法 ……………………………………… 14 2.3 实验方法 ……………………………………… 23 2.4 数据的误差 …………………………………… 27
思考与练习 ………………………………………… 33

第三章统计图表

第三章统计图表

第3章统计图表数据精确、简洁图形直观、形象一、统计表1. 统计表的结构①标题、②标目(纵、横)、③线条(“三线表”)、④数字、⑤备注表1 2001年某工厂四项检测指标异常检出率检测指标受检人数异常人数检出率(%)血压心率TTT∆GPT#5195195195195544362010.160.486.943.85∆:TTT(麝香草酚浊度试验),#:GPT(谷丙转氨酶)。

统计表的结构××. ××┋┋×. ××××. ××纵标目总标目(单位)××. ××××××××合计┋┋┋┋┋┋┋┋×. ××××××┋××. ××××××××横标目纵标目纵标目纵标目总标目横标目的总标目备注:2. 统计表的种类简单表复合表3. 不良统计表的修改举例年份(1) 病例数(2)存活数(3)住院期死亡总例数(4)=(2)+(3)急性期死亡数(5)住院期总病死率(%)(6)=(4)/(2)急性期病死率(%)(7)=(5)/(2)1964 17 9 8 7 47.1 41.21965 13 8 5 4 38.5 30.81966 15 8 7 6 46.7 40.01967 15 9 6 6 40.0 40.01968 12 8 4 4 33.3 33.3合计72 42 30 27 41.7 37.51967 15 6 6 40.0 40.0 1968 12 4 4 33.3 33.3 合计72 30 27 41.7 37.5二、统计图统计图2.统计图的种类与绘制注意事项1. 统计图的制图通则2. 统计图的种类与绘制注意事项(1)条图(bar chart)条图直条相互独立的④误差条图(error-bar)分段条图:具有两个统计指标,一个分组因素,且两个统误差条图:0102030405060ºÉÐÊÁ­ÂÅΪ«Ðº­ËôÊμ썣¤£¦Á¹ËôÊμģ¤ÀäÅü£¤20406080100A BC DͧË÷ÅÑÆåÐÑ(g )图3 四种营养素喂养小白鼠三周后所增体重(克)图2 老、中、青三代的结核菌素阳性率与强阳性率(%)绘制条图注意事项必须从“0”开始由大到小排列自然顺序排列相等一半01234567甲乙(2)圆图(pie chart)圆图3.6°1%12点钟顺时针2002年某医院1402例孕妇分娩结果(3)线图与半对数线图线图连续性资料算术尺度半对数线图发展速度对数尺度绝对差与相对比的比较A →B 绝对差 相对比(A/B ) 对数差(lgA-lgB ) 1000→100 1000-100=900 1000/100=10 lg1000-lg100=3-2=1100→10 100-10=90 100/10=10 lg100-lg10=2-1=1 10→110-1=910/1=10lg10-lg1=1-0=1图2-19 绝对差示意图(算术格纸)数值时间1101001000A B图2-20 相对比示意图(半对数格纸)数值时间表2-13 某市1949~1957年15岁以下儿童结核病和白喉死亡率(1/10万)年份结核病死亡率百喉死亡率年份195719561955195419531952195119501949死40200白喉年份1957195619551954195319521951195019490.5(4)直方图(histogram)直方图25(5)散点图(scatter diagram)散点图0.2X(6)统计地图(statistical map)数量在地域(7)箱图(box plot)治疗组(8)雷达图(radar graph)雷达图ÿĮ³¦Í¥Í¿»¶¼Ä£¤Ì·»ÀÐÀ±ÂЯʼģ¤(9)气泡图气泡图8.â°ãǶ»·²öªä»¹Í½°ã°¾½Ü¶¬®Æ±Â´ÇÁ¶ÄÀ«¯Í®»·ªä»¹³Ñɰ9.Ç®¶À°ÑǶ°ÑÍ´ÊάĻɰ㰾į½Ü¡¢ËÏè°¾ÃéÁ®°ÂŰ½¶¶­­¡°ÑÍ´«Ð­¶­µ¾ÜÍʹϪ²¬¢ªŅ̃ĪǶºù«¿ÎÓǶÍÌÃÉ·Áµ´ª±Æâ°¾ÃÉ«·。

第3章_流体及其混合物热力学性质计算

第3章_流体及其混合物热力学性质计算

第3章 流体热力学性质计算利用这些可测得的量P 、V 、T 和流体的热容数据,可计算其它不能直接从实验测得的热力学性质,如焓H 、熵、热力学能(内能)U 、Gibbs 自由焓G 等。

热力学性质的推算是化工热力学课程的核心内容与最根本任务和应用之一,它是建立在经典热力学原理基础之上,结合反映实际系统特征的数学模型(如状态方程),实现用一个状态方程和气体热容数据模型,如理想气体热容ig P C ,来计算所有其它的热力学性质。

本章学习要求热力学性质是系统在平衡状态下所表现出来的,平衡状态可以是均相的纯物质或混合物,也可以是非均相的纯物质或混合物。

本章要求学生理解和学会使用一些有用的热力学性质表达成P-V-T(x)的普遍化函数,并结合状态方程来推算其它热力学性质的具体方法,内容包括:(1) 从均相封闭系统的热力学基本方程出发,建立热力学函数(如U 、H 、S 、A 、G 、pC 和V C 等)与P-V-T(x)之间的普遍化依赖关系;(2) 应用P-V-T 对应状态原理,计算其它热力学性质的方法; (3) 定义逸度和逸度系数,解决其计算问题; (4) 会使用热力学性质图或表进行计算。

重点与难点3.1 热力学基本方程与Maxwell 关系封闭系统的热力学基本方程为:dU TdS PdV =-(2-1) dH TdS VdP =+(2-2) dA SdT PdV =-- (2-3) dG SdT VdP =-+(2-4)其中H 、A 、G 的定义为:H U PV =+;A U TS =-;G H TS A PV =-=+。

这些热力学基本关系式,适用于只有体积功存在的封闭系统Maxwell 关系是联系U 、H 、S 、A 、G 等函数与P-V-T 性质的数学手段。

3.2 热力学性质的计算方法热力学性质的计算方法有:(1) 对热力学函数的偏微分关系进行积分计算; 2)以理想气体为参考态的剩余性质法; (3) 状态方程法;(4) 普遍化对应状态原理法(或查图、查表法)等。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用升序 汉字型数据,可按汉字的首位拼音字母排列, 也可按笔画排序,其中也有笔画多少的升序降 序之分
递增排序:设一组数据为x1,x2,…,xn,递增 排序后可表示为:x(1)<x(2)<…<x(n) 递减排序:可表示为:x(1)>x(2)>…>x(n)

2. 数值型数据的排序
– –
3.1.4 数据透视表 (pivot table )
时效性 适用性 •来源、口径以及有 关的背景材料 •是否符合自己分析 研究的需要
完整性 审核 •应调查的单位是否有遗漏 •所有的调查项目是否填写齐全
•应尽可能使用最新 的统计数据
准确性 审核 •数据是否有错误 •是否存在异常值
3.1.2 数据筛选
(data filter)
1. 当数据中的错误不能予以纠正,或者有些 数据不符合调查的要求而又无法弥补时, 需要对数据进行筛选 2. 数据筛选的内容 将某些不符合要求的数据或有明显错误的数
绿色 健康饮品
(定性数据)
制作频数分布表
使用Excel数据透视表计数
(pivot table)
第1步:选择【数据】菜单中的【数据透视表和数据透视图】 第2步:确定数据源区域(在操作前将光标放在任意数据单元格 内, 系统会自动选定数据源区域) 第 3 步 : 在 【 向 导 — 3 步 骤 之 3】 中 选 择 数 据 透 视 表 的 输 出 位 置,然后选择【布局】 第 4步:在【向导— 布局】对话框中,依次将“饮料类型”拖至 左边的“行”(或列)区域,将“顾客性别”拖至 “列”(或 行)区域,将“饮料类型”拖至“数据”区域。 第5步:单击【确定】,自动返回【向导—3步骤之3】对话 框。单击【完成】
用数据透视表生成分类数据的频数分布
生成频数分布表
(列联表—Excel)
不同类型饮料和顾客性别的频数分布
绿色
Chart)
1. 用宽度相同的条形的高度或长短来表示各类别数据 2. 各类别可放在纵轴,称为条形图,可以放在横轴,称为柱形 图(column chart)
顺序数据的频数分布表
(例题分析)
【例】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各 抽 样 调 查 300 户,其中的一个 问题是:“您对 您家庭目前的住 房状况是否满意 ?” 1.非常不满意; 2.不满意; 3.一般; 4.满意; 5.非常满意。
甲城市家庭对住房状况评价的频数分布 甲城市 回答类别 户数 (户 ) 24 108 93 45 30 300 百分比 (%) 8 36 31 15 10 100.0 向上累积 户数 (户) 24 132 225 270 300 — 百分比 (%) 8.0 44.0 75.0 90.0 100.0 — 向下累积 户数 (户) 300 276 168 75 30 — 百分比 (%) 100.0 92 56 25 10 —
用Excel创建数据透视表
第1步:在Excel工作表中建立数据清单
用Excel创建数据透视表
第2步:选中数据清单中的任意单元格,并选择【数据】菜单 中的【数据透视表和数据透视图】 第3步:确定数据源区域
第4步:在【向导—3步骤之3】中选择数据透视表的输出位置
。然后选择【布局】 第5步:在【向导—布局】对话框中,依次将”分类变量“拖至
合计 100 100
® Å
30.2
18.1
51.7
Ð Ä 0%
52.3 20% Ö ¯ ² » Í Ð ° © 40%
27.8 60% 80%
19.9 100%
Í ³ ² Ö ¯ » Ù Ï ° ©
² Î ² Ö ¯ » Í Ð
分类数据的图示-环形图(doughnut chart)
1. 环形图中间有一个“空洞”,总体中的每一部 分数据用环中的一段表示 2.环形图与圆形图类似,但又有区别 ◇圆形图只能显示一个总体各部分所占的比例 ◇环形图则可以同时绘制多个总体的数据系列, 每一个总体的数据系列为一个环 3.环形图可用于进行比较研究 4.环形图可用于展示定类和定序的数据
绿色
健康饮品
购买饮料品牌条形图
16 12
ý ³ Ê Æ
15 11 9 6 9
8 4 0 ¿ ¿ É Ú É À ¿ Ö ñ Õ Ð È É ý ù ° ± è °Ê Ù Â É À ¿ Ö
» Ô ã ² û Ö ¹ ­
´   ´ ²Å Æ Æ
» Í ° ¬ Æ ²Å Æ Ò û Á Ï ³ Ä Æ ³ Ê ý ² Ö ° ¼
(户) 0 24 非 常 不 满 意
(a)向上累积
累 积 200 户 100 数 (户)0 非 常 不 满 意
不 满 意
一 般
满 意
(b)向下累积
甲城市家庭对住房状况评价的累积频数分布
3.3 数值型数据的整理与展示
• 3.3.1 数据分组 • 3.3.2 数值型数据的图示
3.3.1 数据分组
统计分组是统计整理的第一步,它是按照统计研究的 目的,将数据分别分入不同的组内。用于观察数据的分 布特征。 按照事物的性质和属性划分的,称为按品质标志分组 ;按照事物的数量标准划分的,称为数量标志分组。
1. 可以从复杂的数据中提取有用的信息
2. 可以对数据表的重要信息按使用者的习惯 或分析要求进行汇总和作图 3. 形成一个符合需要的交叉表(列联表)
4. 在利用数据透视表时,数据源表中的首行 必须有列标题
【例】在某大学随机抽取30名学生,调查他们的性别、 家庭所在地、平均月生活费支出、平均每月购买衣物支 出和购买衣物时所考虑的首要因素等,得到的数据如表 2—4所示。试建立一个数据透视表,在表的行变量中给 出性别和购买衣物首选因素,在列变量中给出学生的家 庭所在地,对平均月生活费支出和月平均购买衣物支出 进行交叉汇总。
32
由 Excel 绘制的环形图
13% 7% 非常不满意 21% 15% 36% 33% 31% 不满意 一般 满意 非常满意 10% 8%
33%
图2-18 26% 甲乙两城市家庭对住房状况的评价
33
3.2.2 顺序数据的整理与展示


顺序数据的整理
(可计算的统计量)
1. 累积频数(cumulative frequencies):各类别频数 的逐级累加 2. 累积频率(cumulative percentages):各类别频率 (百分比)的逐级累加
3.2 品质数据的整理与展示
3.2.1 分类数据的整理与图示 3.2.2 顺序数据的整理与图示
3.2.1 分类数据的整理与展示
分类数据的描述统计量
1. 频数(frequency) :落在各类别中的数据个数 2. 比例(proportion) :某一类别数据个数占全部 数据个数的比值 3. 百分比(percentage) :将对比的基数作为100 而计算的比值 4. 比率(ratio) :不同类别数值个数的比值
60
60%
80
80%
100
100%
40%
25.70%
16.07% 15.04% 1 1 . 5 6 % 1 1 . 4 1 %
20.22%
呼吸系 统病
脑血 管病
恶性 肿瘤
损伤与 中毒
心脏 疾病
其 它
我国部分县1988年的死因构成比
男 女
分化型癌 52.3 30.2
低分化腺癌 27.8 18.1
未分化型 19.9 51.7
第3章 数据的图表展示
数据的预处理
品质数据的整理与展示
数值型数据的整理与展示
合理使用图表
3.1 数据的预处理
1. 数据审核


检查数据中的错误 找出符合条件的数据 升序和降序 寻找数据的基本特征 按需要汇总
2. 数据筛选
3. 数据排序
4. 数据透视
3.1.1 数据审核
二手 数据 secondhand data 原始 数据 raw data
生成频数分布表
(分类数据)
1. 列出各类别
2. 计算各类别的频数
3. 生成频数分布表
分类 A B C D E 频数 比例 百分比 比率


【例】一家市场调查公 司为研究不同品牌饮料 的市场占有率,对随机 抽取的一家超市进行了 调查。调查员在某天对 50名顾客购买饮料的品 牌进行了记录,如果一 个顾客购买某一品牌的 饮料,就将这一饮料的 品牌名字记录一次 。 右边就是记录的原始数 据
由 Excel 绘制的条形图
其他广告 2
招生招聘广告
10 16 9 51
广 房地产广告 告 金融广告 类 型 服务广告
商品广告
112
80 人数(人)120
0
40
某城市居民关注不同类型广告的人数分布
23
饮料类型和顾客性别的复式条形图
12 11 10
检出率(%)
9 8 7 6 5 4 3 2 1 0 血压 心率 TTT GPT 1998 年 1994 年
20 合计
210
220 970
21.65
据予以剔除
将符合某种特定条件的数据筛选出来,而不
符合特定条件的数据予以剔除
【例】8 名学生 4 门课程的考试成绩数据。找出统计学成 绩等于 75 分的学生,英语成绩最高的前 3 名学生, 4 门课 程成绩都大于70分的学生 。
8名学生的考试成绩数据
用Excel进行数据筛选
3.1.3 数据排序
房地产广告 招生招聘广告 其他广告 1.0% 8.0% 5.8% 金融广告 4.5%
服务广告 25.5%
图2-17
商品广告 56.0%
某城市居民关注不同类型广告的人数构成
分类数据的图示—复式饼图
相关文档
最新文档