第三章统计数据的整理及显示
第三章统计数据的整理和显示习题

第三章统计数据的整理和显示练习题一、填空题1.统计数据分组的关键在于。
2.一般说来,统计分组用于三方面:(1>;<2);<3)。
3.根据分组标志的不同,统计分组可以有分组和分组。
4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。
5.在组距式数列中,表示各组界限的变量值叫。
各组中点位置上的变量值叫。
6.组距式变量数列,根据各组的组距是否相等可以分为和。
7.已知一个变量数列最后一组的下限为900,其邻组的组中值为850,则最后一组的上限和组中值分别为和。
b5E2RGbCAP8.统计资料的表现形式主要有和。
9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。
10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。
p1EanqFDPw11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。
12.直方图是用的宽度和高度来表示频数分布的图形。
13.雷达图是一种的图示方法。
二、单项选择题1.统计分组的关键问题是( >A正确选择分组标志 B确定组距和组数C确定组距和组中值 D确定全距和组距2.为了反映我国经济中所有制成份的构成情况需要进行( >A经济成份分类B登记注册类型分类C三次产业分类 D国民经济行业分类3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( >A组数较多 B标志变异不明显C两种性质变异间存在过渡形态 D分组有粗有细4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( >A260 B 215 C 230 D 1855.下列分组中按品质标志分组的是( >A人口按年龄分组 B产品按质量优劣分组C企业按固定资产原值分组 D乡镇按工业产值分组6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( >A简单分组 B平行分组C复合分组 D分组体系7.用组中值代表各组内的一般水平的假定条件是( >A各组的次数均相等 B各组的组距均相等C各组的变量值均相等 D各组次数在本组内呈均匀分布8.对统计总体按两个及以上标志分组后形成的统计表叫( >A简单表 B简单分组表C复合分组表 D汇总表9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( >A变量分组 B属性分组C分组体系 D复合分组10.在频数分布中,频率是指( >A各组频数之比 B各组频率之比C各组频数与总频数之比 D各组频数与各组次数之比11.频数分布用来表明( >A总体单位在各组的分布状况 B各组变量值构成情况C各组标志值分布情况 D各组变量值的变动程度12.在分组时,若有某单位的变量值正好等于某组的下限时,一般应将其归在( >A上限所在组 B下限所在组C任意一组均可 D另设新组13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( >A正比例关系 B反比例关系C乘积关系 D毫无关系14.统计表的宾词是用来说明总体特征的( >A标志 B总体单位C统计指标 D统计对象15.统计表的主词是统计表所要说明的对象,一般排在统计表的( >A左方 B上端中部 C右方 D下方16.用组中值与次数求坐标点连接而成的统计图是( >A直方图 B条形图 C曲线图 D折线图17.按字母的顺序或笔画数的多少顺序排序的统计数据一般是( >A定类型数据 B定距数据C定比数据 D定序数据18.多指标的图示方法是( >A直方图 B条形图 C环行图 D雷达图19.变量数列的构成要素是< )A分组标志和指标B分组标志和次数C数量分组标志数值和频数D品质分组标志属性和频数20.下列哪一种资料,适合编制单项数列< )A连续型变量且各变量值变动比较均匀B离散型变量且变量值的种类数较少C连续型变量且各变量值变动幅度较大D离散型变量且各变量值变动幅度较大21.某组向上累计次数表示< )A大于该组上限的次数有多少B大于该组下限的次数有多少C小于该组上限的次数有多少D小于该组下限的次数有多少三、多项选择题1.统计分组的主要应用有(>A区分现象的类型 B反映现象总体的内部结构C比较现象间的一般水平 D分析现象的变化关系E研究现象之间的数量依存关系2.指出下表表示的分布数列所属的类型( >A品质数列 B变量数列C分组数列 D组距数列E等距数列3.指出下列分组哪些是属性分组( >A人口按性别分组 B企业按产值多少分组C家庭按收入水平分组 D在业人口按文化程度分组 E宾馆按星级分组4.对统计数据准确性审核的方法有( >A计算检查 B逻辑检查C时间检查 D调查检查E平衡检查5.统计数据的预处理,包括( >A数据分类 B数据筛选C数据审核 D数据订正E数据排序6.从形式上看,统计表由哪些部分构成( >A总标题 B主词 C纵栏标题D横行标题 E宾词7.按主词是否分组,统计表可分为( >A单一表 B简单表 C分组表D复合表 E综合表8.统计数据的审核主要是审核数据的( >A准确性 B及时性 C完整性D适用性 E代表性9.统计数据整理的内容一般有( >A对原始数据进行预处理 B对统计数据进行分组C对统计数据进行汇总 D对统计数据进行分析E编制统计表、绘制统计图10.国民经济中常用的统计分组有( >A经济成分分组 B登记注册类型分组C国民经济行业分类 D三次产业分类E机构部门分类11.某厂100名工人按工资额分为800以下、800-1000、1000-1200、1200-1400、1400以上等五个组。
第三章统计数据的整理和显示习题

第三章统计数据的整理和显示习题部门: xxx时间: xxx整理范文,仅供参考,可下载自行编辑第三章统计数据的整理和显示练习题一、填空题1.统计数据分组的关键在于。
2.一般说来,统计分组用于三方面:(1>;<2);<3)。
3.根据分组标志的不同,统计分组可以有分组和分组。
4.按每个变量值分别列组所编制的变量分布数列叫,其组数等于。
5.在组距式数列中,表示各组界限的变量值叫。
各组中点位置上的变量值叫。
6.组距式变量数列,根据各组的组距是否相等可以分为和。
7.已知一个变量数列最后一组的下限为900,其邻组的组中值为850,则最后一组的上限和组中值分别为和。
b5E2RGbCAP8.统计资料的表现形式主要有和。
9.从形式上看,统计表主要由、、和四部分组成;从内容上看,统计表由和两部分组成。
10.统计数据整理就是对搜集得到的进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的的工作过程。
p1EanqFDPw11.数据的预处理是数据整理先行步骤,它是在对数据分类或分组之前对和所做的必要处理,包括对数据的、和。
12.直方图是用的宽度和高度来表示频数分布的图形。
13.雷达图是一种的图示方法。
二、单项选择题1.统计分组的关键问题是( >A正确选择分组标志 B确定组距和组数C确定组距和组中值 D确定全距和组距2.为了反映我国经济中所有制成份的构成情况需要进行( >A经济成份分类B登记注册类型分类C三次产业分类 D国民经济行业分类3.按品质标志分组,分组界限的确定有时会发生困难,这是由于( >A组数较多 B标志变异不明显C两种性质变异间存在过渡形态 D分组有粗有细4.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为( >A260 B 215 C 230 D 1855.下列分组中按品质标志分组的是( >A人口按年龄分组 B产品按质量优劣分组C企业按固定资产原值分组 D乡镇按工业产值分组6.对企业先按经济类型分组,再按企业规模分组,这样的分组,属于( >A简单分组 B平行分组C复合分组 D分组体系7.用组中值代表各组内的一般水平的假定条件是( >A各组的次数均相等 B各组的组距均相等C各组的变量值均相等 D各组次数在本组内呈均匀分布8.对统计总体按两个及以上标志分组后形成的统计表叫( >A简单表 B简单分组表C复合分组表 D汇总表9.对某地区的全部商业企业按实现的销售额多少进行分组,这种分组属于( >A变量分组 B属性分组C分组体系 D复合分组10.在频数分布中,频率是指( >A各组频数之比 B各组频率之比C各组频数与总频数之比 D各组频数与各组次数之比11.频数分布用来表明( >A总体单位在各组的分布状况 B各组变量值构成情况C各组标志值分布情况 D各组变量值的变动程度12.在分组时,若有某单位的变量值正好等于某组的下限时,一般应将其归在( >A上限所在组 B下限所在组C任意一组均可 D另设新组13.在编制组距数列时,当全距不变的情况下,组距与组数的关系是( >A正比例关系 B反比例关系C乘积关系 D毫无关系14.统计表的宾词是用来说明总体特征的( >A标志 B总体单位C统计指标 D统计对象15.统计表的主词是统计表所要说明的对象,一般排在统计表的( >A左方 B上端中部 C右方 D下方16.用组中值与次数求坐标点连接而成的统计图是( >A直方图 B条形图 C曲线图 D折线图17.按字母的顺序或笔画数的多少顺序排序的统计数据一般是( >A定类型数据 B定距数据C定比数据 D定序数据18.多指标的图示方法是( >A直方图 B条形图 C环行图 D雷达图19.变量数列的构成要素是< )A分组标志和指标B分组标志和次数C数量分组标志数值和频数D品质分组标志属性和频数20.下列哪一种资料,适合编制单项数列< )A连续型变量且各变量值变动比较均匀B离散型变量且变量值的种类数较少C连续型变量且各变量值变动幅度较大D离散型变量且各变量值变动幅度较大21.某组向上累计次数表示< )A大于该组上限的次数有多少B大于该组下限的次数有多少C小于该组上限的次数有多少D小于该组下限的次数有多少三、多项选择题1.统计分组的主要应用有(>A区分现象的类型 B反映现象总体的内部结构C比较现象间的一般水平 D分析现象的变化关系E研究现象之间的数量依存关系2.指出下表表示的分布数列所属的类型( >A品质数列 B变量数列C分组数列 D组距数列E等距数列3.指出下列分组哪些是属性分组( >A人口按性别分组 B企业按产值多少分组C家庭按收入水平分组 D在业人口按文化程度分组 E宾馆按星级分组4.对统计数据准确性审核的方法有( >A计算检查 B逻辑检查C时间检查 D调查检查E平衡检查5.统计数据的预处理,包括( >A数据分类 B数据筛选C数据审核 D数据订正E数据排序6.从形式上看,统计表由哪些部分构成( >A总标题 B主词 C纵栏标题D横行标题 E宾词7.按主词是否分组,统计表可分为( >A单一表 B简单表 C分组表D复合表 E综合表8.统计数据的审核主要是审核数据的( >A准确性 B及时性 C完整性D适用性 E代表性9.统计数据整理的内容一般有( >A对原始数据进行预处理 B对统计数据进行分组C对统计数据进行汇总 D对统计数据进行分析E编制统计表、绘制统计图10.国民经济中常用的统计分组有( >A经济成分分组 B登记注册类型分组C国民经济行业分类 D三次产业分类E机构部门分类11.某厂100名工人按工资额分为800以下、800-1000、1000-1200、1200-1400、1400以上等五个组。
统计学第3章统计数据整理与显示

2013-11-21
本 章 内 容
第一节 统计数据整理概述 第二节 统计分组与频数分布数列
第三节 统计数据的显示
第四节
2013-11-21
EXCEL在数据整理应用示例
第一节 统计数据整理概述
一、统计数据整理的含义与要求
二、统计数据整理的步骤
三、统计数据的预处理
2013-11-21
一、统计数据整理的含义与要求
个体企业 其它企业
70~80分 (中等) 80~90分 (良好) 90~100分(优秀)
2013-11-21
统计分组是在总体内部进行的一种定性分类,把 总体划分为一个个性质不同,范围更小的总体。
统计分组有两个方面的含义,即:
是“分” 即将总体区分为性质 不同的若干组成部分
统计 分组
是“合” 即将性质相同的总 体单位合为一组
每一组中的最大变量值称为上限,每组最小变量值
称为下限。
重叠组限 在统计时 遵循“上 限不在内” 的原则。
工人按工资分组:
600 700 800 1200 ~ 700 ~ 800 ~ 1200 ~ 1500
企业按人数分组:
1 ~ 499 500 ~ 999 1000 ~ 2999 3000 ~ 3499
(4)按数量标志分组
数量标志分组,即变量分组。 例如, 按考分分组(分) 60以下 用数量来 60 ~ 70 表示各组 70 ~ 80 性质上的 80 ~ 90 差别 90 ~ 100 注意:第一,明确分组的目的,. 即通过数量的变化来区 分各组质的差别,而不是单纯的数量差别。 第二,采用适当的分组形式, 即要以什么样的数量作 为划分标准。是单项式或是组距式?如果是组距式分
2013-11-21
统计学原理 第三章 数据整理与显示

4.数量(变量)分组
如,企业按产值分组
按数量标志进行的分组。
100万元以下 100 ~ 500 500 ~ 1000 1000万元以上
单项式分组 数量(变量)分组 组距式分组
单项式分组: 在变量分组中, 一个组只有一个变量值。
如,居民家庭按子女数分组: 0 1 2 3 单项式分组适用于变量值变化范围不大、不同变量值个数 较少的离散型变量的场合。
10
22
20
22
30
27
主要步骤:数据------数据透视表------布局
EXCELL应用:单项式分组及汇总 日产量 22 23 24 25 26 工人人数 6 8 10 1 3 比重 20.00% 26.67% 33.33% 3.33% 10.00%
27
总计
2
30
6.67%
100.00%
主要步骤:数据------数据透视表------布局
600 ~ 700 700 ~ 800 800 ~ 1200 1200 ~1500
组 限 重 叠
499以下 500 ~ 999 1000 ~ 1999 2000 ~ 2999 3000及以上
组 限 不 重 叠
组限的划 分方法
不重叠组限(只适用于离散型变量) 重叠组限(适用于连续型变量和离散型变量)
当为重叠组限时,交叉组限值遵循 “上限不在其内”的原则。
它适用于变量值变化范围较大、不同变量值个数较多 的离散型变量及连续型变量的情形。
组距式分组最为常见,进行分组涉及以下几个问题
(1)组限及划分方法
(2)组距与组数 (3)等距分组与不等距分组 (4)组中值
组距式分组的组限及划分方法
每组起点值称为上限,终点值称为下限。 工人按工资分组: 企业按人数分组:
统计学课件 第三张章 数据的整理与显示

1. 2.掌握3.掌握 4.用Excel5.§3.1数据的预处理3.1.1 数据审核3.1.2 数据筛选3.1.3 数据排序1.错误2.符合条件3.升序和降序4.按需要汇总(raw data)完整性准确性检查数据是否有错误,计算是否正确等数值型数据,计算检查)(second hand data)1.适用性2.时效性3.确认(data filter)1. 2.不符合明显错误剔除符合筛选出来,而不用Excel 进行数据筛选8名学生的考试成绩数据(data filter)(data rank)1.一定顺序2.有助于3.排序本身就是分析的目的4.借助于计算机(方法)1.分类数据 字母型习惯上用升序汉字型首位拼音字母笔画多少2.数值型–递增递增–递减x (2)>…>x (n)数据透视表(pivot table )1.复杂提取有用 2.重要信息汇总和作图3. 4.首行列标题拖至区域,将需要汇总的“变【向导—3步骤之3】对,即可输出数据透视表§3.2 分类和顺序数据的整理与显示3.2.1 分类数据的整理与显示3.2.2 顺序数据的整理与显示(基本问题)1.弄清数据类型2.分类数据和顺序数据分类整理3.数值型数据分组整理4.适合于低层次数据的整理和显示方法也适合于高层次的数据;但适合于高层次数据的整(基本过程) BAEDC比率百分比比例频数分类(可计算的统计量)1.个数2.一类别全部数据3.4.不同类别制作频数分布表(bar Chart )1.宽度相同高度或长短2.单式复式3.分类数据频数分布4.条形图可以横置或纵置汇源果汁露露品牌(side - 1.不同时间或不同空间2.差异或变化趋势688563328247戴尔电脑品牌1.频数多少排序2.分类数据不同品牌饮料的帕累托图百事可乐露露汇源果汁品牌(pie Chart)1.圆形及圆内扇形的角度2.各组成部分所占的比例结构性问题3.绘制圆形图时,总体中各部分所占的百分比用圆内的各个扇形角度表示,这些扇形的中心角度,是按各部分数据百分比占不同品牌饮料的构成旭日升冰茶22%分类数据显示图例(可计算的指标)频数逐级累加频率(百分比)的逐级累加☺☺☺☺☺☺———100.092562510276168753044.075.090.0100.0132225270300乙城市回答类别100.093.060.034.012.7300279180102387.040.066.087.3100.0211201982623007.033.026.021.312.72199786438非常不满意不满意一般满意非常满意百分比(%)户数(户)百分比(%)户数(户)向下累积向上累积百分比(%)户数(户)乙城市家庭对住房状况评价的频数分布(243001322252700100200300400非常不满意不满意一般满意非常满意累积户数(户)(a)向上累积非常不满意不满意一般满意非常满意(b)向下累积甲城市家庭对住房状况评价的累积频数分布甲城市家庭对住房状况评价的累积频数分布(annular chart)1. 2.同时绘制多个总体3. 4.环形图主要用于展示分类和顺序数据满意非常满意§3.3 数值型数据的整理与显示3.3.1 数据分组3.3.2 数值型数据的图示等距分组等距分组异距分组异距分组(要点)一个变量值离散变量值较少的情况☺☺☺☺(要点)1.一个区间2.连续变量3.变量值较多4.“不重不漏”5.等距不等距☺~ ☺☺~ ☺☺~ ☺☺~ ☺☺~ ☺(步骤)1.确定组数2.确定组距上限与下限之差,可根据全部数据的最大统计频数并整理成频数分布表(几个概念)(例题分析)【例】某电脑公司2005年前四个月各天的销售量数据(单位:台)。
统计学第三章(统计资料的整理与展示)

第三章统计数据的整理与显示一、单项选择题:1.将统计总体按某一标志进行分组后,其结果是()。
A.组内同质性,组间同质性B.组内差异性,组间差异性C.组内同质性,组间差异性D.组内差异性,组间同质性2.在组距数列中,当全距确定时,组距与组数的关系是()。
A.组距越大,组数越小B.组距越大,组数越大C.组距越小,组数越小D.组距与组数的关系不确定3.连续型量在确定组限时,相邻组的组限必须()。
A.间断B.重叠C.相等D.不等4.变量数列中,各组频率的合计数应该为()。
A.大于1B.等于1C.小于1D.不等于15.在异距数列中,要准确反映其分布状况,必须采用()。
A.向上累计B.向下累计C.频数D.频率密度6.计算向上累计次数或频数时,其计数表达的意义是()。
A.上限以下的累计次数或频数B.上限以上的累计次数或频数C.下限以下的累计次数或频数D.上限以上的累计次数或频数7.在统计表中,说明统计表名称的词语是()。
A.主词B.宾词C.总标题D.横行标题8.次数分布的特征是:两头小,中间大。
即靠近中间的变量值分布的次数多,靠近两边的变量值分布的次数少。
这种次数分布是()。
A.正态分布B.U形分布C.正J形分布D.反J形分布9.类似于直方图,与直方图比较,其构造更容易,且能显示变量的实际值,从而不会因数据分组将具体的数值信息丢失,这种图是()。
A.折线图B.曲线图C.茎叶图D.帕拉图10.填写统计表时,当某一位置不应该有数字,应用的符号是()。
A.0B.×C.…D.–二、多项选择题:1.在统计数据整理之前,要对统计数据进行审核。
审核的主要内容是()。
A.数据的准确性B.数据的及时性C.数据的系统性D.数据的完整性E.数据的客观性2.统计分组的作用是()。
A.划分社会经济现象的类型B.刻画总体具有的特征C.揭示社会经济现象的内部构成D.反映总体单位的分布情况E.分析社会经济现象之间的依存关系3.在组距数列中,组中值是()。
统计学统计数据的整理和显示

组数
组中值:各组中点位置所对应的变量值。其计算公式为:
01
或= (适用上开口组)
03
组中值= (适用所有闭口组)
02
或= (适用下开口组)
表3—2 三次产业增加值结构变化 资料来源:《中国统计年鉴》《2003年中国发展报告》,国家统计局2003年版,中国统计出版社。
从表中可以看出,我国1998—2002年,GDP年均增长7.7%,其中第一产业增加之年均增加2.9%,第二产业、第三产业增加值分别增长8.9%和8.0%。反映在结构中,第一产业比重下降,二、三产业比重上升。其中第一产业比重从1997年的19.1%下降到2002年的14.5%,下降了4.6个百分点;第二产业从50%提高到51.8%,上升了1.8个百分点;第三产业从30.9%提高到33.7%,上升了2.8个百分点。它反映着我国产业结构的变化发展过程。
举例说明:
1
某工厂生产车间30人工人日产量原始数据如下:
第三章 统计数据的整理和显示
本章主要内容
肆
叁
贰
壹
统计整理及其类型 统计整理:就是对搜集得到的初始数据进行审核、分组、汇总,使之条理化、系统化,变成能反映总体特征的综合数据的工作过程。包括(1)对统计调查所搜集到的各种数据进行分类和汇总;(2)对现成的综合统计资料的整理。本章指的是第一种整理。
第一节 统计数据整理概述
3.历史资料的审核:在利用历史资料(或其他间接资料)时,应审核资料的可靠程度、指标含义、所属时间与空间范围、计算方法和分组条件与规定的要求是否一致。一般可以从调查资料的历史背景、调查者搜集资料的目的以及资料来源等,来判断资料的可靠程度,也可以从指标间的相互关系以及指标的变动趋势来检查它的正确性。
第三章统计数据的整理与显示

统计整理方案 1、 确定汇总的统计指标和
综合表; 2、 确定分组方法; 3、 确定汇总资料的形式; 4、 确定资料的审查内容和
审查方法。
第三章 统计数据整理与显示
§2 统计分组 一、统计分组意义和作用 1、概念:它是根据统计研究的需要,将
统计总体按照一定的标志分成若干 个不同的组别。 对总体而言是“分”,对个体而言是“合”。 2、统计分组的原则
第三章 统计数据的整理 与显示
➢ 数量分组的方法 ➢ 分配数列的编制
§1 统计数据整理
一、统计整理的意义和内容 统计整理在统计工作中处于中间阶段,
起着承前启后的作用。通过数据整理,可 以使混乱、缺乏条理性的资料变成有条理 性、在某种程度上能够说明总体特征的有 用的资料。
它是根据统计研究的任务,对调查阶 段所搜集到的大量的原始资料进行加工汇 总,使其系统化、条理化、科学化,以反 映总体综合特征的资料的工作过程。
试将工人分成5组
其基本步骤为: 第一步:将原始资料按数值大小依次排列。 全距(Range)=最大变量值—最小变量值。
=576-432=144
第二步:确定变量的类型和分组方法(单 变量分组或组距分组)。
第三步:确定组数和组距(interval)。当 组数确定后,组距可计算得到: 组距=全距/组数
原则: 应将总体单位分别的特点显示出来 要考虑到原始资料的集中程度 要考虑到所研究对象的实际情况,考
例:重庆市按GDP计算的三次产业结构(%)
1980年
GDP
100
第一产业 38.4
第二产业 44.6
第三产业 17
1990年 100 33.4 39.7 26.9
2000年 100 17.8 41.4 40.8
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
在Excel中建立数据透视表
18
形成的数据透视表
19
第二节 统计数据的整理 一、分类型数据的整理 二、顺序型数据的整理 三、数值型数据的整理
20
一、分类数据整理—频数分布表
【例1】一家市场调查公司为研究不同品牌饮 料的市场占有率,对随机抽取的一家超市进 行了调查。调查员在某天对50名顾客购买饮 料的品牌和顾客性别进行了记录。下页表格 就是记录的原始数据
汇源果汁
顾客性别
女 女 男 女 女 女 女 男 女 女 男 男 男 女 女 女
饮料类型
露露 可口可乐 旭日升冰茶 百事可乐 露露 汇源果汁 可口可乐 百事可乐 露露 旭日升冰茶 可口可乐 旭日升冰茶 可口可乐 汇源果汁 百事可乐 可口可乐
22
分类数据的整理
1.基本过程
▪ 列出各类别 ▪ 计算各类别的频数 ▪ 制作频数分布表
30
分组方法
分组方法
单变量值分组
组距分组 等距分组 异距分组
31
单变量值分组 (要点) 单变量值分组
——将一个变量值作为一组 1.适合于离散变量 2.适合于变量值较少的情况
32
零件数 (个) 107 108 110 112 113 114 115 117 118
单变量值分组表
某车间50名工人日加工零件数分组表
1. 频 数:落在各类别中的数据个数 2. 比 例:某一类别数据占全部数据的比值 3. 百分比:将对比的基数作为100而计算的比值 4. 比 率:不同类别数值的比值
23
分类数据的整理与显示
2.频数分布表(通过数据透视表在Excel中得到)
24
利用SPSS的频数分析得到
25
通过SPSS 的交叉列联表获得
用Excel制作频数分布表
21
顾客性别 饮料类型 顾客性别
女
旭日升冰茶
女
男
露露
男
男
旭日升冰茶
男
女
可口可乐
女
男
百事可乐
男
男
可口可乐
女
女
汇源果汁
男
女
可口可乐
女
男
露露
女
男
可口可乐
女
女
可口可乐
男
女
旭日升冰茶
男
男
可口可乐
女
男
百事可乐茶
女
男
旭日升冰茶
女
饮料类型
旭日升冰茶 可口可乐 可口可乐 旭日升冰茶 露露 旭日升冰茶 可口可乐 露露 百事可乐 百事可乐 汇源果汁 露露 百事可乐 可口可乐 百事可乐 汇源果汁
10
三、数据的排序
1. 按一定顺序将数据排列,以发现一些明显
的特征或趋势,找到解决问题的线索
2. 排序有助于对数据检查纠错,以及为重新
归类或分组等提供依据
3. 在某些场合,排序本身就是分析的目的之
一
4. 排序可借助于计算机完成
11
数据排序(方法) 1. 分类数据的排序
▪ 字母型数据,排序有升序降序
户数 (户)
百分 比
(%)
向上累积 户数 百分比 (户) (%)
非常不满意 24 8
24
8.0
不满意
108 36
一般
93 31
满意
45 15
非常满意 30 10
132
44.0
225
75.0
270
90.0
300
100.0
合计
300 100.0 —
—
28
顺序数据的频数分布表 (例题分析)
乙城市家庭对住房状况评价的频数分布
13
数据排序(方法)
在Excel中进行排序(以8名学生的考试成 绩为例)
14
数据排序(方法)
按统计学成绩排序后的学生成绩排名
15
四、建立数据透视表
➢ 从复杂的数据中提取有用的信息 ➢ 可以对数据表的重要信息按使用者的习惯或
分析要求进行汇总和作图,形成交叉表
➢ 数据源表中的首行必须有列标题
16
数据透视表
4
二、数据的筛选
1)当数据中的错误不能予以纠正, 或者有些数据不符合调查的要求而又无 法弥补时,需要对数据进行筛选
2)根据某种需要进行筛选
5
数据筛选(data filter)
▪ 用Excel进行数据筛选
▪ 8名学生的考试成绩数据
6
数据筛选(data filter)
7
自动筛选
8
高级筛选
9
高级筛选
频数 (人)
零件数 (个)
频数 (人)
零件数 (个)
频数 (人)
1
119
1
128
2
2
120
2
129
1
1
121
1
130
1
2
122
4
131
1
1
123
4
133
2
1
124
3
134
2
1
125
2
135
1
3
126
2
137
1
3
127
3
139
2
33
组距分组 (要点) 组距分组
——将变量值的一个区间作为一组
1. 适合于连续变量 2. 适合于变量值较多的离散型变量情况 3. 需要遵循“不重不漏”的原则 4. 可采用等距分组,也可采用不等距分组
27
顺序数据的频数分布表 (例题分析)
【例2】在一项城 市住房问题的研 究中,研究人员 在甲乙两个城市 各抽样调查300户 ,其中的一个问 题是:“您对您 家庭目前的住房 状况是否满意?
1.非常不满意; 2.不满意;3. 一般;4.满意; 5.非常满意。
甲城市家庭对住房状况评价的频数分布
甲城市
回答类别
乙城市
回答类别
非常不满意
不满意 一般 满意 非常满意
合计
户数 (户)
21 99 78 64 38 300
百分比 (%)
7.0 33.0 26.0 21.3 12.7 100.0
向下累积
户数
百分比
(户)
(%)
300
100.0
279
93.0
180
60.0
102
34.0
38
12.7
—
—
29
三、数值型数据的整理 【例】某生产车间50名工人日加工零件数 如下(单位:个)。试对数据进行分组。
第三章 统计数据的整理与显示
目录
第一节 数据的预处理 第二节 统计数据的整理 第三节 统计数据的显示
2
第一节 数据的预处理
一、数据的审核 二、数据的筛选 三、数据的排序 四、建立数据透视表
3
一、数据的审核
数据的审核即对调查资料进行审核 ➢ 审核资料的完整性和及时性 ➢ 审核资料的正确性 ➢ 历史资料的审核
26
二、顺序型数据的整理
1累积频数(cumulative frequencies): 各类别频数的逐级累加
2累积频率(cumulative percentages): 各类别频率(百分比)的逐级累加
方向: 向上累积:自类别顺序的开始一方向
最后一方累加 向下累积:自类别顺序的最后一方向
开始一方累加
之分,但习惯上用升序
▪ 汉字型数据,可按汉字的首位
拼音字母排列,也可按笔画排 序,其中也有笔画多少的升序 降序之分
12
数据排序(方法)
2.数值型数据的排序 ❖递增排序:设一组数据为 x1,x2,…,xn, 递增排序后可表示为: x(1)<x(2)<…<x(n) ❖递减排序:可表示为 x(1)>x(2)>…>x(n)