第二章统计数据的描述报告
统计学原理(第二章)

数据的计量和类型
一、数据的计量尺度 4.定比尺度:又称为比例尺度或是比较水平, 是对事物之间比值的一种测度,它是最高层 次的测量,可用于参数和非参数统计推断。 它是与定距尺度属于同一层次的一种计量尺 度,但其功能比定距尺度更强一些。
在日常生活中,大多数情况下使用的都是 定比尺度。例如,年龄、收入、某地区每年的 失业人数、罪犯人数等。
数值数据的描述
一、数值数据的 分组
为什么要进行数据的分组?
品质数据的描述
某电脑公司50名销售代表某季度电脑销售量按从小 到大排序如下表:
107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 126 127 127 128 128 129 130 131 133 133 134 134 135 139 139 139
204 80.00% 105 41.17%
235 92.16% 51 20%
255 100% 20 7.84%
— 100% —
品质数据的描述
二、品质数据的 图示 1.条形图:是用宽度相同的条形的高度或长 短来表示数据变动的图形,横置的称为带形 图,纵置的称为柱形图(直方图)。
柱形图(直方图)
120 100 80 60 40 20
定类变量、定序变量、 数值型变量(离散变量、连续变量)
第二节 品质数据的描述
一、品质数据的描述 二、数据的类型品质数据的图示 三、品质数据的分布特征描述
品质数据的描述
一、品质数据的 描述 1.频数:是落在某一特定类别(或组)中的 数据的个数。把各个类别及其相应的频数全 部列出来则形成频数分布。
第二章统计数据的采集与整理

Page 16
3、统计报表制度的种类
(1)按照调查的实施范围不同,可分为国家 统计报表、业务部门统计报表和地方统计报表
(2)按照报送周期不同,可分为定期报表和年报。
(3)按照报送的方式不同,可分为电讯报表和邮 寄报表。
Page 17
17
4、统计报表的资料来源
(1)原始记录:是指基本单位通过一定的表格 , 形式对其产生经营活动的最初直接记录。例如: 工业生产企业的收货单、发货单、出勤记录、 生产记录等,商业企业的发票、收据等。 (2)统计台账:是基本单位根据填报统计报 表的要求和实现本单位生产经营管理的需要而 设置的,将原始记录按时间顺序设置的系统积 累统计资料的表册。例如,工业生产企业的设 备台账、产品台账、工时台账等。
Page 4
4
2、静态数据和动态数据 静态数据是指被调查的总体现象在一定时间 一定空间表现的最终成果。
动态数据是指被调查的总体现象在某一时期内 连续变动的最终成果。
静态数据可以通过直接调查取得,动态数据则 只能通过连续的登记取得。
Page 5
5
二、统计数据的采集及分类
统计数据的采集又称为统计调查,就是根据调查 的任务和要求,采取科学的调查方法,有目的、
Page 20
20
(2)填表说明。它是对统计报表的统计范围、 指标等作出的规定,具体有: 填报范围:即统计报表的范围,规定每种统计 报表的报告单位和填报单位,各级统计部门与主管 部门的范围等。 指标解释:对列入表的统计指标的口径,计算 方法以及其它有关问题的具体说明。 分类目标:有关统计报表主栏中应进行填报的 有关项目的分类。 ④其他有关事项的规定:除了以上各项规定以 外的一些注意事项,如:报送日期,报送方式, 报送份数等。
第二章统计调查总结

• 调查单位是调查资料的直接承担者, • 报告单位是调查资料的提交者,二者有 时一致,有时不一致。 • 如工业企业生产经营情况调查,每一工 业企业既是调查单位,又是报告单位; 工业企业设备使用状况调查,每一台设 备是调查单位,每一工业企业是报告单 位。
数据收集对象=总体(调查对象) 数据观测单位=个体(调查单位) 项目=标志 报告单位(资料的提供者)=或≠数据观测 单位
第二章 统计数据的 收集、整理与显示 • 本章要求 • 1、数据收集的含义、要求。数据收集方 案设计、数据收集的各种方法及问卷设 计的技术。 • 2、统计分组和变量数列的编制 • 3、统计表
第一节 统计数据的收集
• 统计数据的来源 • 统计数据有两个方面来源: • 一方面来自已经被收集、加工整理成型 的数据信息,如已经公开出版或公开报 道的数据,是一种间接的数据源; • 另一方面来自统计调查获得的资料,是 一种直接的数据源。
例1:对某市饮食业从业人员的健康情况进 行调查,则: 总体是: 总体单位是: 调查对象是: 调查单位是: 填报单位是:
如果不能正确确定调查对象及调查单位,资 料就不能准确反映实际情况,也许就会产生误导
例2:下列调查中,调查单位和填报单位 一致的是:
(1)企业设备调查; (2)人口普查;
(3)农村耕畜调查;
按收集时间是否连续分为
经常性调查 一次性调查
• 经常性调查又叫连续性调查。是指随着调查现 象发展变化而连续不断地进行登记,以获取事 物全面发展变化过程和结果的资料。 • 一次性调查又叫不连续性调查。是指对调查现 象某一时刻或瞬间的状态进行登记。如人口数 量、设备数量、耕地面积等。一次性调查又分 定期和不定期两种。
数据 所属 时间 等于 {客观 时间}
2h第二章 定量资料的统计描述

频数与频数分布
对称分布:频数最多的组段在中央,图2-2 正偏峰分布:峰向左侧偏移的分布,右侧的 组段数多于左侧,为右偏峰分布。图2-3 负偏峰分布:峰向右侧偏移的分布,左侧的 组段数多于右侧,称为左偏峰分布。 图21
定量变量的特征数
集中趋势统计指标 对于连续型定量变量,描述集中趋势常 用的统计量为算术均数、几何均数和中位 数。 算术均数:适合描述对称分布资料的集中位 置(也称为平均水平)。其计算公式为
频数与频数分布
数据
7.42 20.38 18.36 14.27 14.89 24.52 17.14 14.77 21.75 12.65 8.65 8.40 23.04 17.40 18.37 19.26 13.77 14.37 19.47 18.48 23.02 17.32 24.22 22.55 19.50 26.13 12.50 24.75 15.51 19.83 21.61 29.64 24.13 17.55 17.08 16.99 20.40 12.73 10.86 23.12 21.31 19.69 21.53 16.10 18.12 18.89 20.30 17.25 27.81 19.22 21.46 21.69 11.09 17.98 26.02 18.46 19.38 19.09 21.65 19.22 9.97 23.90 18.89 20.13 11.34 20.87 23.11 16.79 16.32 16.72 22.73 17.45 18.26 21.00 13.81 17.51 12.67 17.19 20.75 27.90 14.94 19.08 23.29 14.56 10.25 13.12 23.02 19.32 22.11 11.74 20.18 20.52 17.67 19.89 15.94 11.75 24.36 19.59 13.17 24.66 21.62 24.14 15.38 19.82 15.83 17.40 25.61 19.12 17.55 14.18 23.07 23.77 18.61 17.48 18.54 21.36 19.53 15.31 19.26 16.52
统计学 第2章 统计数据的描述

第2章统计数据的描述练习:2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB ACDE A B D D CA DBC C A ED C BC B C ED B C C B C(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元):152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率;(2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业,105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
2.3某百货公司连续40天的商品销售额如下(单位:万元):41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。
统计学第二章计量资料的统计描述

02
统计数据整理与展示方法
数据清洗与预处理技巧
80%
缺失值处理
根据数据的分布情况和实际背景 ,选择合适的缺失值填充方法, 如均值、中位数、众数等。
100%
异常值处理
采用箱线图、散点图等方法识别 异常值,并根据实际情况选择删 除、替换或保留。
分类
根据测量水平的不同,计量资料可分为离散型和连续型两类。离 散型数据只能取整数值,如人口数、医院床位数等;连续型数据 则可以取实数范围内的任何值,如身高、体重等。
计量资料特点分析
数值性
计量资料以数值形式表示,具有数量化的特点,便 于进行数学运算和统计分析。
连续性
连续型计量资料在实数范围内可以取任意值,数据 分布的连续性使得统计推断更为精确。
06
统计图表在数据可视化中应用
常见统计图表类型介绍
条形图(Bar Chart)
用于展示分类数据之间的比较,横轴表示分类,纵轴表示数量或比例。
折线图(Line Chart)
用于展示时间序列数据或连续性数据的趋势变化,横轴表示时间或类 别,纵轴表示数量或比例。
散点图(Scatter Plot)
用于展示两个变量之间的关系,横轴和纵轴分别表示两个变量,点的 位置表示变量的取值。
一组观察值中出现次数最多的数。
计算方法
应用场景
中位数计算需先将数据排序,然后取中间 位置的数;众数计算则是统计各数值出现 的次数,取出现次数最多的数。
适用于各种类型的数据,尤其适用于偏态 分布数据。中位数和众数对极端值不敏感 ,因此能较好地反映数据的集中趋势。
不同集中趋势指标比较
算术平均数、中位数和 众数都是描述数据集中 趋势的指标,但各有特 点。
《统计学》课后习题答案

第一章:数据与统计学思考与练习:思考题:1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.试举出日常生活或工作中统计数据及其规律性的例子。
3.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
4.获取直接统计数据的渠道主要有哪些?5.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
6.一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
第二章统计记录与统计调查

统计记录的方法
(1)连续记录的方法:即按时间顺序,没有缺漏地进行 记录(适用于时期数的记录)
(2)定期记录的方法:即每隔一定时间记录一次(适用 于时点数的记录)
(3)定期计算的方法:一可帮助查借;二可帮助发现规 律性的问题
(4)要心里装数
第二节 基本统计单位和基本情况记录
一、基本统计单位:
包括单位法人和产业活动单位两大组成部分。 1、单位法人:指具有法人资格的独立核算单位。
一、统计调查方式
统计调查应当以周期性普查为基础,以经常 性抽样调查为主体,以必要的统计报表、重 点调查、综合分析等为补充。搜集整理基本 统计资料。
统计调查的种类 地位
抽样调查
主体
普查
基础
重点调查
补充
典型调查
补充
统计报表(制度) 补充
按对象范围分 非全面调查 全面调查 非全面调查 非全面调查 包括全面和非全面调查
不定指标台账
指根据本单位的实际情况 和需要,自行安排记录 指标的台账,也称为不 定长台账。
(3)按是否反映指标计算过程分类
指标记录台账
指台账中所记录的指标数 值,仅是现象表现出来 的结果或经计算后所获 得的结果。
指标计算台账
指台账中所记录的指标 数值之间,反映了一定 的计算关系或计算过程。
5、建立健全统计台账的原则和要求
单位法人必须同时具备
依法成立, 有自己的名 称、组织机 构和场所, 能够承担民
事责任
独立拥有和 使用资产, 承担负债, 有权与其他 单位签订
合同
独立核算盈 亏,能够编 制资产负债
表
企业 法人
机关 法人
其他 法人
事业 法人
社团 法人
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
我国的普查有: 人口普查(逢0)、工业普查(逢2)、农业普 查(逢6)、经济普查(逢3、8)等。
统计调查的组织方式
普
查
总体单位
调查单位
对全部单位 进行调查
重点调查
重点调查:是在调查对象中选择在被调查项目的总量中占 有绝大比重的重点单位进行调查,通过这些少数重点 单位的调查,就可以了解调查对象的基本情况。 这些单位数目不多,但其调查标志值在总体的标志值总和 中占有相当大的比重,能大体反映总体的基本情况。 重点调查的调查单位易于确定,它的选择很少受主观因素 的影响,调查单位较少、花费少、并且能及时获得所 需资料。
统计报表制度的特点:
1、统计报表制度是根据国民经济和社会发展宏观 管理需要而周密设计的,项目和指标都力求规范 和完善、使调查资料具有可靠的基础,保证资料 的统一性,便于在全国范围内汇总。 2、依靠行政手段执行的报告制度,要求严格按照 规定的时间和程序上报,具有100%回收率
3、采用层层上报、逐级汇总的方式,可以满足各 级管理部门对统计资料的需要。
统计调查的要求:
准确性:指统计资料符合实际情况,准确可靠,严 格遵守《中华人民共和国统计法》,杜绝任何 形式的弄虚作假,统计调查所收集资料的准确 性是衡量统计工作质量的重要标志。可以说准 确性是统计工作的生命。 及时性:按照统计调查方案中规定的时间完成各项 调查资料的收集和上报工作,及时满足各部门 对统计资料的需求。 如果做不到及时,一方面会贻误统计整理的时间, 使决策机关不能及时得到所需信息。另一方面 落后于事物发展的统计资料即便准确、完整也 没有多大的现实价值。
统计报表制度:是依照国家有关法律的规定,自 上而下统一布置,以一定的原始记录和统计台账 为依据,按照统一的表式、统一的指标项目、统 一的报送时间和报送程序,自下而上逐级提供统 计资料的统计调查方式。它是我国长期的统计调 查行之有效的一种调查方式。 专门调查:为某一特定目的而组织的一次性调查。
统计调查的种类
第二章
统计数据的描述
统计数据来源(统计调查) 统计资料的整理
统计数据的来源
数据来源
直接来源
间接来源
试验
问卷调查
观察
出版物
(或者网上等)
一、统计数据的间接来源
1、统计部门和政府部门公布的有关资料,如各类 统计年鉴 2、各类经济信息中心、信息咨询机构、专业调查 机构等提供的数据 3、各类专业期刊、报纸、书籍所提供的资料 4、各种会议,如博览会、展销会、交易会及专业 性、学术性研讨会上交流的有关资料 5、从互联网或图书馆查阅到的相关资料
统计调查的种类
按调查时间是否连续分:
经常性调查与一次性调查
经常性调查:随着调查对象的发展变化,连续地 进行登记。经常性调查是为了观察总体现象在一 段时间内的数量变化。 一次性调查:间隔一个相当长的时间所作的调查。 一般是为了对总体现象的一定时点上的状态进行 调查。
统计调查的种类
按调查组织方式不同 统计报表制度与专门调查
一、统计调查的意义和要求
统计数据资料是通过统计调查来搜集的。
统计调查是调查主体对被调查客体的一种认识活动,是统 计工作的第二个阶段。它是以搜集占有大量的数字资料为 主体信息。 统计调查所搜集的数据资料既包括原始资料又包括次级资 料。 统计调查在整个统计工作过程中担负着提供基础资料的 任务,是统计整理和统计分析的基础和前提,所有的统 计分析和统计研究都是在进行统计调查搜集原始资料的 基础上进行的。因此,统计调查取得的资料质量直接影 响统计工作最终成果的质量。
统计调查的种类
按调查范围分
全面统计报表制度 全面调查 普 查
非全面调查
重点调查 典型调查 抽样调查
统计调查的种类
全面调查:就是对调查对象的全部单位无 一例外的进行调查。
非全面调查:对调查对象的一部分单位进 行调查。
全面调查和非全面调查的划分是以调查时调查对 象所包含单位的多少为依据,并不是以最后取得 的资料是不是全面为依据。
统计调查的种类
统计报表的分类:
1、按调查对象范围的不同 2、按照报送周期不同
3、按报送的方式不同
4、按填报单位不同(基层报表和综合报表) 5、按照实施的范围不同
统计调查事业单位对其各项生产活动和业务活动的过程 和结果,通过一定的表格形式,用数字或文字所做的 最初记载。 2、统计台账 把原始记录或有关汇总表上的资料,用表式按时间顺 序逐期进行登记汇总与整理的一种表册。它是为系统 地登记整理和积累统计资料而设置的一种专用表册。
在收集二手资料时要注意的几个问题:
数据是谁搜集的? 为什么目的而搜集的? 数据是怎样搜集的? 什么时候搜集的? 在引用间接资料的时候要注明资料来源。
二、统计数据的直接来源
统计调查(主要用来取得社会经济数据) 科学试验(主要用来取得自然科学数据)
统计调查是整个统计认识活动的基础, 决定着统计认识过程及其结果的成败
统计调查的要求:
全面性:根据统计调查的目的,对统计调查单 位的资料,不重复不遗漏的进行搜集。如果 收集的资料残缺不全,就不能反映调查对象 的全貌,就会给统计整理和统计分析带来困 难,从而直接影响统计工作的质量。 效益性:整个统计工作都应注重效益,争取以 最少的投入获得最大的产出。在统计调查的 各个环节都应该测算其成本费用。在保证质 量的前提下尽可能的降低成本费用。
统计调查的组织方式
报表制度
总体单位 调查单位
可以全面调查,但 通常是调查限定规 模以上的总体单位
普查
普查:是专门组织的一次性的全面调查。它 主要用于搜集某些不能够或不适宜用定期统 计报表搜集的统计资料。
普查的特点
特点1:普查是一次性调查,其主要用来调查属于 一定时点上的社会经济现象的总量。由于普查涉及 面广、调查单位多,需要耗费大量的人力、物力、 财力和时间。 特点2:普查一般需要规定统一的标准时间,以避 免调查数据的重复或遗漏,以保证普查结果的准确 性。 特点3:普查数据一般比较准确、全面、系统,规 范化程度也高。 特点4:普查的适用范围比较窄,一般只适用于最 基本、最重要的全面情况的调查。