第2章-统计数据的收集与整理

合集下载

第2章统计数据的搜集与整理精品PPT课件

第2章统计数据的搜集与整理精品PPT课件

▪ 优点:应用范围广、结果正确、直接
▪ 缺点:成本高、研究时间长。
统计学
2-15
统计调查的组织方式
►统计报表
▪ 依据国家统计局或国家各行政管理的规定,自上而下 地统一布置,以一定的原始记录为依据,按照统一的 表式、指标、时间和程序自下而上地逐级提供基本统 计资料的调查方式。
►专门调查
▪ 普查
▪ 抽样调查
▪ 重点调查
►重点单位是指在全体中虽然数目不多,所占比不 大,但调查标志值却占较大比重。
▪ 典型调查
►有意识地选择有典型意义或具有代表性的单位。
统计学
2-16
统计报表
►是我国定期搜集基本统计资料的一种重要形式。 ►特点
▪ 来源于基层单位的原始记录 ▪ 项目稳定,有利于资料积累和动态比较
►种类
▪ 国家、部门和地方统计报表 ▪ 全面统计报表和非全面统计报表 ▪ 定期报表和年报 ▪ 基层表表和综合报表 ▪ 电讯报表和书面报表
►统计调查方法
▪ 现场观察法、报告法、问卷法、访谈法、实验 采集法等。
►统计调查的组织方式
▪ 统计报表 ▪ 专门调查
统计学
2-12
抽样调查方案
►确定调查目的(为什么调查) ►确定调查对象和调查单位
▪ 有许多性质相同的调查单位组成的现象总体。 ▪ 调查单位:所要研究的个体。
►确定调查项目:调查中所要调查单位的特征。 ►设计调查表与问卷设计 ►选择调查方法 ►确定调查时间和调查期限 ►制定调查的组织实施计划
统计学
2-13
统计调查方法
► 现场观察法
▪ 带有明确的目的到现场,直接观察获得数据信息。 ▪ 优点:准确;缺点:成本大
► 报告法(通讯法)

统计学 第二章 统计数据的搜集、整理和显示

统计学 第二章 统计数据的搜集、整理和显示

(二)实验方式
所谓实验方式,就是运用自然科学的试验 法,通过观测人为安排条件下试验产生的各种 结果并加以记录的方式来获取数据,或通过人 为安排条件下的试验来探求某个或某些因素对 所研究事物的数量影响程度和作用方式,凭借 实验结果来揭示所考察因素与所研究事物之间 的数量因果关系。
1、实验的原则
运用实验方式需要遵循下列两个原则:均衡分散
1、普查
普查是根据特定的统计研究目的而专门组织的 一次性的全面调查,用以收集所研究现象总体的全 面资料(即总体中的所有个体都是观测单位)。 普查的组织方式一般有两种:一是建立专门的 普查机构,配备一定数量的普查人员,对观测单位 直接进行登记。如我国历次的人口普查等。二是利 用观测单位的原始记录和核算资料,颁发调查表, 由观测单位按要求填报。如物资库存普查等。
重点调查的单位可以是一些企业、行业、 也可以是一些地区、城市。此种调查方式的优点是, 所投入的人力、物力少,而又较快地搜集到统计 信息资料。一般来讲,在调查任务只要求掌握基 本情况,而部分单位又能比较集中反映研究项目 和指标时,就可以采用重点调查。
在下列问题中为了得到数据,采用什么调查? • 为了买校服,了解每个学生衣服的尺寸。 • 商检人员在某超市检查出售的饮料的合格率。 • 对占全市工业总产值五分之一的六个大型企 业进行调查,以了解全市工业总产值的基本 情况。
观测性误差
数 据 收 集 误 差
也叫登记性误差或调查性误差,它 是在调查观测的各个环节因工作粗 心或被观测者不愿很好配合而造成 的所收集数据与实际情况不符的误 差,包括计量错误、记录错误、计 算错误、抄写错误、汇总错误、计 算机输入误差等工作误差,以及被 调查者不愿或难以提供真实情况的 误差,有时还存在调查人员弄虚作 假的误差和各种人为因素干扰的误 差。 这部分误差通常是人为造成的,通 过对统计调查资料的严密审核,是 可以发现并加以更正的。观测性误 差则可能存在于任何统计调查。 因样本不能完全代表总体而产生 的估计结果与总体真实数量特征 不符的误差。根据样本不能完全 代表总体的原因不同,代表性误 差又分为系统性代表性误差和偶 然性代表性误差两种。

统计调查统计数据的收集与整理

统计调查统计数据的收集与整理
29
谢 谢!
30
17
2.试验设计
科学试验是进行科学研究的重要手段,在 许多学科中几乎都起着积极的作用。统计中的 试验设计是科学试验研究的组成部分之一 。 试验设计,包括五个相互关联的环节,分别是:
方案设计 方案实施 数据采集 数据分析 优化生产
18
(二)统计资料的间接收集 凡不是通过直接的统计调查和试验,而是 从其他各种渠道搜集的第二手资料,我们 把它总称为统计资料的间接收集。 间接资料的来源大体包括:统计年鉴、 统计摘要、统计资料汇编、统计台账、统 计公告、报纸、杂志、网上资料等。
25
真值与相对真值之间存在的差异应该以不
影响统计认识为前提,否则说明统计方案 存在问题。
真值与相对真值可以作为观测数据质量评 估的参照数。
26
(二)统计调查误差
调查误差是指经过调查所获得的统计数值 与被调查对象实际数值之间的差别。
调查误差有两种:
一种是登记性误差 一种是代表性误差
登代记表误性差误是差由是于 由调 于查 非过 全程 面中 调 各查有只关观环察节总工体作 一的 部失 分误 单而 位造 , 成这的部。分例单如位,不调 能查 完方 全案 反中 映有 总 关体规的定性或质解而释产不 生清 的楚 误而 差产 。生 歧义,或计算错误、抄录错 误,或汇总错误以及不真实 填报等。
第二章 统计数据的收 集与整理
第一节 统计数据收集
2
一、收集资料的方式 概括起来分为直接方式和间接方式
(一)统计资料的直接收集
主要包括统计调查和试验设计
(二)统计资料的间接收集
通过各种渠道收集第二手资料
3
(一)统计资料的直接收集
1.统计调查
统计报表

西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示

西南财经大学向蓉美、王青华《统计学》第三版——第2章:统计数据的收集、整理与显示

– 调查内容详细、提供重要国情国力资料、数 据的规范化程度较高
提供抽样框

– 特别注意

• 必须规定标准时间 • 在规定时间内统一进行
• 基本内容和指标解释统一并相对稳定
• 需要PPT配套视频,请加VX:1033604968 11
Statistics
2.统计报表 –概念 • 按照国家有关法规的规定、自上而下地统一 布置、自下而上地逐级提供基本统计数据。 –特点 • 全面性、稳定性、连续性、可比性 • 曾经是我国数据收集的主要方式 • 耗费大、数据质量差等等。
3
Statistics
§2.1.2 统计调查方案
调查方案的内容

调查
调查

对象
项目


调查
和调

单位
查表

4
Statistics
1.确定调查目的
调查要达到的具体目标 回答“为什么调查?” 调查之前必须明确
5
Statistics
2.确定调查对象和调查单位
调查对象:调查研究的总体或调查范围 调查单位:需要对之进行调查的单位。可以是调查
12
Statistics
第二次全国经济普查的标准时点是2008年12月31日,时
期资料为2008年度。
第六次quanguo人口普查
主要目的:人口普查是一项重大的国情国力调查。组织开
展第六次全国人口普查,将查清十年来我国人口在数量、结构、
分布和居住环境等方面的变化情况,为科学制定国民经济和社
会发展规划,统筹安排人民的物质和文化生活,实现可持续发
重点单位——标志值在总体标志总量中占有 较大比重的单位

管理统计学 第二章 统计数据的搜集与整理

管理统计学 第二章 统计数据的搜集与整理

• 计算相对数的基本公式为:
相 对 数 =比 较 数 值 ( 比 数 ) 基 础 数 值 ( 基 数 )
• 相对数的种类很多,根据其表现形式可分为两类:
一类是有名数,即凡是由两个性质不同而又有联系的绝对 数或平均数指标对比计算所得的相对数,一般都是有名数,而 且多用复合计量单位,如人口密度、人均占有土地和人均国内 生产总值等。
• 总体和个体的概念不是固定不变的, 均工资水平、学生的智商。
我们能否得到A部队的患病率较高的结论。 一家移动 公司最近宣布它将从东南亚运营机构裁减80名职员。
随着研究目的的不同,它们二者是会 也就是说,数值可以是区间内的任意点。
询问法、观察法和实验法三种。
统计总体按其包含的单位数分,可分成:有限总体和无限总体两类。
– 询问法、观察法和实验法三种。 我们关心什么变量?变量的性质是什么?
也就是说,离散变量表现为某些数值,各个可能的数值之间存在间隙。
定性
– 除了以上三种主要的调查方法外,还有计算机 连续变量:如果得到的一组可能结果是区间集合内的任意数值,那么我们称这种定量变量为连续变量。
相对数通常用百分比、千分比或万分比等来表示。
根据Gallop公司的调查结果,我们很想证实是否 有足够的证据让我们得出以下结论:80%以上的 消费者愿意通过互联网利用信用卡进行购物。
1.我们关心什么变量?变量的性质是什么?
2.测量指标是什么?
【例2-3】 在下列事项中采用什么测量指标 能够最好地描述相关信息?
A.一家移动 公司最近宣布它将从东南亚运营机构裁减80名职员。 B.天气预报说,昨天下午1点53分观察到的温度值突破了新加坡的 记录。 C.一家大公司的人力资源管理部门想要调查员工是否对在职培训感到满

第2章 统计数据的收集与整理习题

第2章 统计数据的收集与整理习题
设20个企业的产值利润率分别是:
单位:%
6
2
9
4
25
4
10
27
9
8
12
8
17
16
10
18
14
24
11
9
具体分组如下:
序号
按产值利润率分组(%)
企业数(个)
1
0——10
9
2
10——20
8
3
20——30
3
产值利润率的取值范围从0——30%,使20个企业都有组可归,这就遵循了分组的“穷尽原则”。其中有两个企业的产值利润率为10%,该数值同时作为相邻两组的界限值,统计上规定“上限不在内”,把这两个企业列在第2组,这就遵循了“互斥原则”。
②执行菜单命令[工具][数据分析],调出“数据分析”对话框,选择“直方图”选项,调出“直方图”对话框。
注意,若“数据分析”命令没有出现在“工具”菜单上,则应先使用[工具][加载宏]命令来加载“分析工具库”。
③在“直方图”对对话框中,输入相关数据,见下图。
输入区域:$A$1:$A$51
接收区域:$B$1:$B$6(接收区域的数值应按升序排列)
包括折线图的直方图如下:
⑦对于曲线图。右键单击上图中的折线,在弹出式菜单中单击“数据系列格式”,在调出的对话框的“图案”选项卡下,选中“平滑线”选项,再单击“确定”按钮即可。结果如下图。
(4)累计曲线图
(5)根据频数分布曲线图,人均可支配收入的分布类型属于钟型分布。
10236
4
20
27
86
合营饮食业
17
1144
17
1144


统计学第二章数据搜集整理

统计学第二章数据搜集整理

普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)

n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合

第2章统计资料的搜集与整理

第2章统计资料的搜集与整理
进行调查。
• 2)目的是推断总体的未知数字特征。 • 3)最常用的调查方式。 • 4)具有经济性好、时效性强、适应面广、
准确性高等特点。
2020/3/3
20
• 3、统计报表 • 统计调查方式之一。 • 过去曾经是我国主要的数据搜集方式。
• 按照国家有关法规的规定,自上而下地 布置,自下而上地逐级提供基本统计数 据。
出来,为统计资料的使用和分析做好准备。
2020/3/3
40
四、统计分组(P39)
• (一)统计分组的意义 • 统计分组是将总体所有单位按照一定的
标志区分为若干部分。在不同部分之间, 存在着着差异,而在每一部分内部,我 们忽略其差异,视其性质相同。
• 分组的关键是选择恰当的分组标准和准 确地划分组的界限。
测量、登记、计算上的差错以及调查者和被调查者 主观原因使调查中获得的原始资料不准确引起的误 差而引起的误差。 • 这种误差不是抽样调查所特有的,而是所有统计工 作都可能存在、并难以计算和控制的。 • 它的减少或避免,只有通过改进调查设计、加强组 织和管理、提高统计人员素质予以实现。
2020/3/3
32
真题分析
• 统计资料的基本特征是【 】 • A.数量性、总体性、客观性 • B.准确性、及时性、全面性 • C.大量性、同质性、差异性 • D.科学性、具体性、社会性 •A
2020/3/3
7
真题分析
• 判断并改正划线部分:统计资料描述的 是大量的、密集性事物的综合特征。这 说明统计资料具有客观性。
16
我国历次人口普查资料
普查时间 1953.7.1 1964.7.1 1982.7.1 1990.7.1 2000.11.1 2011.11.1
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
如:第五次人口普查登记的标准时间是2000 年11月1日零时
(3)准确性一般较高,较规范; (4)适用的对象较窄,只能调查一些最基本、 最一般的现象。
2、抽样调查
从调查对象的总体中随机抽取一部分单位作为样 本进行调查,并根据样本调查结果推断总体数量特征。
●特点: (1)经济性强:工作量小、可节省人、财、物力
1、抽样调查是随机抽取调查单位,不存在对调 查对象选择的主观性,因此可以根据抽样结果推断总 体的数量特征;
2、重点调查和典型调查不是随机取样,具有一 定的主观性,因此调查结果不能推断总体。
(二)数据的搜集方法
1、访问调查(派员调查):调查者与被调查者通 过面对面的交谈获取调查资料;
2、邮寄调查:通过邮寄或其他方式将问卷送至被 调查者,由被调查者填写问卷并寄回或投放到指定收 集点;
●绝对统计数据的计量单位: 实物单位(吨、公里) 价值单位(元、万元)、 复合单位(吨公里、元/人)
(2)相对数
相对数是两个绝对数的比值,反映事物的相对 数量
● 相对数的表现形式: 比例、比率 比例(Proportion) :一个总体中各个部分的数 量占总体数量的比重,通常反映总体的构成或结构。 例5:一数量为N的总体被分为K个部分,各部分 的数量分别为 Ni,则比例定义为:Ni/N。显然有:
(2)时效性高:可迅速、及时地获得所需要的信 息
(3)适应面广:可获得更广泛的信息,适用于各 个领域、各种问题的调查;
(4)准确性高:用工量小,从而工作可做得更细, 误差往往很小。
3、统计报表
按国家有关法规规定,自上而下地统一布置,自下而上地 逐级提供基本统计数据。
●特点:
统一的表式、统一的指标、统一的报送时间、统一的报送 程序。
Quantitative, discrete.
三、统计数据的表现形式
1、数量型统计数据两种基本表现形式:
绝对数、相对数
(1)绝对数: 绝对数是统计数据的基本表现形式,表明事
物(现象)的总体规模或一般水平。 如:一地区的总人口、GDP、商品零售额等
●绝对数按其反映事物现象的时间状况不同可分 为:
时期数和时点数。
N 1N N 2N N kN 1
比率(Ration) :各不同类别的数量比值。
可以是同一总体中不同部分的数量对比 如:总人口中:男性/女性;
GDP中:固定资产投资/居民消费 GDP中:三次产业增加值之比 可以是同一现象在不同时间或空间上的数量之比 如:不同年份GDP之比 经济增长率
a)
What is your age?
Quantitative, theoretically continuous, but discrete in practice.
b)
What is your sex?
Qualitative.
c)
What is your marital status?
Qualitative.

本户
省,市



住址
自治区

街道
居委会
姓名
与户 主关 系
性别 出生 民族 年月
常住人口 户口登记 状况
文化 行业 程度
1
2
345
6
78
村 街巷 号 职业 就业 婚姻
状况 状况
9 10 11
生育 子女 总数
12
申报人:
普查员:
填报日期: 月 日
户主签名:
佛罗里达州Lobster Pot 饭店所用的顾客意见调查表:
如:年龄、产品产量、零件尺寸
数量变量
离散变量(discrete variable) 连续变量(continuous variable)
Ex 1:
Information concerning a magazine’s readership is of interest both to the publisher and to the magazine’s advertisers. A survey of 20 subscribers included the following questions. For each, determine the data type of possible responses.
• 时期数反映事物现象在一定时期内的总量;
• 如:产量、产值、出生人口
• 时点数反映事物现象在某一瞬间时刻上的总量;
如:人口数、股票价格等
●特点:
1、时期数可连续计数,并可累计,时点数只能 间断计量,不能累计;
2、时期数形成时间序列数据(Time series data); 3、时点数形成截面数据(Cross-sectional data)。
对不同类型的数据,采用的统计方法可能有所不同:
品质数据:组频率; 数量数据:更多
注意: • 变量:表征个体特征的量; • 变量值:变量的具体表现
统计数据
品质变量(qualitative variable):变量由品质数据来记录
如:性别(男、女);产品等级(一等、二等、三等)
数量变量(数字变量)(quantitative variable):变量由数量 数据来记录
d)
Is your annual income less than $20 000, between $20 000 and
40 000, or over $40 000?
Qualitative, ranked.
e)
How many other magazines do you subscribe to?
• 按照对事物计量的精确程度,可将所采用的计 量尺度由低级到高级分为四个层次: 定类尺度(Nominal Level)列名水准 定序尺度(Ordinal Level)顺序水准 定距尺度(Interval Level)间隔水准 定比尺度(Ratio Level)比率水准
(一)定类尺度
定类尺度(列名尺度):按照事物的某种属性对其进行平 行的分类或分组。
XX 产品 能力 产量
1
2
1
2
1
2
单位负责人:
填表人:
报出日期:
4、重点调查
从调查对象的全部单位中选择少数重点单位进行 调查(适用于“同类”中的“大户”)。
5、典型调查 从调查对象的全部单位中选择一个或几个有代表 性的单位进行调查。(不一定针对“大户”)
▼注意:
重点调查、典型调查与抽样调查的不同处在于:
●类型:
(1)按报送调查范围分: 全面报表:调查对象中的每一个单位都填报 非全面报表:只要求调查对象中的一部分单位填报
(2)按报送时间间隔分 日报、月报、季报、年报
(3)按报送地域(机构)范围分: 国家报表、地方报表、部门报表
主要工业产品生产能力 200 年
省辖市 XX 产品 名称 能力 产量
XX 产品 能力 产量
如:人口普查、工业普查等 ●特点: (1)通常是周期性的或一次性的,涉及面广、耗 时、费力,一般需间隔较长时间; 如:1953、1964、1982、1990、2000(人口普查)
逢“0”年份:人口普查 逢“3”年份:第三产业普查 逢“5”年份:工业普查
(2)一般需要规定统一的标准调查时间,以 避免调查数据的重复或遗漏;
(二)定序尺度
定序尺度(顺序尺度):是对事物之间等级或顺 序差别的一种测度。
例2:产品等级(一等品、二等品…) 考试成绩(优、良、中、可、差)
●特点: 1、不仅可以测度类别差(分类),还可以测度 次序差(比较优劣或排序); 2、无法测出类别之间的准确差值,因此该尺度 的计量结果只能排序,不能进行算术运算。
不同地区GDP之比 两个地区经济水平差异
•百分数(Percentage):将对比的基数抽象化为 100而计算的相对数。
第二节 统计数据的搜集
统 计 数 据 的 来 源
从 数 据 本 身 的 来 源 看 直 接 调 查 或 试 验 从 使 用 者 的 角 度 看 直 接 调 查 和 科 学 试 验 ( 直 接 的 统 计 数 据 )
二、数据的类型
统计数据是采用某种计量尺度对事物进行计量的结果。 采用不同的计量尺度 不同类型的统计数据:
定性数据 定量数据
定性数据(品质数据)(Qualitative data):说明的 是事物的品质特征,不能用数值表示。(由定类尺度或 定序尺度计量形成)
定量数据(数量数据)(Quantitative data):说明的 是事物的数量特征,能够用数值表示。(定距尺度或定 比尺度计量形成)
第二章 统计数据的收集与整理
一、数据的类型与计量 二、统计数据的搜集
三、统计数据的整理
第一节 数据的计量与类型
一、数据的计量尺度(Levels of Measurement) 统计数据是对客观现象计量的结果。
Data are the facts and figures that are collected, analyzed, and summarized for presentation and interpretation.
We are happy you stopped by the Lobster Pot Restaurant and want to make sure you will come back. So, if you have a little time, we will really appreciate it if you will fill out this card. Your comments and suggestions are extremely important to us. Thank you!
3、计量结果可以进行加减运算(加减运算有意义); 4、“0”是测量尺度上的一个测量点,并不代表“没 有”
相关文档
最新文档