统计学第三章
统计学 第三章抽样与抽样分布

=10
= 50 X
总体分布
n= 4
x 5
n =16
x 2.5
x 50
X
抽样分布
从非正态总体中抽样
结论:
从非正态中体中抽样,所形成 的抽样分布最终也是趋近于正态分 布的。只是样本容量需要更大些。
总结:中心极限定理
设从均值为,方差为 2的一个任意总体中抽 取容量为n的样本,当n充分大时(超过30),样本 均值的抽样分布近似服从均值为μ、方差为σ2/n的
总体
样本
参数
统计量
总体与样本的指标表示法
总体参数
样本统计量
(Parameter) (Sample Statistic)
容量 平均数 比例 方差 标准差
N
n
X
x
p
2
s2
s
小练习
某药品制造商感兴趣的是用该公司开发的某 种新药能控制高血压人群血压的比例。进行了一 项包含5000个高血压病人个体的研究。他发现用 这种药后80%的个体,他们的高血压能够被控制。 假定这5000个个体在高血压人群中具有代表性的 话,回答下列问题: 1、总体是什么? 2、样本是什么? 3、识别所关心的参数 4、识别此统计量并给出它的值 5、我们知道这个参数的值么?
正态分布
一个任意分 布的总体
x
n
当样本容量足够 大时(n 30) , 样本均值的抽样 分布逐渐趋于正 态分布
x
X
总体分布
正态分布
非正态分布
大样本 小样本 大样本 小样本
正态分布
正态分布
非正态分布
三 中心极限定理的应用
中心极限定理(Central Limit theorem) 不论总体服从何种分布,从中抽取
统计学原理(第三章)

《统计学原理》 刘鑫春 2
第三章第一节 作用 总量指标可以反映被研究总体的基本状 况和基本实力。 总量指标是制定政策、计划以及检查政 策和计划执行情况的基本依据。 总量指标是计算相对指标、平均指标以 及各种分析指标的基础。
累计到 3 季度止计划执行进度( %) 260 320 100 % 81 . 25 %
计算结果表明,该企业某年第三季度已过,进度已完成计划任 务81.25%,说明计划进度执行较快
《统计学原理》 刘鑫春 17
第三章第二节 中长期计划完成情况的检查
(5年或以上的计划)
• 水平法:在计划制定中,以计划最后应达到的能 力水平为目标时,采用该法。
《统计学原理》 刘鑫春 26
第三章第二节 动态相对指标:又称发展速度,它是同类现 象在不同时间上变动程度的相对指标。
动态相对指标(%)= 报告期水平 基期水平 × % 100
动态相对指标的详细内容在本书第四、五 章将专门介绍
《统计学原理》 刘鑫春
27
第三章第二节 三、计算和应用相对指标应注意的问题 要选择好对比的基数 保持相对指标的可比性
例:某年甲商业企业劳动率为1.10万元,乙企业为1.00万元。 则甲企业劳动率是乙企业的1.1倍(1.10/1.00),1.1倍是 不同企业的同一指标即劳动率(平均指标)的比。
注:计算比较相对指标,通常采用平均指标或相对指 标进行对比,以准确反映现象发展的本质差异。这 是一个静态对比指标
《统计学原理》 刘鑫春 22
按采用的计量单位不同 实物指标—根据实物单位计算得到的 总量指标; 价值指标—以货币为单位计算的总量 指标; 劳动指标—以劳动量计算的总量指标。
统计学第三章名词解释

3.1、什么是统计整理?统计整理的程序有哪些?统计整理是根据统计研究任务的要求,对统计调查阶段所取得的各项原始资料进行分类、汇总,使之系统化、条理化、科学化,得出能反映现象总体特征的综合资料的各种过程。
统计资料整理既是统计调查阶段的继续和深入,又是统计分析阶段的基础和前提,在统计工作中起着承前启后的作用。
(1)根据研究目的设计整理汇总方案。
(2)对统计调查资料进行审核、订正。
(3)进行统计分组和汇总。
(4)将汇总整理的资料编制成统计表(5)统计资料的积累、保管和公布。
3.2 统计资料审核哪些内容?统计调查资料的审查检查资料的完整性和及时性应以统计制度和调查方案为准,核实所有被调查单位的资料是否齐全,是否按规定的份数、项目和时间上报。
检查资料的准确性主要是核实调查材料的口径、计算方法、包括的范围、计量单位等是否符合要求。
检查的方法有逻辑检查和计算检查。
逻辑检查是从合理性方面去检查资料的正确性。
计算检查是通过计算,检查在计算方法、计量单位、计算结果、小计、合计、总计间的各项是否正确等等3.3、什么是统计分组?它有什么作用?统计分组根据统计研究的目的和客观现象的内在特点,按某个标志或几个标志把被研究的总体划分为若干个不同性质的组的一种统计方法。
统计分组的对象是总体。
统计分组标志可以是品质标志,也以是数量标志。
(1)划分社会经济现象的类型统计的研究对象是错综复杂的,具有各种不同的类型。
通过统计分组,可以从数量方面说明不同类型现象的数量特征,表明不同类型现象的本质和发展规律。
(2)反映现象的内部结构及其比例关系将所研究现象按某一标志进行分组,计算出各组在总体中的比重,用以说明总体内部的构成。
同时将总体各组之间进行对比,就可以反映各组之间的比例关系。
(3)分析现象之间的依存关系现象不是孤立的,而是相互依存和相互联系的.利用统计分组分析现象之间的依存关系,首先用影响标志对总体进行分组,然后计算出结果标志的数值,从而分析两个标志的联系程度和方向。
统计学原理(第三章)

3.4数据资料的展示
3.4.1定类数据的展示 3.4.2定序数据的展示 3.4.3定距数据的展示 3.4.4定比数据的展示
3.4.1定类数据的展示
1)条形图:适合于展示分类型数据 条形图是用宽度相同的条形的长短来表 示数据的变动。 2)圆形图:适合于展示结构型数据 又称饼图,是用圆形及圆内扇形的面积 来表示数值大小的图形。
品质数列 分配数列 变量数列 组距数列 不等距数列 单项数列 等距数列
3.3.1分配数列
品质数列:按品质标志分组后,再按一定顺序排列, 所组成的数列。如表3-2所示。
表3-2 某商学院新生按专业分组表
按专业分组 金融学 会计学 工程管理 工商管理 国际贸易 财务管理
人数(人) 56 55 50 58 54 40
1)钟型分布 2)U型分布 3)J型分布
钟型分布
钟型分布又叫正态分布,其特征是“两头 小,中间大”,分布曲线图宛如一口古钟。
钟型分布的类型
对称的钟型分布 非对称的钟型分布
U型分布
U型分布的特征是“两头大,中间小”, 分布曲线图宛如英文字母U。
J型分布
J型分布的特征是“一边大,一边小”,分 布曲线图宛如英文字母J。 1)正J型分布:次数与变量值同向变化 2)反J型分布:次数与变量值反向变化
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
3.3.1分配数列
不等距数列 表3-7 某企业职工月收入分组
按月收入分组 人数(人) 频率(%)
500以下
500—800 800—1000 1000—1500 1500以上
10
15 25 12 8
统计学第3章统计整理

14
7.0 21 10.5 193 96.5
4 90 —100 31 15.5 52 26.0 179 89.5 5 100—110 65 32.5 117 58.5 148 74.0
6 110—120 52 26.0 169 84.5 83 41.5
7 120—130 8 130—140
23 11.5 192 96.0 31 15.5
一、分配数列的概念和种类
1.概念
统计总体按照某一标志分组以后, 用以反映总体各单位分配情况的统计 数列,称分配数列,又可称次数分配, 或次数分布。
它由两部分组成: 总体所分的各个组和各组所拥有的 单位数(次数或频数)。
例
月工资分组(元) 工人数(人) 占总数比重(%)
1000 以下
210
39.6
1000-1500
组距式 分组
以变量值变动的一个区间作为一组,区间的 距离称为组距。适用于连续型变量和离散型 变量的变量值较多的情况。
第三章 统计整理
在进行组距分组时,会涉及到一 些问题,包括:等距分组和不等距分 组、组限、组中值。
第三章 统计整理
等距 分组
不等距 分组
各组组距均相等。如: 10—20 20—30 30—40
组中值 = (上限值+下限值)÷2
开口组组中值的计算: 缺下限:组中值=本组上限— 相邻组组距/2
缺上限:组中值=本组下限+ 相邻组组距/2
例
产值(万元)
第一组组中值:
50以下 50 — 60 60 — 70 70以上
50-(10÷2)= 45 最后一组组中值: 70+(10÷2)= 75
第二节 分配数列
较合适是? (c)
统计学(第三章)

四、统计分组方法 统计分组的关键在于选择分组标志和 划分各组界限。划分各组界限,就是要在 分组标志的变异范围内,划定各相邻组之 间的性质界限和数量界限。 (一)按品质标志分组的方法 选择反映事物属性差异的标志作为分 组标志,界限比较明确,类型比较稳定。 如,企业按所有制分组、人口按性别分组 等。
(二)按数量标志分组的方法 数量标志有离散型和连续型之分,其分 组的方法和形式也不同。 1、按离散型变量标志分组其形式有2个 (单项式分组和组距式分组); 2、按连续型变量标志分组其形式只有一 个(组距式分组)。
某班级学生按性别分组 学生按性别分组 男 女 合 计 人数(人) 60 40 100
2、按数量标志分组。按数量标志分组 就是选择反映事物数量差异的数量标志作 为分组标志,并在数量标志的变异范围内 划定各组界限,将总体划分为性质不同的 若干组成部分。 3、根据分组选择标志的多少不同,统 计分组又可分为简单分组和复合分组。 简单分组。简单分组是指对统计总体 仅按一个标志进行分组。
二、统计整理的步骤 1.设计统计整理方案 2.对原始资料进行审核 3.对原始资料进行分组和汇总 4.编制统计表或绘制统计图 综上所述,设计整理方案、对原始资 料进行审核是整理的前提,统计分组是统 计整理的基础,统计汇总是统计整理的中 心环节,编制统计表或绘制统计图是统计 整理的结果。
1.2、统计分组 一、统计分组的意义 统计分组既是统计认识问题的一种基 本方法,又是统计整理工作的具体内容之 一,因此它在整个统计工作过程中具有十 分重要的作用。
4、次数分配的类型
对称分布
右偏分布
左偏分布
正J型分布
反J型分布
几种常见的频数分布
U型分布
1、钟形分布 钟形分布的特征是“中间多,两边少”,这类 分布是以平均值为中心的,越接近中心,分配的次 数越多,离中心越远,分配的次数越少,其曲线就 像一口古钟。
统计学课件第三章 综合指标(总量 相对 平均 变异指标)

水平法的计算方法:
1、 计划完成程度 计划期末年实际达到的水平
计划期规定末年应达到的水平
例、某地区“九五”计划规定某种产品产量在2000年应达到 200万吨,实际到220万吨。则该产品产量的计划完成程度 为:
220 计划完成程度 100% 110% 200
计算表明,超额10%完成“九五”计划。 2、计算提前完成计划的时间:是以连续12个月的实际数达到 了计划规定的末年水平,则往后的时间均为提前完成计划的 时间。 例:某种产品产量从1999年7月份至2000年6月份实际已达到 200万吨。则该产品产量提前半年时间完成计划。
折合系数 (4)=(2) ÷21% 1.00
(甲)
(1)
(2)
硫酸铵
82000
21.00
硝酸铵
25000
34.65
8662.5
1.65
41250
尿
素
45000
46.20
20790
2.20
99000
碳酸氢铵
16000
16.40 —
2624
0.7809 —
12495
合计
168000
49297
234745
第一产业
第二产业 第三产业
103.53 107.41
298.67
585.38 545.21
284.28
604.39 591.04
283.00
657.51 648.83
95.18 99.54 103.25 111.25 108.41 109.78
5、计划完成程度相对数:是现象在某一段时间 内实际完成数值与计划任务数值的对比。 计划完成程度相对数=实际完成数 / 计划任务数
统计学第三章 统计数据的整理

汇总技术:
有传统手工汇总和现代电子计算机汇总两种技术。
(1)手工汇总。常用的汇总方式有四种: • 划记法。划“正”字符号计数,多用于对总体单位数或次数的简单汇总。
• 过录法。将原始资料分类过录到事先设计的汇总简表中,可用于对内容项 目较多的资料的汇总。
• 折叠法。将每张调查表中需要汇总的同类项目及数据折压一个印记,一张 一张的重叠在一起,再进行汇总。这种方法一次只能选择一个项目及其数 据进行汇总,故适用于数据较少的资料。
• 卡片法。将需要汇总的项目数据分类登记在卡片上,再汇总计算。这种方 法适用于总体单位数多、且多采用复合分组形式的事物,特别是设备、器 材类的实物资产的汇总。
(2)电子计算机汇总。其数据处理程序如下: • 第一步,编程。使用计算机语言编写出一套完整的数据处理程序。
• 第二步,数据录入。计算机自动按程序进行数据处理,并将数据处理结果 存储在磁盘、磁带等磁介质中。
树茎
数叶
数据 个数
10 7 8 8
3
11 0 2 2 3 4 5 7 7 7 8 8 8 9
13
向上累 计个数
3
16
12 0 0 1 2 2 2 2 3 3 3 3 4 4 4 5 5 6 6 7 7 7 8 8 9
24
40
13 0 1 3 3 4 4 5 7 9 9
10
50
14 0 0 1 3
16284
22.3
第三产业
20228
27.7
合计
73025
100.0
3、变量数列的编制
成绩 (分)
某班学生《统计学》考试成绩分布表
学生人数 频率 (人) (%)
向上累计
人
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
按数量标志分组的组限应是决定事物性质的数量界限。 组限的确定:
间断组距式分组:相邻两组的上、下组限的取值是间断的。(离散变量) 连续组距式分组:相邻两组的上、下组限的取值是连续的。(连续变量)
5.
组中值:各组变量范围的中间数值,反映各组变量值的一般水平。
1.
组中值=(上限+下限)/2
6.
是统计工作必不可少的中间环节。 实现从个体单位标志值过渡到总体数量特征值的必经阶段。 统计资料整理的质量如何,会直接影响统计分析的效果。 统计整理方案 统计资料审核 统计资料的分组和汇总 编制统计图表 统计资料的积累和保管
内容(程序):
案例
分配数列(频数分布)
分组数据的图示
(直方图的绘制)
品质数列 分配数列 变量数列
组距数列 单项数列 等距数列
异距数列
品质数列
•
品质数列是按品质标志分组形成的分配数列 例如,我国第五次人口普查人口文化程度构成情况 单位:人 按文化程度分组 绝对数人数 比重(%) 大专及以上 高中和中专 初中 小学 文盲 合计 4571 14109 42989 47334 8950 112953 3.88 11.96 36.45 40.13 7.58 100.0
90--100 合计
累计次数--—截至某一组累积起来的总次数。分为较小制累计和较大制累计。
较小制累计—-从最小一组的次数起逐项累计,表示小于该组上限的次数共有多少。
较大制累计—-从最大一组的次数起逐项累计,表示大于该组下限的次数共有多少。
变量数列的表示方法2
12 10 8 6 4 2 0 50-60 60-70 70-80 80-90 90-100
统计表的结构
2007年全国国民生产总值
国民生产总值 项目 产值(亿元) 第一产业
横行标题 (横标目) 总标题
纵栏标题 (纵标目)
比重(%) 11.7 49.2
数字资料
28910 121381 96328 246619
宾词
第二产业 第三产业 合计
主词
39.1 100.0
统计表的种类
简单表举例
1.
2.
离散型变量可以用相另两个变量值 作为两个相另组的上、下限: 例如,职工人数分组 100人以上 100—499 500—999 1000人以上
400斤以下
400—800 800—1000
1000斤以上
异距数列
各组组距不全相等的组距数列,叫异距数列。例如,
人口按年龄分组 1岁以下(婴儿组) 1~7岁(幼儿组) 7~17岁(学龄儿童组) 17~55岁(有劳动能力的人口组) 55岁以上(老年组) 合 计 人口数(万人) 1 6 12 24.6 8.1 51.7
统计数据
的整理与显示
刘锦雯
第一节 统计数据整理的概念与步骤
第二节 统计分组
第三节 分配数列 第四节 统计数据的显示
第一节 统计整理
概念:统计整理,就是根据统计研究的目的,对调查所 搜集到的原始资料进行科学加工,使之系统化、条理化, 以得出反映事物总体综合特征的资料的工作过程。 作用:
17 28 40 70 32.5 10 --
案例
•
• • •
•
某班40名学生考试成绩为: 89 88 76 99 74 60 82 60 89 86 93 99 94 82 77 79 97 78 95 92 87 84 79 65 98 67 59 72 84 85 56 81 77 73 65 66 83 63 79 70 将上述资料按数值大小排列为: 56 59 60 60 63 65 65 66 67 70 72 73 74 76 77 77 78 79 79 79 81 82 82 83 84 84 85 86 87 88 89 89 92 93 94 95 97 98 99 99 经初步整理可看出,资料的最小值为56,最大值为99,全距=99-56=43. 本例变量为连续型,应取标志值变动的一个区间作为一组,应采用组 距数列。 学生成绩的数量特征分为:优、良、中、及格、不及格,为将本班成 绩分布的数量特征反映出来,应该分为五个组, 全距R 43 组距i 8.6 10 这时, 组数K 5
较小制累计
人数 2 9 20 32 40 -比率% 5.0 22.5 50.0 80.0 100.0 --
比率 人数 (频率) % 2 7 11 12 8 40 5.0 17.5 27.5 30.0 20.0 100.0
较大制累计
人数 40 38 31 20 8 -比率% 100.0 95 77.5 50.0 20.0 --
比重(%)
16.7 22.2 33.3 16.7 11.1
90以下 90--100 100--110 110--120 120以上
组距为 10
125
合计
变量值
180
次数
100.0
频率
变量数列的编制
1. 2.
将原始资料从大到小排列起来 确定变量数列的形式:是采用单项数列?组距数列? 根据变量的类型和变动的幅度来定: 变量的类型 变动的幅度 离散型变量 个数少,变动幅度不大 单项数列 个数多,变动幅度大 连续型变量
分组的方法
品质分组的方法:可以将总体中的不同属性分开; 品质标志的复杂分组称为分类,形成分类目录。 数量分组的方法: 1) 单项式分组:即一个变量值代表一个组;适用于变异范围小的离散变量 2) 组距式分组:一组变量值代表一个组:适用于连续变量和变异范围大的 离散变量
统计分组的种类
品质分组 统计分组 数量分组
我一眼就看出 来了,销售量 在170~180 之间的天数最 多!
频 数
30 25
直方图下的面 积之和等于1
(天) 20 15
10
5
140 150 160 170 180 190 200 210 220 230 240
某电脑公司销售量分布的直方图
第二节 统计分组
概念:统计分组就是根据统计研究的目的,按照某个或某几个重要标志 将总体划分为若干性质不同的部分或组的一种统计方法。 分——突出组与组的差异性,将性质不同的总体单位分配到不同组 组——突出组内的同质性,将性质相同的总体单位归并到同一组里 遵循两个原则:
开口组:在组距分组中,缺少下限或上限的组被称为开口组。
缺上限的开口组组中值=下限+(邻组组距)/2 缺下限的开口组组中值=上限--(邻组组距)/2
3.3分配数列及其种类
概念:在统计分组的基础上,将总体的所有单位按组 归类整理,并按一定的顺序排列,形成总体单位在各 组之间的分布,称之为频数分布、次数分布或分配数 列。 构成:分配数列是由分组标志序列和各组相对应的分 布次数两个要素构成。 种类:
累计次数分布折线图
45 40 35 30 25 20 15 10 5 0 60 70 80 90 100 人数向上累计 人数向下累计
次数分布的主要类型
钟型分布
U型分布
J型分布
3.4 统计表
概念:将汇总整理后得出的一些系统化的统计资料, 料系统化、条理化,更清晰地表 述统计资料的内容。 2. 便于比较各项目(指标)之间的关系,便于计算。 3. 比文字叙述更紧凑、简明、醒目,一目了然。 4. 积累和保存统计资料的良好方式。
次数
34.8
17.4 100.0
频率
组距数列
组距数列是总体按组距式分组而形成的变量数列 每个组是由若干个(一组)变量值形成的区间表示, 在变量值个数较多、变动幅度较大时采用。 某工厂工人完成生产定额情况表
例如,
工人按完成生产定 额分组(%)
开 口 组
组中值
上限
工人数
绝对数
85 95 105 115 30 40 60 30 20
复合表举例
某年某地区工业企业净产值和职工人数
项目 大 国有 中 小 大 集体 中 净产值(万元) 9750 8600 4200 7300 5200 职工人数(人) 13800 45000 10050 7500 10400
小 合计
4400 39450
4500 91250
宾词指标的设计1
简单设计 案例: 某地区工业企业的工人性别和工龄
3.
简单表—主词未经任何 分组的统计表。 分组表—主词按照某一 标志进行了分组的统计 表。 复合表—主词按照两个 或两个以上标志进行复 合分组的统计表。
某年某地区棉纺公司所属棉纺织厂总产值资料 企业名称 第一棉纺织厂 第二棉纺织厂 第三棉纺织厂 第四棉纺织厂 合计 总产值(万元) 6000 7000 5500 4500 23000
单项数列
单项数列是总体按单项式分组而形成的变量数列。 一个变量值为一个组,按大小顺序排列,在组数不多和组值变动 幅度不大时采用。 例如, 某厂第二季度工人平均日产量
工人平均日产量(件) 2 3 4 工人数
绝对数
10 15 30
比重(%)
8.7 13.0 26.1
5
6 合计
变量
40
20 115
穷尽性原则——不漏,使总体每一个单位都有“组”可归; 互斥性原则——不重,使总体任一个单位只能归属于某一个组
作用: 划分社会经济现象的类型 研究事物的内部结构 分析现象间的依存关系 统计分组的种类 按分组标志的多少:简单分组和复合分组 简单分组又称单一分组,就是对被研究现象总体只按一个标志进行的分 组。其特点是只能反映现象在某一个标志特征方面的差异情况,而不能 反映现象在其他标志特征方面的差异,说明问题比较简单明了。