统计学原理第三章
统计学原理计算题复习(六种题型重点)

第三章:编制次数分配数列1.根据所给资料分组并计算出各组的频数和频率,编制次数分布表;根据整理表计算算术平均数。
例题:某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90分为良,90─100分为优。
要求:(1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表;(2)指出分组标志及类型及采用的分组方法;(3)根据考核成绩次数分配表计算本单位职工业务考核平均成绩; (4)分析本单位职工业务考核情况。
解答:(1)(2)此题分组标志是按“成绩"分组,其标志类型是“数量标志”; 分组方法是“变量分组中的组距式分组的等距分组,而且是开口式分组";(3)根据考核成绩次数分配表计算本单位职工业务考核平均成绩。
(4)分析本单位职工考核情况。
本单位的考核成绩的分布呈两头小,中间大的“钟形分布”(即正态分布),不及格和优秀的职工人数较少,分别占总数的7.5%和10%,本单位大部分职工的考核成绩集中在70—90分之间,占了本单位的为67.5%,说明该单位的考核成绩总体良好。
)(774095485127515656553分=⨯+⨯+⨯+⨯+⨯==∑∑f xf x第四章:计算加权算术平均数、加权调和平均数(已知某年某月甲、乙两农贸市场A 、B 、C 三种农产品价格和成交量、成交额资料,试比较哪一个市场农产品的平均价格 较高?并说明原因。
)、标准差、变异系数2.根据资料计算算术平均数指标;计算变异指标;比较平均指标的代表性。
例题:某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件,标准差为9.6件;乙组工人日产量资料如下:要求:⑴计算乙组平均每个工人的日产量和标准差;⑵比较甲、乙两生产小组哪个组的日产量更 有代表性? 标准差的计算参考教材P102页。
统计学原理-统计整理

统计整理的意义
统计调查所搜集的反映个体量的原始资料是分散 的,不是集中的;是零碎的,不是系统的。根据这 些资料。人们难以从总体上分析和认识现象的数量 表现。
至于某些已经加工的综合资料,则往往由于资料在 分组方法、总体范围或指标涵义、口径、计算方法 等方面不同,而不能满足统计分析的要求,也必须 先通过统计整理,才能据以从总体上分析社会经济 现象的数量表现,
一、统计分组的意义和作用
统计分组的作用
⒈区分社会经济现象的类型-类型分组 ⒉研究现象的内部结构-结构分组 ⒊分析现象之间的依存关系-分析分组
某地区2008年底各类工业企业数 按所有制性质分组 企业数(个) 比重(%) 全民所有制企业 集体所有制企业 3204 1286 64.08 25.72
私营企业 中外合资企业 外商独资企业
二、统计分组的要求和方法
统计分组的方法
2、按品质标志和数量标志分组
经调查 ,某地年末货币流通量为 15.3亿元,比上年增加 4.5亿元。
按地区分组 甲县 乙县 丙县 丁县 合计 上期 36000 24000 28000 20000 108000 本期 52000 34000 41000 26000 153000 增减% 44.4 41.7 46.7 30.0 41.7
第三节 变量数列
一、变量数列的概念 分 类
品质标志数列
数量标志数列
连续型变量数列
离散型变量数列 单项数列 组距数列 等距数列 异距数列
按品质标志分组—品质数列,一般是单项式分组
某班学生的性别构成情况 按性别分组 男 女 合计 绝对数人数 30 10 40 比重(%) 75 25 100
某厂第二季度工人平均日产量 工人数 绝对数 比重(%) 10 15 30 40 20 115 8.7 13.0 26.1 34.8 17.4 100
统计学原理(第三章)

《统计学原理》 刘鑫春 2
第三章第一节 作用 总量指标可以反映被研究总体的基本状 况和基本实力。 总量指标是制定政策、计划以及检查政 策和计划执行情况的基本依据。 总量指标是计算相对指标、平均指标以 及各种分析指标的基础。
累计到 3 季度止计划执行进度( %) 260 320 100 % 81 . 25 %
计算结果表明,该企业某年第三季度已过,进度已完成计划任 务81.25%,说明计划进度执行较快
《统计学原理》 刘鑫春 17
第三章第二节 中长期计划完成情况的检查
(5年或以上的计划)
• 水平法:在计划制定中,以计划最后应达到的能 力水平为目标时,采用该法。
《统计学原理》 刘鑫春 26
第三章第二节 动态相对指标:又称发展速度,它是同类现 象在不同时间上变动程度的相对指标。
动态相对指标(%)= 报告期水平 基期水平 × % 100
动态相对指标的详细内容在本书第四、五 章将专门介绍
《统计学原理》 刘鑫春
27
第三章第二节 三、计算和应用相对指标应注意的问题 要选择好对比的基数 保持相对指标的可比性
例:某年甲商业企业劳动率为1.10万元,乙企业为1.00万元。 则甲企业劳动率是乙企业的1.1倍(1.10/1.00),1.1倍是 不同企业的同一指标即劳动率(平均指标)的比。
注:计算比较相对指标,通常采用平均指标或相对指 标进行对比,以准确反映现象发展的本质差异。这 是一个静态对比指标
《统计学原理》 刘鑫春 22
按采用的计量单位不同 实物指标—根据实物单位计算得到的 总量指标; 价值指标—以货币为单位计算的总量 指标; 劳动指标—以劳动量计算的总量指标。
统计学原理 第三章 数据整理与显示

4.数量(变量)分组
如,企业按产值分组
按数量标志进行的分组。
100万元以下 100 ~ 500 500 ~ 1000 1000万元以上
单项式分组 数量(变量)分组 组距式分组
单项式分组: 在变量分组中, 一个组只有一个变量值。
如,居民家庭按子女数分组: 0 1 2 3 单项式分组适用于变量值变化范围不大、不同变量值个数 较少的离散型变量的场合。
10
22
20
22
30
27
主要步骤:数据------数据透视表------布局
EXCELL应用:单项式分组及汇总 日产量 22 23 24 25 26 工人人数 6 8 10 1 3 比重 20.00% 26.67% 33.33% 3.33% 10.00%
27
总计
2
30
6.67%
100.00%
主要步骤:数据------数据透视表------布局
600 ~ 700 700 ~ 800 800 ~ 1200 1200 ~1500
组 限 重 叠
499以下 500 ~ 999 1000 ~ 1999 2000 ~ 2999 3000及以上
组 限 不 重 叠
组限的划 分方法
不重叠组限(只适用于离散型变量) 重叠组限(适用于连续型变量和离散型变量)
当为重叠组限时,交叉组限值遵循 “上限不在其内”的原则。
它适用于变量值变化范围较大、不同变量值个数较多 的离散型变量及连续型变量的情形。
组距式分组最为常见,进行分组涉及以下几个问题
(1)组限及划分方法
(2)组距与组数 (3)等距分组与不等距分组 (4)组中值
组距式分组的组限及划分方法
每组起点值称为上限,终点值称为下限。 工人按工资分组: 企业按人数分组:
第三章--统计整理-幻灯片(1)

如某班学生按年龄分组:17岁,18岁,19岁, 20岁, 21岁,22岁。
组距式分组
将作为分组依据的数量标志的整个取 值范围依次划分为若干个满足互斥性
和包容性的区间,用这些数值区间作
为组的名称。
某班学生统计 学原理成绩分 组
60分以下 60—70分 70—80分 80—90分 90分以上
组距式分组中的一些概念 《统计学原理》第三章 统计整理
对教师 的分类
按性别分类
男性 女性
高级 按职称分类 中级 共计7组
初级 2+3+2
青年 按年龄分类
中年
复合分组体系
对教师 的分类
按性别 分类
按职称 分类
按年龄 分类
《统计学原理》第三章 统计整理
共计12组 男 2×3×2
女 高级
中级
初级 青年 中年
《统计学原理》第三章 统计整理
统计资料的再分组
• 统计资料的再分组就是把统计分 组资料按某种要求,重新划定各 组界限,再将资料中的单位数或 比重分布重新做出调整。
对总体单位而言,是“合”,即将性质相同的 个体组合起来,在同一组内则保持着相同的性 质。
分组
《统计学原理》第三章 统计整理
25%
33%
分组前
分组后
42%
作用:1·区分事物的性质
例:按所有制性质划分,我国现有8种经济类型:
国有经济;集体经济;私营经济;个体经济 联营经济;股份制经济;外商投资经济;港 澳台投资经济
将统计调查得到的原始资料进行科
统计整理 学的分类和汇总,使之成为系统化、
条理化的综合资料,以反映研究总 体的特征。
地位 是统计调查的继续,统计分析的前提 和基础,起着承前启后的作用。
统计学原理与技能训练 第3章 统计整理

四、统计分组的方法 1.根据分组标志的性质不同分为两种 (1)按品质标志分组 例如按性别这一品质标志可将班级的学生 分为两组。 (2)按数量标志分组 如按成绩这一数量标志可以将班级学生分 为三组:60分以下为一组,60~80分为一组, 80分以上为一组。
2.根据分组标志的多少分为两种 (1)简单分组 按一个分组标志分组。 (2)复合分组 按两个或两个以上标志重叠分组。如按性 别可以将人口分为两组,在此基础上又可以按 年龄将各组的人分为少年组、青年组、中年组 和老年组。
二、统计整理的步骤
(一)设计和编制统计资料整理方案 (二)对原始资料进行审查 1.逻辑审查:主要是从定性的角度审查数 据是否符合逻辑,内容是否合理,各项目或数 量之间有无相互矛盾的现象。 2.计算审查:是指审查调查表中的各项数 据在计算结果和计算方法上有无错误。如各分 项数字之和是否等于相应的合计数,各结构之 和是否等于1或100%等。
第一节 统计整理的意义和步骤
一、统计整理意义 (一)概念 统计整理是根据统计研究的目的和要 求,对统计调查所搜集到的原始资料进行 分组、汇总,使其条理化、系统化、科学 化,从而得到表现总体特征的综合统计资 料的统计过程。 另外,对于整理过的初级资料进行再 整理,也属于统计整理。
(二)意义 1.统计整理是统计调查的继续,也是统 计分析的前提,它在统计研究中起着承前 启后的作用。 2.资料整理得是否正确,直接决定着整 个统计研究任务的完成。不恰当的加工整 理,不完善的整理方法,往往使调查得来 的丰富、完备的资料失去价值,得不到正 确的结论。
表3 -3
某车间50名工人日加工零件数分组表
向 上 累 计 向 频 下 数 累 计 频 数 频 率 频率
按零件数分组 频数 频率 (人) (%) (个/人)
统计学原理(第三章)

3.4数据资料的展示
3.4.1定类数据的展示 3.4.2定序数据的展示 3.4.3定距数据的展示 3.4.4定比数据的展示
3.4.1定类数据的展示
1)条形图:适合于展示分类型数据 条形图是用宽度相同的条形的长短来表 示数据的变动。 2)圆形图:适合于展示结构型数据 又称饼图,是用圆形及圆内扇形的面积 来表示数值大小的图形。
品质数列 分配数列 变量数列 组距数列 不等距数列 单项数列 等距数列
3.3.1分配数列
品质数列:按品质标志分组后,再按一定顺序排列, 所组成的数列。如表3-2所示。
表3-2 某商学院新生按专业分组表
按专业分组 金融学 会计学 工程管理 工商管理 国际贸易 财务管理
人数(人) 56 55 50 58 54 40
1)钟型分布 2)U型分布 3)J型分布
钟型分布
钟型分布又叫正态分布,其特征是“两头 小,中间大”,分布曲线图宛如一口古钟。
钟型分布的类型
对称的钟型分布 非对称的钟型分布
U型分布
U型分布的特征是“两头大,中间小”, 分布曲线图宛如英文字母U。
J型分布
J型分布的特征是“一边大,一边小”,分 布曲线图宛如英文字母J。 1)正J型分布:次数与变量值同向变化 2)反J型分布:次数与变量值反向变化
频数(人)
3 5 8 14 10 6 4 50
频率(%)
6 10 16 28 20 12 8 100
合计
3.3.1分配数列
不等距数列 表3-7 某企业职工月收入分组
按月收入分组 人数(人) 频率(%)
500以下
500—800 800—1000 1000—1500 1500以上
10
15 25 12 8
《统计学原理》(财经版、黄立华)第三章思考与练习答案

思考与练习(第三章)一、单项选择题1.下面属于按品质标志分组的是(A )。
A.工人按性别分组B.教师按年龄分组C.学生按成绩分组D.商业按销售额分组2.下面属于按数量标志分组的是(B )。
A.工人按政治面貌分组B.工人按年龄分组C.工人按性质分组D.工人按民族分组3.变量数列中各组变量值在决定总体数量大小时所起的作用就其实质而言(C )。
A.与比重、频率或比率大小无关B.与次数或频数大小有关C.与比重、频率或比率大小有关D.与次数或频数大小有关,与比重、频率或比率大小无关4.组距式变量数列的全距等于(D )。
A.最大组的上限与最小组的上限之差B.最大组的下限与最小组的下限之差C.最大组的下限与最小组的上限之差D.最大组的上限与最小组的下限之差5.对于越高越好的现象按连续型变量分组,如第一组为60以下,第二组为60~70,第三组为70~80,第四组为80以上,则数据(A )。
A.70在第三组B.60在第一组C.80在第三组D.70在第二组6.按连续型变量分组,其第一组为开口组,上限为1000.已知相邻组的组中值为1250,则该组组中值为(C )。
A.1000B.500C.750D.8507.对连续性变量分组( B )。
A.要用单项式分组B.要用组距式分组C.单项式或组距式分组都可以D.要用等距式分组8.划分连续性变量的组限时,相邻组的组限必须(AB )。
A.重叠B.相等C.不相等D.间断9.统计分组的关键是( C )。
A.划分分组界限B.确定组数C.选择分组标志D.划定分组形式10.次数分配中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种分布的类型是( B )。
A.钟型分布B.U型分布C.J型分布D.洛伦茨分布11.对总体进行分组时,采用等距数列还是异距数列,决定于( A )。
A.次数的多少B.变量的大小C.组数的多少D.现象的性质和研究的目的12.区分简单分组与复合分组的根据是( C )。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
例题5:某省某年电信职工收入调查资料如表。 某省某年电信职工收入调查资料如表。计算M 0和 M e
按月收入额分组 1000以下 1000-1300 1300-1600 1600-1900 1900-2200 2200-2500 2500以上 合计 调查职工人数 40 90 110 105 70 50 35 500 向上累积次数 40 130 240 345 415 465 500 — 向下累积次数 500 460 370 260 155 85 35 —
将数据按大小顺序排队形成次数分配后, 将数据按大小顺序排队形成次数分配后,在统计 分布中具有明显趋势点的数值, 分布中具有明显趋势点的数值,是数据一般水平 代表性的一种。 代表性的一种。如何找出众数 如何找出众数? 众数?
众数是一种位置平均数 众数是一种位置平均数, 一种位置平均数,是总体中出现次数最多 总体中出现次数最多 的变量值, 的变量值,因而在实际工作中有时有它特殊的用途。 因而在实际工作中有时有它特殊的用途。 诸如, 诸如,要说明一个企业中工人最普遍的技术等 级,说明消费者需要 说明消费者需要的内衣 消费者需要的内衣、 的内衣、鞋袜、 鞋袜、帽子等最普遍的 号码, 号码,说明农贸市场 说明农贸市场上某种农副产品最普遍的 农贸市场上某种农副产品最普遍的成交价 上某种农副产品最普遍的成交价 格等,都需要利用众数。 都需要利用众数。
2、分组数据:
N − S m −1 Me ≈ L + 2 ×i fm
Me——中位数; L——中位数所在组下限; fm——为中位数所在组的次数; N——总次数; d——中位数所在组的组距; Sm − 1——中位数所在组以下的累计 次数;
例1:2、3、4、5、6 中位数: 中位数:4 如果总数个数是奇数的话, 如果总数个数是奇数的话,按从小到大的顺序,取 中间的那个数。 中间的那个数。
xi
频数 3 5 8 14 10 6 4 50
fi
xi f i
322.5 562.5 940.0 1715.0 1275.0 795.0 550.0 6160.0
∑
K
X = i =1K
X i Fi
i =1
∑ Fi
1055 . ×3+1125 . ×5+1175 . ×8+1225 . ×14+1275 . ×10+1355 . ×6+1375 . ×4 X= 3+5+8+14+10+6+4 3225 . +5625 . +9405 . +1715+1275+790+550 = 50 6160 = 50 =1232 .
二、中位数( 中位数(Median)
中位数是指将数据按大小顺序排列起来, 形成一个数列, 形成一个数列,居于数列中间位置的那个数 据。如何确定中位数? 如何确定中位数?
1、未分组数据: 未分组数据: N为奇数
Me = X
(
N N + X N ( +1) 2 (2) 2
X 1 …… X k , 各组变量值出现的频数为 F1 …… Fk
设有K组,各组变量值或组中值 总体:
K
∑
X = i =1K
样本:
k
X i Fi
i =1
∑ Fi
Fi X = ∑ Xi K i =1 ∑ Fi
K i =1
x = i =1k
∑ xi ∑
i =1
fi
fi
例题7:计算 x 按零件数分组 组中值 105-110 110-115 115-120 120-125 125-130 130-135 135-140 合计 107.5 112.5 117.5 122.5 127.5 132.5 137.5
男皮鞋号码/厘米 24.0 24.5 25.0 25.5 26.0 26.5 27.0 合计 销售量/双 12 84 118 541 320 104 52 1200
从表中可以看到, 从表中可以看到,25.5厘米的鞋号销售量最多, 厘米的鞋号销售量最多,鞋 号25.5厘米就是众数。 厘米就是众数。
如果我们计算算术平均数 如果我们计算算术平均数, 算术平均数,则平均号码为25.65厘 米,而这个号码显然是没有实际意义的, 而这个号码显然是没有实际意义的,而直接用25.5 厘米作为顾客对男皮鞋所需尺寸的集中趋势 厘米作为顾客对男皮鞋所需尺寸的集中趋势既便捷又符 集中趋势既便捷又符 合实际。 合实际。
向上累计次 数 5 16 30 57 77 91 100 --
中位数位次= Σf/2 =100/2 =50 ∵30<50<57 ∴ 中位数在110~120组 代入下限公式
N − S m −1 Me ≈ L + 2 ×i fm
100 − 30 M e ≈ 110 + 2 × 10 27
M e ≈ 117.4
但是必须注意,从分布的角度看, 从分布的角度看,众数是具有明 显集中趋势点的数值, 显集中趋势点的数值,一组数据分布的最高峰点所对 应的数值即为众数。 应的数值即为众数。 当然,如果数据的分布没有明显的集中趋势或最 高峰点, 峰点,众数也可能不存在; 如果有两个最高峰点, 峰点,也可以有两个众数。 个众数。 只有在总体单位 有在总体单位比较多 总体单位比较多, 比较多,而且又明显地集中于某 个变量值时, 个变量值时,计算众数才有意义。 有意义。
统计学原理
数信学院信息技术系
编写人:游运
第三章 数据分布特征的描述
3.1 分布集中趋势的侧度 3.2 分布离散程度的侧度 3.3 分布偏态与峰度的侧度 3.4 茎叶图与箱线图 3.5 统计表与统计图
经过第二章的学习, 经过第二章的学习,对数据分布的状况有了一个 初步认识, 初步认识,了解到各组次数及其分布的特点, 了解到各组次数及其分布的特点,但是还 缺少对数据总体分布特征的准确描述, 缺少对数据总体分布特征的准确描述,为了掌握统计 数据总体分布特征和规律, 数据总体分布特征和规律,还要作进一步的分析。 还要作进一步的分析。
例题4:计算 M 0 和 M e
按零件数 分组 105-110 110-115 115-120 120-125 125-130 130-135 135-140 合计 频数 (人) 3 5 8 14 10 6 4 50 频率 (%) 频数 6 10 16 28 20 12 8 100 3 8 16 30 40 46 50 频率 6 16 32 60 80 92 100 频数 50 47 42 34 20 10 4 频率 100 94 84 68 40 20 8 向上累积 向下累积
•四分位数、 分位数、十分位数等; •上四分位数、 分位数、下四分位数; •计算方法同中位数( 计算方法同中位数(见书26页)。
四、均值( 均值(算术平均数) 算术平均数)
x
是数据集中趋势的最主要测定值。 要测定值。 1、理解:是一组数据中该变量标志值总和(又称为 总体标志总量)除以其总体单位数所得的结果。
本章将从以下三个方面对统计数据总体分布特征 进行测定和描述: 进行测定和描述:
1、数据分布集中趋势的测定, 数据分布集中趋势的测定,描述各数据向其中 心值(均值)集中或靠拢的程度。 集中或靠拢的程度。
2、数据分布离散程度的测定, 数据分布离散程度的测定,描述各数据远离其 中心值(均值)的程度。 的程度。
解:从表中的数据可以看出, 从表中的数据可以看出,最大的频数值是14,即 众数组为120~125这一组, 这一组,根据公式得50名工人日加 工零件的众数为: 的众数为:
f − f −1 M0 ≈ L + ×i ( f − f −1 ) + ( f − f +1 )
14 − 8 M 0 ≈ 120 + ×5 ( 14 − 8 ) + ( 14 − 10 )
集中趋势是指一组数据向某一中心值靠拢的 程度, 程度,它反映了一组数据中心点的位置所在。 它反映了一组数据中心点的位置所在。 数据分布集中趋势的测定就是寻找数据水平的 代表值或中心值。 代表值或中心值。
从不同的角度测度, 从不同的角度测度,集中趋势的测定值有多个。 集中趋势的测定值有多个。
一、众数( 众数(Mode)
3、数据分布偏度与峰度的测定, 数据分布偏度与峰度的测定,描述数据分布的 形状, 形状,与正态分布相比较, 与正态分布相比较,反映其偏离正态分布的程 度。
教学内容
1.数据分布集中趋势的测度即数据的各种平均指 标的概念及计算。 标的概念及计算。 2.数据分布离散趋势的测度即数据的各种变异指 标的概念及计算。 标的概念及计算。 3.数据分布偏态与峰度测度系数的概念与计算。 数据分布偏态与峰度测度系数的概念与计算。 4. 统计表和统计图
2、分组数据: 分组数据: 等距分组的众数计算公式 :
f − f −1 M0 ≈ L + ×i ( f − f −1 ) + ( f − f +1 )
众数 众数 所在 组下 限的 邻组 次数 众数 所在 组次 数 众数 所在 组上 限的 邻组 次数 众数 组组 距
众数 所在 组下 限
例:根据下表的数据, 据下表的数据,计算50名工人日加工零件数的 众数。 众数。
1、未分组数据、 未分组数据、品质数列和单项式变量数列确定 品质数列和单项式变量数列确定 众数比较容易: 众数比较容易:指出现次数最多的变量值。 指出现次数最多的变量值。 例如: 例如:某制鞋厂要了解消费者 某制鞋厂要了解消费者最需要哪种型号的 消费者最需要哪种型号的 男皮鞋, 男皮鞋,调查了某百货商场 调查了某百货商场某季度男皮鞋的销售情 百货商场某季度男皮鞋的销售情 况,得到资料如下表( 得到资料如下表(某商场某季度男皮鞋销售情 况):
3、特点: 特点: 1)不受极值的影响。 中位数是以它在所有标志值中所处的位置确定的 全体单位标志值的代表值, 值的代表值,不受分布数列的极大或极 小值影响,从而在一定程度上提高了中位数对分布数 列的代表性。 列的代表性。 2)各变量值与中位数的离差绝对值之和最小