第二章第二节 统计整理

合集下载

卫生统计学第二章

卫生统计学第二章

六、资料的贮存
1、纸带机或卡片paper tape, card 2、磁带magnetic tape 3、软盘floppy disk 4、硬盘hard disk 5、光盘CD Rom 6、USB移动存贮设备(flash memory)
• Database 的优点:
– 便于资料的再利用 – 便于汇总交流 – 便于查询 – 便于补充、修改和连接
– x为组中值class mid-value (midpoint)=本组下限 与相邻较大组段的下限相加除以2 – k 为组数 – f 为各组的频数,又称权数weight – ∑f 各组频数之总和 – ∑fx 为各组组中值与频数乘积之和 • 计算实例见P3

110名7岁男童的身高均数的计算
身高组段 110~ 112~ 114~ 116~ 118~ 120~ 122~ 124~ 126~ 128~ 130~ 132~ 134~136 合计 频数 f 1 3 9 9 15 18 21 14 10 4 3 2 1 110 组中值 X 111 113 115 117 119 121 123 125 127 129 131 133 135 fx 111 339 1035 1053 1785 2178 2583 1750 1270 516 393 266 135 13314
• 注意事项:
– 1、一般不能计算发病率和患病率 – 2、不同医院的病人差别大,相互比较要谨慎 – 3、某医院就诊(住院)病人中各种病人的比例, 不一定代表居民中各种病人所占的比例 – 4、同一医院同一科室不同时期病的病情也会不 同 – 5、资料记载的详细程度和标准一致性问题
• 四、实验数据experimental data(指在动植物 实验研究中获得的数据)、试验数据trial data(指在人体进行试验所得到的数据) • 五、现场调查field survey资料

统计学_第二章_统计调查与整理

统计学_第二章_统计调查与整理
料的事物时。 ⑵有些资料虽可进行全面调查,但比较困难或并不必要。如: 居民家庭收支情况调查。Байду номын сангаас⑶对普查或全面调查统计资料的质量进行检查和修正。如: 人口普查资料的正确性复查、验证等。
26

5.使用统计资料时必须注意:不应在非随机抽样情况下,随 意把结论扩大到总体。

严格的推断必须事先框定一个总体,形成抽样框,随机抽 取样本;由样本信息也只能推断到这个框定的总体,而非随
2.抽样调查目的:以样本数值推算总体数值。
3.抽样调查的特点: (1)按随机原则来进行。 (2)以样本数值推算总体数值。 (3)抽样误差可以估计和控制,使推断结果具有一定的可靠
性和准确性。
抽样调查和全面调查相比,具有经济性、时效性、准确性 和灵活性等优越性。
25
4.应用范围:
⑴在实际工作中不可能进行全面调查而又需要了解其全面资
⑵报告法:它是指要求被调查者以原始记录和核算资料 为依据, 向有关单位提供统计资料的方法。如报表制度。 ⑶采访法:它是由调查人员向被调查者提问,根据被调 查者的答复来搜集资料的方法。如口头询问或开调查 会等。 ⑷问卷调查法: ⑸卫星遥感法:使用卫星高分辨率照片,提供地面农作 物绿度资料,来估计农产量的方法。
意的抽样,任意的推断。

随机抽样不是随便抽样。
27

调 查 误 差
登记性误差 代表性误差
总体
随机样本

偏 差 随机误差
实际误差
抽样平均误差
统计推断中的抽样误差就是抽样平均误差。它是处 于调查所固有的,是对抽样推断精确度的量度。
28
一次失败的统计调查
在1936年的美国总统选举前,一份名为 Literary Digest 杂 志进行了一次民意调查。调查的焦点是谁将成为下一届总统 —是挑战者,堪萨斯州州长Alf Landon,还是现任总统 Franklin Delano Roosevelt。为了解选民意向,民意调查 专家们根据电话簿和车辆登记簿上的名单给一大批人发了简 单的调查表(电话和汽车在1936年并不像现在那样普及,但 是这些名单比较容易得到)。尽管发出的调查表大约有一千 万张,但收回的比例并不高。在收回的调查表中, Alf Landon非常受欢迎。于是该杂志预测 Landon 将赢得选举 。但事实上是Franklin Roosevelt赢得了这次选举 在经济大萧条时期调查有电话和汽车的人们,并不能够反映 全体选民的观点。此外,只有少数的问卷被收回。这些都是 值得怀疑的

第二章 统计学原理(李洁明版)

第二章 统计学原理(李洁明版)

▲ 2.统计报表
统计报表:我国定期搜集基本统计资料的一种重 要的组织形式。
主要特点:
1资料来源于基层单位的各种原始记录;
2逐级上报和汇总; 3属于经常性调查,项目相对稳定,利于积累资 料,动态对比。
统计报表制度主要种类:
(1)国家、部门和地方统计报表。 (2)全面、非全面统计报表。
(3)定期报表和年报(进度报表、总结性报表)。
(4)基层报表和综合报表。 (5)电讯报表和书面报表。 问:统计报表是全面调查还是非全面调查?
▲ 3.抽样调查:
是一种非全面调查,它是在全部调查单位中按照 随机原则抽取一部分单位进行调查,根据调查的 结果推断总体的一种调查方法。
两个基本特征:
依经验,组数一般分为5-7组,尽可能取奇数, 避免偶数。
某班学生统计学考试成绩表
考分
50~60 60~70 70~80 80~90 90~100
人数(人)
2 7 11 12 8 40
比重(%)
5.0 17.5 27.5 30.0 20.0 100
合计
(二)等距分组和异距分组
1.等距数列适用于标志变异比较均匀的现象。
(1)重点单位选多少,要根据调查任务确定。 (2)选择重点单位时,注意重点可以变动的情况。 (3)选中的单位应是管理健全、统计基础工作较 好的单位。 例如:调查我国钢铁技术水平?
▲ 5.典型调查
是在调查对象中有意识地选取若干具有典型意义 的或有代表性的单位进行非全面调查。
典型调查的中心问题在于如何正确的选择典型单 位,要保证被选中的单位具有充分代表性。 典型调查的具体方法通常有直接观察法、个别访 问和开调查会。其中开调查会是最简单易行和比 较可靠的方法。

统计学基础-第二章-统计调查与整理

统计学基础-第二章-统计调查与整理

调查单位与填报单位的区别
调查单位 填报单位
负责向上级部门提交资 料的单位
调查资料的承担者
有时一致,有时不一致
一致:调查单位是企事 业单位、社会组织、社 会团体
不一致:调查单位是 个人、物体、事件、 行为
三、确定调查项目设计调查表
调查项目是调查的具体内容,是调查单位的标志
它可以是调查单位的数量特征, 如一个人的年龄、收入,一个 企业的职工人数、产值;
四、问卷调查的设计程序和形式
3、试答和修改
一般说来,所有设计出来的问卷都存在着一些问 题,需要将初步设计出来的问卷,在小范围内进 行试验性调查,以便弄清问卷在初稿中存在的问 题,了解被调查者是否乐意回答和能够回答所有 的问题,哪些语句不清、多余或遗漏,问题的顺 序是否符合逻辑,回答的时间是否过长等。如果 发现问题,应做必要的修改,使问卷更加完善。 试调查与正式调查的目的是不一样的,它并非要 获得完整的问卷,而是要求回答者对问卷各方面 提出意见,以便于修改。
回复问卷的代 表性难以估计
无法了解、 控制和判断
很 低 较 高 较 低
难了解控制和 判断
较 较 低 高
可控制和选择 、但过于集中
较 较 较 高 低 低
便于了解控制 和判断
高 不稳定 较 高
一 般


较 长
较 长
较 短

二、问卷调查的意义
(一) 问卷调查是通俗易行的调查
问卷调查的 意义
方式
(二) 问卷调查可全面、准确地反
调查项目
统计调查方案的 内 容
调查表
调查时间和期限
调查组织计划
一、确定调查目的
调查目的是调查所要达到的具体目标

南京大学统计学课件 ch2统计整理

南京大学统计学课件   ch2统计整理
组数=全距 组距 组数 全距/组距 全距 斯特杰斯经验公式: 斯特杰斯经验公式: 组数=1+3.322 Lg N 组数 由此推出
组距=(最大变量值 最小变量值 ( 最小变量值) 组距 (最大变量值-最小变量值)/(1+3.322Lg N )
1-11
例如:通过调查取得 个商业企业某月销售额资料: 例如:通过调查取得100个商业企业某月销售额资料: 个商业企业某月销售额资料 单位:万元) , , , , (单位:万元)20,60,45,90,105,56,250,89, , , , , 130,30,98,…300。 , , , 。 将这些数据资料按“销售额”的多少进行整理, 将这些数据资料按“销售额”的多少进行整理,得到下 列整理结果: 列整理结果: 销售额(万元) 企业数(个) 0 — 50 50 — 100 100— 150 150— 200 250— 300 合 计 12 25 30 23 10 100
统计整理的内容:分组、 统计整理的内容:分组、汇总和制表
1-12
第三节 变量数列
一、次数分布与变量数列 1、次数分布与变量数列的概念 、 在统计分组的基础上, 在统计分组的基础上,将总体所有的单位按 某一标志进行归类排列,称为次数分布, 某一标志进行归类排列,称为次数分布,或 频数分布。根据分组标志特征的不同, 频数分布。根据分组标志特征的不同,次数 分布数列可分为品质数列和变量数列。 分布数列可分为品质数列和变量数列。 2、变量数列的两个要素 、
第二章 统计整理
第一节 统计整理的概念和内容 第二节 统计分组 第三节 变量数列
1-1
第一节 统计整理的概念和内容
一、统计整理的概念和作用 1、根据统计研究的目的和任务,将调查取得的大量 、根据统计研究的目的和任务, 原始资料进行科学的分类和汇总, 原始资料进行科学的分类和汇总,为统计分析提供 系统化和条理化的综合统计资料的工作过程。 系统化和条理化的综合统计资料的工作过程。 2、通过统计整理使说明个体和局部的资料过渡到说 、 明总体和全局的资料。 明总体和全局的资料。 二、统计整理的内容

统计一到三章重点

统计一到三章重点

第一章概述重点第一节统计的含义和特点1、统计概念:统计是人们正确运用统计理论和方法采集数据、整理数据、分析数据和由数据得出结论的实际操作过程,是人们从数据上对客观世界的一种认识活动和结果。

2、统计学的研究对象:大量社会经济现象总体的数量方面3、社会经济统计的特点:数量性、总体性、具体性、社会性4、统计工作过程:统计设计阶段、统计调查阶段、统计整理阶段、统计分析阶段、统计数据提供与管理阶段5、统计职能:信息、咨询、监督6、统计研究的具体方法:大量观察法、统计分组法、综合指标法、统计推断法第二节统计中常用的基本概念1、统计总体及总体单位的概念:统计总体是根据研究目的确定的所要研究的对象的全体,它是由客观存在的、具有某种共同性质的许多个体所构成的整体。

构成总体的个体则称为总体单位。

2、统计总体的特点:同质性、大量性、差异性3、统计标志概念及分类:标志是说明总体单位属性或特征的名称。

按其性质不同可分为品质标志和数量标志。

品质标志的具体表现用文字表示;数量标志的具体表现用数值来表示。

4、统计指标概念、六要素及种类:统计指标是各种说明总体综合数量特征和数量关系的数字资料。

六要素:时间限制、空间限制、指标名称、计量单位、计算方法、指标数值。

种类:数量指标(又分为总体单位总量和总体标志总量)、质量指标5、标志与指标的区别与联系:区别:(1)标志是表明总体单位特征的;指标是表明总体特征的(2)标志可以用数量表示为数量标志,也可以用文字表示为品质标志;指标都是用数量表示联系:(1)统计指标的基础是总体单位及其标志值,总体单位及数量标志值的汇总与综合(2)由于统计研究目的和任务不同,确定的总体和总体单位不同,标志与指标也不同6、变异的概念及种类:变异是标志的具体表现在总体个单位间的差异。

种类:品质变异和数量变异7、变量的概念及种类:变量是可变的数量标志和所有的统计指标。

种类:按变量值是否连续分为离散变量(只能用整数表示)和连续变量(可用小数表示);按性质不同可以分为确定性变量和随机变量。

统计学第二章数据搜集整理

统计学第二章数据搜集整理

普查的规定
• • • • 规定统一的调查项目 规定统一的标准时点 规定统一的普查周期 例如:第六次人口普查,调查表,性别、年龄、 民族、受教育程度、行业、职业、迁移流动、社 会保障、婚姻生育、死亡、住房情况等 • 截止时间,标准时点是2010年11月1日零时 • 人口普查的周期是10年,2000年,2010年
频率
fi
fi
fi :第i组频数
32
(2)频率的性质 (A )
0
fi
1 fi
(B ) (3)频数密度与频率密度(消除异距分组对频数影响) (A) (2.7) 频数密度=频数/组距 (B) (2.8) 频率密度=频率/组距 各组频数密度与各组组距乘积之和等于总体单位数,各 组频率密度与各组组距乘积之和等于1.
29
组数的确定(H.A.Struges经验公 式)

n = 1 + 3.3logN
N – 24 – 44 – 89 – 170 – 359 n 5 6 7 8 9
(斯特杰斯)
• • 15 • 25 • 45 • 90 • 180 • 组距=
30
四、频数(次数)分布
1.频数分布的基本理论
(1)频数分布的定义 在统计分组的基础上,将总体所有单位按某一标志 归类排列,并计算其相应出现的次数。 频数分布是统计整理的重要形式,通过对零乱的、 分散的原始资料进行有次序的整理,形成一系列反映 总体各组之间单位分布状况的数列,即分布数列。
10
• 概率抽样的特点: 1、样本单位按随机原则抽取,排除了主观因素对 选样的影响。 2、根据部分调查的实际资料对调查对象总体的数 量特征作出估计。 3、抽样误差可以事先计算并加以控制。 • 抽样调查的适用场合

第二部分统计资料的搜集与整理-精品.ppt

第二部分统计资料的搜集与整理-精品.ppt

用来指导整个调查工作的纲领性 文件,是统计设计在统计调查阶 段的具体化
⒈确定调查目的和任务; (为什么调查)
⒉确定调查对象与调查单位; (向谁调查)
⒊确定调查项目与调查表; (调查什么)
4.调查表格和问卷设计;
5.确定调查时间; (何时调查)
6.制定调查工作的组织实施计划。
《统计学》第二章
调查对象
对时点现象进行定期或不定期的
一次性调查 调查登记,以反映现象在某一时
点上的发展水平或规模。
《统计学》第二章
定期报表
指基层单位和企业,根据一定的原始 记录或统计台帐,按照一定的统计表 式、统一的指标、统一的报送 时间和 程序,自下而上定期向上级 统计机关 报告基本统计资料的一种 统计调查方
式方法。
专门调查
专门调查是为了研究某些专门问题或 为某一目的而对某些社会经济现象专 门组织的登记和调查。
专门调查又多为一次性调查
《统计学》第二章
统计报表
以真实性准确的原始记录和核算资料 为基础,按照国家统一规定的表格形 式搜集统计资料的一种调查方式。
基本统计报表
按报表的性质和内容 专业统计报表
按报送周期
定期报表:日报、月报、季报 年报:报送年度资料
调查表的基本结构:
表头 表体 表脚
《统计学》第二章
名称、编号、 制表单位、填 表日期等等
被调查者的基 本情况、调查 项目等等
备注、指标 解释等
(三)实验设计的原则
《统计学》第二章
在相同的条件下进行多次重复实
重复性原则 验,可获得更加精确的效应估计
量。
在进行实验设计时,实验对象的
随机化原则 分配、实验次序的安排都是随机
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第二节统计整理一、统计整理的概念和意义统计整理是指根据统计研究的目的和任务,对统计调查或科学实验获得的大量原始资料进行科学的分类、汇总,或对已经加工过的资料进行再加工,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料的工作过程。

通过统计调查或实验,我们取得了大量的原始资料,但这些原始资料一般是分散的、不系统的个体资料。

它们只能说明总体各单位的具体情况,而不能说明总体特征,难以反映总体的全貌情况。

用这样的资料,无法从总体上认识和研究社会经济现象的数量表现,无法揭示社会经济现象发展变化的本质和规律。

因此,必须对这些分散的、不系统的个体资料采用科学的方法进行加工、整理、汇总,使之成为系统化、条理化、标准化的能反映总体特征的综合统计资料,并以此计算各种反映总体特征的综合指标,认识社会经济现象的总体特征和全貌,认识、分析社会经济现象的本质和发展变化规律。

可见,统计整理不是单纯的数据汇总,而是运用科学的方法,对调查资料进行分类和综合,从感性认识上升到理性认识。

它是从对社会经济现象个体量的认识到社会经济现象总体量的认识的连接点,是统计调查的继续,是统计显示与分析的前提和基础,在整个统计工作中起着承前启后的作用。

统计数据整理的质量,直接影响着统计工作的成果。

二、统计整理的内容统计整理的内容,主要包括以下几个方面:(1)对原始资料进行审核与检查,如果发现被调查单位的资料不齐全或有差错,要及时查询订正。

(2)对各项指标进行综合汇总,并按调查和分析目的的要求进行各种分组,汇总出各组单位数和各项指标的总数。

(3)将汇总的结果编制成统计表与统计图,以便进一步分析和应用。

三、统计整理的方法与步骤(一)统计分组统计分组是根据研究的任务和对象的特点,按照某种分组标志将统计总体分为若干组成部分。

理解统计分组的概念要注意三点:(1)统计分组的对象是总体。

(2)统计分组应有分组标志。

(3)统计分组对总体而言是“分”,对总体单位而言是“合”。

统计分组的关键是选择分组标志与划分各组界限。

选择分组标志,是确定将统计总体区分为各个性质不同的组的标准或依据。

划分各组界限,是根据分组标志,划定各相邻组间的性质界限和数量界限。

将统计资料按其分组标志进行分组的过程,实际上就是统计分布数列形成的过程,如图2-4所示。

分布数列是指在统计分组的基础上,将总体单位按类入组,并汇总各组内的单位数,形成总体中单位数在各组间的分布。

由上述概念可看出,分布数列包含有两个组成要素,即分组和次数。

根据分组标志的不同,分布数列可分为品质(属性)数列和变量数列。

根据分组标志的不同,分布数列可分为品质(属性)数列和变量数列。

按品质标志分组,观察总体各单位分布情况的分布数列叫品质数列,见表2-5。

按某一数量标志分组,观察总体各单位分布情况的分布数列叫变量数列,见表2-6。

(二)统计汇总统计汇总是指对统计分组后的资料进行汇总和计算,计算出各组指标和综合指标。

统计汇总计算的指标包括总量指标、相对指标和平均指标。

统计汇总的技术包括手工汇总和计算机汇总,其中,手工汇总又包括划记法、过录法、折叠法、卡片法和分票法等。

(三)编制统计表和统计图在经过统计汇总得到表明社会经济现象总体和各个组的单位数及一系列标志总量的资料后,将这些资料用统计图表展示出来,就得到统计整理的最终结果。

四、品质数据的整理(一) 品质型分类数据的整理在整理数据时首先应列出所分的类别;然后,计算出每一类别的频数、频率或比例、比率,形成一张数据频数分布表;最后,根据需要选择适当的图形进行展示,以便对数据及其特征有一个初步的了解。

下面结合实例说明如何建立和解释品质数据的频数分布。

(二)品质顺序数据的整理对于品质顺序数据,除了可使用上面介绍的分类数据的整理和表示方法外,还可以计算累积频数和累积频率(百分比)。

【例2-1】某手机专营店为了解人们在购买手机时关注的因素,随机调查了100名光顾店面的顾客,当问及“您在选购手机时最关注的问题是什么”时供选择答案为:A.价格;B.品牌;C.售后服务;D.功能;E.外观。

得到回答的原始数据如表2-7所示。

(1) 频数与频数分布的操作。

落在某一特定类别(或组)中的数据个数,称为频数;数据在各类别(或组)中的分配,称为频数分布;各类别(或组)频数所占的比重,称为频率。

根据【例2-1】数据编制频数分布如表2-8所示。

经分类整理后,原始数据由杂乱无序变得简洁明了,从中可以很容易看出,关注“功能”的人数最多,共43人,占被调查总人数的43%;关注“品牌”的人数为30人,占被调查总人数的30%。

由此可见,现在人们购买手机时普遍关注的是功能与品牌。

(2)品质分类数据的图形描述。

统计数据除用统计表加以概括表达外,还可以用统计图显示。

统计图具有直观、鲜明、形象、便捷等特点,在表述统计数据时能够给人留下深刻的印象。

统计图的种类有很多,下面简要介绍统计图形中常用的条形图和柱形图。

图形的制作可以由计算机来完成,也可以用手工绘制。

条形图是用宽度相同的条形的高度或长短来表示数据多少的图形。

条形图可以横置或纵置,纵置时也称为柱形图。

在表示分类数据的分布时,条形图的高度或长度用以表示各类别数据的频数或频率。

绘制时,各类别可以放在纵轴,称为条形图;也可以放在横轴,称为柱形图。

通常用于显示品质分类数据分布的图形,在绘制时是以图的纵坐标表示分组(类),图的横坐标表示每组的频数或者频率,并在纵轴每组对应画出固定宽度的条形,延伸该条形的长度,直到等于横轴上标明的该组的频数或者频率为止。

为了强调每组数据都是独立的类别,这些条形应分离开来。

【例2-2】表2-8整理后的频数分布用条形图和柱形图表示,分别如图2-5和图2-6所示。

条形图或柱形图只能直观地描述单位数量,要更清楚地了解各单位数量总数之间的关系,可以用扇形图来表示。

【例2-3】要调查某个班内同学最喜欢的运动项目,全班共40人。

其中:喜欢足球的8人;喜欢篮球的6人;喜欢排球的5人;喜欢乒乓球的12人;喜欢其他项目的9人。

根据数据绘制的扇形图,如图2-9所示。

在这个扇形图中,整个圆用以表示全班学生总数,扇形面积用以表示喜欢某个项目的学生数。

在扇形图中,频率通常转化为百分数来表示。

【例2-4】在一项城市住房问题的研究中,研究人员在甲、乙两个城市各抽样调查300户,采用问卷调查工具问题为:您对您家庭目前的住房状况是否满意?要求回答的类别为: 1.非常不满意;2.不满意;3.一般;4.满意;5.非常满意。

(1)频数与频数分布的统计。

将【例2-3】数据具体整理结果如表2-9和表2-10所示。

(2)顺序数据的图形描述。

品质顺序数据也可用柱形图来描述,如图2-8所示。

扇形图还可以画成截圆柱形的,通常称为饼状图。

与扇形图类似,饼状图反映的是各组次数所占的比例,一般用百分比表示,如图2-9所示。

通过图形来观察不同评价等级的人数比例要比看数字数据更清楚、更直观。

统计数据的分析中位数是一种位置的代表值,其特点是不受数据极端值的影响,它主要用于测度带有顺序性的数据的集中趋势,但不适用于没有顺序意义的分类数据。

概括来讲,当数据分布的偏斜程度较大时,即当数据中存在极端值时,中位数对集中趋势的代表性较高。

因此,在研究社会居民收入、财产状况、人口年龄构成状况时,居民收入、人口年龄中位数比平均收入、平均年龄更能代表居民收入、财产状况、人口年龄状况等数据的集中趋势。

例如,根据2010年人口普查资料,我国人口年龄中位数为35.5岁,这个数字描述了我国人口年龄结构的水平,即当年我国人口年龄状况是有一半人口年龄大于35.5岁,一半人口年龄小于35.5岁。

变量数据的整理(一)变量分布数列的概念用数量标志进行分组所得到的分布数列,叫做变量分布数列。

若每一组别都是由单个的组值(整数或小数)表示,称为单项式变量分布数列;若每一组别都是由数域(区间)表示,则称为组距式变量分布数列。

(二)单项式变量分布数列的编制(三)组距式变量分布数列的编制组距式变量分布数列又分为等距变量分布数列、开口组组距变量分布数列和异距变量分布数列。

【例2-5】某生产组20 名工人同种产品日产量如下(单位:件):这是一个离散型变量,其变量值不多,变动范围不大,宜编制单项式变量分布数列。

编制步骤如下:(1)按变量值大小顺序排列:(2)每种变量值为一组(重复者只取一个),顺序排列为7组:(3)列入表中并汇总出各组频数,如表2-11所示。

将表2-7绘制成频率图,见图2-10所示。

在分组整理单项式变量分布数列中,可以通过观察直接寻找到众数。

【例2-6】某地区男胶鞋销售量资料如表2-12所示,试确定众数。

从表中可以直接看出,众数组就是销售量最多的124.0千双这个组,25厘米就是众数。

等距分组即标志值在各组保持相等的组距。

在变量值变动比较均匀,没有突然的大起大落时,可采用等距分组。

等距分组由于各组的组距相等,便于各组单位数和变量值的直接比较,也便于计算各种综合指标。

下例适用于编制一个等距变量数列。

【例2-7】对某班40名学生某科某次考试成绩按试卷登记得到如下资料:编制等距数列一般有以下步骤:(1)将原始数据按顺序排列起来,并确定变量性质。

根据上列,对数据按成绩由低到高排列可得到:该例变量的性质为连续变量。

确定变量性质,是为了正确进行数列的编制和确定组限的表示方法。

(2) 计算全距。

确定全距是为了适当进行分组。

全距是指在全部变量值中最大变量值与最小变量值的差距,全距从原始数据中可求出。

全距=最大变量值-最小变量值(3) 确定组限、组距和组数。

组限是指每个组的两端变量值。

其中,每个组的起点值(或称最小值)为下限、每个组的终点值(或称最大值)为上限。

所谓组距是指每个组中的上限值与下限值之差。

组距可按下式计算:组距=上限-下限所谓组数是指某个变量数列应划分为多少个组。

确定组距与组数的具体方法如下:在计算组数与组距时,所使用的变量最小值应略低于实际资料的最小值,自50分开始,最大值应略高于实际资料最大值,取至100分,则全距为100-50 =50。

上式中全距是既定的,而组数和组距是可变的。

一般来讲,组距应尽可能取5或10的整倍数,而组数则必须是整数。

若组距为5,则:若组距为10,则:上例中,宜采用以10为组距,分为5组。

(4)写出组限并据以归类汇总计算各组次数。

所谓归类汇总,是指依据各个总体单位的具体标志值,将其划归某一具体组之中。

在归类汇总时,要遵循“不重复、不遗漏”的基本原则。

不重复是指所确定的组限必须使各组的范围互斥,以便确保每个数据只能归入唯一的组,不能模棱两可,或归属不定。

不遗漏是指所确定的组限必须包容全部原始数据,不允许将任何数据遗漏在外,即要求所确定的最小的组限不大于原始数据中的最小值,所确定的最大的组限不小于原始数据中的最大值。

相关文档
最新文档