统计学第一二章

合集下载

统计学第1-2章作业参考答案

统计学第1-2章作业参考答案

第1-2章作业参考答案一、单项选择1、政治算术学派的代表人物是(B)A.凯特勒B.威廉·配第C.康令D.阿亨瓦尔2、统计学研究对象的重要特点是(A)A.数量性B.总体性C.社会性D.具体性3、就总体单位而言(C)A.只能有一个标志B.只能有一个指标C.可以有多个标志D.可以有多个指标4、要了解某班50名学生的学习情况,则总体是(A)A.50名学生B.每一个学生C.50名学生的学习成绩D.每一个学生的学习成绩5、对某地区所有工业企业的职工情况进行研究,总体单位是(A)A.每个职工B.每个企业C.每个个数的职工D.全部工业企业6、某生产班组四名工人月工资收入分别是3200元、3250元、3320元和3560元,这四个数字是(B)A.变量B.变量值C.数量标志D.数量指标7、某工业企业工人的技术等级分为一级、二级、三级、四级和五级,这里的“技术等级”是(B)A.数量标志B.品质标志C.数量指标D.质量指标8、职工人数是一个(A)变量。

A.离散型B.连续型C.有时是离散型有时是连续型D.无法判断9、一项调查是否属于全面调查,关键看其是否(B)A.对调查对象的各方面都进行调查B.对组成调查总体的所有单位逐一进行调查C.制定统计调查方案D.采用多种调查方法10、制定统计调查方案,首先要明确(D)A.统计调查对象B.统计调查单位C.统计调查项目D.统计调查目的11、经常调查与一时调查是按(B)来划分的。

A.调查组织形式B.登记事物连续性C.调查方法D.调查对象包括范围12、下列属于经常调查的是(D)A.对2011年大学毕业生就业状况的调查B.对近几年来居民消费价格变动情况进行一次摸底调查C.对全国人口每隔10年进行一次普查D.按月上报的钢铁产量13、对某地区饮食业从业人员的身体状况进行调查,调查对象是该地区饮食业的(C)A.全部营业网点B.每个营业网点C.所有从业人员D.每个从业人员14、某市工商企业2011年生产经营成果的年报呈报时间规定在2012年1月31日,则调查期限为(B)A.一日B.一个月C.一年D.一年零一个月15、调查时间的含义是(A)A.调查资料所属的时间B.进行调查的时间C.调查工作期限D.调查资料报送的时间16、重点调查的重点单位是指(C)A.处于较好状态的单位B.体现当前工作重点的单位C.就调查标志而言,在单体标志总量中占有很大比重的单位D.总体中的典型单位17、下列调查中,调查单位与填报单位一致的是(C)A.企业固定资产使用情况调查B.人口普查C.工业企业现状调查D.某地区工商企业职工基本情况调查18、人口普查属于(D)A.典型调查B.抽样调查C.全面统计报表D.全面调查19、某灯泡厂生产一批灯泡,欲了解其产品质量,需要采用(C)A.重点调查B.典型调查C.抽样调查D.普查20、对某企业职工情况进行调查,则调查对象是(B)A.该企业每一个职工的情况B.该企业全部职工C.该企业每一个职工的情况D.该企业所有职工的情况21、划分连续变量的组限时,相邻的组限必须(A)A.重叠B.相近C.不等D.无所谓22、统计分组的关键是(C)A.确定组距和组数B.确定全距和组数C.确定分组标志D.确定组距和组中值23、次数分布的类型主要取决于(C)A.统计总体所处的条件B.分组标志的选择C.社会经济现象的性质D.变量是连续还是离散24、下列分组属于品质分组的是(D)A.人口按年龄分组B.住户按人口分组C.企业按拥有的固定资产原值分组D.产品按等级分组25、对某综合性大学的全体学生,首先按文科和理科分组,在此基础上再按性别分组,其分组结果如下:这样的分组属于(B)A.简单分组B.复合分组C.平行分组D.再分组26、某公司职工月奖金额最高为3000元,最低为500元,此资料分为6个组,形成等距数列,则各组组距应为(A)A.400 B.415 C.416 D.41727、某连续变量数列,第一组设置为开口组,其上限为800,相邻组的组中值为880,则第一组的组中值为(C)A.700 B.710 C.720 D.74028、在次数分布中,频率是指(C)A.各组的频数相互之比B.各组分布次数相互之比C.各组分布次数与总次数之比D.各组分布次数与比重之比29、某企业职工按工资水平分为4组:500元以下;500元~600元;600元~700元;700元以上。

统计学温习宝典

统计学温习宝典

统计学温习宝典第一章、第二章1、在数据计量尺度中,虽然没有绝对零点,但可分类、排序、比较大小、进行加减运算的计量尺度是()。

A、列名尺度B、顺序尺度C、间隔尺度D、比率尺度答案:C2、关于众数,下列说法正确的是()。

A、众数不适用于定距和定比数据B、众数不受数据中极端值的影响C、一组数据只能有一个众数D、众数不适用于定类数据答案:B3在下列数据中,()属于绝对数。

A、中位数B、众数C、上缴税金额D、劳动生产率答案:C4对列名水平进行分析的统计量主要是()。

A、频数B、频率C、中位数D、A且B答案:D5随机变量Y~B(n,p),则其变异系数为()。

A、根号(npq)/npB、np / 根号(npq)C、qD、1/ q答案:A6关于均值,下列说法正确的是()。

A、均值不适用于定类数据和定序数据B、均值不适用于定距数据和定比数据C、各变量与其均值的离差之和等于1D、几何平均数不适用于定比数据答案:A7抽样调查()。

A、按随机原则抽取样本B、是一种非全面调查方式C、目的是为推断总体数量特征D、现已成为我国统计调查体系的主体E、往往不如全面调查精确度高答案:ABCD8定量数据是由()计量所形成的数据。

A、列名水平B、有序水平C、间隔水平D、比较水平E、以上均有答案:CD9适合于有序水平的统计量有()。

A、均值B、标准差C、频数D、四分位数E、众数答案:CDE10、影响次数分布的要素可分为_________、_________、__________和___________。

答案:组数组距组限组中值11、将基数抽象化为100而计算的相对数称为_______。

答案:百分数12、表示次数分布最常用的图形有_______、_______、和_______等。

答案:直方图折线图曲线图13在相对数中,根据分子和分母的不同情况可以将相对数分为_______相对数和_____相对数。

答案:比例,比率14、怎样理解权数对均值的影响?[答案:均值不仅受到组中值大小的影响,而且也受权数fi的影响。

统计学重点

统计学重点

第一章1、数据类型:按照所采用的计量尺度不同,我们将数据分为:分类数据(归于某一类别的非数字型数据,ex:血型),顺序数据(有序类别的非数据型数据,ex:喜好,产品等级),数值型数据(按照数字尺度测量的观测值)2、统计量:用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数,样本统计量通常用小写英文字母表示,若存在未知变量就不是统计量。

第二章1、概率抽样(随机抽样):(1)特点:按一定的概率以随机原则抽取样本(抽取样本时使每个单位都有一定的机会被抽中)。

每个单位被抽中的概率是已知的,或是可以计算出来的。

当用样本对总体目标量进行估计时,要考虑到每个样本单位被抽中的概率(2)简单随机抽样:体现在每一个样本点的选取上(简单直观方便,但是效率低)(3)分层抽样:适用于总体差距大,体现在每一层样本点选取上(精度最高)(4)系统抽样:第一个样本点的选取是随机的(简单,提高精度,但是方差估计难)(5)整群抽样:要求:群集间互斥且周延,群集与群集间差异小,群集内类似总体每一群的选取是随机的(简单,相对集中,方便,但是精度较差)(6)多阶段抽样:先抽取群,但并不是调查群内的所有单位,而是再进行一步抽样,从选中的群中抽取出若干个单位进行调查。

2、非概率抽样(1)抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查(2)有方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样等方式3、比较:4、抽样误差:所有样本可能的结果与总体真值之间的平均性差异影响因素:样本量的大小、总体的变异性第三章1、数据审核:(1)原始数据:完整性,准确性;(2)二手数据:适用性,时效性,确认是否有必要做进一步的加工整理2、分类数据的图示:(1)条形图:主要反映分类数据的频数分布(2)帕累托图:各类别数据出现的频数多少排序的柱形图,用于展示分类数据分布。

(3)饼图:主要用于表示样本或总体中各组成部分所占的比例,用于研究结构性问题。

统计学知识点

统计学知识点

第一章思考题1.1统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。

1.2描述统计:它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。

推断统计:它是研究如何利用样本数据来推断总体特征的统计方法。

1.3统计学的类型和不同类型的特点统计数据:按所采用的计量尺度不同分;〔定性数据〕分类数据:只能归于*一类别的非数字型数据,它是对事物进展分类的结果,数据表现为类别,用文字来表述;〔定性数据〕顺序数据:只能归于*一有序类别的非数字型数据。

它也是有类别的,但这些类别是有序的。

〔定量数据〕数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

统计数据;按统计数据都收集方法分;观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。

实验数据:在实验中控制实验对象而收集到的数据。

统计数据;按被描述的现象与实践的关系分;截面数据:在一样或相似的时间点收集到的数据,也叫静态数据。

时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。

1.4解释分类数据,顺序数据和数值型数据答案同1.31.5对一千灯泡进展寿命测试,则这千个灯泡就是总体,从中抽取一百个进展检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象*种特征的概念,比方说灯泡的寿命。

1.6变量可以分为分类变量,顺序变量,数值型变量。

变量也可以分为随机变量和非随机变量。

经历变量和理论变量。

1.7离散型变量,只能取有限个值,取值以整数位断开,比方"企业数〞连续型变量,取之连续不断,不能一一列举,比方"温度〞。

1.8统计应用实例:人口普查,商场的名意调查等。

1.9统计应用的领域:经济分析和政府分析还有物理,生物等等各个领域。

统计学 第一章 总论

统计学 第一章 总论

(三)现代统计学时期(从19世纪末到现 在,是现代统计学时期 )
这一时期的显著特点是数理统计学由于同 自然科学、工程技术科学紧密结合及被广泛应 用于各个领域而获得迅速发展,各种新的统计 理论与方法、尤其是推断统计理论与方法得以 大量涌现。现代统计学时期是统计学发展最辉 煌的时期。
三、统计学的学科性质
截面数据
又称静态数据,是指在相同或近似相同的时点 上获得的数据,通常是在不同空间上获得的。
二、统计数据研究过程
统计设计
统计设计要在有关学科理论指导下,根据研究问题的性质、目 的和任务,科学地确定统计研究的总体对象,明确所要搜集数 据的种类,确定相应的统计指标及其体系并给出统一的定义和 标准,确定统计数据搜集、整理、推断和分析的基本方法,规 定研究工作的进度安排和质量要求,拟定研究工作的资源配置 和组织实施方式等。 数据搜集就是按照统计设计的要求,有针对地获取所需的统计 数据的环节,也就是说,要通过统计观测或实验的方式、方法 去搜集各种各类计算统计指标所需的原始数据,以及其他已经 存在的各种相关数据。 数据整理就是对通过统计观测或实验所获得的原始数据,进行 必要的系统化处理,使之条理化、综合化,成为能反映总体特 征的统计数据的环节,也称为统计整理环节。 数据分析是在数据整理的基础上,运用各种统计方法对数据进 行各种统计分析,得出某些有用的定量结论的环节,也称为统 计分析环节。
定序数据
是对事物按照一定的顺序进行分类的结果,表 现为有顺序的类别,由定序尺度计量而成,各 类别之间有大小优劣之分。 表现事物数量特征的数据,具体又分为定距数 据与定比数据两种。
定量数据: 也称数量数据,用数值来表现。是指用数值来
一、统计数据类型 定距数据 是一种不仅能反映事物所属的的类别和

生物统计学 第一二章

生物统计学 第一二章

第一章统计一般有三个含义,即( )。

B A.统计调查、统计整理、统计分析 B.统计工作、统计资料、统计学C.统计活动、统计管理、统计预测D.统计咨询、统计监督、统计信息 科学研究的基本过程是( )。

CA .选题、实验、写论文B .实验验证、形成假说、抽样调查C .形成假说、实验验证、形成结论D .抽样调查、实验验证、形成结论 科学研究的基本方法包括了( )。

C A .选题、实验、写论文 B .实验验证、形成假说、抽样调查C .选题、查文献、假说、假说的检验、实验的规划与设计D .抽样调查、实验验证、形成结论 4.因素的水平是指( )DA .因素量的级别B .因素质的不同状态C .研究的范围与内容、D .A +B 5.生物学实验中十分重视实验结果的( )。

CA .代表性B .正确性C .A +D D .重演性6.实验方案按其参试因子的多少可以区分为( )。

BA .单因素实验B .A +C +D C .多因素试验 D .综合性试验 7.实验处理是指( )。

BA .不同的水平B .A +C C .不同水平的组合D .均不是8.用于衡量实验效果的指示性状称为( )。

AA .实验指标B .实验效应C .实验因素D .实验环境9.一个实验中可以选用( )作为实验指标。

AA .B +C B .单个性状 C .多个性状D .主要性状10.在多因素实验中可能存在( )。

C A .简单效应 B .主要效应 C .A +B +D D .互作效应11.在下列图示中,N 因素与P 因素间存着( )。

A A .负的交互作用 B .正的交互作用 C .负的影响 D .正的影响12、制定实验方案主要应考虑( )。

B A.用多因素实验、设置对照B.实验目的明确、恰当的因素与水平、设置对照、唯一差异原则C.唯一差异原则、实验条件、水平间距小些D.水平间距大些、多用单因素实验、注意互作13、与单因素实验相比,多因素实验具有( )等优势。

统计学 (1.2章)

统计学 (1.2章)

统计学第一章导论1.1统计及其应用领域1.11什么是统计学统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。

统计学数据分析的方法可分为描述统计方法和推断统计方法。

描述统计:数据收集、处理、汇总、图标描述、概括与分析等统计方法。

推断统计:研究如何利用样本数据来推断总体特征的方法。

1.1.2统计的应用领域1.企业发展战略2.产品质量管理3.市场研究4.财务分析5.经济预测6.人力资源管理1.2统计数据的类型1.2.1分类数据、顺序数据、数值型数据按照所采用的计量尺度的不同,可以将统计数据分为分类数据、顺序数据、和数值型数据。

分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,是用文字来描述的。

(如,人口按照性别分为男、女两类。

)顺序数据:只能归于某一有序类别的非数字型数据。

顺序数据虽然也是类别,但这些类别是有序的。

(比如,将产品分为一等品、二等品、三等品。

)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。

1.2.2 观测数据和实验数据按照统计数据的收集方法,可以将其分为观测数据和实验数据。

观测数据:通过调查或观测到的数据,这类数据是在没有对事物人为控制的条件下得到的,有关社会经济现象的统计数据几乎都是观测数据。

实验数据:是在实验中控制实验对象而收集到的数据。

自然科学领域的数据大多数都是实验数据。

1.2.3截面数据和时间序列数据按照被描述的现象和时间的关系,可以将统计数据分为截面数据和时间序列数据。

截面数据:是在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间获得的,用于描述现象在某一时刻的变化情况。

(同时间不同空间/对象)。

比如说,2010年我国各地区的国内生产总值就是截面数据。

时间序列数据:是在不同时间收集到的数据,这类数据是按时间顺序收集到的,用于描述现象随时间变化的状况。

(同空间不同时间)比如,2010-2012年我国的国内生产总值就是时间序列数据。

统计学(第1章)

统计学(第1章)

排序

排 序 相对指标
量的差距
×
加减
有绝对0点
÷
乘除
第三章 统计数据的整理
28
三、统计指标和指标体系
(一)统计指标(Indicaton)的含义
统计指标简称指标,是反映同类社会 经济现象总体某一综合数量特征的概 念和数值。
统计指标的基本要素:时间限定、空 间范围、指标名称、指标数值、计量 单位、计算方法。
31
3、按计算方法和作用不同
6/15/2019
第一章 总论
32
(三)统计指标的特点
数量性 综合性:反映的是总体特征 质的规定性:统计指标应该具有实际
意义,包括时间、地点、条件等等。
6/15/2019
第一章 总论
33
(四)统计指标与标志的区别与联系
6/15/2019
第一章 总论
39
6/15/2019
第一章 总论
4
四、统计学在商务和经济中的应用
会计 财务 营销 生产 经济
6/15/2019
第一章 总论
5
第二节 统计学分类及研究方法
一、统计学的学科性质
方法论科学:定性-定量-定性 从数量方面来认识客观现象总体
6/15/2019
第一章 总论
6
二、描述统计学与推断统计学
对其进行分析的统计量主要是频数或 频率。
第三章 统计数据的整理
23
(2)定序尺度(顺序尺度 ordinal scale)
是把各类事物按一定特征的大小、高低、 强弱等顺序排列起来,构成定序数据,是 对事物之间等级或顺序差别的一种测度。
特征:
计量精度要优于定类尺度。它不仅可以测度 类别差,还可以测度次序差,并可比较大小, 但不能进行加减乘除计算。
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第一章数据与统计学第一节统计数据与统计学1.统计学是一门收集、整理、显示和分析统计数据的科学,目的是探索数据的内在数量规律性。

2.解释数据(结果说明解决问题第二节统计学的产生与发展3.古典统计学阶段(17世纪中叶~19世纪初):(1)国势学派:使用记述、对比的方法研究国家基本国情;(2)政治算术学派:使用数字、图表等统计方法,研究英国、法国、荷兰三国的国情、国力;(3近代统计学阶段(19世纪初~20现代统计学阶段(20世纪初至今)第三节统计学的分科4.从统计教育的角度,统计学可以分为描述统计和推断统计、理论统计和应用统计5.描述统计是指用图形、表格和概括性的数字对数据进行描述的统计方法。

描述统计学是研究数据收集、整理和描述的统计学分支。

6.描述统计学的内容:(1)整理数据;(2)收集数据;(3)展示数据;(4)描述性分析。

7.描述统计学的目的:(1)描述数据的基本特征;(2)找出数据的基本规律。

8.描述统计学的研究对象:确定性现象。

9.推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。

10.推断统计学的内容:(1)参数估计;(2)假设检验。

11.推断统计学的目的:对总体的基本特征做出推断。

12.推断统计学的研究对象:不确定性现象。

13.理论统计是研究统计学的一般理论,是研究统计方法的数学原理。

应用统计是研究统计学在各领域的具体应用。

第四节数据的种类与来源14.数据的种类按性质可以分为(1)定位数据,如坐标数据;(2)定性数据,如表示事物属性的数据(城镇、河流、道路等);(3)定量数据,如面积,体积,重量,速度等;(4)定时数据,如年,月、日等。

15.数据的种类按表现形式可分为(1)结构型数据,如各种数字、测量数据及其解释;(2)非结构型数据,如网络日志、音频、视频、图片和地理信息等。

16.第一手数据(直接数据):统计数据来源于直接组织的调查、观察或科学试验,第二手数据(间接数据):统计数据来源于已有的数据。

17.统计调查是按照预定的统计任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集资料的全过程。

18.统计调查包括(1)普查,普查是为了某一特定目的,专门组织的的一次性全面调查。

通常是一次性或周期性的,非经常一般需要规定统一的标准调查时间数据的规范化程度较高应用范围比较狭窄。

(2)抽样调查,抽样调查是从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据收集方法。

特点:经济性、时效性、适应面广、准确性高。

(最重要的调查方法)(3)统计报表,统计报表是按国家统一规定的表式,统一的指标项目,统一的报送时间,自下而上逐级定期提供基本统计资料的调查方法。

(4)重点调查,重点调查是在所要调查的总体中选择一部分重点单位进行调查。

重点单位是着眼于现象量的方面,尽管这些单位在全部单位中只占一部分,但是它们的某一主要标志的标志总量在总体标志总量中有绝大比重。

(不带主观因素)(5)典型调查,典型调查是指有意识地选取若干具有代表性的单位进行调查和研究,借以认识事物发展变化的规律。

典型调查包括①解剖麻雀:总体内部个体间差异很小;②划类选典:总体内部个体间差异较大。

(虽然抽样调查、重点调查、典型调查都属于非全面调查,但是只有抽样调查可以用来推断总体的数量特征。

重点调查和典型调查所得资料只能形成对总体的定性认识,不能上升为总体的定量结果。

)(6)科学试验,在自然科学和工程的研究领域,通常是通过科学试验的方法获得研究的统计数据。

(7)网络获取等。

19.间接数据的获取渠道:(1)统计部门和政府部门公布的有关资料,如各类统计年鉴;(2)各类专业期刊、报纸、书籍所提供的资料;(3)各种会议(博览会、展销会、交易会等)及专业性、学术性研讨会上交流的有关资料;(4)从互联网或图书馆查阅到的相关资料。

20.文件检索:(1)系统检索,选取合适的数据库和检索的关键词;(2)追溯检索,Science Citation Index;(3)浏览检索,根据平时的积累。

第五节统计数据的质量21.统计调查阶段是统计研究的第一步,在这一阶段中,统计数据的误差从不同的角度分类,可以分为非抽样误差与抽样误差。

22.抽样误差是指利用样本推断总体时产生的误差。

影响抽样误差大小的因素:(1)样本容量的大小;(2)总体的变异性。

抽样误差可以计算和控制。

23.非抽样误差是指由于调查过程中有关环节的失误造成的。

从理论上来说,非抽样误差是可以避免的。

控制方法:(1)对调查员进行挑选;(2)对调查员进行培训;(3)对调查过程进行控制;(4)对调查结果进行检验、评估。

第六节统计学的基本概念24.总体:是指所研究的所有个体(基本单位)的集合。

总体中的每个个体称为总体单位。

总体单位的特点:大量性,同质性和异质性。

25.样本:是指从总体中抽取的一部分元素的集合。

构成样本的元素的数目称为样本容量。

26.标志(变量):说明总体单位属性和特征的名称。

标志包括(1)品质标志:说明总体单位质的特征;(2)数量标志:说明总体单位量的特征。

27.指标:综合反应总体数量特征的概念和数值,具有可量性和综合性。

指标包括(1)理论指标:指标名称、核算方法、计量单位;(2)实践指标:时间、空间、数值。

常用指标:总量指标、平均指标和相对指标。

例如:2014年我国国内生产总值568845亿元(总量指标),按可比价格计算,比上年增长7.7%(相对指标)。

全年全国粮食总产量达到60194万吨(总量指标),比上年增加1236万吨(总量指标),增长2.1%(相对指标)。

全年城镇居民人均总收入29547元(总量指标)。

其中,城镇居民人均可支配收入26955元(总量指标),比上年名义增长9.7%(相对指标),扣除价格因素实际增长7.0%(相对指标)。

全年农村居民人均纯收入8896元(总量指标),比上年名义增长12.4%(相对指标),扣除价格因素实际增长9.3%(相对指标)。

2013年全国居民收入基尼系数为0.473 (相对指标)。

第二章统计数据的描述第〇节数据的预处理1.数据的审核包括逻辑审核和计算检查,目的:保证数据的完整性和准确性第一节统计数据的整理2.统计调查阶段是统计研究的第一步,它是根据统计研究的需要,将数据按照某个属性分成不同的组别。

在分组时,如果按照性别、质量等定性指标分组,称为品质标志分组;如果按照数量或数值等定量指标分组,称为数量标志分组。

(品质标志分组)(数量标志分组)单变量值分组适用于品质标志分组及数量标志分组中变量值较少时。

3.次数分配(组距分组)是指将数据按其分组标志进行分组。

4.次数分配的特点:(1)将变量值的一个区间作为一组;(2)适合于连续变量;(3)适合于变量值较多的情况;(4)需要遵循“不重不漏”的原则(上组限不在该组内);(5)可采用等距分组,也可采用不等距分组。

5.组距分组的思路:(1)先确定组数,再确定组距;(2)先确定组距,再确定组数。

不管怎么分组,都是组数越多,组距越少。

例:66 69 74 76 78 80 82 84 88 896.与组距分组有关的几个概念:(1)下限(low limit) :一个组的最小值;(2)上限(upper limit) :一个组的最大值;(3)组距(class width) :上限与下限之差;(4)组中值:下限与上限之间的中点值(组中值=(上限+下限)/2).7.累计频数(shuÒ):(1)向上累积频数(以下累计):变量值由小到大排列,表示某个变量值的位置,或者小于等于某个变量值的个数;(2)向下累计频数(以上累计):变量值由大到小排列,表示某个变量值的位置,或者大于等于某个变量值的个数。

8次数分配直方图:用矩形的宽度和高度来表示频数分布的图形。

在直角坐标中,用横轴表示数据分组,纵轴表示频数或频率,各组与相应的频数就形成了一个矩形,即直方图。

9.折线图(频数多边形图)是指在直方图的基础上,把直方图顶部的中点(组中值)用直线连接起来,再把原来的直方图抹掉。

具体做法:(1)第一个矩形的顶部中点通过竖边中点(即该组频数一半的位置)连接到横轴,最后一个矩形顶部中点与其竖边中点连接到横轴;(2)折线图下所围成的面积与直方图的面积相等,二者所表示的频数分布是一致的。

10.次数分布曲线:当观察次数逐渐增多,组距越小组数越多时,所画出来的折线就会越光滑,逐渐形成一条光滑的曲线,即次数分配曲线。

常见的有四种曲线,即正态分布曲线,偏态曲线,J形曲线和U形曲线。

(1)正态分布曲线也称为钟形曲线,,是客观事物数量特征表现最多的一种次数分布曲线,如人的身高、体重、智商,电子管中的热噪声、电流、电压,纤维长度。

细沙强度,钢的含碳量,农作物产量,橡胶的抗张力。

一个地区多年的降雨量等。

所有的试验、测量和观测误差都服从正态分布;(2)偏态分布曲线根据尾巴拖向哪一方分为正偏(右偏)和负偏(左偏)两种分布曲线。

例如人均收入分配的曲线就是右偏分布曲线;(3)J形曲线包括正J形曲线和反J形曲线。

例如供给曲线(正J形曲线)和需求曲线(反J形曲线);(4)U形曲线又称为死亡率曲线、产品故障率曲线或浴盆曲线,人和动物的死亡率近似服从U形曲线分布。

产品的故障和报损情况也有类似的分布规律。

11.20世纪初意大利经济学家基尼(G. Gini)根据洛伦茨曲线给出了衡量收入分配平均程度的指标A 表示实际收入曲线与绝对平均线之间的面积B 表示实际收入曲线与绝对不平均线之间的面积 如果A=0,则基尼系数=0,表示收入绝对平均 如果B=0,则基尼系数=1,表示收入绝对不平均 基尼系数在0 和1之间取值一般认为,基尼系数若小于0.2,表明分配平均;基尼系数在0.2至0.4之间是比较适当的,即一个社会既有效率又没有造成极大的分配不公;基尼系数在0.4被认为是收入分配不公平的警戒线,超过了0.4应该采取措施缩小这一差距。

第二节 分布集中趋势的测度12.众数是指一组数据中出现次数最多的数据。

特点:(1)适合于数据较多时使用;(2)不受极端值的影响;(3)一组数据可能没有众数或有几个众数;(4)主要用于分类数据,也可用于顺序数据和数值型数据。

应用:市场中价格的确定。

13.中位数是排序后位于中间位置的的是数据。

若总数据个数为奇数,则中位数=21+中间数;若总数据个数为偶数,则中位数=221中间数中间数+。

特点:(1)不受极端值影响;(2)主要用于顺序数据,也可用数值型数据,但不能用于分类数据14.中位数是将统计分布从中间分为面积(即数据个数)相等的两部分,与中位数性质相似的还有四分位数、十分位数和百分位数。

四分位数是指将数据分布4等分的三个数值,其中中间的四分位数就是中位数。

十分位数和百分位数分别是将是数据十等分和一百等分的数值。

相关文档
最新文档