统计学期末复习第3章
《统计学概论》第三章 统计整理

70 ~ 80
80 ~ 90
90 ~ 100
合
计
学生人数
(人)
5 15 18 10
2 50
由表3-1可见,整理后的学生考 STAT 分资料,较整理前的考分资料明 显要条理、系统。由上表可见, 在学生总体中,60分以下和90分 以上的学生人数都较少,绝大多 数学生的考分分布在60—90分之 间。
所以,统计整理是统计调查的继续,是统计分析的前提, 它实现了从个别单位的标志表现(标志值)向总体综合指标 的过渡,在统计研究中起着承前启后重要的作用。
编制步骤:
⒈求变异全距 R X max X min 139 107 32(百万元)
⒉确定组距及组数 R≤组距(d) ×组数(m)
确定组距的原则:
要能区分各组的性质差异 要能反映总体资料的分布特征 为方便计算,尽可能为5或10的整数倍
编少)
要求编制组距数列。
STAT
• 排序结果为
• 107 108 108 110 112 112 113 114 115 117 117 117 118 118 118 119 120 120 121 122 122 122 122 123 123 123 123 124 124 124 125 125 126 126 127 127 127 128 128 129 130 131 133 133 134 134 135 137 139 139
合计
频数(人) 3 5 8 14 10 6 4
50
频率(%) 6 10 16 28 20 12 8
100
统计分组方法
选择反映事物属性差异的标
按品质标志分组 志作为分组标志,如性别、
所有制类型
统计学--第三章综合指标---复习思考题

统计学--第三章综合指标---复习思考题第三章综合指标、填空题1.总量指标按其反映的时间状况不同可以分为指标和标。
2. 相对指标是不同单位(地区、国家)的同类指标之⽐。
3. 相对指标是两个性质不同⽽有联系的指标之⽐。
4.某企业某年计划增加值达到500万元,实际为550万元,则增加值的计划完成相对指标为5.某企业某年计划单位产品成本为40元,实际为45元,则单位产品成本的计划完成相对指标为6.某车间5名⼯⼈的⽇产量(件)为10 10 11 12 14,则⽇产量的中位数7.市场上某种蔬菜早、中、晚的价格(元)分别为、1、,早、中、晚各买1元,则平均价格为8.在两个数列平均⽔平时, 可以⽤标准差衡量其变异程度。
9. (X X)、判断题年我国⼈⼝出⽣数是⼀个时点指标。
(年我国国内⽣产总值是⼀个时期指标。
年我国⼈均国内⽣产总值是⼀个平均指标。
4.我国第三产业增加值在国内⽣产总值所占⽐重是⼀个结构相对指标。
5.某企业某年计划劳动⽣产率⽐去年提⾼4%,实际上提⾼了5%,则劳动⽣产率的计划完成相对指标为5%/ 4%。
(6.某企业某年计划单位产品成本⽐去年降低3%,实际上提咼了 %, 则单位产品成本的计划完成相对指标为1+%/1+3%0 (7.某车间7名⼯⼈的⽇产量(件)为22 23 24 24 24 25 26,则⽇产量的众数是24。
(8.三个连续作业车间的废品率分别为% % %,则平均废品率为V0.5% 0.8% 0.3%。
(C 甲数列的变异程度⽐⼄数列⼩D.不能确定两个数列变异程度的⼤⼩9.当A B时,则说明A 数列平均数的代表性⽐B 数列强。
(10. 全距容易受极端值的影响。
(11. 某企业⼈均增加值是⼀个强度相对指标。
12. 某企业⽉末库存额是⼀个时点指标。
13. 平均指标反映现象的离散程度。
(14. 变异指标反映现象的集中趋势。
( 15.总体中的⼀部分数值与另⼀部分数值之⽐得到⽐例相对指标。
( 16.报告期⽔平与基期⽔平之⽐得到⽐较相对指标。
统计学第三章

第三章统计整理一、单项选择题1、统计整理阶段最关键的问题是:A统计分组和统计汇总B统计指标和统计分析C统计分组和统计指标D统计分组和统计分析2、在统计整理工作阶段的统计整理:A主要对原始资料整理B只对原始资料整理C主要对次级资料整理D只对次级资料整理3、将统计总体按某一标志分组的结果表现为:A组内同质性,组间差异性B组内差异性,组间差异性C组内差异性,组间同质性D组内同质性,组间同质性4、统计分组的关键在于:A确定分组标志B确定组数C确定组距D确定分组组限5、按组距分组而编制的变量数列称为:A分配数列B组距数列C分组数列D分布数列6、划分连续型变量的组限时,相邻组的组限必须:A相等B不等C重叠D间断7、次数分配数列是指:A各组组别依次排成的数列B各组次数依次排成的数列C各组组别与次数(或频率)依次排列而成的数列D各组频率依次排成的数列8、在次数分布中,比率是指:A各组分布次数频率之比B各组分布次数与总次数之比C各组分布次数相互之比D各组的频率相互之比9、各组变量值在决定总体数量大小中所起的作用:A与次数或比率大小无关B与次数或比率大小有关C与次数大小有关,与比率大小无关D与次数大小无关,与比率大小有关10、商业企业按经济类型分组和商业企业按职工人数分组,这两个统计分组是:A按数量标志分组B前者按数量标志分组,后者按品质标志分组C按品质标志分组D前者按品质标志分组,后者按数量标志分组11、下面属于变量分配数列的资料有:A大学生按专业分配B电站按发电能力分配C商业企业按类型分配D企业按国民经济部门分配12、对同一总体选择两个或两个以上的标志进行简单分组是:A简单分组B平行分组体系C复合分组D复合分组体系13、变量数列中各组频率的总和应该:A小于1B等于1C大于1D不等于114、在等距数列中,组距的大小与组数多少成:A正比B等比C反比D不成比例15、要准确地反映异距数列的实际分布情况,必须采用:A次数B次数密度C频率D累计频率16、说明统计表名称的语句,在统计表中称为:A横行标题B主词C纵栏标题D总标题17、统计表中的横行标题是表示各组的名称,一般写在统计表的:A上方B下方C左方D右方18、统计表的主词是指:A各种指标所描述的研究对象B描述研究对象的指标C宾词的具体表现D总体单位标志的总称19、区分简单分组和复合分组的依据是:A分组对象的复杂程度B采用分组标志的多少不同C分组的数目多少不同D研究的总体变化如何20、把统计表区分为简单表和分组表的标志是:A分组标志的选定B分组的数目多少C看主词是否分组D总体是否相同21、统计表区分为调查表、汇总表(或整理表)和分析表,其划分依据是:A统计表的性质B统计表的作用C统计数列的性质D统计分组的情况22、反映事物属性、性质的标志分组称为:A数量标志分组B品质标志分组C主要标志分组D辅助标志分组23、统计资料整理的内容不包括:A对原始资料进行审核与检查B对原始指标进行综合汇总C将汇总的结果编制成统计表与分析表D对统计资料进行分析研究24、将某企业职工人数按年龄分为5组,这种分组属于:A简单分组B复合分组C平行分组D再分组25、分配数列中的次数是指:A用以分组的标志B分组的组数C分布在各组的单位数D分组的次数26、品质数列和变量数列的区别在于:A数列的质量B数列的组数C各组次数分布性质D分组标志的性质27、在全距一定的情况下,组距大小与组数多少:A成反比B成正比C无比例关系D有时成正比,有时成反比28、组距数列中的上限一般是指:A本组变量的最大值B本组变量的最小值C总体内变量的最大值D总体内变量的最小值29、有各组上限和下限进行平均,其结果是:A组距B组数C组限D组中值30、某大学学生分别按年龄和年级分组,形成的是:A平行分组体系B复合分组体系C平行与复合二者兼而有之D不成体系二、填空题1、______是统计工作的第三阶段,既是______的继续,又是______的前提。
统计学原理第三章(统计资料整理)习题答案

第三章统计资料整理一.填空题部分(将正确答案的序号填在括号内,共12小题,每小题2分,共24分)1:统计整理实现了个别单位的()向说明总体数量特征的()过渡。
答案:标志值指标值2:分析分组的分组标志称为(),与其对应的标志称为()。
答案:原因标志结果标志3:统计分组按分组标志的多少不同,可分为()和()两种。
答案:品质分组变量分组4:社会劳动力资源按学历程度不同分组,属于(),按劳动生产率水平分组属于()。
答案:品质分组变量分组5:统计分组按分组标志的多少不同,可分为()和()两种。
答案:简单分组复合分组6:离散变量分组中,变量值变动幅度比较小时,应采取(),如变量值变动很大,项数很多时则采取()。
答案:单项式分组组距式分组7:统计分布主要包括()和()两个要素。
答案:统计分组各组单位数8:根据分组标志的不同,分配数列可分为()和()。
答案:品质分配数列变量数列9:变量数列中各组标志值出现的次数称(),各组单位数占单位总数的比重称()。
答案:頻数頻率10:累计()和累计()可以更简便地概括总体各单位的分布特征。
答案:頻数頻率11:任何一个统计分布都必须满足()和()两个条件。
答案:各组頻率大于零各组頻率之和等于1(或100%)12:统计表中宾词配置可有()和()两种。
答案:平行配置层叠配置二.单项选择题部分(将正确答案的序号填在括号内,共10小题,每小题2分,共40分)1:统计整理的关键在( B )。
A、对调查资料进行审核B、对调查资料进行统计分组C、对调查资料进行汇总D、编制统计表2:在组距分组时,对于连续型变量,相邻两组的组限( A )。
A、必须是重叠的B、必须是间断的C、可以是重叠的,也可以是间断的D、必须取整数3:下列分组中属于按品质标志分组的是( B )。
A、学生按考试分数分组B、产品按品种分组C、企业按计划完成程度分组D、家庭按年收入分组4:有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B )。
统计学第三章选择题

第三章选择题1。
落在某一特定类别或组中的数据个数称为(A)。
A.频数B。
频率C。
频数分布表D。
累计频率2.一个样本或总体中各个部分的数据与全部数据之比称为(C ).A.频数B。
频率C。
比例 D.比率3。
样本或总体中各不同类别数值之间的比值称为( D ).A。
频数 B.频率C.比例D。
比率4.将比例乘以100得到的数值称为(B)。
A.频数B。
百分数C。
比例D。
比率5.下面的哪一个图形最适合于描述结构性问题(B )。
A.条形图B。
饼图C雷达图D直方图6.下面的哪一个图形适合于比较研究两个或多个样本或总体的结构性问题( A).A。
环形图 B.饼图C.直方图 D.茎叶图7.将全部变量值依次划分为若干个区间,并将这一区间的变量作为一组,这样的分组方法称为( B )。
A。
单变量值分组B。
组距分组C.等距分组D.连续分组8。
组中值是( B )。
A。
一个组的上限与下限之差B。
一个组的上限与下限之间的中点值C。
一个组的最小值D.一个组的最大值9.下面的图形中最适合于描述一组数据分布的图形是(C).A.条形图B。
箱线图C。
直方图 D.饼图10.对于大批量的数据,最适合于描述其分布的图形是(C )。
A.条形图 B.箱线图C。
直方图D。
饼图11.对于小批量的数据,最合适于描述其分布的图形是( B ).A.条形图B。
箱线图C.直方图 D.饼图12.对于时间序列数据,用于描述其变化趋势的图形通常是(D)。
A.条形图B。
直方图C.箱线图 D.线图13.为描述身高与体重之间是否有某种关系,适合采用的图形是( C ).A。
条形图 B.对比条形图C。
散点图D。
箱线图14。
气泡图主要用于描述(B)。
A。
两个变量之间的相关关系B。
三个变量之间的相关关系C.两个变量的对比关系D。
三个变量的对比关系15.为了研究多个不同变量在不同变量在不同样本间的相似性,适合采用的图形是( C)。
A。
环形图 B.茎叶图 C.雷达图D.箱线图16.10家公司的于销售额数据(万元)分别:72,63,54,54,29,26,25,23,23,20.下列哪些图形不宜用于描述这些数据(B )。
统计学第三章,统计分组

第三章:统计分组一、单项选择题1。
在组距分组时,对于连续型变量,相邻两组的组限( A )。
A.必须是重叠的B.必须是间断的C。
可以是重叠的,也可以是间断的 D.必须取整数2。
有一个学生考试成绩为70分,在统计分组中,这个变量值应归入( B ).A.60-——70分这一组B。
70-——80分这一组C。
60-70或70—80两组都可以D。
作为上限的那一组3.某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的分组属于(B )。
A。
简单分组 B.复合分组 C.分析分组 D.结构分组4。
划分连续变量的组限时,相邻组的组限必须(A ).A。
重叠B。
相近 C.不等D。
间断5。
在等距数列中,组距的大小与组数的多少成( C ).A.正比B.等比C。
反比D。
不成比例6.有12名工人分别看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、4,按以上资料编制变量数列,应采用(A ).A。
单项式分组B。
等距分组C。
不等距分组D。
以上几种分组均可7.分配数列有两个组成要素,它们是( C )。
A. 一个是单位数,另一个是指标数B. 一个是指标数,另一个是分配次数C。
一个是分组,另一个是次数 D.一个是总体总量,另一个是标志总量8.对职工的生活水平状况进行分组研究,正确地选择分组标志应当用(C )A. 职工月工资总额的多少B。
职工人均月收入额的多少C。
职工家庭成员平均月收入额的多少D。
职工的人均月岗位津贴及奖金的多少9。
下面那一条不是统计分组的作用(D )A。
划分类型B。
反映总体内部结构C。
研究现象间的依存关系 D.反映现象的变动趋势12。
统计分组的关键在于( A )。
A.正确选择分组标志B。
正确确定组限与组数C。
正确划分分组界限D。
正确选择分组数列的类型13。
分组标志一经选定( B )。
A。
就掩盖了总体在此标志下的性质差异B。
就突出了总体在此标志下的性质差异C。
就突出了总体在其他标志下的性质差异 D. 就使总体内部的差异消失了14。
统计学第三章习题答案
7:30
4
8:00
4
8:30
7
9:00
2
总计
20
(2)
第三章
7
第三章
7、 (1)、
(2)
8
第三章
8、 (1)
(2)
(3)
9
第三章
9、 (1)
接收 29 39 49 59 69 79 89
合计
(2)
频率% 10 16 12 16 20 12 4 100
累积 % 10.00 26.00 38.00 64.00 84.00 96.00 100.00 -
多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的
高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
其次,由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开
排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
Stem width: 10.00
Each leaf:
1 case(s)
5、
(1) VAR00003 Stem-and-Leaf Plot
Frequency Stem & Leaf
1.00 2.00 1.00 2.00 2.00
11 . 6 12 . 02 12 . 8 13 . 04 13 . 56
Frequency Stem & Leaf
2.00 6.00 8.00 11.00 9.00 7.00 4.00 2.00 1.00
6. 7. 8. 9. 10 . 11 . 12 . 13 . 14 .
89 233566 01123456 12224556788 002466678 2355899 4678 24 1
《统计学》-第三章-统计整理
第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。
在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。
2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。
3、统计分组实质上是在统计总体内部进行的一种定性分类。
4、对原始资料审核的重点是真实性。
5、区分现象质的差别是统计分组的根本作用。
6、标志是统计分组的依据,是划分组别的标准。
7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组。
8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组。
9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。
10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。
11、按品质标志分组的结果,形成品质分布数列。
12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值。
13、组距变量数列的组距大小与组数的多少成反比。
与全距的大小成正比。
14、组距变量数列的分布可以用次数分布曲线图表示。
15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。
16、统计资料的整理方法主要有统计分组和统计汇总两种。
17、钟形分布、U形分布和J形分布是次数分布的三种主要类型。
18、统计分组体系有品质标志分组和数量标志分组两种。
19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。
20、统计表从内容结构上看,是由主词和宾词两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)1、统计分组的结果表现为( A )A. 组内同质性,组间差异性B. 组内差异性,组间同质性C. 组内同质性,组间同质性D. 组内差异性,组间差异性2、统计分组的依据是( A )A、标志B、指标C、标志值D、变量值3、下面属于按品质标志分组的有( C )A. 企业按职工人数分组B. 企业按工业总产值分组C. 企业按经济类型分组D. 企业按资金占用额分组4、统计分组的关键在于( A )A、正确选择分组标志B、正确划分各组界限C、正确确定组数和组限D、正确选择分布数列种类5、下面属于按数量标志分组的有( B )A. 工人按政治面貌分组B. 工人按年龄分组C. 工人按工种分组D. 工人按民族分组6、在全距一定的情况下,组距的大小与组数的多少成(B)A、正比B、反比C、无比例关系D、有时成正比有时成反比7、某地区商业企业按所有制形式分组,然后在各种所有制形式中再按销售额多少分组,这样的分组属于( C )A. 按数量标志分组B. 简单分组C. 复合分组D. 平行分组体系8、次数分配中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种次数分布的类型是( B )A. 钟形分布B. U形分布C. J形分布D. 洛伦茨分布9、变量数列中的各组频率(以百分比表示)的总和应该( D )A. 大于100%B. 小于100%C. 不等于100%D.等于100%10、等距分组适合于( B )A、一切变量B、变量变动比较均匀的情况C、呈急剧升降变动的变量D、按一定比率变动的变量11、单项数列中,某组的向上累计次数是80,这表示总体中( C )A. 低于该组标志值的单位有80个B. 等于该组标志值的单位有80个C. 等于和低于该组标志值的单位有80个D. 高于该组标志值的单位有80个12、确定连续型变量的组限时,相邻的组限要求( B)A、不重叠B、重叠C、不等D、重叠或不重叠13、在编制等距数列时,如果全距等于56,组数为6。
统计学习题第三章
第三章统计数据整理一、单项选择题1、统计分组的关键在于()。
A、正确选择不同特征的品质标志和数量标志B、确定组距C、选择统计指标和统计指标体系D、选择分组标志和划分各组界限2、按某一标志分组的结果()A、组内差异性,组间同质性B、组内同质性,组间同质性C、组内同质性,组间差异性D、组内差异性,组间差异性3、统计分组的主要问题是()A、划分各组组限B、确定组数C、选择分组标志D、确定分组形式4、划分连续变量的组限时,相邻的组限必须()A、重叠B、相近C、不等D、间断5、统计分组对总体而言()A、将总体区分为性质相同的若干部分B、将总体区分为性质相异的若干部分C、将总体单位区分为性质相同的若干部分D、将总体单位区分为性质相异的若干部分6、次数分布中的次数是指()A、划分各组数量标志B、分组的组数C、分布在各组的总体单位数D、标志变异个数7、在全距一定的情况下,组距的大小与组数的多少()A、成正比B、成反比C、有时成正比,有时成反比D、没有比例关系8、某连续变量数列,其末组为开口组,下限为500,又知其相邻组的组中值为480,则末组的组中值为()。
A、 520B、510C、500D、4909、组距、组限、组中值之间关系是()。
A、组中值=(上限+下限)÷2B、组距=(上限-下限)÷2C、组中值=(上限+下限)×2D、组限=组中值÷210、将统计表分为总标题、横行标题、纵栏标题和指标数值四部分是()。
A、从构成形式上看B、从内容上看C、从作用上看D、从性质上看11、指出下列哪种分组是按品质标志分组()A、企业按职工人数多少分组B、企业按经济类型分组C、企业按资金拥有量分组D、企业按设备拥有量分组12、采用不等距分组编制变量数列是因为()A、现象是均匀变动的B、现象变动是不均匀的C、在标志值中没有极端值D、在标志值中有极端值13、按连续变量分组,第一组45~55,第二组55~65,第三组65~75,第四组75以上。
统计学第三章课后题及答案解析
统计学第三章课后题及答案解析第三章一、单项选择题1.统计整理的中心工作是()A.对原始资料进行审核 B.编制统计表C.统计汇总问题 D.汇总资料的再审核2.统计汇总要求资料具有()A.及时性 B.正确性C.全面性 D.系统性3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定()A.50在第一组,70在第四组 B.60在第二组,80在第五组C.70在第四组,80在第五组 D.80在第四组,50在第二组4.若数量标志的取值有限,且是为数不多的等差数值,宜编制()A.等距式分布数列 B.单项式分布数列C.开口式数列 D.异距式数列5.组距式分布数列多适用于()A.随机变量 B.确定型变量C.连续型变量 D.离散型变量6.向上累计次数表示截止到某一组为止()A.上限以下的累计次数 B.下限以上的累计次数C.各组分布的次数 D.各组分布的频率7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于()A.正态分布曲线 B.J型分布曲线C.右偏分布曲线 D.左偏分布曲线8.划分连续变量的组限时,相临组的组限一般要()A.交叉 B.不等C.重叠 D.间断二、多项选择题1.统计整理的基本内容主要包括()A.统计分组 B.逻辑检查C.数据录入 D.统计汇总E.制表打印2.影响组距数列分布的要素有()A.组类 B.组限C.组距 D.组中值E.组数据3.常见的频率分布类型主要有()A.钟型分布 B.χ型分布C.U型分布 D.J型分布E.F型分布4.根据分组标志不同,分组数列可以分为()A.组距数列 B.品质数列C.单项数列 D.变量数列E.开口数列5.下列变量一般是钟型分布的有()A.粮食平均产量的分布 B.零件公差的分布C.大学生身高的分布 D.商品市场价格的分布E.学生成绩的分布6.下列变量呈J型分布的有()A.投资额按利润率的分布B.60岁以上人口按年龄分组的分布C.经济学中的供给曲线 D.不同年龄人口的死亡率分布E.经济学中的需求曲线三、填空题1.分布在各组的_______叫次数(频数)。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
中位数
(median)
1. 排序后处于中间位置上的值
50%
Me
2. 不受极端值的影响
50%
3. 主要用于顺序数据,也可用数值型数据,但不能 用于分类数据
4. 各变量值与中位数的离差绝对值之和最小,即
n
xi M e min
i 1
三、数值型数据:平均数
平均数
(mean)
1. 也称为均值
2. 集中趋势的最常用测度值
22200 185 120
众数、中位数和平均数的比较
众数、中位数和平均数的关系
均值 中位数 众数 均值 = 中位数 = 众数
众数 中位数 均值
左偏分布
对称分布
右偏分布
众数、中位数、平均数的特点和应用
1. 众数 不受极端值影响 具有不惟一性 数据分布偏斜程度较大且有明显峰值时应用
2. 中位数 不受极端值影响 数据分布偏斜程度较大时应用
3. 平均数 易受极端值影响 数学性质优良 数据对称分布或接近对称分布时应用
第二节 离散程度测度指标
一、 分类数据:异众比率 二、 顺序数据:四分位差 三、 数值型数据:方差和标准差 四、 相对离散程度:离散系数
离中趋势
1. 数据分布的另一个重要特征 2. 反映各变量值远离其中心值的程度(离散程度) 3. 从另一个侧面说明了集中趋势测度值的代表程度 4. 不同类型的数据有不同的离散程度测度值
8.1
220
12.5
390
18.0
430
22.0
480
26.5
650
40.0
950
64.0
1000
69.0
离散系数
(例题分析)
x1 536.25(万元)
s1 309.19(万元)
v1=
309.19 536.25
=0.577
x2 32.5215(万元)
s2 23.09(万元)
v2=
23.09 32.5215
第一节 集中趋势测度指标
一、 分类数据:众数 二、 顺序数据:中位数和分位数 三、 数值型数据:平均数 四、 众数、中位数和平均数的比较
集中趋势
(central tendency)
1. 测度集中趋势就是寻找数据水平的代表值或中心值 2. 不同类型的数据用不同的集中趋势测度值 3. 低层次数据的测度值适用于高层次的测量数据,但高
第 3 章 数据的概括性度量
第一节 集中趋势测度指标 第二节 离散程度测度指标
用Excel计算描述统计量
原始 加工 统计 数据 整理 指标
静态 分布
总量指标(绝对规模) 相对指标(相对关系) 平均指标(集中趋势) 变异指标(离散趋势)
动态 趋势
水平指标(绝对规模) 速度指标(相对变化) 因素分析(趋势预测)
3. 一组数据的均衡点所在
x
3. 体现了数据的必然性特征
4. 易受极端值的影响
5. 有简单平均数和加权平均数之分
6. 根据总体数据计算的,称为平均数,记为;根据 样本数据计算的,称为样本平均数,记为x
加权平均数
(Weighted mean)
设各组的组中值为:M1 ,M2 ,… ,Mk 相应的频数为: f1 , f2 ,… ,fk
差),记为2();根据样本数据计算的, 称为样本方差(标准差),记为s2(s)
样本方差和标准差
(sample variance and standard deviation)
方差的计算公式
未分组数据
n
(xi x)2
s 2 i1 n 1
组距分组数据
注意:
样本方差用自 由度n-1去除!
k
(Mi x)2 fi
合计
组中值(Mi) 145 155 165 175 185 195 205 215 225 235
—
频数(fi) 4 9
16 27 20 17 10
8 4 5
120
Mi fi 580 1395 2640 4725 3700 3315 2050 1720 900 1175
22200
k
Mi fi
x i1 n
样本加权平均
k
x
M1 f1 M 2 f2
Mk fk
Mi fi
i 1
f1 f2 fk
n
总体加权平均
k
M1 f1 M 2 f2
Mk fk
Mi fi
i 1
f1 f2 fk
N
加权平均数
(例题分析)
某电脑公司销售量数据分组表
按销售量分组
140~150 150~160 160~170 170~180 180~190 190~200 200~210 210~220 220~230 230~240
s 2 i1 n 1
标准差的计算公式
未分组数据
n
(xi x)2
s i1 n 1
组距分组数据
k
(Mi x)2 fi
s i1 n 1
相对离散程度:离散系数
离散系数
(coefficient of variation)
1. 标准差与其相应的均值之比
2. 对数据相对离散程度的测度
3. 消除了数据水平高低和计量单位的影响
4. 用于对不同组别数据离散程度的比较
5. 计算公式为
vs
s x
离散系数
(例题分析)
【 例 】某管理局抽查了所属的8家企业,其产品销售数 据如表。试比较产品销售额与销售利润的离散程度
企业编号
1 2 3 4 5 6 7 8
某管理局所属8家企业的产品销售数据
产品销售额(万元)
销售利润(万元)
x1
x2
170
数值型数据:方差和标准差
极差
(range)
1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度值 3. 易受极端值影响 4. 未考虑数据的分布
5. 计算公式为
R = max(xi) - min(xi)
方差和标准差
(variance and standard deviation)
1. 数据离散程度的最常用测度值 2. 反映了各变量值与均值的平均差异 3. 根据总体数据计算的,称为总 计算结果表明,v1<v2,说明产品销售额 的离散程度小于销售利润的离散程度
偏态
(skewness)
1. 统计学家Pearson于1895年首次提出 2. 数据分布偏斜程度的测度 2. 偏态系数=0为对称分布 3. 偏态系数> 0为右偏分布 4. 偏态系数< 0为左偏分布 5. 偏态系数大于1或小于-1,被称为高度
层次数据的测度值并不适用于低层次的测量数据 4. 一组数据向其中心值靠拢的倾向和程度
一、分类数据:众数
众数
(mode)
1. 一组数据中出现次数最多的变量值 2. 适合于数据量较多时使用 3. 不受极端值的影响 4. 一组数据可能没有众数或有几个众数 5. 主要用于分类数据,也可用于顺序数据和
数值型数据