10第十章 数据的统计描述和分析
第十章 数据的收集、整理与描述巩固基础

学生姓名性别年级学科授课教师上课时间年月日第()次课课时:课时教学课题第十章数据的收集、整理与描述教学目标1.了解总体、样本、个体等基本概念,;2.知道调查的几种方式及其特点;3.理解频数、频率以及扇形统计图的特点;4.理解数据收集的一般步骤;5.会画频数分布表和频数分布直方图,理解其意义和作用.教学重点与难点重点:1.了解几种统计图侧重表达的信息,学会选择合适的统计图表并会绘制统计图表,能准确而迅速地反映出要表达的信息;2.了解频数分布的意义和作用,会列频数分布表、会画频数分布直方图和频数折线图,并能解决简单的实际问题.难点:根据统计的结果做出合理的判断和预测,体会统计对决策的作用,能清晰地表达自己的观点,并进行交流.教学过程第十章数据的收集、整理与描述一、知识网络二、知识要点梳理知识点一总体、样本的概念1总体要考察的全体对象称为总体.2个体组成总体的每一个考察对象称为个体.3样本被抽取的那些个体组成一个样本.4样本容量样本中个体的数目叫样本容量不带单位.注意为了使样本能较好地反映总体的情况除了要有合适的样本容量外抽取时还要尽量使每一个个体都有同等的机会被抽到.知识点二全面调查与抽样调查调查的方式有两种全面调查和抽样调查1全面调查考察全面对象的调查叫全面调查. 全面调查也称作普查调查的方法有问卷调查、访问调查、电话调查等.全面调查的步骤1收集数据2整理数据划记法3描述数据条形图或扇形图等.2抽样调查若调查时因考察对象牵扯面较广调查范围大不宜采用全面调查因此采用抽样调查. 抽样调查只抽取一部分对象进行调查然后根据调查数据推断全体对象的情况.抽样调查的意义1减少统计的工作量2抽样调查是实际工作中应用非常广泛的一种调查方式它是总体中抽取样本进行调查根据样本来估计总体的一种调查.3判断全面调查和抽样调查的方法在于①全面调查是对考察对象的全面调查它要求对考察范围内所有个体进行一个不漏的逐个准确统计而抽样调查则是对总体中的部分个体进行调查以样本来估计总体的情况. ②注意区分“总体”和“部分”在表述上的差异. 在调查实际生活中的相关问题时要灵活处理既要考虑问题本身的需要又要考虑实现的可能性和所付出代价的大小. 知识点三扇形统计图和条形统计图及其特点1生活中我们会遇到许多关于数据的统计的表示方法它们多是利用圆和扇形来表示整体和部分的关系即用圆代表总体圆中的各个扇形分别代表总体中的不同部分扇形的大小反映部分占总体的百分比的大小这样的统计图叫做扇形统计图.1扇形统计图的特点①用扇形面积表示部分占总体的百分比②易于显示每组数据相对于总体的百分比③扇形统计图的各部分占总体的百分比之和为100或1. 在检查一张扇形统计图是否合格时只要用各部分分量占总量的百分比之和是否为100进行检查即可.2扇形统计图的画法把一个圆的面积看成是1以圆心为顶点的周角是360°则圆心角是36°的扇形占整个面积的即10. 同理圆心角是72°的扇形占整个圆面积的即20. 因此画扇形统计图的关键是算出圆心角的大小.扇形的面积与圆心角的关系扇形的面积越大圆心角的度数越大扇形的面积越小圆心角的度数越小. 扇形所对圆心角的度数与百分比的关系是圆心角的度数百分比×360°.3扇形统计图的优缺点扇形统计图的优点是易于显示每组数据相对于总数的大小缺点是在不知道总体数量的条件下无法知道每组数据的具体数量.2用一个单位长度表示一定的数量关系根据数量的多少画成长短不同的条形条形的宽度必须保持一致然后把这些条形排列起来这样的统计图叫做条形统计图.1条形统计图的特点①能够显示每组中的具体数据②易于比较数据之间的差别.2条形统计图的优缺点条形统计图的优点是能够显示每组中的具体数据易于比较数据之间的差别缺点是无法显示每组数据占总体的百分比.注意1条形统计图的纵轴一般从0开始但为了突出数据之间的差别也可以不从0开始这样既节省篇幅又能形成鲜明对比2条形图分纵置个横置两种. 知识点四频数、频率和频数分布表1一般我们称落在不同小组中的数据个数为该组的频数频数与数据总数的比为频率. 频率反映了各组频数的大小在总数中所占的分量.公式 .由以上公式还可得出两个变形公式1频数频率×数据总数.2 .注意1所有频数之和一定等于总数2所有频率之和一定等于1.2数据的频数分布表反映了一组数据中的每个数据出现的频数从而反映了在一组数据中各数据的分布情况.要全面地掌握一组数据必须分析这组数据中各个数据的分布情况.知识点五频数分布直方图与频数折线图1在描述和整理数据时往往可以把数据按照数据的范围进行分组整理数据后可以得到频数分布表在平面直角坐标系中用横轴表示数据范围纵轴表示各小组的频数以各组的频数为高画出与这一组对应的矩形得到频数分布直方图.2条形图和直方图的异同直方图是特殊的条形图条形图和直方图都易于比较各数据之间的差别能够显示每组中的具体数据和频率分布情况.直方图与条形图不同条形图是用长方形的高纵置时表示各类别或组别频数的多少其宽度是固定的直方图是用面积表示各组频数的多少等距分组时可以用长方形的高表示频数长方形的宽表示各组的组距各长方形的高和宽都有意义. 此外由于分组数据都有连续性直方图的各长方形通常是连续排列中间没有空隙而条形图是分开排列长方形之间有空隙.3频数折线图的制作一般都是在频数分布直方图的基础上得到的具体步骤是首先取直方图中每一个长方形上边的中点然后再在横轴上取两个频数为0的点直方图最左及最右两边各取一个它们分别与直方图左右相距半个组距最后再将这些点用线段依次连接起来就得到了频数折线图.4频数分布直方图的画法1找到这一组数据的最大值和最小值2求出最大值与最小值的差3确定组距分组4列出频数分布表5由频数分布表画出频数分布直方图.5画频数分布直方图的注意事项1分组时不能出现数据中同一数据在两个组中的情况为了避免通常分组时比题中要求数据单位多一位. 例如题中数据要求到整数位分组时要求数据到0.5即可.2组距和组数的确定没有固定的标准要凭借数据越多分成的组数也就越多当数据在100以内时根据数据的多少通常分成512组. 四、规律方法指导【总结】。
第10讲 数据的统计分析与描述PPT课件

服 从 自 由 度 为 n 的 2分 布 , 记 为 Y ~ 2 n.
Y 的 均 值 为 n , 方 差 为 2 n .
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
13.11.2020
8
3、 t分 布 t( n)
3 、 作 频 率 直 方 图 : 在 直 角 坐 标 系 的 横 轴 上 , 标 出 x 1 ',x 2 ', ,x n ' 各 点 , 分 别 以
( x i ',x i ' 1 ]为 底 边 , 作 高 为 f x ii ' 的 矩 形 , x i ' x i ' 1 x i ',i 1 ,2 , ,n 1 ,即 得
数学建模与数学实验
数据的统计描述和分析
13.11.2020
1
实验目的
1、直观了解统计基本内容。 2、掌握用数学软件包求解统计问题。
实验内容
1、统计的基本理论。 2、用数学软件包求解统计问题。 3、实验作业。
数 据 的 统 计 描 述 和 分 析
13.11.2020
统计的基本概念 参数估计 假设检验
13.11.2020
4
3. 表示分布形状的统计量—偏度和峰度
偏度:g1
1 s3
n
(Xi
i1
X)3
峰度:g2
1 s4
n
(Xi
i1
X)4
偏度反映分布的对称性,g1 >0称为右偏态,此时数据位于均值 右边的比位于左边的多;g1 <0称为左偏态,情况相反;而g1接近0 则可认为分布是对称的.
第十章《数据的收集、整理与描述》教材分析

七年级数学(人教版)第十章《数据的收集、整理与描述》教材分析西葛中学董介文一、教材的地位:在当今的信息社会里,我们需要用数据解决问题。
统计概率所提供的“运用数据进行推断”的思考方法已成为现代社会一种普遍使用并且强有力的思维方式。
数据的收集、整理与描述与我们的生活息息相关。
例如:日本的福田地震、海啸和核泄漏问题已成为全世界人民关注的焦点,每天都需要收集大量的统计数据,并对这些数据进行精细的分析,并得出结论,从而采取有效措施;全国的人口普查;一个家庭的收入与支出;分析中考学生的数学成绩;统计学生的视力情况、身高、体重等等,都需要收集数据、整理数据、描述数据、得出结论。
这一章的知识充分体现了数学来源于生活,并服务于生活,更注重了数学的时效性。
在人教版的数学课程中,已加强统计概率的份量,已将“统计与概率”列为知识领域之一,成为与“数与代数”“图形与几何”并重的内容,这使得义务教育阶段的数学课程结构更加合理,使学生解决问题的能力得到更全面的培养。
在近几年的中考120分中,与数据的收集、整理与描述相关的这些统计知识和概率知识所占的比重有所加大,占9分左右。
“统计与概率”领域主要学习收集、整理、描述和分析数据等处理数据的基本方法和概率的初步知识,这些内容在三个年级均有安排,教学要求随着年级的升高和学生水平的增长逐渐提高。
本套教材安排了三章。
这三章内容采用统计部分和概率部分分开编排的方式,前两章是统计,最后一章是概率。
统计部分的两章内容按照数据处理基本过程的不同侧重点来安排,分别是7年级下册的第10章“数据的收集、整理与描述”,8年级下册的第20章“数据的分析”;概率部分为9年级上册的第25章“概率初步”。
二、教材安排:第十章是统计部分的第一章,内容包括:1.利用全面调查与抽样调查(以抽样调查为重点)收集和整理数据;2.利用统计图表(以直方图为重点)描述数据;3.展现收集、整理、描述和分析数据得出结论的统计调查的基本过程。
10 第十章 统计表与统计图

三、编制统计表的基本要求 1.统计表必须重点突出,简单明了,即一 张表只包括一个中心内容,表达一个主题。 2.统计表要主谓分明,层次清楚,即主谓 语的位臵准确,标目的安排及分组要层次 清楚,符合逻辑,便于分析比较,这是一 个统计表质量优劣的关键所在。 3.数据准确、可靠,是统计工作的根本, 自然也是统计表编制时必须遵循的原则, 这里就不赘述了。
二、常用统计图的绘制方法及要求 在医学中常用的统计图有直条图、百分条 图、圆图、线图、半对数线图、直方图、散点 图和箱式图与统计地图等。绘制统计图总要求 首先是根据资料的性质和分析的目的选择适当 的图形。 一)、直条图 直条图(bar chart),用等宽的直条的 长短来表示各独立指标数值大小和它们之间的 对比关系。主要适用于无连续关系,各自独立 指标。指标既可以是绝对数,也可以是相对数, 常用的条图有三种:单式条图、复式条图和分 段条图。
一、统计表的结构 (l)从外形上看,统计表由标题、标目(包括 横标目、纵标目)、线条、数字及必要的文字说明 和备注5部分构成。其基本格式如表12-l: 表10-1 统计表基本结构 标号 标题
横标目的总标目 横标目的 合计 纵标目 数据资料 合计
标题:它是统计表的总名称,不可缺少。标题 文字应该简明扼要,清晰确切地反映出统计表 的中心内容。 标目:对标目的要求是文字简明,有单位的标 目要注明单位。根据位臵与作用,标目又可分 成横标目、纵标目和总标目。横标目位于表的 左侧,向右说明各横行数字的意义,如表10- 2中的各年龄组;纵标目位于表头右侧,向下 说明各纵栏数字的涵义,如表10-2中的“死 亡率(%)”、“死亡百分比”。总标目是对 横标目和纵标目内容的概括, 横标目的总标 目位于表的左上角,如表12-2的“年龄组 (岁)”,纵标目的总标目在需要才设臵。
人教版七年级数学下第十章-数据的收集与整理归类总结

第十章数据的收集与整理【知识梳理】一、调查与收集数据想知道“喜欢哪种动物的同学最多”,要通过调查来收据数据.其过程主要有如下步骤:1、明确调查问题——喜欢哪种动物的同学最多;2、明确调查对象——全班每个同学;3、选择调查方法——采用问卷调查;4、展开调查——每位同学将自己最喜欢的动物写在调查问卷上,收集每位同学最喜欢的动物,进行编号;5、整理数据——用“划记法”记录数据;6、得出结论——划记最多的动物,即为同学们喜欢的最多的动物;7、描述数据——统计表是描述数据最常用的方式,为了更直观地获取信息,还可以用条形统计图和扇形统计图来描述数据.二、调查方式的有关概念统计调查是收集数据常用的方法,一般有全面调查和抽样调查两种方式.实际上最常用的调查方式是抽样调查.1、全面调查:在“喜欢哪种动物的同学最多”调查活动中,全班同学都是考察对象。
像这样考察全体对象的调查属于全面调查,又称为“普查”.2、抽样调查:在“调查中小学生的视力情况”调查活动中,采用了调查部分学生的方式来收集数据,根据部分学生的视力来估计整个地区学生的视力情况.这种调查称为抽样调查.这里,整个地区的中小学生的视力情况是要考察的全体对象,称为总体;所有实际被调查的小学生、初中生和高中生的视力组成一个样本.注意:(1)抽样调查只考虑总体中的一个样本,因此其优点是调查范围小,节省时间、人力、物力,但其调查结果往往不如全面调查得到的结果准确.(2)抽样调查时一般应注意:被调查的对象不能太少,被调查的对象应是随意抽取的,调查的对象应是真实的.因此,抽样调查时既要关注样本的广泛性又要关注其代表性.方法点拨:(1)全面调查是对总体中每个对象进行调查,调查范围广,数据详细;而调查样本有局限性,数据不全面;(2)当受客观条件限制,无法对所有对象进行全面调查时,往往采用抽样调查;(3)当调查具有破坏性时,不允许进行全面调查;4. ⑴总体:把所要考察对象的①叫总体.⑵个体:②考察对象叫做个体.⑶样本:从总体中所抽取的一部分③叫做总体的一个样本.⑷样本容量:样本中个体的④叫做样本容量.规律总结:①弄清考察对象是明确总体、个体、样本的关键;②总体或样本中的每一个数据表示个体,不同的个体在数值上是可以相同的,样本中有多少个体,样本容量就是多少,样本容量没有单位.三、统计图的选择——条形统计图、扇形统计图和折线统计图,它们各具特色:条形统计图能清晰地展现出每个项目的具体数目,扇形统计图能清晰地展现出各部分在总体中所占的百分比,折线统计图能清晰地展现出事物变化的情形。
第十章 数据的收集、整理与描述 复习练习题(二)

数据的收集、整理与描述1.下列调查中,调查方式选择正确的是()A.为了了解100个灯泡的使用寿命,选择全面调查;B.为了了解某公园全年的游客流量,选择全面调查;C.为了了解生产的50枚炮弹的杀伤半径,选择全面调查;D.为了了解一批袋装食品是否有防腐剂,选择全面调查.2.为了解某初中学校学生的视力情况,需要抽取部分学生进行调查,下列抽取学生的方最合适的是()A.随机抽取该校一个班级的学生B.随机抽取该校一个年级的学生C.随机抽取该校一部分男生D.分别从该校初一、初二、初三年级中各班随机抽取10%的学生3.某地区有8所高中和22所初中,要了解该地区中学生的视力情况,下列抽样方式获得的数据最能反映该地区中学生视力情况的是( )A.从该地区随机选取一所中学里的学生B.从该地区30所中学生里随机选取800名学生C.从该地区的一所高中和一所初中各选取一个年级的学生D.从该地区的22所初中里随机选取400名学生4.为了了解某市八年级学生的肺活量,从中抽样调查了500名学生的肺活量,这项调查中的样本是()A、某市八年级学生的肺活量B、从中抽取的500名学生的肺活量C、从中抽取的500名学生D、5005.为了解某市参加中考的32000名学生的体质情况,抽查了其中1600名学生的体重进行统计分析.下面叙述正确的是()A、32000名学生是总体B、1600名学生的体重是总体的一个样本C、每名学生是总体的一个个体D、以上调査是普查6.为了了解一批电视机的寿命,从中抽取100台电视机进行试验,这个问题的样本是()A.这批电视机;B.这批电视机的寿命;C.抽取的100台电视机的寿命;D.100.7.滨州市教育局为了了解实行课改后七年级学生在家的学习时间,应采用的最佳调查方式是()A.对所有学校进行全面调查B.抽取农村和城区部分学校进行调查C.只对一所学校进行调查D.只对城区学校进行调查8.为了了解某校七年级500名学生的身高情况,从中抽取了100名学生进行测量,这100名学生的身高是()A.总体的一个样本 B.个体C.总体 D.样本容量9.今年我市有9万名初中毕业生参加升学考试,为了了解9万名考生的数学成绩,从中抽取2000名考生数学成绩进行统计分析.在这个问题中总体是()A.9万名考生B.2000名考生C.9万名考生的数学成绩D.2000名考生的数学成绩10.期末统考中,甲校优秀人数占30%,乙校优秀人数占35%,则两校优生人数()A.甲校多于乙校B.乙校多于甲校C..甲、乙校—样多D.无法比较11.某校公布了该校反映各年级学生体育达标情况的两张统计图,该校七、八、九三个年级共有学生800人。
管理统计学10 第十章 方差分析

问:不同的方案是否对汽车销售量产生影响。
星蓝海学习网
10.1 方差分析的内容和思想
10.1.1 方差分析的内容
这是一个方差分析问题。即对四种方案下的电话交易频数的均值是否相等进 行检验。 由于汽车是同一厂家生产的,它们的质量、外形设计、价格、内装修等所有
可能影响销售量的因素全部相同,如果检验结果 1,2,3,4
2
(xij - x)
2
(xij x j )
2
(x j x)
即
SST = SSE+SSA
关键是如何确定各离差平方的自由度:
对总离差平方和(SST)来说,它是n个离差平方之和,共同拥有一个
平均数,也就失去了一个自由度,其自由度应为n—1。因为它只有一
个约束条件,即 SST
(xij - x) 0
星蓝海学习网
10.2 单因素方差分析
10.2.2 F分布与F值的计算
对水平离差平方和(SSA)来说,它是4组水平(即四种不同方案)离差平方
(x j - x)2之和,共同拥有一个平均数,也失去1个自由度,其自由度为4-1。
用r表示组数,则有 r = 4,4-1 = r-1。它也有一个约束条件,即要求:
为了将方差分析的主要过程表现的更清楚,通常把有关计算结果列成方差分 析表,如表10-3所示。
表10-3 方差分析表
星蓝海学习网
10.2 单因素方差分析
10.2.3 样本容量不等下方差分析
进行方差分析时,各个水平下的样本容量可以相同,也可以不同。 进行方差分析时,可以把方差分析的因素放在列的位置,也可以放在行的位 置,但通常放在列的位置。这样与计算机中数据库的结构相一致,便于计算 机处理。
新人教版七年级数学下册第十章数据的收集、整理与描述题测试题(含答案)

人教版七年级下期第10章《数据的收集、整理与描述》(有答案)人教版七年级下期第10章《数据的收集、整理与描述》(有答案)一.选择题(共6小题)1.以下问题,不适合用全面调查的是()A.了解全班同学每周体育锻炼的时间B.旅客上飞机前的安检C.学校招聘教师,对应聘人员面试D.了解全市中小学生每天的零花钱2.下列调查中,适合采用普查方式的是()A.调查市场上婴幼儿奶粉的质量情况B.调查黄浦江水质情况C.调查某个班级对青奥会吉祥物的知晓率D.调查《直播南京》栏目在南京市的收视率3.下列调查中,须用普查的是()A.了解某市学生的视力情况B.了解某市中学生课外阅读的情况C.了解某市百岁以上老人的健康情况D.了解某市老年人参加晨练的情况4.为了检查一批灯管的使用寿命,从中抽取了10只进行检测,以下说法正确的是()A.这一批灯管是总体B.10只灯管是总体的一个样本C.每只灯管是个体D.10只灯管的使用寿命是总体的一个样本5.为了了解某地区12 000名初中毕业生参加中考的数学成绩,从中抽取了500名考生的数学成绩进行统计分析,下列说法正确的是()A.个体是指每个考生B.12000名考生是个体C.500名考生的成绩是总体的一个样本D.样本是指500名考生6.今年我市有近4万名考生参加中考,为了解这些考生的数学成绩,从中抽取1000名考生的数学成绩进行统计分析,以下说法正确的是()A.这1000名考生是总体的一个样本B.近4万名考生是总体C.每位考生的数学成绩是个体D.1000名学生是样本容量二.填空题(共8小题)7.学校为七年级学生订做校服,校服型号有小号、中号、大号、特大号四种.随机抽取了100名学生调查他们的身高,得到身高频数分布表如下,已知该校七年级学生有800名,那么中号校服应订制套.145155x<x<155165x<165175175185x<8.已知一组数据是连续的整数,其中最大值是242,最小数据是198,若把这组数据分成9个小组,则组距是.9.某镇卫生部门2014年4月份对镇所辖学校的中小学生进行体质健康测试,随机抽取了200名学生的测试成绩作为样本,数据整理如下表,其中x的值为.D410.如图是某市20132016-年私人汽车拥有量和年增长率的统计图.该市私人汽车拥有量年净增量最多的是年,私人汽车拥有量年增长率最大的是年.11.图1表示某地区2003年12个月中每个月的平均气温,图2表示该地区某家庭这年12个月中每月的用电量.根据统计图,请你说出该家庭用电量与气温之间的关系(只要求写出一条信息即可):.12.我区有15所中学,其中九年级学生共有3000名.为了了解我区九年级学生的体重情况,请你运用所学的统计知识,将解决上述问题要经历的几个重要步骤进行排序.①收集数据;②设计调查问卷;③用样本估计总体;④整理数据;⑤分析数据.则正确的排序为.(填序号)13.为了解我市某学校“书香校园”的建设情况,检查组在该校随机抽取40名学生,调查了解他们一周阅读课外书籍的时间,并将调查结果绘制成如图的频数直方图(每小组的时间值包含最小值,不包含最大值),根据图中信息估计该校学生一周课外阅读时间不少于4小时的人数占全校人数的百分数约等于.14.对某班组织的一次考试成绩进行统计,已知80.5~90.5分这一组的频数是8,频率是0.2,那么该班级的人数是人.三.解答题(共6小题)15.2013年我国中东部地区先后遭遇多次大范围雾霾天气,其影响范围、持续时间、雾霾强度历史少见,给人们生产生活造成了严重影响.为此“雾霾天气的主要成因”就成为某校环保小组调查研究的课题,他们随机调查了部分市民,并对调查结果进行整理,绘制了如下尚不完整的统计图表.请根据图表中提供的信息解答下列问题;(1)填空:m=,n=,扇形统计图中表示E组的扇形圆心角等于度.(2)若该市人口约有800万人,请你估计其中持D组“观点”的市民人数;(3)治理雾霾天气需要每个人的环保行动和参与,作为一名中学生的你能为“应对雾霾天气,保护环境”做些什么?请你写出来.(只需写出一条措施或建议即可)16.某校有1000名学生.为了解全校学生的上学方式,该校数学兴趣小组在全校随机抽取了100名学生进行抽样调查.整理样本数据,得到下列图表(频数分布表中部分划记被污染渍盖住)(1)本次调查的个体是;(2)求扇形统计图中,乘私家车部分对应的圆心角的度数;(3)请估计该校1000名学生中,选择骑车和步行上学的一共有多少人?17.为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛.为了解本次竞赛成绩情况,从中抽取了部分学生的成绩进行统计.请你根据尚未完成的频数分布表和频数分布直方图,解答下列问题:(1)填充频数分布表的空格;(2)补全频数直方图,并绘制频数分布直方图;(3)全体参赛学生中,竞赛成绩落在哪组范围内的人数最多?(4)若成绩在90分以上(不含90分)为优秀,则该校成绩优秀的约为多少人?18.网瘾低龄化问题已引起社会各界的高度关注,有关部门在全国范围内对1235-岁的网瘾人群进行了简单的随机抽样调查,得到了如图所示的两个不完全统计图.请根据图中的信息,解决下列问题:(1)求条形统计图中a的值;(2)求扇形统计图中1823-岁部分的圆心角;(3)据报道,目前我国1235-岁的人数.-岁网瘾人数约为2000万,请估计其中122319.某校为开展每天一小时阳光体育活动,准备组建篮球、排球、羽毛球、乒乓球四个兴趣小组,并规定每名学生只能参加1个小组,且不能不参加.该校对九年级学生报名情况进行了抽样调查,并将所得数据绘制成了如下两幅统计图:根据图中的信息,解答下列问题:(1)本次调查共抽样了名学生;(2)补全条形统计图;(3)若该校九年级共有450名学生,试估计报名参加排球兴趣小组的人数.20.班主任张老师为了了解本班学生课堂发言情况,对前一天本班男、女生的发言次数进行了统计,并绘制成如下频数分布折线图(图1).(1)该班共有名学生;(2)在张老师的鼓励下,该班学生第二天的发言次数比前一天明显增加,图2是全班第二天发言次数变化的人数的扇形统计图人教版七年级数学下册第十章数据的收集、整理与描述单元检测试题(解析版)人教版七年级数学下册第十章数据的收集、整理与描述单元测试题学校:__________ 班级:__________ 姓名:__________ 考号:__________一、选择题(本题共计10 小题,每题3 分,共计30分,)1. 某同学想了解寿春路与阜阳路交叉路口1分钟内各个方向通行的车辆数量,他应采取的收集数据方法为()A.查阅资料B.实验C.问卷调查D.观察2. 下列调查中,适合采用全面调查(普查)方式的是()A.对长江水质情况的调查B.对端午节期间市场上粽子质量情况的调查C.对某类烟花爆竹燃放安全情况的调查D.对神舟飞船的零部件的质量情况的调查3. 下列调查中,适宜采用普查的是()A.调查我县初三学生每天体育锻炼的时间B.调查全校学生每月花费的零花钱C.调查初三1班某次数学考试成绩D.调查初三学生参加这次月考的心理状态4. 某纺织厂从10万件同类产品中随机抽取了100件进行质检,发现其中有5件不合格,那么估计该厂这10万件产品中合格品约为()A.9.5万件B.9万件C.9500件D.5000件5. 下列调查方式合适的是()A.了解炮弹的杀伤力,采用普查的方式B.了解全国中学生的视力状况,采用普查的方式C.了解一批罐头产品的质量,采用抽样调查的方式D.对载人航天器“神舟七号”零部件的检查,采用抽样调查的方式6. 某市有3000名初一学生参加期末考试,为了了解这些学生的数学成绩,从中抽取200名学生的数学成绩进行统计分析.在这个问题中,下列说法:①这3000名初一学生的数学成绩的全体是总体;②每个初一学生是个体;③200名初一学生是总体的一个样本;④样本容量是200.其中说法正确的是()A.4个B.3个C.2个D.1个7. 某市将大、中、小学生的视力进行抽样分析,其中大、中、小学生的人数比为2:3:5,若已知中学生被抽到的人数为150人,则应抽取的样本容量等于()A.1500B.1000C.150D.5008. 为了估计水塘中的鱼数,养鱼者首先从鱼塘中捕获20条鱼,在每条鱼身上做好记号后,把这些鱼放归鱼塘.再从鱼塘中打捞100条鱼,如果在这100条鱼中有5条鱼是有记号的,则估计该鱼塘中的鱼数约为()A.300条B.380条C.400条D.420条9. 实验中学九年级进行了一次数学测试,参加考试人数共540人,为了了解这次数学成绩,下列所抽取的样本中较合理的是()A.抽取前:100名同学的数学成绩B.抽取各班学号为3的倍数的同学的数学成绩C.抽取1、2两班同学的数学成绩D.抽取后100名同学的数学成绩10. 某校七(3)班的同学进行了一次安全知识测试,测试成绩进行整理后分成四个组,并绘制如图所示的频数直方图,则第二组的频数是()A.0.4B.18C.0.6D.27二、填空题(本题共计10 小题,每题3 分,共计30分,)11. 一个样本的50个数据分别落在5个小组内,其中第3组有8个数,那么第3组的频率为________.12. 一个容量为77的样本最大值是153,最小值是60,取组距为10,则可分成________组.13. 为了更好的刻画数据的总体的规律,我们还可以在得到的频数分布直方图上________,________,得到________图.14. 一组数据的最大值为169,最小值为141,在绘制频数分布直方图时要求组据为6,则组数为________.15. 某校对去年毕业的350名学生的毕业去向进行跟踪调查,并绘制出扇形统计图(如图所示),则该校去年毕业生在家待业人数有________人.16. 某校为了了解八年级学生的体能情况,随机选取一部分学生测试一分钟仰卧起坐次数,并绘制了如图所示的直方图,学生仰卧起坐次数在25∼30之间的频率是________.该店决定本周进货时,多进一些尺码为厘米的鞋,影响鞋店决策的统计量是18. 下图是根据某中学为地震灾区玉树捐款的情况而制作的统计图,已知该校在校学生3000人,请根据统计图计算该校共捐款________元.19. 今年5月份有关部门对计划去上海迪士尼乐园的部分市民的前往方式进行调查,图1和图2是收集数据后绘制的两幅不完整统计图.根据图中提供的信息,那么本次调查的对象中选择公交前往的人数是________.20. 某校为了解本校九年级学生足球训练情况,随机抽查该年级若干名学生进行测试,然后把测试结果分为4个等级:A、B、C、D,并将统计结果绘制成两幅不完整的统计图.该年级共有700人,估计该年级足球测试成绩为D等的人数为________人.三、解答题(本题共计6 小题共计60分,)(2)计算各种果树对应的圆心角度数;(3)制作扇形统计图.请根据表中信息,回答下列问题:(1)活动小组共有学生多少人?(2)制作标本数在6个及以上的人数占小组总人数的百分比是多少?(3)根据统计表制作一个形象的统计图.23. 吸烟有害健康:为配合“禁烟”运动,某校组织同学们在某社区开展了“你支持哪种戒烟方式”的问卷调查,征求市民的意见,并将调查结果整理后制成了如图所示统计图:(1)同学们一共随机调查了________人;(2)请你把条形统计图补充完整;(3)如果在该社区随机咨询一位市民,那么该市民支持“强制戒烟”的概率是多少?(4)假定该社区有1万人,请估计该地区支持“警示戒烟”这种方式的大约有多少人?24. 某校七年级数学兴趣小组的同学调查了若干名家长对“初中学生带手机上学”现象的看法,统计整理并制作了如下的条形与扇形统计图.依据图中信息,解答下列问题:(1)接受这次调查的家长人数为多少人?(2)表示“无所谓”的家长人数为多少人?(3)在扇形统计图中,求“不赞同”的家长部分所对应扇形的圆心角大小.25. 如图所示的是一位同学设计的一幅象形统计图,不过这位同学太粗心了,应该给出的题目及一些说明性文字都忘了写,你能看出这幅图是要反应什么内容吗?能把图形中缺少的文字补上吗?(能补上三项文字性的说明即可)26. 下面三幅统计图,反映了某市两个化肥厂三个方面的情况,请看图回答问题.(1)从折线统计图中可以看出,哪个厂的产值增长得快?(2)从条形统计图中可以看出,哪个厂的工人人数多,哪个厂的技术人员多?(3)从扇形统计图中可以看出,哪个厂的外销产品占产品销售总数的百分比大?(4)综合上面的分析,你认为哪个厂的生产搞得好,为什么?参考答案与试题解析七年级数学下册第十章数据的收集、整理与描述单元检测试题一、选择题(本题共计10 小题,每题 3 分,共计30分)1.【答案】D【解析】根据收集数据的基本方法有观察、统计、调查、实验、查阅文献资料或因特网查询等分析判断即可.【解答】解:想了解寿春路与阜阳路交叉路口1分钟内各个方向通行的车辆数量,他应采取的收集数据方法为观察,故选:D.2.【答案】D【解析】根据适合普查的方式一般有以下几种:①范围较小;②容易掌控;③不具有破坏性;④可操作性较强,进而判断即可.【解答】解:A、适合抽样调查,因为普查的难度较大,故此选项错误;B、适合抽样调查,因为调查的破坏性较大,故此选项错误;C、适合抽样调查,因为调查的破坏性较大,故此选项错误;D、适合全面调查,因为神舟飞船零部件要求极高,不能出现任何问题,故此选项正确.故选:D.3.【答案】C【解析】由普查得到的调查结果比较准确,但所费人力、物力和时间较多,而抽样调查得到的调查结果比较近似.【解答】解:A,对全国中学生每天体育锻炼的时间的调查不必全面调查,大概知道因为普查工作量大,适合抽样调查;B,调查全校学生每月花费的零花钱,适合抽样调查;C,调查初三1班某次数学考试成绩,适合普查;D,调查初三学生参加这次月考的心理状态,适合抽样调查.故选:C.4.【答案】A【解析】由于100件中进行质检,发现其中有5件不合格,那么合格率可以计算出来,然后利用样本的不合格率估计总体的不合格率,就可以计算出10万件中的不合格品产品数,进而求得合格品数.【解答】解:∵100件中进行质检,发现其中有5件不合格,∴合格率为(100−5)÷100=95%,∴10万件同类产品中合格品约为100000×95%=95000=9.5万件.故选A.5.【答案】C【解析】调查方式的选择需要将普查的局限性和抽样调查的必要性结合起来,具体问题具体分析,普查结果准确,所以在要求精确、难度相对不大,实验无破坏性的情况下应选择普查方式,当考查的对象很多或考查会给被调查对象带来损伤破坏,以及考查经费和时间都非常有限时,普查就受到限制,这时就应选择抽样调查.【解答】解:A、了解炮弹的杀伤力,有破坏性,故得用抽查方式,故本选项错误;B、了解全国中学生的视力状况,工作量大,得用抽查方式,故本选项错误;C、了解一批罐头产品的质量,工作量大,得用抽查方式,故本选项正确;D、对载人航天器“神舟七号”零部件的检查十分重要,故进行普查检查,故本选项错误.故选C.6.【答案】C【解析】根据总体、个体、样本、样本容量的定义即可判断.【解答】解:①这3000名初一学生的数学成绩的全体是总体正确;②每个初一学生的期末数学成绩是个体,故命题错误;③200名初一学生的期末数学成绩是总体的一个样本,故命题错误;④样本容量是200,正确.故选C.7.【答案】D【解析】根据分层抽样方法,设抽到的大、中、小学生人数分别为2x、3x、5x,由抽到的中学生人数可得x,继而可得样本容量.【解答】解:设抽到的大、中、小学生人数分别为2x、3x、5x,由3x=150可得x=50,∴应抽取的样本容量等于10x=500(人),故选:D.8.【答案】C【解析】首先求出有记号的5条鱼在100条鱼中所占的比例,然后根据用样本中有记号的鱼所占的比例等于鱼塘中有记号的鱼所占的比例,即可求得鱼的总条数.【解答】×100%=5%,解:∵5100∴20÷5%=400(条).故选C9.【答案】B【解析】抽取样本注意事项就是要考虑样本具有广泛性与代表性,所谓代表性,就是抽取的样本必须是随机的,即各个方面,各个层次的对象都要有所体现.【解答】解:A、不具有代表性,故A错误B、抽取各班学号为3的倍数的同学的数学成绩,具有代表性广泛性,故B正确;C、不具有代表性,故C错误;D、不具有代表性,故D错误;故选:B.10.【答案】B【解析】根据频数分布直方图即可求解.【解答】解:根据频数分布直方图可知,第二组的频数是18.故选B.二、填空题(本题共计10 小题,每题 3 分,共计30分)11.【答案】425【解析】根据频率的定义,频率=频数数据总和即可求解.【解答】解:第3组的频率为850=425.故答案是:425.12.【答案】10【解析】先求出该组数据最大值与最小值的差,再用极差除以组距即可得到组数.【解答】解:∵153−60=93,而93÷10=9.3,∴应该分成10组.故答案为:10.13.【答案】取点,连线,频数分布折线【解析】根据画频数分布折线图的方法即可求解.【解答】解:为了更好的刻画数据的总体的规律,我们还可以在得到的频数分布直方图上取点,连线,得到频数分布折线图.故答案为取点,连线,频数分布折线图.14.【答案】5【解析】由于一组数据的最大值为169,最小值为141,那么极差为169−141=28,而在绘制频数直方图时要求组距为6,那么根据它们即可求出组数.【解答】解:∵一组数据的最大值为169,最小值为141,∴最大值与最小值的差是169−143=28,而要求组距为6,∴28÷6=423,∴组数为5.故答案为:5.15.【答案】28【解析】首先求得在家待业的百分比,然后乘以毕业的总人数即可.【解答】解:在家待业的毕业生所占百分比为:1−24%−68%=8%,故该校去年毕业生在家待业人数有350×8%=28人,故答案为:28.16.【答案】0.2【解析】即可求解.根据频率的计算公式:频率=频数总数【解答】=0.2.解:学生仰卧起坐次数在25∼30之间的频率是:630故答案是:0.2.17.【答案】众数【解析】平均数、中位数、众数是描述一组数据集中程度的统计量;方差、标准差是描述一组数据离散程度的统计量.销量大的尺码就是这组数据的众数.【解答】由于众数是数据中出现次数最多的数,故影响鞋店决策的统计量是众数.18.【答案】37770【解析】首先根据扇形统计图求得各年级的人数,再结合条形统计图求得共捐款数.【解答】解:初一人数:3000×32%=960(人);初二人数:3000×33%=990(人);初三人数:3000×35%=1050(人).该校共捐款数:960×15+990×13+1050×10=37770(元).19.【答案】6000【解析】根据自驾车人数除以百分比,可得答案.【解答】由题意,得4800÷40%=12000,公交12000×50%=6000人教版七年级下册第十章数据的收集、整理与描述单元练习题(解析版)人教版七年级数学下册第十章数据的收集、整理与描述单元测试题一、选择题1.为了了解某校初三年级400名学生的体重情况,从中抽查了50名学生的体重进行统计分析,在这个问题中,总体是()A.400名学生的体重B.被抽取的50名学生C.400名学生D.被抽取的50名学生的体重2.下列调查中,调查方式选择合理的是()A.为了了解某一品牌家具的甲醛含量,选择全面调查B.为了了解某公园的游客流量,选择抽样调查C.为了了解神州飞船的设备零件的质量情况,选择抽样调查D.为了了解一批袋装食品是否有防腐剂,选择全面调查调查3.墨墨对他所住小区的100户居民2月份天然气的使用量(单位:m3)进行统计,其结果如图所示,图中36-38段因不小心洒上水而看不清,则2月份天然气的使用量在36-38段的居民有()A.18户B.20户C.22户D.24户4.某班同学参加植树,第一组植树15棵,第二组植树18棵,第三组树数14棵,第四组植树19棵.为了把这个班的植树情况清楚地反映出来,应该制作的统计图为()A.条形统计图B.折线统计图C.扇形统计图D.条形统计图、扇形统计图均可5.PM2.5指数是测控空气污染程度的一个重要指数.在一年中最可靠的一种观测方法是()A.随机选择5天进行观测B.选择某个月进行连续观测C.选择在春节7天期间连续观测D.每个月都随机选中5天进行观测6.水库中放养鲤鱼8 000条,鲢鱼若干.在n次随机捕捞中,共抓到鲤鱼320条,抓到鲢鱼400条,估计塘中原来放养了鲢鱼()A.9 000条B.9 600条C.10 000条D.12 000条7.老师对某班全体学生在电脑培训前后进行了一次水平测试,考分以同一标准划分为“不合格”、“合格”、“优秀”三个等级,成绩见下表.下列说法错误的是()A.培训前“不合格”的学生占80%B.培训前成绩“合格”的学生是“优秀”学生的4倍C.培训后80%的学生成绩达到了“合格”以上D.培训后优秀率提高了30%8.某校对全体学生开展心理健康知识测试,七、八、九三个年级共有800名学生,各年级的合格人数如表所示,则下列说法正确的是()A.七年级的合格率最高B.八年级的学生人数为262名C.八年级的合格率高于全校的合格率D.九年级的合格人数最少二、填空题9.为了考察某区3500名毕业生的数学成绩,从中抽出20本试卷,每本30份,在这个问题中,样本容量是________.10.我国泰山,华山等五座名山的海拔高度如下表.若根据表中的数据作出统计图,以便能更清楚地对几座名山的高度进行比较,则应选用________统计图.11.为了掌握我校初中二年级女同学身高情况,从中抽测了60名女同学的身高,这个问题中的总体是____________________,样本是____________________.12.某市2016年将有九万名考生参加中考,为了了解这九万名考生的视力情况,从中抽取了2 000名考生的视力情况进行统计分析,得出①这种调查采用了抽样抽样调查的方式;②九万名考生是总体;③2 000名考生的视力情况是总体的一个样本;④每一名考生是个体;⑤样本容量为1 000名,则以上5个结论正确的是________.13.为了了解某所初级中学学生对6月5日“世界环境日”是否知道,从该校全体学生1 200名中,随机抽查了80名学生,结果显示有2名学生“不知道”,由此,估计该校全体学生中对“世界环境日”约有________名学生“不知道”.14.下列调查中,适合用抽样调查的为________.(填序号)①了解全班同学的视力情况;②了解某地区中学生课外阅读的情况;③了解某市百岁以上老人的健康情况;④日光灯管厂要检测一批灯管的使用寿命.15.调查市场上某种食品的色素含量是否符合国家标准,这种调查适用________________.(填全面调查或者抽样调查)16.如图是某班50名学生身高(精确到1 cm)的频率分布直方图,从左起第一、二、三、四个小长方形的高的比是1∶3∶5∶1,那么身高是160 cm及160 cm以上的学生有________人.三、解答题17.某市建设森林城市需要大量的树苗,某生态示范园负责对甲、乙、丙、丁四个品种的树苗共500株进行树苗成活率试验,从中选择成活率高的品种进行推广.通过实验得知:丙种树苗的成活率为89.6%,把实验数据绘制成下面两幅统计图(部分信息未给出).(1)实验所用的乙种树苗的数量是________株.(2)求出丙种树苗的成活数,并把图2补充完整.(3)你认为应选哪种树苗进行推广?(4)请通过计算说明理由.18.请指出下列样本是否具有代表性:(1)在全县范围内随意选择十个幼儿园,对其中每个孩子的情况进行调查,以了解该县幼儿园的身体发育等情况;(2)到省城一所中学进行调查,以便了解全省中学生上网的情况;(3)在每个省任意确定两名房地产开发商,让他们每人填写一张内容详尽的调查表,包括他们负责的工程质量,所盖楼房中使用的涂料、门窗、地板是不是合格,以及建房的利润情况等,以了解全国各地的房地产开发商的工作情况.19.2016年3月,某中学以“每天阅读1小时”为主题,对学生最喜爱的书籍类型进行随机抽样调查,收集整理数据后,绘制出以下两幅未完成的统计图,请根据图1和图2提供的信息,解答下列问题:(1)请把折线统计图(图1)补充完整;(2)如果这所中学共有学生900名,那么请你估算最喜爱科普类书籍的学生人数.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不妨记作 x1, x2 ,L, xn , n 称为样本容量。
简单地说,统计的任务是由样本推断总体。
1.2 频数表和直方图
一组数据(样本)往往是杂乱无章的,做出它的频数表和直方图,可以看作是对这
组数据的一个初步整理和直观描述。
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次
数,称为频数,由此得到一个频数表。以数据的取值为横坐标,频数为纵坐标,画出一
(ii)作频数表及直方图 求频数用 hist 命令实现,其用法是:
[N,X] = hist(Y,M) 得到数组(行、列均可)Y 的频数表。它将区间[min(Y),max(Y)]等分为 M 份(缺省时 M 设定为 10),N 返回 M 个小区间的频数,X 返回 M 个小区间的中点。
命令
hist(Y,M) 画出数组 Y 的直方图。
load data.txt
这样在内存中建立了一个变量 data,它是一个包含有 20 ×10 个数据的矩阵。
为了得到我们需要的 100 个身高和体重各为一列的矩阵,应做如下的改变: high=data(:,1:2:9);high=high(:) weight=data(:,2:2:10);weight=weight(:)
166
55
161
49
173
57
175
76
158
51
170
63
169
63
173
61
164
59
165
62
167
53
171
61
166
70
166
63
172
53
173
60
178
64
163
57
169
54
169
66
178
60
177
66
170
56
167
54
169
58
173
73
170
58
160
65
179
62
172
50
下面我们介绍几种常用的统计量。
-203-
(i)表示位置的统计量—算术平均值和中位数
算术平均值(简称均值)描述数据取值的平均位置,记作 x ,
∑ x
=
1 n
n i =1
xi
中位数是将数据由小到大排序后位于中间位置的那个数值。
(1)
Matlab 中 mean(x)返回 x 的均值,median(x)返回中位数。 (ii)表示变异程度的统计量—标准差、方差和极差
172
75
169
55
169
64
171
65
167
47
171
62
168
67
165
52
169
62
168
65
166
62
168
65
164
59
170
58
165
64
160
55
175
67
173
74
172
64
168
57
155
57
176
64
172
69
169
58
176
57
173
58
168
50
169
52
167
72
170
57
一个行向量。
对例 1 给出的学生身高和体重,用 Matlab 计算这些统计量,程序如下:
clc load data.txt;
high=data(:,1:2:9);high=high(:);
weight=data(:,2:2:10);weight=weight(:);
-204-
shuju=[high weight]; jun_zhi=mean(shuju) zhong_wei_shu=median(shuju) biao_zhun_cha=std(shuju) ji_cha=range(shuju) pian_du=skewness(shuju) feng_du=kurtosis(shuju)
个阶梯形的图,称为直方图,或频数分布图。
若样本容量不大,能够手工做出频数表和直方图,当样本容量较大时则可以借助
Matlab 这样的软件了。让我们以下面的例子为例,介绍频数表和直方图的作法。
例 1 学生的身高和体重
学校随机抽取 100 名学生,测量他们的身高和体重,所得数据如表
表 1 身高体重数据
身高 体重 身高 体重 身高 体重 身高 体重 身高 体重
废品分类),学校全体学生的身高。
总体中的每一个基本单位称为个体,个体的特征用一个变量(如 x )来表示,如一
件产品是合格品记 x = 0 ,是废品记 x = 1 ;一个身高 170(cm)的学生记 x = 170 。
从总体中随机产生的若干个个体的集合称为样本,或子样,如 n 件产品,100 名学
生的身高,或者一根轴直径的 10 次测量。实际上这就是从总体中随机取得的一批数据,
标准差 s 定义为
1
∑ s
=
⎡1 ⎢⎣ n −1
n i =1
( xi
−
x)2
⎤2 ⎥⎦
(2)
它是各个数据与均值偏离程度的度量,这种偏离不妨称为变异。
方差是标准差的平方 s2 。
极差是 x = ( x1, x2 ,L, xn ) 的最大值与最小值之差。
Matlab 中 std(x)返回 x 的标准差,var(x)返回方差,range(x)返回极差。
163
47
173
67
165
58
176
63
162
52
-201-
165
66
172
59
177
66
182
69
175
75
170
60
170
62
169
63
186
77
174
66
163
50
172
59
176
60
166
76
167
63
172
57
177
58
177
67
169
72
166
50
182
63
176
68
172
56
173
59
174
64
171
59
175
68
165
56
169
65
168
62
177
64
184
70
166
49
171
71
170
59
(i) 数据输入 数据输入通常有两种方法,一种是在交互环境中直接输入,如果在统计中数据量比 较大,这样作不太方便;另一种办法是先把数据写入一个纯文本数据文件 data.txt 中, 格式如例 1 的表 1,有 20 行、10 列,数据列之间用空格键或 Tab 键分割,该数据文件 data.txt 存放在 matlab\work 子目录下,在 Matlab 中用 load 命令读入数据,具体作法是:
例 2 统计下列五行字符串中字符 a、g、c、t 出现的频数 1.aggcacggaaaaacgggaataacggaggaggacttggcacggcattacacggagg 2.cggaggacaaacgggatggcggtattggaggtggcggactgttcgggga 3.gggacggatacggattctggccacggacggaaaggaggacacggcggacataca 4.atggataacggaaacaaaccagacaaacttcggtagaaatacagaagctta 5.cggctggcggacaacggactggcggattccaaaaacggaggaggcggacggaggc
统计量中最重要、最常用的是均值和标准差,由于样本是随机变量,它们作为样本 的函数自然也是随机变量,当用它们去推断总体时,有多大的可靠性就与统计量的概率 分布有关,因此我们需要知道几个重要分布的简单性质。
第十章 数据的统计描述和分析
数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是 以概率论为基础的一门应用学科。
数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的 数值来体现数据样本总体的规律。描述性统计就是搜集、整理、加工和分析统计数据, 使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。它是统计推断的基 础,实用性较强,在统计工作中经常使用。
随机变量 x 的偏度和峰度指的是 x 的标准化变量 ( x − Ex) / Dx 的三阶中心矩和
四阶中心矩:
[ ] ν1
= E ⎢⎢⎣⎡⎜⎜⎝⎛
x
−E D(
(x x)
)
⎟⎟⎠⎞
3
⎤⎥Leabharlann ⎥⎦=E(x − E(x))3 (D( x))3/2
,
[ ] ν2
=
E
⎢⎢⎣⎡⎜⎜⎝⎛
x
−E D(
(x) x)
⎟⎟⎠⎞4
⎤ ⎥ ⎥⎦
=
E (x − E(x))4 (D( x) )2
.
偏度反映分布的对称性,ν1 > 0 称为右偏态,此时数据位于均值右边的比位于左 边的多;ν1 < 0 称为左偏态,情况相反;而ν1 接近 0 则可认为分布是对称的。
峰度是分布形状的另一种度量,正态分布的峰度为 3,若ν 2 比 3 大得多,表示分布
对于例 1 的数据,编写程序如下: load data.txt; high=data(:,1:2:9);high=high(:); weight=data(:,2:2:10);weight=weight(:); [n1,x1]=hist(high) %下面语句与hist命令等价