用样本估计总体知识讲解
《用样本估计总体》 讲义

《用样本估计总体》讲义在我们的日常生活和各种研究领域中,经常会遇到需要了解某个总体的情况,但由于总体规模过大或者其他限制,我们无法对总体中的每一个个体进行调查和分析。
这时候,用样本估计总体就成为了一种非常实用且有效的方法。
那么,什么是样本,什么又是总体呢?总体就是我们所关心的研究对象的整个集合,比如全国所有高中生的身高情况,这就是一个总体。
而样本呢,则是从总体中抽取的一部分个体,比如从某几个学校中抽取的部分高中生的身高数据。
为什么要用样本估计总体呢?首先,直接研究总体往往是不现实的,成本太高、时间太长,甚至根本无法做到。
其次,通过合理抽取的样本,我们能够以相对较小的代价和时间获取到关于总体的一些有用信息。
接下来,让我们看看如何抽取样本。
抽取样本可不是随便抓几个就行,得有一定的方法和原则,这样才能保证样本具有代表性,能够较好地反映总体的特征。
简单随机抽样是一种常见的抽样方法。
想象一下,我们把总体中的每个个体都编上号,然后通过随机数表或者其他随机的方式抽取一定数量的个体,这就是简单随机抽样。
比如要从一个班级的 50 名学生中抽取 5 名进行调查,我们可以给每个学生一个编号,然后随机抽取 5 个编号对应的学生。
分层抽样也是常用的方法之一。
如果总体中存在明显的不同层次或者类别,我们就可以按照这些层次进行分层,然后从每一层中分别抽取样本。
比如要调查一个城市居民的收入情况,我们可以按照不同的区域、职业等进行分层,然后从每个层次中抽取一定数量的居民。
系统抽样则是先将总体中的个体编号,然后按照一定的间隔抽取样本。
比如从 1000 个个体中抽取 50 个,我们可以先计算出间隔为 20,然后从第 1 个个体开始,每隔 20 个抽取一个。
抽取了合适的样本之后,我们就要通过样本的数据来估计总体的特征了。
首先是估计总体的均值。
样本均值就是样本中所有个体的平均值,我们可以用样本均值来估计总体的均值。
假设我们抽取的样本数据为 x1, x2, x3,, xn,那么样本均值x=(x1 + x2 + x3 ++ xn) / n 。
第02讲 用样本估计总体 (精讲)(教师版)

,nx +)标准差与方差据1x ,nx +,标22()(n x x x x +-++-2(n x x ++-知识点三:在频率分布直方图中,众数,中位数,平均数的估计值最高的小矩形底边中点的横坐标即是众数中位数左边和右边的所有小矩形的面积和是相等的“重心”,等于频率分布直方图中每个小矩形的面积乘小矩形底边中点的横坐标3,b ,3,b ,【答案】45 45.85379⨯=975%∴+=25m故选:B.例题4.(PM2.5的浓度(单位:知这组数据的极差为A.73 B.75 C.77 D.79,,n x 的平均数个分数分别为18,,,x x ,6,8,,x 的平均数为228361001081210++++-=x ,28624++=x 8610++++x ,即12864+++=x x x 2624888-⨯=故答案为:14..(2022·全国55%分位数,②众数这两个条件中任选一个,补充在下面问题中的横线上,并解答问题抗坏血酸,是一种水溶性维生素,是高等灵长类动物与其他少数2,3,,)n ,则下列结论正确的是(2,3,,)n ,则它们的众数也满足该关系,12(21)(21)(21)nn y x x x nn++-+-++-=1nx n++- 121b =-,故B 正确;由方差的性质可得2c =C 正确;23,x x ,…,,假设其第80百分位数为1d , 是整数时,x 21,2x x --30,,x 的平均数为10,,x 这10个数的平均数为8,方差为30,,x ___________. 【详解】由题意得12306x x x +++=2309x ++=⨯1081080x ++=⨯=,222121058690x x x =⨯+=++,所以剩余的20个数的平均数为18080520-=, 30221350690660x +=-=+,所以剩余的20个数的方差为66020258-=,故答案为:82022·全国·高一单元测试)敢于冒险奋进精神的载体,A.这组数据的极差为50 B.这组数据的众数为76(0.005+0.75800.3-+故选:CD例题2.(学生人数比例、[(1)估计总体400名学生中分数小于60的人数;分数小于60的频率为()10.020.040.02100.2-++⨯=,所以[)60,70x ∈,即()0.2600.010.25x +-⨯=,解得65x =,则本次考试的及格分数线为65分.例题3.(2022·全国·高一单元测试)中秋佳节来临之际,小李准备销售一种农特产,这段时间内,每售出1箱该特产获利50元,未售出的,每箱亏损30元.经调查,市场需求量的频率分布直方图如图所示.小李购进了160箱该特产,以x (单位:箱,100200x ≤≤)表示市场需求量,y (单位:元)表示经销该特产的利润.(1)根据频率分布直方图估计市场需求量的众数和平均数;(2)将y 表示为x 的函数;(3)根据频率分布直方图求利润不少于4800元的频率.【答案】(1)150,153(2)804800,1001608000,160200x x y x -≤<⎧=⎨≤≤⎩(3)0.9(1)由频率分布直方图,得市场需求量的众数的估计值是150,需求量为[100,120)的频率为0.005×20=0.1,需求量为[120,140)的频率为0.01×20=0.2,需求量为[140,160)的频率为0.015×20=0.3,需求量为[160,180)的频率为0.0125×20=0.25,需求量为[180,200]的频率为0.0075×20=0.15,则市场需求量的平均数约为110×0.1+130×0.2+150×0.3+170×0.25+190×0.15=153.(2)因为每售出1箱该特产获利50元,未售出的,每箱亏损30元,所以当100160≤<x 时,5030(160)804800y x x x =-⨯-=-,当160200x ≤≤时,160508000y =⨯=,所以804800,1001608000,160200x x y x -≤<⎧=⎨≤≤⎩. (3)当100160≤<x 时,由8048004800x -≥,得120160x ≤<;当160200x ≤≤时,80004800y =>,所以当120200x ≤≤时,利润不少于4800元,所以由(1)知利润不少于4800元的频率为10.10.9-=.同类题型归类练A.此次测试众数的估计值为85(1)求频率分布直方图中a的值;(1)求本次初赛成绩的平均数;(每组数据以区间中点值为代表)(1)求出表中m,p的值;(1)分别计算甲、乙两厂提供的10个轮胎宽度的平均数;(1)请你估计该地区所有用户评分的25%,95%分位数;(1)求频率分布直方图中x的值以及样本中身高不低于175cm的学生人数;(1m ii x x =-∑同理可得21s m ∴=+1⎡、、A .20B .40C .64D .80根据此频率分布直方图,下面结论中不正确的是( ) A .该地农户家庭年收入低于4.5万元的农户比率估计为6% B .该地农户家庭年收入不低于10.5万元的农户比率估计为10% C .估计该地农户家庭年收入的平均值不超过6.5万元D .估计该地有一半以上的农户,其家庭年收入介于4.5万元至8.5万元之间 【答案】C【详解】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元的农户的比率估计值为0.020.040.066%+==,故A 正确; 该地农户家庭年收入不低于10.5万元的农户比率估计值为0.040.0230.1010%+⨯==,故B 正确; 该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.100.140.2020.6464%50%++⨯==>,故D 正确;该地农户家庭年收入的平均值的估计值为30.0240.0450.1060.1470.2080.2090.10100.10110.04120.02130.02140.027.68⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=(万元),超过6.5万元,故C 错误.综上,给出结论中不正确的是C. 故选:C.3.(多选)(2021·全国·高考真题)下列统计量中,能度量样本12,,,n x x x 的离散程度的是( )A .样本12,,,n x x x 的标准差B .样本12,,,n x x x 的中位数C .样本12,,,n x x x 的极差D .样本12,,,n x x x 的平均数【答案】AC【详解】由标准差的定义可知,标准差考查的是数据的离散程度; 由中位数的定义可知,中位数考查的是数据的集中趋势; 由极差的定义可知,极差考查的是数据的离散程度;。
《用样本估计总体》 讲义

《用样本估计总体》讲义在我们的日常生活和各种科学研究中,常常需要从部分数据(样本)来推断整体的情况(总体)。
这就好像我们通过观察一小部分苹果的质量,来推测整批苹果的质量好坏;或者根据部分学生的考试成绩,来估计整个班级的学习水平。
这种用样本估计总体的方法,是统计学中非常重要的一种手段。
一、为什么要用样本估计总体首先,我们来思考一下,为什么不能直接研究总体呢?这往往是因为总体的数量太大、获取全部数据的成本太高或者根本就不可能获取到全部数据。
比如说,要调查全国所有成年人的身高,这几乎是不可能完成的任务。
但如果我们抽取一部分具有代表性的成年人作为样本,通过对这些样本的测量和分析,就能够对全国成年人的身高情况做出一个相对准确的估计。
用样本估计总体还有一个重要的原因,那就是能够节省时间和资源。
想象一下,如果要对一个大型工厂生产的所有零件进行质量检测,那需要耗费大量的人力、物力和时间。
而通过抽取一定数量的零件作为样本进行检测,就能在较短的时间内,以较小的成本对整批零件的质量有一个大致的了解。
二、样本与总体的关系样本是从总体中抽取出来的一部分个体或观测值。
总体则是我们所关心的研究对象的全体。
样本应该具有代表性,也就是说,样本的特征应该能够反映总体的特征。
举个例子,如果要研究一个城市居民的收入水平,不能只抽取高收入人群作为样本,也不能只抽取低收入人群,而应该按照一定的比例,从不同收入层次的人群中抽取样本,这样得到的样本才能较好地代表总体的收入情况。
样本的大小也会影响估计的准确性。
一般来说,样本越大,估计的准确性就越高。
但样本大小也不是越大越好,因为过大的样本会增加调查的成本和难度。
所以,在实际应用中,需要根据具体情况,选择合适的样本大小。
三、抽样方法为了获得具有代表性的样本,我们需要采用合适的抽样方法。
常见的抽样方法有简单随机抽样、分层抽样和系统抽样。
简单随机抽样是最基本的抽样方法,就是从总体中随机地抽取个体,每个个体被抽取的概率相等。
课件1:5.1.4 用样本估计总体

课程标准
学科素养
理解并会运用样本的数字特征估 通过对用样本估计总体的学习,强
计总体的数字特征,用样本的分布 化数据分析、数学运算、数学建模
估计总体的分布,通过实例体会其 的核心素养.
意义和作用.
【自主预习】
知识点1 用样本的数字特征估计总体的数字特征
一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本 的特征能够反映总体的特征.特别地,样本平均数(也称为样本均 值)、方差(也称为样本方差)与总体对应的值相差不会____太__大____.
[方法总结] 1.众数、中位数、平均数与频率分布表、频率分布直方图的关系 (1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示, 即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.
(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数 值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而 在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于 中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的 面积应该相等.
探究三 在频率分布直方图中求平均数、中位数、众数
【例3】某校从参加高二年级学业水平测试的学生中抽出80名学生, 其数学成绩(均为整数)的频率分布直方图如图所示. (1)求这次测试数学成绩的众数; (2)求这次测试数学成绩的中位数; (3)求这次测试数学成绩的平均分.
解 (1)由图知众数为70+2 80=75.
【课堂小结】
1. 样本平均数与总体平均数的关系:①在简单随机抽样中,我们常 用样本平均数-y 去估计总体平均数-Y . ②一般地,大部分样本平均数离总体平均数不远,在总体平均数附近 波动.样本量越大,波动幅度越小. 2.众数、中位数分别是频率分布直方图中最高的小矩形的中间值、 累计频率为 0.5 时所对应的样本数据的值,平均数为每个小矩形底边 中点的横坐标与小矩形的面积的乘积之和.
用样本估计总体

用样本估计总体要用样本估计总体的平均数和方差,首先需要了解一些基本概念和方法。
这篇文章将从样本、总体、样本估计等方面进行讨论,并介绍一些常见的样本估计方法。
1.样本与总体:样本是指从总体中选取的一部分观察值,总体是指研究对象的全部观察值的集合。
通常情况下,我们无法直接获得总体的所有观察值,但可以通过选取一部分样本来对总体进行估计。
2.样本估计:样本估计是通过对样本数据进行分析,得出对总体的一些参数的估计值。
常见的参数包括总体的平均数、方差、比例等。
3.样本的选择:为了保证样本的代表性,需要采用一定的抽样方法。
简单随机抽样是常用的抽样方法之一,它的特点是每个样本被选中的概率相等。
其他常用的抽样方法包括等距抽样、分层抽样等。
4.样本均值的估计:样本均值是用来估计总体均值的一个重要指标。
样本均值的估计值可以通过计算样本观察值的平均数得到。
假设样本的观察值为x1, x2, ..., xn,样本均值的估计公式为:样本均值的估计值 = (x1 + x2 + ... + xn) / n。
其中,n表示样本容量。
5.样本方差的估计:样本方差是用来估计总体方差的一个重要指标。
样本方差的估计值可以通过计算样本观察值与样本均值之差的平方的平均数得到。
假设样本的观察值为x1, x2, ..., xn,样本方差的估计公式为:样本方差的估计值= ((x1 - 样本均值的估计值)^2 + (x2 - 样本均值的估计值)^2 + ... + (xn - 样本均值的估计值)^2) / (n - 1)。
其中,n表示样本容量。
6.置信区间:在样本估计中,通常需要给出一个区间估计来反映估计值的准确程度。
置信区间是一个包含总体参数真值的区间,置信度表示该区间包含总体参数真值的概率。
置信区间的计算需要考虑样本容量、样本分布以及所选的置信水平等因素。
综上所述,通过样本对总体的平均数和方差进行估计是统计学中常见的问题。
根据样本均值的估计和样本方差的估计公式,可以计算出相应的估计值。
☆☆用样本估计总体

组距
0.5
4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。
思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别
两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
总体密度曲线反映了总体在各个范围内取值的
百分比,精确地反映了总体的分布规律。是研究总
体分布的工具.
用样本分布直方图去估计相应的总体分布时, 一般样本容量越大,频率分布直方图就会无限接 近总体密度曲线,就越精确地反映了总体的分布
规律,即越精确地反映了总体在各个范围内取值
百分比。
表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
频率分布
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。
频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图
1、抛掷硬币的大量重复试验的结果: 频率分布表: 样本容量为72 088
分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计
频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100
23.4 用样本估计总体课件(共19张PPT)

1
2
3
4
5
6
7
8
9
10
质量/千克
14
21
27
17
18
20
19
23
19
22
根据调查,市场上今年樱桃的批发价格为15元/千克,用所学的统计知识估计今年此果园樱桃按批发价格销售所得的总收入为 元.
30 000
王强几年前承包了甲、乙两座荒山,各载500棵杨梅树,成活率为98%,现已挂果,经济效益初步显现.为了分析收成情况,他分别从两山上随机采摘了4棵树上的杨梅,每棵树的产量如折线统计图所示.(1)分别计算甲、乙两山样本的平均数,并用样本平均数估计甲、乙两山杨梅的产量总和;(2)试通过计算说明,哪座山上的杨梅产量较稳定.
C
2.有甲、乙两种水稻,测得每种水稻各10穴的分孽数后,计算出样本方差分别为S2甲=11,S2乙=3.4,由此可以估计( )A.甲比乙种水稻分蘖整齐 B.乙种水稻分蘖比甲种水稻整齐C.分蘖整齐程度相同 D.甲、乙两种水稻分孽整齐程度不能比
B
3.李大伯承包了一个果园,种植了100棵樱桃树,今年已进入收获期.收获时,从中任选并采摘了10棵树的樱桃,分别称得每棵树所产樱桃的质量如下表:
例1
例题解读
知识点2 用样本方差估计总体方差
例2
一个苹果园,共有2 000棵树龄相同的苹果树.为了估计今年苹果的总产量,任意选择了6棵苹果树,数出它们挂果的数量(单位:个)分别为: 260,340,280,420,360,380根据往年的经验,平均每个苹果的质量约为250 g.试估计今年苹果园苹果的总产量.
160.0
160.9
160.4
159.0
159.5
用样本估计总体

月收入(元)
1000 1500 2000 2500 3000 3500 4000
练习1、如图是150辆汽车通过某路段 时速度的频率分布直方图,则速度在[60, 60 辆. 70)的汽车大约有______
在频率分布直方图中,依次连接各小长 方形上端的中点,就得到一条折线,这条 折线称为频率分布折线图.
练习3、以往招生Biblioteka 计显示,某所大学录 取的新生高考总分的中位数基本稳定在550 分,若某同学今年高考得了520分,他想报 考这所大学还需收集哪些信息?
要点: (1)查往年录取的新生的平均分数.若平均数 小于中位数很多,说明最低录取线较低,可以 报考; (2)查往年录取的新生高考总分的标准差.若 标准差较大,说明新生的录取分数较分散,最 低录取线可能较低,可以考虑报考.
标准差的取值范围是什么?标准差为0 的样本数据有何特点? s≥0,标准差为0的样本数据都相等. 方差的意义: 方差(或标准差)越大离散程度越大,数 据较分散; 方差(或标准差)越小离散程度越小,数 据较集中在平均数周围.
例 2 、有两个班级,每班各自按学号随 机选出 5 名学生,测验铅球成绩,以考察 体育达标程度,测验成绩如下:单位(米) 甲 9.1 7.8 8.5 6.9 5.2 乙 8.8 7.2 7.3 7.5 6.7 两个班相比较,哪个班整体实力强一些 ?
制作频率分布直方图的方法: (1)求极差(即一组数据中最大值与最小 值的差); (2)决定组距与组数;(样本容量不超过
100时,组数常分成5~12组)
(3)将数据分组; (4)列频率分布表; (5)画频率分布直方图.
注:频率分布直方图中
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
用样本估计总体【学习目标】1.在表示样本数据的过程中,学会列频率分布表,画频率分布直方图、频率折线图和茎叶图.2.通过实例体会频率分布直方图、频率折线图、茎叶图的各自特征,从而恰当地选择上述方法分析样本的分布,准确地做出总体估计.3.正确理解样本数据标准差的意义和作用,学会计算数据的标准差.4.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.5.会用样本的基本数字特征估计总体的基本数字特征.【要点梳理】要点一、频率分布的概念频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.其一般步骤为:1.计算一组数据中最大值与最小值的差,即求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图要点诠释:频率分布直方图的特征:1.从频率分布直方图可以清楚的看出数据分布的总体趋势.2.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.要点二、频率分布折线图、总体密度曲线1.频率分布折线图的定义:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.2.总体密度曲线的定义:在样本频率分布直方图中,样本容量越大,所分组数越多,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.要点诠释:总体密度曲线能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,能够精确的反映一个总体在各个区域内取值的规律.要点三、茎叶图当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.要点诠释:茎叶图的特征:(1)用茎叶图表示数据有两个优点:一是在统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示.(2)茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰.要点四、众数、中位数与平均数1.众数一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数.2.中位数将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分成了相同数目的两部分.3.平均数样本数据的算术平均数,即121()n x x x x n=+++L . 要点诠释:由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.要点五、标准差与方差 1.标准差 样本数据1,2,,n x x x 的标准差的算法:(1)算出样本数据的平均数x .(2)算出每个样本数据与样本数据平均数的差:()12i x x i n -=L , ,, (3)算出(2)中()12i x x i n -=L , ,,的平方. (4)算出(3)中n 个平方数的平均数,即为样本方差. (5)算出(4)中平均数的算术平方根,,即为样本标准差. 其计算公式为:s =2.方差从数学的角度考虑,人们有时用标准差的平方2s (即方差)来代替标准差,作为测量样本数据分散程度的工具:2222121[()()()]n s x x x x x x n=-+-++-L 要点诠释:在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差. 数据的离散值程度可以用极差、方差或标准差来描述.极差反映了一组数据变化的幅度;样本方差描述了一组数据围绕平均数波动的大小;样本方差的算术根表示样本的标准差,它也描述了数据对平均数的离散程度.【典型例题】类型一:频率分布表、频率分布直方图例1.在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高? 【答案】(1)60 (2)四组 18(3)六组 【解析】 (1)依题意知第三组的频率为412346415=+++++.∵第三组的频数为12,∴本次活动的参评作品数为126015=件). (2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有66018234641⨯=+++++(件).(3)第四组的获奖率是105189=, 第六组上交的作品数量为1603234641⨯=+++++(件), ∴第六组的获奖率为2639=. 显然第六组的获奖率较高.【总结升华】弄清所求问题是什么,并正确地运算是做对题的关键.本题主要考查同学们对频率分布直方图的理解,只有熟悉它的特征,才能清楚数据分布的总体趋势,根据直方图反映的信息正确解题.举一反三:【变式1】某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图所示).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是________.例2.阅高考试卷有一个环节叫“试批”.某省为了了解和掌握考生的实际答卷情况,随机地抽取了100名考生的数学成绩,数据如下(单位:分):135 98 102 110 99 121 110 96 100 103 125 97 117 113 110 92 102 109 104 112 105 124 87 131 97 102 123 104 104 128109 123 111 103 105 92 114 108 104 102 129 126 97 100 115 111 106 117 104 109 111 89 110 121 80 120 121 104 108 118 129 99 90 99 121 123 107 111 91 100 99 101 116 97 102 108 101 95 107 101 102 108 117 99 118 106 119 97 126 108 123 119 98 121 101 113 102 103 104 108 (1)列出频率分布表;(2)画出频率分布直方图和折线图;(3)估计该省考生数学成绩在100~120分之间的比例;(4)设该省有20万考生,估计该省考生数学成绩不及格的人数(满分150分,90分及以上视为及格);(5)根据折线图估计该省考生的数学成绩在哪一个分数段的人数将会最多. 【思路点拨】理解频率分布直方图的具体含义.【解析】 100个数据中,最大值为135,最小值为80,极差为135-80=55. 把100个数据分成11组,这时组距55511===极差组数. (1)频率分布表如下:[95,100)14 0.14 0.028[100,105)24 0.24 0.048[105,110)15 0.15 0.030[110,115)12 0.12 0.024[115,120)9 0.09 0.018[120,125)11 0.11 0.022[125,130) 6 0.06 0.012[130,135] 2 0.02 0.004合计100 1 0.2”一列,这是为画频率直方图准备的,因为它是频率直方图的纵坐标.注:表中加上“频率组距(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,见下图.(3)从频率分布表中可知,这100名考生的数学成绩在100~120分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在100~120分之间的比例为60%(0.60=60%).(4)100名考生中,数学成绩不及格的频率为0.01+0.02=0.03.比例为3%.200000×3%=6 000(人).估计该省考生数学成绩不及格的有6000人.(5)折线图的最高点位于100~105之间,据此估计该省考生的数学成绩在100~105分这个分数段的人数将会最多.【总结升华】本例中,决定分点时,直接使用了最小值加组距,即80+5k (k=1,2,…,11),而没有把最小值减去某一个数(例如80-0.5=79.5)作为第1个分点,这是因为100个分数是明确的,即它们都在80~135之间.凡事都要具体问题具体分析,不可教条化.本例是把5分看成一个分数段,统计各段的情况.举一反三:【变式1】一个容量为20的样本,分组后,组距与频数如下[10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本在(-∞,50]上的频率为( )A .120 B .14 C .12 D .710【答案】 D【解析】 根据频率的计算公式频率=频数样本容量求解.频率23451472345422010+++===+++++.【变式2】对某电子元件进行寿命追踪调查,情况如下:(1)列出频率分布表; (2)画出频率分布直方图;(3)估计该电子元件寿命在100~400 h 以内的占总体的比例; (4)估计该电子元件寿命在400 h 以上的在总体中占的比例. 【解析】(1)样本频率分布表如下:100~200 20 0.10200~300 30 0.15300~400 80 0.40400~500 40 0.20500~600 30 0.15合计200 1(2)频率分布直方图如下图所示;(3)估计该电子元件寿命在100~400 h以内占总体的比例为65%;(4)估计该电子元件寿命在400 h以上的在总体中占的比例为35%.类型二:众数、中位数、平均数例3.据报道,某公司的33名职工的月工资(以元为单位)如下:职务董事长副董事长董事总经理经理管理员职员人数 1 1 2 1 5 3 20工资(元)5500 5000 3500 3000 2500 2000 1500 (1)求该公司人员月工资的平均数、中位数、众数;(精确到元)(2)假设副董事长的工资从5000元提升到20000元,董事长的工资从5500元提升到30000元,那么新的平均数、中位数、众数又是什么?(精确到元)(3)你认为哪个统计量更能反映这个公司人员的工资水平?结合此问题谈一谈你的看法.【思路点拨】理解平均数、中位数、众数的概念.【答案】(1)2091 1500 1500 (2)3288 (3)中位数和众数 【解析】 (1)平均数是40003500200021500100055003020150033x ++⨯++⨯+⨯+⨯=+150********≈+=(元), 中位数是1500元,众数是1500元. (2)平均数是2850018500200021500100055003020'150015001788328833x ++⨯++⨯+⨯+⨯=+≈+=(元),中位数是1500元,众数是1500元.(3)在这个问题中,中位数和众数均能反映该公司人员的工资水平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数与中位数偏差较大,所以平均数不能反映这个公司人员的工资水平.【总结升华】 (1)深刻理解和把握平均数、中位数、众数在反映样本数据上的特点,结合实际情况,灵活运用.(2)众数、中位数、平均数三者比较,平均数更能体现每个数据的特征,它是各数据的重心. 举一反三:【变式1】为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少? (2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.【答案】(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小, 因此第二小组的频率为:40.0824171593=+++++又因为频率=第二小组频数样本容量所以 121500.08===第二小组频数样本容量第二小组频率(2)由图可估计该学校高一学生的达标率约为171593100%88%24171593+++⨯=+++++(3)由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.类型三:方差、标准差例4.在一次科技知识竞赛中,两组学生的成绩如下表:已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.【解析】 (1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.(2)21251013146s =+++++甲[2(50-80)2+5(60-80)2+10(70-80)2+13(80-80)2+14(90-80)2+6(100-80)2]=150(2×900+5×400+10×100+13×0+14×100+6×400)=172,2150s =乙(4×900+4×400+16-100+2×0+12×100+12×400)=256.∴22s s <乙甲,∴甲组成绩较乙组成绩稳定,故甲组成绩好些.(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度看,甲组的成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为14+6=20(人),乙组成绩大于或等于90分的人数为12+12=24(人),∴乙组成绩集中在高分段的人数较多,同时,乙组得满分的人数比甲组得满分的人数多6人,从这一角度看,乙组的成绩较好【总结升华】 要正确解答这道题,首先要抓住问题中的关键词语.全方位地进行必要的计算,而不能习惯地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.举一反三:【变式1】甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm) 甲机床:10.2 10.1 10.0 9.8 9.9 10.3 9.7 10.0 9.9 10.1乙机床:10.3 10.4 9.6 9.9 10.1 10.9 8.9 9.7 10.2 10.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10 mm ,从计算的结果来看哪台机床加工这种零件较合适? 【解析】101001011.101.102.10101=⨯=++=)(甲Λx ,1010101104.103.10101=⨯=+++=)(乙Λx .∴[]2222101.10101.10102.10101)()()(甲-+-+-=Λs =0.032mm []22221010104.10103.10101)()()(乙-+-+-=Λs =0.062mm . ∴2甲s <2乙s∴用甲机床比乙机床稳定,即用甲机床加工较合适.类型四:茎叶图例5.某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下: 甲:95,81,75,91,86,89,71,65,76,88,94,110,107; 乙:83,86,93,99,88,103,98,114,98,79,78,106,101. 画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【思路点拨】茎叶图便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据. 【答案】乙同学的成绩比较稳定【解析】 甲、乙两人数学成绩的茎叶图如图所示.从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.举一反三:【变式1】在某高中篮球联赛中,甲、乙两名运动员的得分如下:甲:14,17,25,26,30,31,35,37,38,39,44,48,51,53,54;乙:6,15,17,18,21,27,28,33,35,38,40,44,56.(1)用茎叶图表示上面的样本数据,并求出样本数据的中位数;(2)根据(1)中所求的数据分析甲、乙两名运动员中哪一位发挥得更加稳定.【解析】(1)茎叶图如图所示.甲运动员的中位数是37,乙运动员的中位数是28.(2)从茎叶图上可以看出甲运动员的得分大致对称,中位数是37,乙运动员的得分也大致对称,中位数是28,因此,甲运动员发挥得比较稳定,总体得分比乙运动员高.【变式2】随机抽取某中学甲乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图如图.(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差.【答案】(1)乙班(2)57【解析】(1)由茎叶图可知:甲班身高集中于160179:之间, 而乙班身高集中于170180:之间.因此乙班平均身高高于甲班; (2) 15816216316816817017117917918217010+++++++++==x甲班的样本方差为:()()()()()()()()()()222222222211581701621701631701681701681701017017017117017917017917018217057[-+-+-+-+-+-+-+-+-+-]=THANKS !!!致力为企业和个人提供合同协议,策划案计划书,学习课件等等打造全网一站式需求欢迎您的下载,资料仅供参考。