2019届高考数学一轮复习第10章第2讲统计图表数据的数字特征用样本估计总体知能训练及解析-经典汇编

合集下载

高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

高考数学一轮复习 第十章 第2讲 用样本估计总体课件 文

ppt精选
3
2.样本的数字特征 (1)众数:一组数据中___出__现__次__数__最__多_____的那个数据,叫 做这组数据的众数. (2)中位数:把 n 个数据按大小顺序排列,处于_最__中___间____ 位置的一个数据叫做这组数据的中位数.
a1+a2+…+an (3)平均数:把________n___________称为 a1,a2,…,an 这 n 个数的平均数.
15
(2)(2014·高考北京卷)从某校随机抽取 100 名学生,获得了
他们一周课外阅读时间(单位:小时)的数据,整理得到数据
分组及频数分布表和频率分布直方图:
组号 1 2 3 4 5 6 7 8 9
合计
分组
[0,2) [2,4) [4,6) [6,8) [8,10) [10,12) [12,14) [14,16) [16,18)
ppt精选
4
(4)标准差与方差:设一组数据 x1,x2,x3,…,xn 的平均
数为-x ,则这组数据的标准差和方差分别是
s=
n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
s2=n1[(x1--x )2+(x2--x )2+…+(xn--x )2]
ppt精选
5
[做一做]
1.(2014·高考四川卷)在“世界读书日”前夕,为了了解某
第十章 统计、统计案例及算法初步
第2讲 用样本估计总体
ppt精选
1
1.统计图表的含义
(1)频率分布表
①含义:把反映总体频率分布的表格称为频率分布表.
②频率分布表的画法步骤:
第一步:求___极__差_____,决定组数和组距,组距=极组差数;
第二步:__分__组______,通常对组内数值所在区间取左闭右开

北师大版高三数学一轮复习课件:第2讲 统计图表、数据的数字特征、用样本估计总体

北师大版高三数学一轮复习课件:第2讲 统计图表、数据的数字特征、用样本估计总体

解析/显隐
考点突 破
考点一
[例 1] (2014· 新课标全国Ⅱ卷)某市为了考
茎叶图及其应 用
核甲、乙两部门的工作情况,随机访问了 50 位 市民.根据这 50 位市民对这两部门的评分(评 分越高表明市民的评价越高 ) ,绘制茎叶图如 下: (1)分别估计该市的市民对甲、乙两部门评分的中位数; (2)分别估计该市的市民对甲、乙两部门的评分高于 90 的概率; (3)根据茎叶图分析该市的市民对甲、乙两部门的评价.
频率分布直方图(多维探究)
规律 方法 (1)准确理解频率分布直方图的数据特点,频率分布直方图中纵轴上的 数据是各组的频率除以组距的结果,不要误以为纵轴上的数据是各组的频 率和条形图混淆. (2)①“命题角度二”的例题中抓住频率分布直方图中各小长方形的面 积之和为 1,这是解题的关键.②利用频率分布直方图可以估计总体分布.
由 1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02) =0.5×a+0.5×a, 解得 a=0.30. (2)由(1)知,该市 100 位居民中月均用水量不低于 3 吨的频率为 0.06+0.04+0.02=0.12. 由以上样本的频率分布,可以估计 30 万居民中月均用水量不低于 3 吨的人数为 300 000×0.12=36 000. 因为前 5 组的频率之和为 (3)设中位数为 x 吨.
考点一
茎叶图及其应 用
规律 方法
(1)茎叶图的优点是保留了原始数据,便于记录及表示,能反 映数据在各段上的分布情况. (2)①作样本的茎叶图时先要根据数据特点确定茎、叶,再作 茎叶图;作“叶”时,要做到不重不漏,一般由内向外,从小到大排 列,便于数据的处理. ②根据茎叶图中数据数字特征进行分析判断考查识图能力, 判 断推理能力和创新应用意识;解题的关键是抓住“叶”的分布特征, 准确提炼信息.

高考数学一轮复习第十章统计与统计案例10.2用样本估计总体课件文新人教A

高考数学一轮复习第十章统计与统计案例10.2用样本估计总体课件文新人教A

[点石成金] 1.频率分布直方图的解题要点 解决频率分布直方图的问题,关键在于找出图中数据之间的 联系.这些数据中,直接的有组距、 频率 组距,间接的有频率、小长方形的面积,合理使用这些数据,
频率 再结合两个等量关系:小长方形面积=组距×组距=频率,小长 方形面积之和等于 1,即频率之和等于 1,就可以解决直方图的 有关问题.
(2)某公司为了了解用户对其产品的满意度,从 A,B 两地区 分别随机调查了 40 个用户,根据用户对产品的满意度评分,得 到 A 地区用户满意度评分的频率分布直方图和 B 地区用户满意度 评分的频数分布表.
A 地区用户满意度评分的频率分布直方图
B 地区用户满意度评分的频数分布表 满意 度评 [50,6 [60,7 [70,8 [80,9 [90,1 分分 0) 0) 0) 0) 00] 组 频数 2 8 14 10 6
1 的概率约是__3________.
解析:由条件可知,落在[31.5,43.5)内的数据有 12+7+3= 22(个),故所求概率约为2626=13.
频率分布直方图:中位数与众数的区别;平均值
某次月考后,从所有考生中随机抽取 50 名考生的数学成绩
进行统计,得到频率分布直方图如图所示,则该次考试数学成绩 2
的中位数的估计值是____7_1_3____.
解析:由频率分布直方图,可知中位数位于 70 到 80 之间,
0.002+0.006+0.012+0.024=0.044,01.05-0.044=0.006,所以由
00..000366×10=53,得中位数的估计值为
2 713.
[典题 1] (1)某电子商务公司对 10 000 名网络购物者 2014 年度的消费情况进行统计,发现消费金额(单位:万元)都在区间 [0.3,0.9]内,其频率分布直方图如图所示.

高考数学一轮复习 10.2用样本估计总体课件 文 湘教版

高考数学一轮复习 10.2用样本估计总体课件 文 湘教版

ppt精选
12
11/18/2020
【解析】(1)由频率分布直方图得前五组频率为 (0.008+0.016+0.04+0.04+0.06)×5=0.82,后三组频率 为1-0.82=0.18,人数为0.18×50=9(人),这所学校高三 年级全体男生身高在180 cm以上(含180 cm)的人数为 800×0.18=144(人). (2)由频率分布直方图得第八组频率为0.008×5=0.04,人 数为0.04×50=2(人),设第六组人数为m,则第七组人数 为9-2-m=7-m.又m+2=2×(7-m),∴m=4,所以第 六组人数为4人,第七组人数为3人,频率分别为0.08,0.06.频 率/组距分别为0.016,0.012(画图如图).
入一个新数据 5,此时样本容量为 9,平均数为,方差为 s2 ,则()
A. x =5, s2 <2
B. x =5, s2 >2
C. x >5, s2 <2
D. x >5, s2 >2
【解析】∵ 1 8
(x1x2源自+…+x8)=5,∴
1 9
( x1 x2 +…+ x8 +5)=5,
∴=5,由方差定义及意义可知加入新数据 5 后,样本数据取值的稳
5.(2014·武汉武昌区联考)已知某单位有40名职工,现要从中抽取
5名职工,将全体职工随机按1~40编号,并按编号顺序平均分成
5组.按系统抽样方法在各组内抽取一个号码.
(1)若第1组抽出的号码为2,则所有被抽出职工的号码为 ;
(2)分别统计这5名职工的体重(单位:公斤),获得体重数据的茎
叶图如图所示,则该样本的方差为
定性比原来强,∴ s2 <2,故选 A.

第十章 统计与概率10-2用样本估计总体

第十章  统计与概率10-2用样本估计总体

注意以下结论: (1)如果x1、x2、„、xn的平均数为 - ,则ax1+b,ax2 x +b,„,axn+b的平均数为a -+b. x



(2)数据x1、x2、„、xn与数据x1+m、x2+ m、„、xn+m的方差相等. (3)若x1、x2、„、xn的方差为s2,则kx1, kx2,„,kxn的方差为k2s2. 计算方差时,要依据所给数据的特点恰当选 取公式以简化计算.



3.茎叶图 统计中还有一种被用来表示数据的图叫做茎 叶图. 茎是指中间的一列数,叶是从茎的旁边生长 出来的数. 在样本数据较少、较为集中,且位数不多时, 用茎叶图表示数据的效果较好,它当 样本数据较多时,茎叶图就不太方便.

4.平均数、中位数和众数

把样本方差的算术平方根叫做这组数据的样 本标准差.

(3)数据的离散程度可以通过极差、方差或
误区警示 1.对频率分布直方图和茎叶图识图不准是常见的错 误.在频率分布直方图中,小矩形的高= 频率 组距 =
频数 频率 .频率= ×组距=小矩形的面积. 组距×样本容量 组距

2.中位数可能不在样本数据中. 3.计算公式用错或计算错误.计算平均数、 方差、标准差等时计算量大,要注意计算结 果的准确性.

③将数据分组:通常对组内数值所在区间取 左闭右开区间,最后一组取闭区间,也可以 将样本数据多取一位小数分组;


④列频率分布表:登记频数,计算频率,列 出频率分布表. 将样本数据分成若干小组,每个小组内的样 本个数称作频数,频数与样本容量的比值叫 做这一小组的频率.频率反映数据在每组 所占比例 的大小.
方差:s12= 100)2]≈3.43. 乙车间:

2019高三数学(北师大版理科)一轮课件10.3 统计图表、数据的数字特征、用样本估计总体精选ppt版本

2019高三数学(北师大版理科)一轮课件10.3 统计图表、数据的数字特征、用样本估计总体精选ppt版本

关键能力
-12-
考点1 考点2 考点3
(1)求频率分布直方图中x的值; (2)求月平均用电量的众数和中位数; (3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的 四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在 [220,240)的用户中应抽取多少户? 解: (1)由(0.002+0.009 5+0.011+0.012 5+x+0.005+0.002 5)×20=1,得x=0.007 5,所以直方图中x的值是0.007 5. (2)月平均用电量的众数是220 +2 240=230. 因为(0.002+0.009 5+0.011)×20=0.45<0.5,(0.002+0.009 5+0.011+0.012 5)×20=0.7>0.5,所以月平均用电量的中位数在 [220,240)内,设中位数为a, 由(0.002+0.009 5+0.011)×20+0.012 5×(a-220)=0.5,得a=224, 所以月平均用电量的中位数是224.
②绘制频率分布直方图的步骤为: 求极差 ;决定组距与
组数; 将数据分组
;列频率分布表;画频率分布直方图.
(2)频率分布折线图:在频率分布直方图中,按照分组原则,再在左
边和右边各加一个区间.从所加的左边区间的中点开始,用线段依
次连接各个矩形的顶端中点直至右边所加区间的中点,就可以得
到一条折线,我们称之为频率折线图.随着样本容量的增加,作图时
本的频率分布直方图(如图).根据频率分布直方图可估计这1 000名
学生在该次数学考试中成绩不低于60分的学生人数是

高考一轮复习第10章统计统计案例第2讲用样本估计总体

第二讲 用样本估计总体知识梳理·双基自测 知识梳理知识点一 用样本的频率分布估计总体分布 (1)频率分布表与频率分布直方图频率分布表和频率分布直方图,是从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布规律,从中可以看到整个样本数据的频率分布情况.绘制频率分布直方图的步骤为:①_求极差__;②_决定组距与组数__;③_将数据分组__;④_列频率分布表__;⑤_画频率分布直方图__.(2)频率分布折线图顺次连接频率分布直方图中_各小长方形上端的中点__,就得到频率分布折线图. (3)总体密度曲线总体密度曲线反映了总体在各个范围内取值的百分比,它能提供更加精细的信息. 知识点二 茎叶图(1)茎叶图中茎是指_中间__的一列数,叶是从茎的_旁边__生长出来的数.(2)茎叶图的优点是可以_保留__原始数据,而且可以_随时__记录,这对数据的记录和表示都能带来方便.知识点三 样本的数字特征(1)众数:一组数据中出现次数最多的数.(2)中位数:将数据从小到大排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数.(3)平均数:x =_x 1+x 2+…+x nn__,反映了一组数据的平均水平.(4)标准差: s =_1n[x 1-x2+x 2-x2+…+x n -x2]__,反映了样本数据的离散程度.(5)方差:s 2=_1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]__,反映了样本数据的离散程度.重要结论(1)若一组数据x i (i =1,2,…,n)的平均数为x -,方差为s 2,则数据组ax i +b(i =1,2,…,n ,a ,b 为常数)的平均数为a x -+b ,方差为a 2·s 2.(2)频率分布直方图与众数、中位数与平均数的关系 ①最高的小长方形底边中点的横坐标即是众数.②中位数左边和右边的小长方形的面积和是相等的,均为12.③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.双基自测题组一 走出误区1.判断下列结论是否正确(请在括号中打“√”或“×”)(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( √ ) (2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( × )(3)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.( √ )(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (6)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) 题组二 走进教材2.(P 81A 组T1改编)已知某班级部分同学一次测验的成绩统计如图,则其中位数和众数分别为( B )A .95,94B .92,86C .99,86D .95,91[解析]由茎叶图可知,此组数据由小到大排列依次76,79,81,83,86,86,87,91,92,94,95,96,98,99,101,103,114,共17个,故92为中位数,出现次数最多的为众数,故众数为86,故选B .3.(P 7T1)如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有_25__人.[解析]100×(0.5×0.5)=25(人).题组三走向高考4.(2020·新课标Ⅲ)设一组样本数据x1,x2,…,x n的方差为0.01,则数据10x1,10x2,…,10x n的方差为( C )A.0.01 B.0.1C.1 D.10[解析]∵样本数据x1,x2,…,x n的方差为0.01,∴根据任何一组数据同时扩大几倍方差将变为平方倍增长,∴数据10x1,10x2,…,10x n的方差为:100×0.01=1,故选C.5.(2020·天津)从一批零件中抽取80个,测量其直径(单位:mm),将所得数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( B )A.10 B.18C.20 D.36[解析]直径落在区间[5.43,5.47)的频率为(6.25+5)×0.02= 0.225,则被抽取的零件中,直径落在区间[5.43,5.47)内的个数为0.225×80 =18个,故选B.考点突破·互动探究考点一频率分布直方图——自主练透例1 (1)(2021·江西赣州十四县联考)中央电视台播出《中国诗词大会》火遍全国,下面是组委会在选拔赛时随机抽取的100名选手的成绩,按成绩分组,得到的频率分布表如下所示:组号分组频数频率第1组[160,165) 0.100笫2组[165,170) ①第3组[170,175) 20 ②第4组[175,180) 20 0.200第5组[180,185) 10 0.100合计100 1.00(ⅰ)请先求出频率分布表中①、②位置的相应数据,再完成频率分布直方图(用阴影表示).(ⅱ)为了能选拔出最优秀的选手,组委会决定在笔试成绩高的第3,4,5组中用分层抽样抽取5名选手进入第二轮面试,则第3,4,5组每组各抽取多少名选手进入第二轮面试?(ⅲ)在(ⅱ)的前提下,组委会决定在5名选手中随机抽取2名选手接受考官A面试,求第4组至少有一名选手被考官A面试的概率.(2)(2021·福建漳州质检)2018年9月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达52亿元.某青年志愿者组织调查了某地区的50个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五组:[0,2 000],(2 000,4 000],(4 000,6 000],(6 000,8 000],(8 000,10 000](单位:元),得到如图所示的频率分布直方图.(ⅰ)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表);(ⅱ)台风后该青年志愿者与当地政府向社会发出倡议,为该地区的农户捐款帮扶,现从这50户损失超过4 000元的农户中随机抽取2户进行重点帮扶,设抽出损失超过8 000元的农户数为X,求X的分布列和数学期望.[解析](1)(ⅰ)第1组的频数为100×0.100=10,所以①处应填的数为100-(10+20+20+10)=40, 从而第2组的频率为40100=0.400.②处应填的数为1-(0.1+0.4+0.2+0.1)=0.200. 频率分布直方图如图所示.(ⅱ)因为第3,4,5组共有50名选手,所以利用分层抽样在50名选手中抽取5名选手进入第二轮面试时,每组抽取的人数分别为:第3组:2050×5=2,第4组:2050×5=2,第5组:1050×5=1,所以第3,4,5组分别抽取2人,2人,1人进入第二轮面试. (ⅲ)记“第4组至少有一名选手被考官A 面试”为事件A , 则P(A)=C 12C 13+C 22C 25=710. ⎝ ⎛⎭⎪⎫或P A =1-P A -=1-C 23C 25=710 (2)(ⅰ)记每个农户的平均损失为x -元,则x -=1 000×0.3+3 000×0.4+5 000×0.18+7 000×0.06+9 000×0.06=33 601;(ⅱ)由频率分布直方图,可得损失超过 4 000元的农户共有(0.000 09+0.000 03+0.000 03)×2 000×50=15(户),损失超过8 000元的农户共有0.000 03×2 000×50=3(户),随机抽取2户,则X 的可能取值为0,1,2; 计算P(X =0)=C 212C 215=2235,P(X =1)=C 112C 13C 215=1235,P(X =2)=C 23C 215=135.所以X 的分布列为:X0 1 2P2235 1235 135数学期望为E(X)=0×2235+1×1235+2×135=25.名师点拨应用频率分布直方图时的注意事项用频率分布直方图解决相关问题时,应正确理解图表中各个量的意义,识图掌握信息是解决该类问题的关键.频率分布直方图有以下几个要点:(1)纵轴表示频率/组距;(2)频率分布直方图中各长方形高的比也就是其频率之比;(3)频率分布直方图中每一个矩形的面积是样本数据落在这个区间上的频率,所有的小矩形的面积之和等于1,即频率之和为1.〔变式训练1〕(1)(2021·安徽“皖南八校”摸底)某校高三年级有400名学生,在一次数学测试中,成绩都在[80,130](单位:分)内,其频率分布直方图如图,则这次测试数学成绩不低于100分的人数为_220__.(2)(2021·山西适应性考试)某病毒引起的肺炎的潜伏期平均为7天左右,短的约2~3天,长的约10~14天,甚至有20余天.某医疗机构对400名确诊患者的潜伏期进行统计,整理得到以下频率分布直方图.根据该直方图估计:要使90%的患者显现出明显病状,需隔离观察的天数至少是( C )A .12B .13C .14D .15[解析] (1)根据频率分布直方图知: (2a +0.04+0.03+0.02)×10=1⇒a =0.005; 计算出数学成绩不低于100分的频率为: (0.03+0.02+0.005)×10=0.55;所以这次测试数学成绩不低于100分的人数为0.55×400=220人.(2)由题可知,第一,二,三,四,五组的频率分别为0.16,0.4,0.32,0.08,0.04. 因为前三组的频率和为0.88, 故要使90%的患者显现出明显病状,则需隔离观察的天数至少是:13+0.9-0.880.02=14,故选C .考点二 茎叶图——师生共研例2 (多选题)(2021·四川省乐山市调研改编)胡萝卜中含有大量的β-胡萝卜素,摄入人体消化器官后,可以转化为维生素A ,现从a ,b 两个品种的胡萝卜所含的β-胡萝卜素(单位mg)得到茎叶图如图所示,则下列说法正确的是( ABD )A .x a <x bB .a 的方差大于b 的方差C .b 品种的众数为3.31D .a 品种的中位数为3.27 [解析] 由茎叶图得:b 品种所含β-胡萝卜素普遍高于a 品种, ∴x a <x b ,故A 正确;a 品种的数据波动比b 品种的数据波动大, ∴a 的方差大于b 的方差,故B 正确; b 品种的众数为3.31与3.41,故C 错误; a 品种的数据的中位数为:3.23+3.312=3.27,故D 正确.名师点拨茎叶图的绘制及应用(1)茎叶图的绘制需注意:①“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;②重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置上的数据.(2)茎叶图通常用来记录两位数的数据,可以用来分析单组数据,也可以用来比较两组数据.通过茎叶图可以确定数据的中位数,数据大致集中在哪个茎,数据是否关于该茎对称,数据分布是否均匀等.〔变式训练2〕(2019·山东)如图所示的茎叶图记录了甲,乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 与y 的值分别为( A )A .3,5B .5,5C .3,7D .5,7[解析] 甲组数据的中位数为65,由甲、乙两组数据的中位数相等,得y =5.又甲、乙两组数据的平均值相等,∴15×(56+65+62+74+70+x)=15×(59+61+67+65+78),∴x =3.故选A . 考点三 样本数字特征——多维探究 角度1 样本数字特征与频率分布直方图例3 (1)如图所示是一样本的频率分布直方图,则由图形中的数据,可以估计众数与中位数分别是( B )A .12.5,12.5B .12.5,13C .13,12.5D .13,13[解析] 由频率分布直方图可知,众数为10+152=12.5,因为0.04×5=0.2,0.1×5=0.5,在频率分布直方图中,中位数左边和右边的面积相等,所以中位数在区间[10,15)内.设中位数为x ,则(x -10)×0.1=0.5-0.2,解得x =13.角度2 样本数字特征与茎叶图(2)将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91,现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示:⎪⎪⎪897 74 0 1 0 x 9 1则7个剩余分数的方差为_367__.[解析] 由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4,∴s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.角度3 样本数字特征的计算(3)(2021·湖北武汉、襄阳、荆门、宜昌四地六校考试联盟联考)已知某7个数据的平均数为5,方差为4,现又加入一个新数据5,此时这8个数的方差s 2为( C )A .52B .3C .72D .4[解析] 设某7个数据分别为a 1,a 2,…,a 7, 则由题意得a 1+a 2+…+a 7=5×7=35, (a 1-5)2+(a 2-5)2+…+(a 7-5)2=4×7=28, 加入新数据5后的平均数x -=35+58=5,方差s 2=a 1-52+a 2-52+…+a 7-52+5-528=288=72.故选C .名师点拨平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数,中位数,众数描述其集中趋势,方差和标准差描述其波动大小.〔变式训练3〕(1)(角度1)某小区共有1 000户居民,现对他们的用电情况进行调查,得到频率分布直方图如图所示,则该小区居民用电量的中位数为_155__,平均数为_156.8__.(2)(角度2)(2021·陕西西安八校联考)在一次技能比赛中,共有12人参加,他们的得分(百分制)茎叶图如图,则他们得分的中位数和方差分别为( B )A .89 54.5B .89 53.5C .87 53.5D .89 54(3)高铁、扫码支付、共享单车、网购并称中国“新四大发明”,近日对全国100个城市的共享单车和扫码支付的使用人数进行大数据分析,其中共享单车使用的人数分别为x 1,x 2,x 3,…,x 100,它们的平均数为x -,方差为s 2:其中扫码支付使用的人数分别为3x 1+2,3x 2+2,3x 3+2,…,3x 100+2,它们的平均数为x -′,方差为s′2,则x -′,s′2分别为( C )A .3x -+2,3s 2+2 B .3x -,3s 2C .3x -+2,9s 2D .3x -+2,9s 2+2[解析] (1)中位数为:150+(170-150)×0.10.02×20=155.该组数据的平均数为x =0.005×20×120+0.015×20×140+0.020×20×160+0.005×20×180+0.003×20×200+0.002×20×220=156.8.(2)由题可知,中位数为:87+912=89,先求平均数:x -=78+79+84+86+87+87+91+94+98+98+99+9912=90,S 2=112[(-12)2+(-11)2+(-6)2+(-4)2+(-3)2+(-3)2+12+42+82+82+92+92]=53.5,故中位数为:89,方差为53.5,故选:B .(3)显然x -′=3x -+2,而每个数据上都加上或减去相同数不影响方差,但每个数据都乘以a ,则方差变为原方差的a 2倍,故选C .考点四 折线图——师生共研例4 (多选题)(2021·河南顶级名校模拟改编)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论不正确的是( BCD )A .连续三天日平均温度的方差最大的是7日,8日,9日三天B .这15天日平均温度的极差为15 ℃C .由折线图能预测16日温度要低于19 ℃D .由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数[解析] A 选项,日平均温度的方差的大小取决于日平均温度的波动的大小,7,8,9三日的日平均温度的波动最大,故日平均温度的方差最大,正确;B 选项,这15天日平均温度的极差为18 ℃,B 错;C 选项,由折线图无法预测16日温度是否低于19 ℃,故C 错误;D 选项,由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,故D 错误.故选B 、C 、D .名师点拨折线图可以显示随时间(根据常用比例放置)而变化的连续数据,因此非常适用于显示在相等时间间隔下数据的趋势.〔变式训练4〕(多选题)甲乙两名同学在本学期的六次考试成绩统计如图,甲乙两组数据的平均值分别为x -甲、x -乙,则( BC )A .每次考试甲的成绩都比乙的成绩高B .甲的成绩比乙稳定C .x -甲一定大于x -乙D .甲的成绩的极差大于乙的成绩的极差[解析] 第二次考试甲的成绩比乙低,A 错;由图可知甲的成绩比乙的成绩波动小,B 正确,D 错;甲的平均成绩显然比乙的平均成绩高,C 正确;故选B 、C .名师讲坛·素养提升 高考与频率分布直方图例5 (2021·安徽省池州市期末)高三年级某班50名学生期中考试数学成绩的频率分布直方图如图所示,成绩分组区间为:[80,90),[90,100),[100,110),[110,120),[120,130),[130,140),[140,150].其中a ,b ,c 成等差数列且c =2a ,物理成绩统计如表.(说明:数学满分150分,物理满分100分)分组 [50,60) [60,70) [70,80) [80,90) [90,100]频数6920105(1)根据频率分布直方图,请估计数学成绩的平均分; (2)根据物理成绩统计表,请估计物理成绩的中位数;(3)若数学成绩不低于140分的为“优”,物理成绩不低于90分的为“优”,已知本班中至少有一个“优”同学总数为6人,从此6人中随机抽取3人.记X 为抽到两个“优”的学生人数,求X 的分布列和期望值.[解析] (1)根据频率分布直方图得, (a +b +2c +0.024+0.020+0.004)×10 =1, 又因a +c =2b ,c =2a ,解得a =0.008,b =0.012,c =0.016, 故数学成绩的平均分x -=85×0.04+95×0.12+105×0.16+115×0.2+125×0.24 +135×0.16+145×0.08=117.8(分),(2)总人数50分,由物理成绩统计表知,中位数在成绩区间[70,80), 所以物理成绩的中位数为75分.(3)数学成绩为“优”的同学有4人,物理成绩为“优”有5人,因为至少有一个“优”的同学总数为6名同学,故两科均为“优”的人数为3人,故X 的取值为0、1、2、3.P(X =0)=C 33C 36=120,P(X =1)=C 13C 23C 36=920,P(X =2)=C 23C 13C 36=920,P(X =3)=C 33C 36=120,所以分布列为:X 0 1 2 3 P120920920120∴期望值为E(X)=0×120+1×920+2×920+3×120=32.名师点拨(1)通过统计图可以很清楚地表示出各部分数量同总数之间的关系. (2)准确理解频率分布直方图的数据特点是解题关键. 〔变式训练5〕(2019·高考全国Ⅲ卷)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).[解析](1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1-0.05-0.15-0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.。

新高考新教材数学人教B版一轮课件:第十章 第二节 用样本估计总体 课件(71张)

思维点2 根据频率分布直方图计算样本数据的百分位数 [例2] 某市为了鼓励市民节约用电,实行“阶梯式”电价,将该市每户居民的月用 电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时 但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收 费. (1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式; (2)为了了解居民的用电情况,通过抽样获得了今年 1月份100户居民每户的用电量,统计分析后得到如图所 示的频率分布直方图.若这100户居民中,今年1月份用 电费用不超过260元的占80%,求a,b的值; (3)根据(2)中求得的数据计算用电量的75%分位数.
4.分层抽样的均值与方差
必备知识 关键能力 限时规范训练 8
我们以分两层抽样的情况为例.假设第一层有 m 个数,分别为 x1,x2,…,xm,平均
数为 x ,方差为 s2;第二层有 n 个数,分别为 y1,y2,…,yn,平均数为 y ,方差为 t2.则
x =__m1__i=m_1x_i___,s2=____m1__i=m_1_(_x_i-___x_)2____,
3.(链接人B必修第二册P64例1)一个容量为20的样本,其数据按从小到大的顺序排 列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为 ________,第86百分位数为________.
解析:∵75%×20=15,∴第 75 百分位数为14+2 15=14.5.∵86%×20=17.2.∴第 86 百分位数为第 18 个数据 17.
必备知识 关键能力 限时规范训练 7
知识点三 极差、方差与标准差 1.极差:一组数的极差指的是这组数的最大值减去最小值所得的_差__.不难看出,极 差反应了一组数的变化范围,描述了这组数的__离__散__程度.

高考数学一轮复习配套课件:10.2统计图表、数据的数字特征、用样本估计总体(北师大版·数学理)


(3)根据国家标准,污染指数在0~50之间时,空气质量为优; 在51~100之间时,为良;在101~150之间时,为轻微污染; 在151~200之间时,为轻度污染. 请你依据所给数据和上述标准,对该市的空气质量给出一个简 短评价. 【解题指南】首先根据题目中的数据完成频率分布表,作出频 率分布直方图,根据污染指数,确定空气质量为优、良、轻微 污染、轻度污染的天数.
天,占当月天数的 17,超过50%,说明该市空气质量有待进一
30
步改善.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特 征估计总体的基本数字特征,理解用样本估计总体的思想; 5.会用随机抽样的基本方法和样本估计总体的思想解决一些简 单的实际问题.
1.频率分布直方图的应用和平均数、标准差的计算及应用是考 查重点; 2.频率分布等内容经常与概率等知识相结合出题; 3.题型以选择题和填空题为主,与概率交汇则以解答题为主.
【提醒】在画频率分布表或频率分布直方图分组时,取值区间 两端点可根据数据分别向外延伸半个组距.
【例1】对某电子元件进行寿命追踪调查,情况如下:
寿命(h) [100,200) [200,300) [300,400) [400,500) [500,600]
个数
20
30
80
40
30
(1)列出频率分布表; (2)画出频率分布直方图; (3)估计电子元件寿命在[100,400) h以内的概率; (4)估计电子元件寿命在400 h以上的概率.
统计与概率的综合应用 【方法点睛】统计与概率的综合 高考中,对统计知识的考查,往往与概率相结合,考查学生分 析、使用统计图表的能力,抽样方法的操作,概率(尤其是古 典概型)的求解,并进一步解决实际问题.在此类问题中,从统 计图表中准确获取相关信息是解题关键.

2019高考数学一轮复习用样本估计总体02课件


(3)由 x 甲= x 乙,说明甲、乙两战士的平均水平相当;
2 又∵s2 甲>s乙,说明甲战士射击情况波动大,因此乙战士比甲战士
射击情况稳定.
易错警示
统计图表中概念不清、识图不准致误
(5 分)如图所示是某公司(共有员工 300 人)2011 年员工年薪情 况的频率分布直方图,由此可知,员工中年薪在 1.4 万元~1.6 万元之间的共有________人.
2
13)2]=4, 1 2 s 乙 = [(13 - 13)2 + (14 - 13)2 + (12 - 13)2 + (12 - 13)2 + (14 - 5 13)2]=0.8.
2 (2)由 s2 甲>s乙可知乙的成绩较稳定.
从折线图看, 甲的成绩基本呈上升状态, 而乙的成绩上下波动, 可知甲的成绩在不断提高,而乙的成绩则无明显提高.
失误与防范
1.不要把直方图错以为条形图,两者的区别在于条形图是离 散随机变量,纵坐标刻度为频数或频率,直方图是连续随机变 量,纵坐标刻度为频率/组距,这是密度.连续随机变量在某一 点上是没有频率的. 2.几种表示频率分布的方法的优点与不足: (1)频率分布表在数量表示上比较确切,但不够直观、形 象,分析数据分布的总体态势不太方便. (2)频率分布直方图能够很容易地表示大量数据,非常直 观地表明分布的形状,使我们能够看到在分布表中看不清楚的 数据模式.但从直方图本身得不出原始的数据内容,也就是说, 把数据表示成直方图后,原有的具体数据信息就被抹掉了.
用样本的数字特征估计总 体的数字特征
例3 甲乙二人参加某体育项目训练, 近期的五次测试成绩得 分情况如图.
(1)分别求出两人得分的平均数与方差; (2)根据图和上面算得的结果,对两人的训练成绩作出评价.
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第3讲相关性与最小二乘估计、统计案例
1.(2016·陕西省质检)一个频率分布表(样本容量为30)不小心被损坏了一部分,只记得样本中数据在[20,60)上的频率为0.8,则估计样本在[40,50),[50,60)内的数据个数共为( )
A.19 B.17
C.16 D.15
解析:选D.由题意得样本数据在[20,60)内的频数为30×0.8=24,则样本在[40,50)和[50,60)内的数据个数之和为24-4-5=15.
2.(2014·高考广东卷)已知某地区中小学生人数和近视情况分别如图①和图②所示.为了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为( )
A .200,20
B .100,20
C .200,10
D .100,10
解析:选A.该地区中小学生总人数为3 500+2 000+4 500=10 000,则样本容量为10 000×2%=200,其中抽取的高中生近视人数为2 000×2%×50%=20,故选A.
3.(2016·郑州第二次质量检测)
已知甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m 、n
的比值m n
=( ) A .1 B.13
C.29
D.38
解析:选D.由题中茎叶图可知甲的数据为27,30+m 、39,乙的数据为20+n 、32、34、38.由此可知乙的中位数是33,所以甲的中位数也是33,所以m =3.由此可以得出甲的平均数
为33,所以乙的平均数也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38
. 4.(2016·邢台摸底考试)样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其样本方差为( ) A.105 B.305 C. 2 D .2
解析:选D.依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15
(12+02+12+22+22)=2,即所求的样本方差为2.
5.(2016·武汉调研)如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频率为( )
A .0.04
B .0.06
C .0.2
D .0.3
解析:选C.由频率分布直方图的知识得,年龄在[20,25)的频率为0.01×5=0.05,[25,30)
的频率为0.07×5=0.35,设年龄在[30,35),[35,40),[40,45]的频率为x ,y ,z ,又x ,
y ,z 成等差数列,所以可得⎩
⎪⎨⎪⎧x +y +z =1-0.05-0.35,x +z =2y , 解得y =0.2,所以年龄在[35,40)的网民出现的频率为0.2.
6.(2016·济南模拟)100名学生某次数学测试成绩(单位:分)的频率分布直方图如图所示,则测试成绩落在[60,80)中的学生人数是________.
解析:测试成绩落在[60,80)中的学生人数是100×3a +7a 2a +3a +7a +6a +2a
=50. 答案:50
7.在样本的频率分布直方图中,共有4个小长方形,这4个小长方形的面积由小到大构成等比数列{a n },已知a 2=2a 1,且样本容量为300,则小长方形面积最大的一组的频数为________.
解析:因为小长方形的面积由小到大构成等比数列{a n },且a 2=2a 1,
所以样本的频率构成一个等比数列,且公比为2,
所以a 1+2a 1+4a 1+8a 1=15a 1=1,
所以a 1=115
, 所以小长方形面积最大的一组的频数为300×8a 1=160.
答案:160
8.已知x 是1,2,3,x ,5,6,7这七个数据的中位数且1,2,x 2
,-y 这四个数据的平均数为1,则y -1x
的最小值为________. 解析:1+2+x 2-y =4,所以y =x 2-1.由中位数定义知,3≤x ≤5,所以y -1x =x 2-1-1x
.当x ∈[3,5]时,函数y =x 2-1与y =-1x 均为增函数,所以y =x 2-1-1x 为增函数,所以⎝ ⎛⎭
⎪⎫y -1x min
=8-13=233. 答案:233
9.某校高一某班的某次数学测试成绩(满分为100分)的茎叶图和频率分布直方图都受了不同程度的破坏,但可见部分如图,据此解答下列问题:
(1)求分数在[50,60]的频率及全班人数;
(2)求分数在[80,90]之间的频数,并计算频率分布直方图中[80,90]间的矩形的高. 解:(1)分数在[50,60]的频率为0.008×10=0.08.由茎叶图知,分数在[50,60]之间的频数为2,所以全班人数为20.08
=25. (2)分数在[80,90]之间的频数为25-2-7-10-2=4,频率分布直方图中[80,90]间的矩
形的高为425
÷10=0.016. 10.某车间将10名技工平均分成甲、乙两组加工某种零件,在单位时间内每个技工加工的合格零件的统计数据的茎叶图如图所示,已知两组技工在单位时间内加工的合格零件的平均数都为10.
(1)求出m ,n 的值;
(2)求出甲、乙两组技工在单位时间内加工的合格零件的方差s 2甲和s 2
乙,并由此分析两组技工的加工水平.
解:(1)根据题意可知:x -甲=15(7+8+10+12+10+m)=10,x -乙=15
(9+n +10+11+12)=10,所以n =8,m =3.
(2)s 2甲=15
[(7-10)2+(8-10)2+(10-10)2+(12-10)2+(13-10)2]=5.2,
s 2乙=15
[(8-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2]=2, 因为x -甲=x -乙,s 2甲>s 2乙,所以甲、乙两组的整体水平相当,乙组技工更稳定一些.。

相关文档
最新文档