2022届高考数学统考一轮复习第9章统计与统计案例第2节用样本估计总体教师用书教案理新人教版.doc
![2022届高考数学统考一轮复习第9章统计与统计案例第2节用样本估计总体教师用书教案理新人教版.doc](https://img.360docs.net/imge3/1qkdnzhjg2p7zho71ytadcbrj4m7fmwf-31.webp)
![2022届高考数学统考一轮复习第9章统计与统计案例第2节用样本估计总体教师用书教案理新人教版.doc](https://img.360docs.net/imge3/1qkdnzhjg2p7zho71ytadcbrj4m7fmwf-62.webp)
用样本估计总体
[考试要求] 1.了解分布的意义与作用,能根据频率分布表画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点.
2.理解样本数据标准差的意义和作用,会计算数据标准差.
3.能从样本数据中提取基本的数字特征(如平均数、标准差),并做出合理的解释.
4.会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征.理解用样本估计总体的思想,会用样本估计总体的思想解决一些简单的实际问题.
1.常用统计图表
(1)作频率分布直方图的步骤:
①求极差(即一组数据中最大值与最小值的差).
②决定组距与组数.
③将数据分组.
④列频率分布表.
⑤画频率分布直方图.
(2)频率分布直方图:反映样本频率分布的直方图(如图)
横轴表示样本数据,纵轴表示频率
组距
,每个小矩形的面积表示样本数据落在该组内的频
率.各小矩形的面积和为1.
(3)频率分布折线图和总体密度曲线
①频率分布折线图:将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起来,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频
率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.
(4)茎叶图的画法步骤:
第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的右(左)侧. 2.样本的数字特征 (1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数. (2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数. (3)平均数:把x =x 1+x 2+…+x n n
称为x 1,x 2,…,x n 这n 个数的平均数. (4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x ,则这组数据的标准差和方差分别是
s =1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2]; s 2=1n
[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. [常用结论]
1.频率分布直方图中的常见结论
(1)众数的估计值为最高矩形的中点对应的横坐标.
(2)平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(3)中位数的估计值的左边和右边的小矩形的面积和是相等的.
2.平均数、方差的公式推广
(1)若数据x 1,x 2,…,x n 的平均数为x ,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x +a .
(2)数据x 1,x 2,…,x n 的方差为s 2.
①数据x 1+a ,x 2+a ,…,x n +a 的方差也为s 2;
②数据ax 1,ax 2,…,ax n 的方差为a 2s 2.
一、易错易误辨析(正确的打“√”,错误的打“×”)
(1)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.
( )
(2)一组数据的方差越大,说明这组数据越集中. ( ) (3)频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间的频率越高.
( )
(4)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.
( )
[答案] (1)√ (2)× (3)√ (4)×
二、教材习题衍生
1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为( )
A .4
B .8
C .12
D .16
B [设频数为n ,则n 32=0.25, ∴n =32×0.25=8.]
2.若某校高一年级8个班参加合唱比赛的得分分别为87,89,90,91,92,93,94,96,则这组数据的中位数和平均数分别是( )
A .91.5和91.5
B .91.5和92
C .91和91.5
D .92和92 A [∵这组数据为87,89,90,91,92,93,94,96,∴中位数是91+922
=91.5, 平均数x =87+89+90+91+92+93+94+968
=91.5.] 3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有 人.
25 [0.5×0.5×100=25.]
考点一 样本的数字特征的计算与应用
利用样本的数字特征解决决策问题的依据
(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.
(2)方差的简化计算公式:s 2=1n [(x 21+x 22+…+x 2n )-n x 2],或写成s 2=1n
(x 21+x 22+…+x 2n )-x 2,即方差等于原数据平方的平均数减去平均数的平方.
这8个数的平均数为x ,方差为s 2,则( )
A .x =4,s 2<2
B .x =4,s 2>2
C .x >4,s 2<2
D .x >4,s 2>2 A [∵某7个数的平均数为4,∴这7个数的和为4×7=28,∵加入一个新数据4,∴x =28+48
=4.又∵这7个数的方差为2,且加入一个新数据4,∴这8个数的方差s 2=7×2+(4-4)28=74
<2,故选A .] 2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )
甲 乙
A .甲的成绩的平均数小于乙的成绩的平均数
B .甲的成绩的中位数等于乙的成绩的中位数
C .甲的成绩的方差小于乙的成绩的方差
D .甲的成绩的极差小于乙的成绩的极差
C [根据条形统计图可知甲的中靶情况为4环、5环、6环、7环、8环;乙的中靶情况
为5环、5环、5环、6环、9环.x
甲=15(4+5+6+7+8)=6,x 乙=15
(5×3+6+9)=6,甲的成绩的方差为 (4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)25
=2, 乙的成绩的方差为(5-6)2×3+(6-6)2+(9-6)25
=2.4;甲的成绩的极差为4环,乙的成绩的极差为4环;甲的成绩的中位数为6环,乙的成绩的中位数为5环,综上可知C 正确,故选C .]
3.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( )
A .1
B .2
C .3
D .4
D [由题意可知
??? 15(x +y +10+11+9)=10,
15[(x -10)2+(y -10)2+1+1]=2,∴?????
x +y =20,x 2+y 2=208. ∴(x +y )2=x 2+y 2+2xy ,即208+2xy =400,∴xy =96.
∴(x -y )2=x 2+y 2-2xy =16,
∴|x -y |=4,故选D .]
4.(2020·全国卷Ⅰ)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A ,B ,C ,D 四个等级.加工业务约定:对于A 级品、B 级品、C 级品,厂家每件分别收取加工费90元,50元,20元;对于D 级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表
(1)
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
[解] (1)由试加工产品等级的频数分布表知,
甲分厂加工出来的一件产品为A 级品的概率的估计值为40100=0.4; 乙分厂加工出来的一件产品为A 级品的概率的估计值为28100
=0.28. (2)由数据知甲分厂加工出来的100件产品利润的频数分布表为
利润 65 25 -5 -75
频数 40 20 20 20
因此甲分厂加工出来的100件产品的平均利润为65×40+25×20-5×20-75×20100
=15. 由数据知乙分厂加工出来的100件产品利润的频数分布表为
利润 70 30 0 -70
频数 28 17 34
21 因此乙分厂加工出来的70×28+30×17+0×34-70×21100
=10. 比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务.
考点二 茎叶图
1.茎叶图的三个关注点
(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.
(2)重复出现的数据要重复记录,不能遗漏.
(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.注意“叶”中数不一定按大小次数排列.
2.利用茎叶图解题的关键是抓住“叶”的分布特征,准确从中提炼信息.
3.以茎叶图为载体,一般考查中位数、平均数、方差.
开展了一次诗词默写比赛,班里40名学生得分数据的茎叶图如图所示.若规定得分不小于85分的学生得到“诗词达人”的称号,小于85分且不小于70分的学生得到“诗词能手”的称号,其他学生得到“诗词爱好者”的称号,根据该次比赛的成绩,按照称号的不同进行分层
抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为()
A.2 B.4 C.5 D.6
A[由茎叶图可得,获“诗词达人”称号的有8人,据该次比赛的成绩按照称号的不同
=2(人).]进行分层抽样抽选10名学生,则抽选的学生中获得“诗词达人”称号的人数为8×10
40
2.(2020·长沙质检)为比较甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:℃)制成如图所示的茎叶图,已知甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,则甲地该月11时的平均气温的标准差为()
A.2 B. 2 C.10 D.10
B[甲地该月5天11时的气温数据(单位:℃)为28,29,30,30+m,32;
乙地该月5天11时的气温数据(单位:℃)为26,28,29,31,31,
则乙地该月11时的平均气温为(26+28+29+31+31)÷5=29(℃),
所以甲地该月11时的平均气温为30 ℃,
故(28+29+30+30+m+32)÷5=30,解得m=1.
则甲地该月11时的平均气温的标准差为
1
2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]
5×[(28-30)
= 2.]
3.空气质量指数(Air Qualit y Inde x,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为(该年为365天).
146 [该样本中AQI 大于100的频数是4,频率为25, 由此估计该地全年AQI 大于100的频率为25
, 估计此地该年AQI 大于100的天数约为365×25
=146.] 考点三 频率分布直方图
频率、频数、样本容量的计算方法
(1)频率组距
×组距=频率. (2)频数样本容量=频率,频数频率
=样本容量,样本容量×频率=频数. 分钟仰卧起坐的成绩(次数),将数据整理后绘制成如图所示的频率分布直方图,根据统计图的数据,下列结论错误的是( )
A .该校九年级学生1分钟仰卧起坐的次数的中位数为26.25
B .该校九年级学生1分钟仰卧起坐的次数的众数为27.5
C .该校九年级学生1分钟仰卧起坐的次数超过30的人数约为320
D .该校九年级学生1分钟仰卧起坐的次数少于20的人数约为32
(2)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A ,B 两组,每组100只,其中A 组小鼠给服甲离子溶液,B 组小鼠给服乙离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比,根据试验数据分别得到如下直方图:
甲离子残留百分比直方图
乙离子残留百分比直方图
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
①求乙离子残留百分比直方图中a,b的值;
②分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
(1)D[由频率分布直方图可知,中位数是频率分布直方图面积等分线对应的数值,是26.25;众数是最高矩形的中间值27.5;1分钟仰卧起坐的次数超过30的频率为0.2,所以估计1分钟仰卧起坐的次数超过30的人数为320;1分钟仰卧起坐的次数少于20的频率为0.1,所以估计1分钟仰卧起坐的次数少于20的人数为160.故选D.]
(2)[解]①由已知得0.70=a+0.20+0.15,故
a=0.35.
b=1-0.05-0.15-0.70=0.10.
②甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
点评:(1)频率分布直方图的纵坐标是频率组距
,而不是频率,切莫与条形图混淆. (2)频率分布直方图考查时,重视求平均数、中位数、方差,计算要准确,解决突破口是各个矩形面积之和为1.
[跟进训练]
1.为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,由于不慎将部分数据丢失,但知道后5组频数和为62,设视力在
4.6到4.8之间的学生数为a ,最大频率为0.32,则a 的值为( )
A .64
B .54
C .48
D .27
B [前两组中的频数为100×(0.05+0.11)=16.因为后五组频数和为62,所以前三组为38.所以第三组频数为22.又最大频率为0.32,对应的最大频数为0.32×100=32.所以a =22+32=54.]
2.(2020·石家庄模拟)“一带一路”是“丝绸之路经济带”和“21世纪海上丝绸之路”的简称.某市为了了解人们对“一带一路”的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分为100分(90分及以上为认知程度高).现从参赛者中抽取了x 人,按年龄分成5组,第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45],得到如图所示的频率分布直方图,已知第一组有6人.
(1)求x ;
(2)求抽取的x 人的年龄的中位数(结果保留整数);
(3)从该市大学生、军人、医务人员、工人、个体户五种人中用分层抽样的方法依次抽取6人,42人,36人,24人,12人,分别记为1~5组,从这5个按年龄分的组和5个按职业分的组中每组各选派1人参加知识竞赛,分别代表相应组的成绩,年龄组中1~5组的成绩分
别为93,96,97,94,90,职业组中1~5组的成绩分别为93,98,94,95,90.
(ⅰ)分别求5个年龄组和5个职业组成绩的平均数和方差;
(ⅱ)以上述数据为依据,评价5个年龄组和5个职业组对“一带一路”的认知程度,并谈谈你的感想.
[解] (1)根据频率分布直方图得第一组的频率为0.01×5=0.05,
∴6x
=0.05,∴x =120. (2)设中位数为a ,则0.01×5+0.07×5+(a -30)×0.06=0.5,
∴a =953
≈32,则中位数为32. (3)(ⅰ)5个年龄组成绩的平均数为x 1=15×(93+96+97+94+90)=94,方差为s 21=15
×[(-1)2+22+32+02+(-4)2]=6.
5个职业组成绩的平均数为x 2=15×(93+98+94+95+90)=94,方差为s 22=15
×[(-1)2+42+02+12+(-4)2]=6.8.
(ⅱ)从平均数来看两组的认知程度相同,从方差来看年龄组的认知程度更稳定(感想合理即可).