高考数学第65讲用样本估计总体
5.1.4 高中必修二数学教案《用样本估计总体》

高中必修二数学教案《用样本估计总体》教材分析义务教育阶段,学生学习了统计内容,对数据统计全过程有所体验。
高中阶段要求进一步培养学生的随机思想,发展学生的统计观念。
其中包括:统计意识、统计方法及对统计结果的正确认识。
本节课《用样本估计总体》是抽样方法及数据的数字特征内容后的又一重要内容,通过本节课的学习,学生进一步掌握了对样本数据处理的重要方法之一——画频率分布直方图,以及用样本估计总体的思想,同时为学生在后续学习统计案例和应用统计知识解决实际问题打下良好的基础。
学情分析学生在初中就知道了分布的初步概念,在前面也刚学习过概率及抽样的相关知识,对用样本估计总体有一定的认识,对用表和图来反映知识有很强的意识,具有一定的作图能力和较为周全的分析问题能力,而学生的理解能力不足,发现问题能力上可能很难满足本节课的要求。
但学生对新知识兴趣高,肯下功夫,思维活跃,会为本节课的顺利推进提供一定的保障。
教学目标1、通过实例理解样本数据标准差的意义和作用,学会计算数据标准差。
2、进一步体会用样本估计总体的思想,会用样本的基本数字特征估计总体的基本数字特征;初步体会样本频率分布和数字特征的随机性。
教学重点用样本的数字特征估计总体的数字特征、通过频率分布或频率分布直方图对数据作出总体估计。
教学难点通过频率分布或频率分布直方图,对数据作出总体估计。
教学方法讲授法、讨论法、练习法教学过程一、情境导学以下是某学校高一年级98位学生的身高(单位:cm);已知这组数的总体平均数为163.5,总体方差为56.3。
用简单随机抽样的方法,从总体中抽取容量为10的样本3次,分别计算样本平均数与样本方差,并与总体对应的值进行比较。
二、学习新知1、用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。
特别地,样本平均值(也称为样本均值)、方差(也称为样本方差)与总体对应的值相差不会太大。
用样本估计总体 - 简单 -讲义

用样本估计总体知识讲解一、用样本的频率分布估计总体的频率分布1.频率分布直方图1)列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且=极差组距组数; ③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图。
2)频率分布直方图的特点: ①==⨯频率小长方形的面积组距频率组距②个小长方形的面积等于1, ③1==频率小长方形的高,所有小长方形的高的和组距组距. 3)频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义. 4)总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.2.茎叶图1)制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出. 2)茎叶图的优点:①没有原始信息的损失,所有的数据信息都可以从茎叶图中得到; ②茎叶图可以在比赛时随时记录,方便记录与表示二、用样本的数字特征估计总体的数字特征1.用样本的平均数估计总体平均数1)众数:在样本数据中,出现次数最多的那个数据;2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,若样本数据个数为偶数,则取中间两个数据的平均数作为中位数。
2020届高考数学总复习《用样本估计总体》

2020届高考数学总复习《用样本估计总体》1.统计图表(1)频率分布直方图的画法步骤①求极差(即一组数据中最大值与最小值的差); ②决定组距与组数; ③将数据分组; ④列频率分布表; ⑤画频率分布直方图.(2)频率分布折线图和总体密度曲线①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图;②总体密度曲线:随着样本容量的增加,作图时所分组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.(3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列; 第三步:将各个数据的叶依次写在其茎的两侧. 2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n 个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a 1+a 2+…+a n n称为a 1,a 2,…,a n 这n 个数的平均数.(4)标准差与方差:设一组数据x 1,x 2,x 3,…,x n 的平均数为x -,则这组数据的标准差和方差分别是s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2], s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2].常用知识拓展1.若x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,…,mx n +a 的平均数为m x -+a .2.数据x 1,x 2,…,x n 与数据x ′1=x 1+a ,x ′2=x 2+a ,…,x ′n =x n +a 的方差相等,即数据经过平移后方差不变.3.若x 1,x 2,…,x n 的方差为s 2,那么ax 1+b ,ax 2+b ,…,ax n +b 的方差为a 2s 2. 4.s 2=1n ∑i =1n (x i -x -)2=1n ∑i =1n x 2i -x -2,即各数平方的平均数减去平均数的平方.判断正误(正确的打“√”,错误的打“×”)(1)一组数据的方差越大,说明这组数据的波动越大.( )(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( ) (4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.( )(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.( ) 答案:(1)√ (2)√ (3)× (4)√ (5)√(2017·高考全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( ) A .月接待游客量逐月增加 B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月份D .各年1月至6月的月接待游客量相对7月至12月,波动性更小,变化比较平稳 解析:选A.根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A 错误.贵阳地铁1号线12月28日开通运营,某辆机车某时刻从下麦西站驶往贵阳北站的过程中,10个车站上车的人数统计如下:70、60、60、50、60、40、40、30、30、10,则这组数据的众数、中位数、平均数的和为( )A .170B .165C .160D .150解析:选D.将这组数据从小到大排列:10、30、30、40、40、50、60、60、60、70,易知其众数为60,中位数为45,平均数为45,故众数、中位数、平均数的和为150.故选D.我市某校组织学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.解析:依题意得,成绩低于60分的相应的频率等于(0.005+0.01)×20=0.3,所以该班的学生人数是15÷0.3=50.答案:50从某选手的7个得分中去掉1个最高分,去掉1个最低分后,剩余5个得分的平均数为91分,如图所示是该选手得分的茎叶图,其中有一个数字模糊,无法辨认,在图中用x 表示,则剩余5个得分的方差为________.解析:由茎叶图知,最低分为87分,最高分为99分.依题意得,15×(87+93+90+9×10+x +91)=91,解得x =4.则剩余5个得分的方差s 2=15×[(87-91)2+(93-91)2+(90-91)2+(94-91)2+(91-91)2]=15×(16+4+1+9)=6.答案:6样本的数字特征(典例迁移)(1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差(2)(2019·盐城模拟)已知一组数据x 1,x 2,x 3,x 4,x 5的方差是2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的标准差为________.【解析】 (1) x -甲=15×(4+5+6+7+8)=6,x -乙=15×(5×3+6+9)=6,甲的成绩的方差为15×(22×2+12×2)=2,乙的成绩的方差为15×(12×3+32×1)=2.4.故选C.(2)由s 2=1n i =1n (x i -x -)2=2,则数据2x 1,2x 2,2x 3,2x 4,2x 5的方差是8,标准为2 2.【答案】 (1)C (2)2 2[迁移探究] (变条件)本例(2)增加条件“x 1,x 2,x 3,x 4,x 5的平均数为2”,求数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数和方差.解:数据2x 1+3,2x 2+3,2x 3+3,2x 4+3,2x 5+3的平均数为2×2+3=7,方差为22×2=8.(1)众数、中位数、平均数及方差的意义①平均数与方差都是重要的数字特征,是对总体的一种简明地描述; ②平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. (2)在计算平均数、方差时可利用平均数、方差的有关结论.1.已知样本数据x 1,x 2,…,x n 的均值x -=5,则样本数据2x 1+1,2x 2+1,…,2x n+1的均值为________.解析:由条件知x -=x 1+x 2+…+x n n =5,则所求均值x -0=2x 1+1+2x 2+1+…+2x n +1n=2(x 1+x 2+…+x n )+n n=2x -+1=2×5+1=11.答案:112.一组数据1,10,5,2,x ,2,且2<x <5,若该数据的众数是中位数的23倍,则该数据的方差为________.解析:根据题意知,该组数据的众数是2,则中位数是2÷23=3,把这组数据从小到大排列为1,2,2,x ,5,10, 则2+x2=3, 解得x =4,所以这组数据的平均数为x -=16×(1+2+2+4+5+10)=4,方差为s 2=16×[(1-4)2+(2-4)2×2+(4-4)2+(5-4)2+(10-4)2]=9.答案:9茎叶图(师生共研)(2017·高考山东卷)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7【解析】 根据两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以56+62+65+74+(70+x )5=59+61+67+(60+y)+785,解得x=3.故选A.【答案】 A茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.1.(2019·贵州遵义航天高中模拟)某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117 B.118C.118.5 D.119.5解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.2.某省为了抽选运动员参加“国际马拉松比赛”,将35名运动员的一次马拉松比赛成绩(单位:分钟)制成茎叶图,如图所示.若将运动员按成绩由好到差编号,再用系统抽样的方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人数为()A.6 B.5。
2019-2020年高考数学一轮复习第十章算法初步课时达标65用样本估计总体

2019-2020年高考数学一轮复习第十章算法初步课时达标65用样本估计总体[解密考纲]用样本估计总体在高考中,三种题型均有可能考查,作为解答题时,题目较简单,属于不能失分的题目.一、选择题1.某班的全体学生参加英语测试,成绩的频率分布直方图如图,数据的分组依次为[20,40),[40,60),[60,80),[80,100].若低于60分的人数是15,则该班的学生人数是( B )A .45B .50C .55D .60解析 根据频率分布直方图,低于60分的同学所占频率为(0.005+0.01)×20=0.3,故该班的学生人数为150.3=50(人),故选B .2.某公司10位员工的月工资(单位:元)为x 1,x 2,…,x 10,其平均数和方差分别为x 和s 2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为( D )A .x ,s 2+1002B .x +100,s 2+1002C .x ,s2 D .x +100,s 2解析 对平均数和方差的意义深入理解可巧解,因为每个数据都加上了100,故平均数也增加100,而离散程度应保持不变,故选D .3.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率分布直方图,估计这批产品的中位数为( C )A .20B .25C.22.5 D.22.75解析产品的中位数出现在概率是0.5的地方,自左至右各小矩形面积依次为0.1,0.2,0.4,0.15,0.15,设中位数是x,则由0.1+0.2+0.08·(x-20)=0.5,得x=22.5,故选C.4.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有( D)A.a>b>c B.b>c>aC.c>a>b D.c>b>a解析平均数a=110×(15+17+14+10+15+17+17+16+14+12)=14.7,中位数b =15,众数c=17,∴c>b>a.5.(2017·全国卷Ⅲ)某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( A)A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳解析根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A项错误.6.下面左图是某学习小组学生数学考试成绩的茎叶图,1号到16号同学的成绩依次为A1,A2,…,A16,右图是统计茎叶图中成绩在一定范围内的学生人数的算法流程图,那么该算法流程图输出的结果是( B)A .6B .10C .91D .92解析 由算法流程图可知,其统计的是数学成绩大于等于90的人数,所以由茎叶图知,数学成绩大于等于90的人数为10,因此输出结果为10,故选B .二、填空题7.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为__10__.解析 设5个班级的人数分别为x 1,x 2,x 3,x 4,x 5, 则x 1+x 2+x 3+x 4+x 55=7,x 1-2+x 2-2+x 3-2+x 4-2+x 5-25=4,即5个整数平方和为20,最大的数比7大但与7的差值不能超过3,否则方差超过4,故最大值为10,最小值为4.8.如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为__6.8__.⎪⎪⎪018 90 3 5解析 ∵x =8+9+10+13+155=11,∴s 2=-2+-2+-2+-2+-25=6.8.9.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:cm),所得数据均属于区间[80,130],其频率分布直方图如图所示,则在60株树木中底部周长小于100 cm 的株数为__24__.解析 由题意,在抽测的60株树木中,底部周长小于100 cm 的株数为(0.015+0.025)×10×60=24.三、解答题10.为迎接6月6日的“全国爱眼日”,某高中学生会从全体学生中随机抽取16名学生,经校医用视力表检查得到每个学生的视力状况的茎叶图(以小数点前的一位数字为茎,小数点后的一位数字为叶)如图,若视力测试结果不低于5.0,则称为“好视力”.(1)写出这组数据的众数和中位数;(2)从这16人中随机选取3人,求至少有2人是“好视力”的概率;(3)以这16人的样本数据来估计整个学校的总体数据,若从该校(人数很多)任选3人,记X 表示抽到“好视力”学生的人数,求X 的分布列及数学期望.解析 (1)由题意知众数为4.6和4.7,中位数为4.75.(2)记“至少有2人是‘好视力’”为事件A ,则事件A 包含的基本事件个数为C 24·C 112+C 34,总的基本事件个数为C 316,故P (A )=C 24·C 112+C 34C 316=19140. (3)X 的所有可能取值为0,1,2,3.由于该校人数很多,故X 近似服从二项分布B ⎝ ⎛⎭⎪⎫3,14.P (X =0)=⎝ ⎛⎭⎪⎫343=2764,P (X =1)=C 13×14×⎝ ⎛⎭⎪⎫342=2764, P (X =2)=C 23×⎝ ⎛⎭⎪⎫142×34=964,P (X =3)=⎝ ⎛⎭⎪⎫143=164, 则X 的分布列为故X 的数学期望E (X )=3×14=34.11.随着现代高等级公路的迅速发展,公路绿化苗木消费量剧增.某林场在某城市的零售店分析往年“美人梅”的零售情况,作出相关的统计与分析,按照日零售量[50,100),[100,150),[150,200),[200,250]分成4组,并制作了日零售量的频率分布直方图,如图所示(假设每天的零售量相互独立,且日零售量落入各组的频率视为概率).(1)求图中a 的值;(2)求从明日开始的连续4天中,有2天的日零售量少于150株而另外2天的日零售量不少于200株的概率;(3)用X 表示从明日开始的连续4天里日零售量不少于150株的天数,求随机变量X 的分布列和数学期望.解析 (1)第一个小矩形的面积为1-(0.005+0.006+0.007)×50=0.1,则a =0.150=0.002.(2)设日零售量为x ,有2天日零售量少于150株,另外2天日零售量不少于200株为事件A .则P (x <150)=0.002×50+0.006×50=0.4,P (x ≥200)=0.005×50=0.25,∴P (A )=C 24×0.42×0.252=0.06.(3)由(2)知,日零售量不少于150株的概率P =1-0.4=0.6,则X ~B (4,0.6), 于是P (X =k )=C k4·0.6k·0.44-k(k =0,1,2,3,4),则关于随机变量X 的分布列为∴E (X )=0×625+1×625+2×625+3×625+4×625=2.4.12.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[40,50),[50,60),…,[80,90),[90,100].(1)求频率分布直方图中a 的值;(2)估计该企业的职工对该部门评分不低于80的概率;(3)从评分在[40,60)的受访职工中,随机抽取2人,求此2人评分都在[40,50)的概率. 解析 (1)因为(0.004+a +0.018+0.022×2+0.028)×10=1,所以a =0.006. (2)由所给频率分布直方图知,50名受访职工评分不低于80的频率为(0.022+0.018)×10=0.4,所以该企业职工对该部门评分不低于80的概率的估计值为0.4.(3)受访职工中评分在[50,60)的有50×0.006×10=3(人),记为A 1,A 2,A 3; 受访职工中评分在[40,50)的有50×0.004×10=2(人),记为B 1,B 2.从这5名受访职工中随机抽取2人,所有可能的结果共有10种,它们是{A 1,A 2},{A 1,A 3},{A 1,B 1},{A 1,B 2},{A 2,A 3},{A 2,B 1},{A 2,B 2},{A 3,B 1},{A 3,B 2},{B 1,B 2},又因为所抽取2人的评分都在[40,50)的结果有1种,即{B 1,B 2},故所求的概率为P =110.。
高中数学必修3用样本估计总体(高三第一轮复习)PPT

● [规律方法] ● (1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征. ● (2)中位数是样本数据居中的数. ● (3)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据越分散,
标准差、方差越小,数据越集中.
●
[跟踪训练]
●
3.(2012·山东高考)在某次测量中得到的A样本数据如下:82,84,84,86,86,86,
样本的数字特征 [典题导入]
(1)(2012·江西高考)样本(x1,x2,…,xn)的平均数为-x ,
样本(y1,y2,…,ym)的平均数为-y (-x ≠-y ).若样本(x1,x2,…, xn,y1,y2,…,ym)的平均数-z =α-x +(1-α)-y ,其中 0<α<12,则
n,m 的大小关系为
(2)(0.003 6+0.006 0+0.004 4)×50×100=70.
答案 (1)0.004 4 (2)70
茎叶图的应用
● [典题导入]
●
(2012·陕西高考)从甲、乙两个城市分别随机抽取16台
自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图
所示).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别 为m甲、m乙,则
● [跟踪训练]
● 1.(2013·湖北高考)从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至 350度之间,频率分布直方图如图所示.
(1)直方图中x的值为________;
(2)在这些用户中,用电量落在区间[100,250)内的 户数为________.
解析 (1)根据频率和为1,得(0.002 4+0.003 6+ 0.006 0+x+0.002 4+0.001 2)×50=1,解得x= 0.004 4;
2020高三数学一轮复习(人教版理):课时作业65用样本估计总体

8个数的平均数为-x ,方差为s2,则( )
A.-x =4,s2<2
B.-x =4,s2>2
C.-x >4,s2<2
D.-x >4,s2>2
解析 因为某7个数的平均数为4,所以这7个数的和为4×7=28,因
为加入一个新数据4,所以
-x
=
28+4 8
=4,又因为这7个数的方差为2,且
加入一个新数据4,所以这8个数的方差s2=7×2+84-42=47<2。故选A。
ξ0 1 2
P
2 5
81 15 15
所以数学期望E(ξ)=0×52+1×185+2×115=23。
能力提升组 13.(2019·湖北部分重点中学模拟)某商场对某一商品搞活动,已知该 商品每一个的进价为3元,销售价为8元,每天售出的第20个及之后的半价 出售。该商场统计了近10天这种商品的销量,如图所示,设x(个)为每天商 品的销量,y(元)为该商场每天销售这种商品的利润。从日利润不少于96元 的几天里任选2天,则选出的这2天日利润都是97元的概率为( )
答案 C
4.样本中共有五个个体,其值分别为0,1,2,3,m。若该样本的平均值 为1,则其方差为( )
A.
10 5
C. 2
B.
30 5
D.2
解析
依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=
1 5
(12+02
+12+22+22)=2,即所求的样本方差为2。故选D。
答案 D
5.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这
(3)已知这种植物果实重量不低于32.5克的即为优质果实,用样本估计 总体。若从这种植物果实中随机抽取3个,其中优质果实的个数为X,求X 的分布列和数学期望E(X)。
2020版高考数学一轮复习(六十五)随机抽样与用样本估计总体(含解析)
课时跟踪检测(六十五)随机抽样与用样本估计总体一、题点全面练1。
(2018·石家庄模拟)某校一年级有男生560人,女生420人,用分层抽样的方法从该年级全体学生中抽取一个容量为140的样本,则此样本中男生人数为()A。
80 B。
120C。
160 D。
240解析:选A 因为男生和女生的比例为560∶420=4∶3,样本容量为140,所以应该抽取男生的人数为140×错误!=80,故选A.2。
一个总体中有600个个体,随机编号为001,002, (600)利用系统抽样方法抽取容量为24的一个样本,总体分组后在第一组随机抽得的编号为006,则在编号为051~125之间抽得的编号为( )A。
056,080,104 B。
054,078,102C.054,079,104D.056,081,106解析:选D 系统抽样的间隔为错误!=25,编号为051~125之间抽得的编号为006+2×25=056,006+3×25=081,006+4×25=106.3。
(2019·天水模拟)甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为x甲,x乙,标准差分别为s甲,s乙,则( )A。
错误!甲<错误!乙,s甲<s乙B.错误!甲<错误!乙,s甲>s乙C.错误!甲>错误!乙,s甲<s乙D。
错误!甲>错误!乙,s甲>s乙解析:选C 由图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知错误!甲>x乙。
图中数据显示甲同学的成绩比乙同学稳定,故s甲<s乙.4.(2019·中山模拟)某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为( )A。
10万元 B.12万元C。
15万元D。
30万元解析:选D 由图知,9时至10时的销售额频率为0。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
高中数学知识点高考资料高考历年考试真题 第65讲 用样本估计总体
考纲要求 考情分析 命题趋势 1.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点. 2.理解样本数据标准差的意义和作用并会计算. 3.能从样本数据中提取基本的数字特征(如平均数、标准差),并给出合理的解释. 4.会用样本的频率分布估计总体分布,会用样本数字特征估计总体的数字特征,理解用样本估计总体的思想. 2016·山东卷,3 2016·四川卷,16 2015·全国卷Ⅱ,18 2015·重庆卷,3 2015·安徽卷,6 根据样本数据求基本的数字特征,利用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题. 分值:5~12分
1.频率分布直方图和茎叶图 (1)作频率分布直方图的步骤 ①求极差(即一组数据中__最大值__与__最小值__的差); ②决定__组距__与__组数__; ③将数据__分组__; ④列__频率分布表__; ⑤画__频率分布直方图__. (2)频率分布折线图和总体密度曲线 ①频率分布折线图:连接频率分布直方图中各小长方形上端的__中点__,就得到频率分布折线图. ②总体密度曲线:随着样本容量的增加,作图时__所分的组数__增加,__组距__减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线. (3)茎叶图的优点 茎叶图的优点是可以__保留__原始数据,而且可以__随时__记录,这对数据的记录和表示都能带来方便. 2.样本的数字特征 (1)众数、中位数、平均数 高中数学知识点高考资料高考历年考试真题 数字特征 定义与求法 优点与缺点
众数 一组数据中重复出现次数__最多__的数 众数通常用于描述变量的值出现次数最多的数,但显然它对其他数据信息的忽视使得无法客观地反映总体特征
中位数 把一组数据按__从小到大的__顺序排列,处在__中间__位置的一个数据(或两个数据的平均数)
中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点
平均数 如果有n个数据x1,x2,…,xn,那么这n个数的平均数x=__x1+x2+…+xnn__ 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低 (2)标准差、方差 ①标准差:样本数据到平均数的一种平均距离,一般用s表示,
s=__1n[x1-x2+x2-x2+…+xn-x2]__. ②方差:标准差的平方 s2=__1n[(x1-x)2+(x2-x)2+…+(xn-x)2]__, 其中xi(i=1,2,3,…,n)是__样本数据__,n是__样本容量__,x是__样本平均数__. (3)平均数、方差公式的推广 若数据x1,x2,…,xn的平均数为x,方差为s2,则数据mx1+a,mx2+a,…,mxn+a的平均数为mx+a,方差为m2s2.
1.思维辨析(在括号内打“√”或打“×”). (1)在频率分布直方图中,小矩形的高表示频率.( × ) (2)茎叶图一般左侧的叶按从大到小的顺序写,右侧的叶按从小到大的顺序写,相同的数据可以只记一次.( × ) (3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( √ ) (4)在频率分布直方图中,众数左边和右边的小长方形的面积和是相等的.( × ) (5)一组数据的方差越大,说明这组数据的波动越大.( √ ) 高中数学知识点高考资料高考历年考试真题 解析 (1)在频率分布直方图中,小矩形的高为频率/组距. (2)茎叶图中,相同的数据要重复记,故错误. (3)由众数概念知结论正确. (4)在频率分布直方图中,中位数左边和右边的小长方形面积和相等,故错误. (5)由方差定义和结论知正确. 2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 ( A )
A.91.5和91.5 B.91.5和92 C.91和91.5 D.92和92
解析 将这组数据从小到大排列,得87,89,90,91,92,93,94,96.故中位数为91+922=91.5,
平均数为x=87+89+90+91+92+93+94+968=91.5. 3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有__25__人.
解析 由图可知,在[2,2.5)范围内的居民人数有100×0.5×(2.5-2)=25. 4.一个容量为200的样本的频率分布直方图如图所示,则样本数据落在[5,9)内的频率和频数分别为__0.2,40__.
解析 由图可知,落在[5,9)内的频率为0.05×(9-5)=0.2,频数为200×0.2=40. 5.某赛季甲、乙两名篮球运动员每场比赛得分记录用茎叶图表示,从茎叶图的分布情况看,__乙__运动员的发挥更稳定. 高中数学知识点高考资料高考历年考试真题 解析 由茎叶图可知,乙运动员的得分大部分集中在30~40之间,而甲运动员的得分相对比较分散且在低分区的较多,故乙比赛得分更稳定.
一 频率分布直方图及其应用 (1)已知频率分布直方图中的部分数据,求其他数据.可根据频率分布直方图中的数据求出样本与整体的关系,利用频率和等于1就可求出其他数据. (2)已知频率分布直方图,求某种范围内的数据,可利用图形及已知范围结合求解. 【例1】 (2016·四川卷)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.
(1)求直方图中a的值; (2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由; (3)估计居民月均用水量的中位数. 解析 (1)由频率分布直方图,可知月均用水量在[0,0.5)的频率为0.08×0.5=0.04.同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02. 由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a+0.5×a,解得a=0.30. (2)由(1)知,100位居民月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12,由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000. (3)设中位数为x吨. 因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之高中数学知识点高考资料高考历年考试真题 和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x<2.5.由0.50×(x-2)=0.5-0.48,解得x=2.04.故可估计居民月均用水量的中位数为2.04吨. 二 茎叶图及其应用
由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示;其缺点是当样本容量较大时,作图较繁琐. 【例2】 在科普知识竞赛前的培训活动中,将甲、乙两名学生的6次培训成绩(百分制)制成如图所示的茎叶图.
(1)若从甲、乙两名学生中选择1人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由; (2)若从学生甲的6次培训成绩中随机选择2个,记选到的分数超过87分的个数为ξ,求ξ的分布列和数学期望.
解析 (1)学生甲的平均成绩x甲=68+76+79+86+88+956=82,学生乙的平均成绩x
乙=71+75+82+84+86+946=82, 又s2甲=16[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77, s2乙=16[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673. 则x甲=x乙,s2甲>s2乙, 说明甲、乙的平均水平一样,但乙的方差小,则乙发挥更稳定,故应选择学生乙参加知识竞赛. (2)ξ的所有可能取值为0,1,2,则
P(ξ=0)=C24C26=25,P(ξ=1)=C14C12C26=815,P(ξ=2)=C22C26=115, 则ξ的分布列为 ξ 0 1 2 P 错误错误错误
所以数学期望E(ξ)=0×25+1×815+2×115=23. 高中数学知识点高考资料高考历年考试真题 三 样本的数字特征及其应用 平均数和方差都是重要的数字特征,是对总体的一种简明的阐述.平均数、中位数、众数描述总体的集中趋势,方差和标准差描述波动大小. 【例3】 甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是 甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. (1)分别计算两组数据的平均数; (2)分别计算两组数据的方差; (3)根据计算结果,估计一下两名战士的射击水平谁更好一些.
解析 (1)x甲=110×(8+6+7+8+6+5+9+10+4+7)=7,
x乙=110×(6+7+7+8+6+7+8+7+9+5)=7. (2)由方差公式s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2]可求得s2甲=3.0,s2乙=1.2. (3)由x甲=x乙,说明甲、乙两战士的平均水平相当; 又∵s2甲>s2乙,说明甲战士射击情况波动大,因此乙战士比甲战士射击情况稳定.
1.下图是样本容量为200的频率分布直方图.
根据样本的频率分布直方图估计,数据落在[2,10)内的概率约为__0.4__. 解析 由题组可得(0.02+0.08)×4=0.4. 2.某电子商务公司对10 000名网络购物者2017年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.
(1)直方图中的a=__3__; (2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为__6_000__.