2019年人教版A版高三数学(理)高考一轮复习10.3 用样本估计总体教学设计及答案

合集下载

用样本估计总体教案

用样本估计总体教案

用样本估计总体【第一课时】【教学目标】1.会画一组数据的频率分布表、频率分布直方图.2.会用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.3.掌握求n个数据的第p百分位数的方法.【教学重难点】1.频率分布表、频率分布直方图.2.用样本估计总体.3.总体百分位数的估计.【教学过程】一、问题导入预习教材内容,思考以下问题:1.绘制频率分布表和频率分布直方图有哪些步骤?2.频率分布直方图有哪些特征?3.如何求n个数据的第p百分位数?二、基础知识1.频率分布表、频率分布直方图的制作步骤及意义2.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.三、合作探究1.频率分布表、频率分布直方图、频率分布折线图的绘制角度一:频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单位:kg)如下:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以4为组距,列表如下:分组频率累计频数频率[41.5,45.5)20.0455[45.5,49.5)70.1591[49.5,53.5)80.1818[53.5,57.5)160.3636[57.5,61.5)50.1136[61.5,65.5)40.0909[65.5,69.5)20.0455频率分布直方图和频率分布折线图如图所示.(1)在列频率分布表时,极差、组距、组数有如下关系:①若极差组距为整数,则极差组距=组数;②若极差组距不为整数,则极差组距的整数部分+1=组数.(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本量越大,所分组数越多.角度二:频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少?(3)样本中不达标的学生人数是多少?(4)第三组的频数是多少?【解】(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.(3)由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12.所以样本中不达标的学生人数为150×0.12=18(人).(4)第三小组的频率为172+4+17+15+9+3=0.34.又因为样本量为150,所以第三组的频数为150×0.34=51.频率分布直方图的应用中的计算问题(1)小长方形的面积=组距×频率组距=频率;(2)各小长方形的面积之和等于1;(3)频数样本量=频率,此关系式的变形为频数频率=样本量,样本量×频率=频数.2.条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题:(1)求抽取的学生数;(2)若该校有3000名学生,估计喜欢收听易中天《品三国》的学生人数;(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比.【解】(1)从统计图上可以看出,喜欢收听于丹析《庄子》的男生有20人,女生有10人;喜欢收听《故宫博物院》的男生有30人,女生有15人;喜欢收听于丹析《论语》的男生有30人,女生有38人;喜欢收听易中天《品三国》的男生有64人,女生有42人;喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为106 300,由于该校有3000名学生,因此可以估计喜欢收听易中天《品三国》的学生有106300×3000=1060(人).(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为45 300×100%=15%.(1)绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.3.折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1)护士每隔几小时给小明测量一次体温?(2)近三天来,小明的最高体温、最低体温分别是多少?(3)从体温看,小明的病情是在恶化还是在好转?(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】(1)根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.(2)从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是39.5摄氏度,最低体温是36.8摄氏度.(3)从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏度,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时.因此小明最快可以在9月10凌晨6时出院.(1)绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.4.扇形统计图下图是A ,B 两所学校艺术节期间收到的各类艺术作品的情况的统计图:(1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2)已知A 学校收到的剪纸作品比B 学校的多20件,收到的书法作品比B 学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?【解】(1)不能.因为两所学校收到艺术作品的总数不知道.(2)设A 学校收到艺术作品的总数为x 件,B 学校收到艺术作品的总数为y 件,则x -5%y =20,y -40%x =100,=500,=600,即A 学校收到艺术作品的总数为500件,B 学校收到艺术作品的总数为600件.(1)绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.5.百分位数的计算现有甲、乙两组数据如下表所示.序号1234567891011121314151617181920甲组1222233355668891010121313乙组00001123456677101414141415试求甲、乙两组数的25%分位数与75%分位数.【解】因为数据个数为20,而且20×25%=5,20×75%=15.因此,甲组数的25%分位数为x5+x62=2+32=2.5;甲组数的75%分位数为x15+x162=9+102=9.5.乙组数的25%分位数为x5+x62=1+12=1,乙组的75%分位数为x15+x162=10+142=12.求百分位数时,一定要将数据按照从小到大的顺序排列.【课堂检测】1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是()解析:选D.用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中的图不能称为统计图.2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2700,3000)g的频率为()A.0.1B.0.2C.0.3D.0.4解析:选C.由题图可得,新生儿体重在[2700,3000)g的频率为0.001×300=0.3,故选C.3.观察下图所示的统计图,下列结论正确的是()A.甲校女生比乙校女生多B.乙校男生比甲校男生少C.乙校女生比甲校男生少D.甲、乙两校女生人数无法比较解析:选D.图中数据只是百分比,甲、乙两个学校的学生总数不知道,因此男生与女生的具体人数也无法得知.【第二课时】【教学目标】1.理解样本数据标众数、中位数、平均数的意义和作用,学会计算数据的众数、中位数、平均数.2.理解样本数据方差、标准差的意义和作用,学会计算数据的方差、标准差.【教学重难点】会用样本的基本数字特征来估计总体的基本数字特征.【教学过程】一、基础知识1.众数、中位数、平均数众数、中位数、平均数定义(1)众数:一组数据中出现次数最多的数.(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.(3)平均数:如果n个数x1,x2,…,x n,那么x=1n(x1+x2+…+x n)叫做这n个数的平均数.思考:平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点?答案:平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.2.方差、标准差标准差、方差的概念及计算公式(1)标准差是样本数据到平均数的一种平均距离,一般用s表示.s=1n[(x1-x)2+(x2-x)2+…+(x n-x)2].(2)标准差的平方s2叫做方差.s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2](x n是样本数据,n是样本容量,x是样本平均数).(3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x .二、合作探究1.众数、中位数、平均数的计算(1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为()A .85,85,85B .87,85,86C .87,85,85D .87,85,90(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x ,y 的值分别为()A .2,5B .5,5C .5,8D .8,8答案(1)C(2)C解析(1)平均数为100+95+90×2+85×4+80+7510=87,众数为85,中位数为85.(2)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解.由于甲组数据的中位数为15=10+x ,所以x =5.又乙组数据的平均数为9+15+10+y +18+245=16.8,所以y =8,所以x ,y 的值分别为5,8.【教师小结】平均数、众数、中位数的计算方法:平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.2.标准差、方差的计算及应用甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?解(1)x甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],得s2甲=3,s2乙=1.2.(3)x甲=x乙,说明甲、乙两战士的平均水平相当.又s2甲>s2乙说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加比赛.【教师小结】(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.三、课堂总结1.标准差的平方s2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.【课堂检测】1.某市2017年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是()A.19B.20C.21.5D.23解析由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B.2.下列关于平均数、中位数、众数的说法中正确的一个是()A.中位数可以准确地反映出总体的情况B.平均数可以准确地反映出总体的情况C.众数可以准确地反映出总体的情况D.平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况答案D3.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得的数据,则A,B两样本的下列数字特征对应相同的是() A.众数B.平均数C.中位数D.标准差答案D4.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a1,a2,则一定有()A.a1>a2B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关答案B解析由茎叶图知,a1=80+1+5+5+4+55=84,a2=80+4+4+6+4+75=85,故选B.5.若样本数据x1,x2,…,x10的标准差为8,则数据2x1-1,2x2-1,…,2x10-1的标准差为________.解析设样本数据x1,x2,…,x10的标准差为s,则s=8,可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.。

人教版高中数学高考一轮复习--用样本估计总体(课件)

人教版高中数学高考一轮复习--用样本估计总体(课件)
2.在实际问题中,总体平均数、总体方差和总体标准差都是未知的,一般用
样本估计总体.在随机抽样中,样本平均数、样本方差和样本标准差依赖于
样本的选取,具有随机性.
频率
1.在频率分布直方图中,纵坐标表示
组距
频率
,不是频率,频率=组距×
组距
小长方形高的比等于频率比.
2.若数据 x1,x2,…,xn 的平均数为,方差为 s2,则数据 mx1+a,mx2+a,
由题意可知数据3x1+1,3x2+1,3x3+1,…,3xn+1的平均数为3×5+1=16,方差
为32×2=18.
4.(多选)已知某滑冰比赛有9位评委进行评分,第一这9位评委给出某选手
的原始评分,然后评定该选手的得分时,从9个原始评分中去掉一个最高分、
一个最低分,得到7个有效评分,则7个有效评分与9个原始评分相比,可能变
第二环节
关键能力形成
能力形成点1
频率散布直方图及其应用
例1 (202X天津,4)从一批零件中抽取80个,测量其直径(单位:mm),将所得
数据分为9组:[5.31,5.33),[5.33,5.35),…,[5.45,5.47),[5.47,5.49],并整理得到
如下频率散布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的
2.平均数、方差的公式推广:
(1)若数据 x1,x2,…,xn 的平均数为,则 ax1+b,ax2+b,ax3+b,…,axn+b 的平均数是
a+b.
(2)若数据 x1,x2,…,xn 的方差为 s2,则
1 2
2
2
2

用样本估计总体教案

用样本估计总体教案

用样本估计总体教案一、课程名称:(适用大部分课程教案)二、授课对象初中二年级学生三、授课时间每课时45分钟四、授课教师张某某五、教学目标1、知识与技能目标(1)掌握用样本估计总体的基本概念和方法;(2)能够运用样本数据对总体进行估计,并计算估计的误差;(3)能够运用统计学软件进行样本估计总体的操作。

2、过程与方法目标(1)通过小组合作探究,培养学生运用统计学方法解决问题的能力;(2)通过实际案例的分析,培养学生将理论知识与实际应用相结合的能力;(3)通过课堂讲解和练习,培养学生自主学习、思考总结的能力。

3、情感态度价值观目标(1)培养学生对统计学产生兴趣,认识到统计学在生活中的重要性;(2)培养学生具备客观、严谨的科学态度;(3)培养学生团结协作、共同探究的精神。

六、教学重占和难点1、教学重点(1)用样本估计总体的基本方法和步骤;(2)样本估计总体的误差分析;(3)统计学软件在样本估计总体中的应用。

2、教学难点(1)样本估计总体误差的计算;(2)统计学软件的操作使用;(3)将理论知识与实际案例相结合,解决实际问题。

七、教学过程1、导入新课(5分钟)授课教师通过展示与学生生活密切相关的总体数据问题,例如:“假设我们要了解全校学生的平均身高,我们是否需要测量每一个学生?有没有更高效的方法?”引发学生对用样本估计总体概念的思考,从而导入新课。

2、新知讲授(20分钟)(1)介绍用样本估计总体的基本概念,包括总体、样本、参数、统计量等;(2)讲解如何从样本数据推断总体数据,包括点估计和区间估计;(3)详细解释样本估计的误差来源及如何计算误差;(4)展示统计学软件(如SPSS、Excel等)在样本估计总体中的应用实例。

3、合作探究(15分钟)将学生分成小组,每组给予一个实际案例,如调查班级学生的平均成绩,要求小组讨论并设计出合理的样本调查方案,包括样本的大小、选择方法等,并尝试使用统计学软件进行数据处理和分析。

用样本估计总体教学设计

用样本估计总体教学设计

用样本估计总体 教学设计一、课程名称:(适用大部分课程教案)二、授课对象高中二年级学生,具备基础的统计学知识和一定的数据分析能力。

三、授课时间2课时,每课时45分钟。

四、授课教师张XX,高中数学教师,具备多年统计学教学经验。

五、教学目标1、知识与技能目标(1)掌握用样本估计总体的基本原理和方法;(2)能够运用不同的估计方法对总体参数进行估计;(3)学会分析估计结果的可靠性和准确性。

2、过程与方法目标(1)通过实例分析,培养学生运用统计学方法解决实际问题的能力;(2)培养学生合作探究、交流讨论的学习习惯;(3)提高学生运用计算工具进行数据分析的能力。

3、情感态度价值观目标(1)培养学生对统计学的好奇心和兴趣,激发学生学习积极性;(2)使学生认识到统计学在现实生活中的重要作用,增强学生的应用意识;(3)培养学生严谨、客观的科学态度,提高学生的数据分析素养。

六、教学重占和难点1、教学重点(1)用样本估计总体的基本方法;(2)估计结果的可靠性和准确性的分析;(3)实际问题的解决方法。

2、教学难点(1)样本估计总体原理的理解;(2)不同估计方法的适用条件和优缺点;(3)估计结果的分析和评价。

七、教学过程1、导入新课(5分钟)授课开始时,通过向学生展示一个与日常生活密切相关的统计数据问题,例如:“根据班级学生的身高数据,估计全年级学生的平均身高”,引发学生对用样本估计总体问题的思考。

通过这个实例,引导学生回顾已学的统计学知识,为新课的学习做好铺垫。

2、新知讲授(20分钟)(1)介绍用样本估计总体的基本概念和原理,如:样本均值、样本方差、置信区间等;(2)讲解不同估计方法,如:点估计、区间估计,并分析各自的优缺点;(3)通过具体例题,展示如何运用这些方法进行总体参数的估计;(4)强调估计结果的可靠性和准确性的判断标准,以及如何在实际问题中进行应用。

3、合作探究(15分钟)将学生分成小组,每组针对一个实际问题进行探究,如:“根据某地区部分家庭的年收入数据,估计该地区所有家庭的平均年收入”。

2019届一轮复习人教A版 第65讲 用样本估计总体 课件

2019届一轮复习人教A版   第65讲 用样本估计总体   课件

★★★
★☆☆
教学参考
真题再现
■ [2017-2013]课标全国真题再现
[答案] A
[解析] 由题图可 知,2014 年 8 月至 9 月的月接待游客 量在减少,故 A 选 项错误.
教学参考
2.[2016· 全国卷Ⅲ] 某旅游城市为向游客介绍本地的气温情况,绘制 了一年中各月平均最高气温和平均最低气温的雷达图.图中 A 点表 示十月的平均最高气温约为 15℃,B 点表示四月的平均最低气温约 为 5℃.下面叙述不正确的是 ( )
[答案]
D
[解析] 平均最高气 温高于 20℃的月份 有七、八 2 个月.
A.各月的平均最低气温都在 0℃以上 B.七月的平均温差比一月的平均温差大 C.三月和十一月的平均最高气温基本相同 D.平均最高气温高于 20℃的月份有 5 个
教学参考
3.[2017· 全国卷Ⅱ] 海水养殖场进行某水产品的新、 旧网箱养殖方法的产量对比,收获时各 随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如图所示:
教学参考
(2)记 CA1 表示事件:“A 地区用户的满意度等级为满意或非常满意”;CA2 表示事件:“A 地区用 户的满意度等级为非常满意”;CB1 表示事件:“B 地区用户的满意度等级为不满意”;CB2 表示 事件:“B 地区用户的满意度等级为满意”. 则 CA1 与 CB1 独立,CA2 与 CB2 独立,CB1 与 CB2 互斥,C=CB1CA1∪CB2CA2,所以 P(C)=P(CB1CA1∪CB2CA2)=P(CB1CA1)+P(CB2CA2)=P(CB1)P(CA1)+P(CB2)P(CA2).
字特征,理解用样本估计总体的思想.

2019版一轮理数(人教版A版)课件:第十章 第三节 用样本估计总体

2019版一轮理数(人教版A版)课件:第十章 第三节 用样本估计总体

第二步: 分组 ,通常对组内数值所在区间取左闭右开区间, 最后一组取闭区间; 第三步:登记频数,计算频率,列出频率分布表.
(2)频率分布直方图:反映样本频率分布的直方图. 如图:
频率 组距 ,每个小矩形的面积表 横轴表示样本数据,纵轴表示_____
示样本落在该组内的 频率 .
(3)茎叶图的画法: 第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将最小茎与最大茎之间的数按 大小 次序排成一 列,写在左(右)侧; 第三步:将各个数据的叶依次写在其茎的右(左)侧.
考点二
考点三
பைடு நூலகம்
[跟踪训练] 某中学初中部共有 110 名教师,高中部共有 150 名教师,其性别 比例如图所示,则该校女教师的人数为( C )
A.93 C.137
B.123 D.167
由扇形统计图可得,该校女教师人数为 110×70%+150×(1 -60%)=137.故选 C.
解析 答案
考点一
考点二
(2)标准差、方差 ①标准差:表示样本数据到平均数的一种平均距离,一般用 s 表示, s= 1 2 2 2 [ x - x + x - x +„+ x - x ]. 2 n n 1
②方差:标准差的平方 s2 叫作方差.
1 2 2 2 [( x - x ) + ( x - x ) +„+ ( x - x ) ] 1 2 n 2 n s= ,其中 xi(i=
1,2,3,„,n)是样本数据,n 是样本容量, x 是样本平均数.
[三基自测] 1.一个容量为 32 的样本,已知某组样本的频率为 0.25,则 该组样本的频数为( B ) A. 4 C.12 B.8 D.16
2 .已知一个样本中的数据为 1,2,3,4,5 ,则该样本的方差为 ( B ) A. 1 C. 3 B. 2 D. 4

2019届高考数学一轮复习:《用样本估计总体》教学案(含解析)

2019届高考数学一轮复习:《用样本估计总体》教学案(含解析)

用样本估计总体[知识能否忆起]一、作频率分布直方图的步骤1.求极差(即一组数据中最大值与最小值的差).2.确定组距与组数.3.将数据分组.4.列频率分布表.5.画频率分布直方图.二、频率分布折线图和总体密度曲线1.频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图.2.总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,即总体密度曲线.三、样本的数字特征将一组数据按大小依次排列,把处在最中间位置的一个数据或最中间两个数据的平均数叫做这组数据的中位数,在频率分布直方图中,中位数左边和右边的直方图的面积相等四、茎叶图茎叶图的优点是可以保留原始数据,而且可以随时记录,方便记录与表示.[小题能否全取]1.(教材习题改编)( )A.23与26 B.31与26C .24与30D .26与30解析:选B 观察茎叶图可知,这组数据的众数是31,中位数是26.2.(教材习题改编)把样本容量为20的数据分组,分组区间与频数如下:[10,20),2;[20,30),3;[30,40),4;[40,50),5;[50,60),4;[60,70],2,则在区间[10,50)上的数据的频率是( )A .0.05B .0.25C .0.5D .0.7解析:选D 由题知,在区间[10,50)上的数据的频数是2+3+4+5=14,故其频率为1420=0.7.3.(2018·长春模拟)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图由图中数据可知身高在[120,130]内的学生人数为( )A .20B .25C .30D .35解析:选C 由题意知a×10+0.35+0.2+0.1+0.05=1, 则a =0.03,故学生人数为0.3×100=30.4.(教材习题改编)甲、乙两人比赛射击,两人所得的平均环数相同,其中甲所得环数的方差为5,乙所得环数如下:5、6、9、10、5,那么这两人中成绩较稳定的是________.解析:x =7,s 2乙=4.4, 则s 2甲>s 2乙,故乙的成绩较稳定. 答案:乙5.(2018·山西大同)将容量为n 的样本中的数据分为6组,绘制频率分布直方图,若第一组至第六组的数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和为27,则n =________.解析:依题意得,前三组的频率总和为2+3+42+3+4+6+4+1=920,因此有27n =920,即n =60.答案:601.在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数的值,而平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和,众数是最高的矩形的中点的横坐标.2.注意区分直方图与条形图,条形图中的纵坐标刻度为频数或频率,直方图中的纵坐标刻度为频率/组距. 3.方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,虽然方差与标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般多采用标准差.典题导入[例1] (2018·广东高考)某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a 的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分; (3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.[自主解答] (1)由频率分布直方图知(2a +0.02+0.03+0.04)×10=1,解得a =0.005.(2)由频率分布直方图知这100名学生语文成绩的平均分为55×0.005×10+65×0.04×10+75×0.03×10+85×0.02×10+95×0.005×10=73(分).(3)由频率分布直方图知语文成绩在[50,60),[60,70),[70,80),[80,90)各分数段的人数依次为0.005×10×100=5,0.04×10×100=40,0.03×10×100=30,0.02×10×100=20.由题中给出的比例关系知数学成绩在上述各分数段的人数依次为5,40×12=20,30×43=40,20×54=25.故数学成绩在[50,90)之外的人数为100-(5+20+40+25)=10.在本例条件下估计样本数据的众数.解:众数应为最高矩形的中点对应的横坐标,故约为65.由题悟法解决频率分布直方图问题时要抓住 (1)直方图中各小长方形的面积之和为1.(2)直方图中纵轴表示频率组距,故每组样本的频率为组距×频率组距,即矩形的面积.(3)直方图中每组样本的频数为频率×总体数.以题试法1.(2018·深圳调研)某中学组织了“迎新杯”知识竞赛,从参加考试的学生中抽出若干名学生,并将其成绩绘制成频率分布直方图(如图),其中成绩的范围是[50,100],样本数据分组为[50,60),[60,70),[70,80),[80,90),[90,100],已知样本中成绩小于70分的个数是36,则样本中成绩在[60,90)内的学生人数为________.解析:依题意得,样本中成绩小于70分的频率是(0.010+0.020)×10=0.3;样本中成绩在[60,90)内的频率是(0.020+0.030+0.025)×10=0.75,因此样本中成绩在[60,90)内的学生人数为36×0.750.3=90.答案:90典题导入[例2] (2018·陕西高考)从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x 甲、x 乙,中位数分别为m 甲、m 乙,则( )A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙[自主解答] x 甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516, x 乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716.∴x 甲<x乙.又∵m 甲=20,m 乙=29,∴m 甲<m 乙. [答案] B由题悟法由茎叶图可以清晰地看到数据的分布情况,这一点同频率分布直方图类似.它优于频率分布直方图的第一点是从茎叶图中能看到原始数据,没有任何信息损失;第二点是茎叶图便于记录和表示.其缺点是当样本容量较大时,作图较繁.以题试法2.(2018·淮北模考)如图所示的茎叶图记录了一组数据,关于这组数据,其中说法正确的序号是________.①众数是9;②平均数是10;③中位数是9或10;④标准差是3.4.解析:由茎叶图知,该组数据为7,8,9,9,9,10,11,12,12,13,∴众数为9,①正确;中位数是9+102=9.5,③错;平均数是x =110(7+8+9+9+9+10+11+12+12+13)=10,②正确;方差是s 2=110[(7-10)2+(8-10)2+(9-10)2+(9-10)2+(9-10)2+(10-10)2+(11-10)2+(12-10)2+(12-10)2+(13-10)2]=3.4,标准差s = 3.4,④错.答案:①②典题导入[例3] (1)(2018·江西高考)样本(x 1,x 2,…,x n )的平均数为x -,样本(y 1,y 2,…,y m )的平均数为y -(x -≠y -).若样本(x 1,x 2,…,x n ,y 1,y 2,…,y m )的平均数z -=αx -+(1-α)y -,其中0<α<12,则n ,m 的大小关系为( )A .n<mB .n>mC .n =mD .不能确定(2)(2018·山东高考)在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差[自主解答] (1)x =x 1+x 2+…+x n n ,y =y 1+y 2+…+y mm,z =x 1+x 2+…+x n +y 1+y 2+…+y mm +n,则z =n x +m ym +n=n m +n x +mm +ny . 由题意知0<n m +n <12,∴n <m.(2)对样本中每个数据都加上一个非零常数时不改变样本的方差和标准差,众数、中位数、平均数都发生改变.[答案] (1)A (2)D由题悟法(1)众数体现了样本数据的最大集中点,但无法客观地反映总体特征. (2)中位数是样本数据居中的数.(3)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据越分散,标准差、方差越小,数据越集中.以题试法3.(2018·淄博一检)一农场在同一块稻田中种植一种水稻,其连续8年的产量(单位:kg)如下:450,430,460,440,450,440,470,460,则该组数据的方差为( )A .120B .80C .15D .150解析:选D 根据题意知,该组数据的平均数为450+430+460+440+450+440+470+4608=450,所以该组数据的方差为18×(02+202+102+102+02+102+202+102)=150.1.(2018·豫西五校联考)某人5次上班途中所花的时间(单位:分钟)分别为8,12,10,11,9,估计此人每次上班途中平均花费的时间为( )A .8分钟B .9分钟C .11分钟D .10分钟解析:选D 依题意,估计此人每次上班途中平均花费的时间为8+12+10+11+95=10分钟.2.(2018·湖北高考)容量为20的样本数据,分组后的频数如下表:则样本数据落在区间[10,40)的频率为( ) A .0.35 B .0.45 C .0.55D .0.65解析:选B 求得该频数为2+3+4=9,样本容量是20,所以频率为920=0.45.3.某厂10名工人在一个小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a ,中位数为b ,众数为c ,则有( )A .a >b >cB .b >c >aC .c >a >bD .c >b >a解析:选D 把该组数据按从小到大的顺序排列为10,12,14,14,15,15,16,17,17,17,其平均数a =110×(10+12+14+14+15+15+16+17+17+17)=14.7,中位数b =15+152=15,众数c =17,则a <b <c.4.(2018·济宁模拟)为了解一片大约一万株树木的生长情况,随机测量了其中100株树木的底部周长(单位:cm).根据所得数据画出的样本频率分布直方图如图所示,那么在这片树木中,底部周长小于110 cm 的株数大约是( )A .3 000B .6 000C .7 000D .8 000解析:选C 底部周长小于110 cm 的频率为:(0.01+0.02+0.04)×10=0.7,所以底部周长小于110 cm 的株数大约是10 000×0.7=7 000.5.(2018·江西高考)小波一星期的总开支分布如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为( )图1图2A .30%B .10%C .3%D .不能确定解析:选C 由图1得到小波一星期的总开支,由图2得到小波一星期的食品开支,从而再借助图2计算出鸡蛋开支占总开支的百分比.由图2知,小波一星期的食品开支为30+40+100+80+50=300元,由图1知,小波一星期的总开支为30030%=1 000元,则小波一星期的鸡蛋开支占总开支的百分比为301 000×100%=3%.6.(2018·江西盟校二联)若一个样本容量为8的样本的平均数为5,方差为2.现样本中又加入一个新数据5,此时样本容量为9,平均数为x ,方差为s 2,则( )A.x =5,s 2<2 B.x =5,s 2>2 C.x >5,s 2<2D.x >5,s 2>2解析:选A 设18(x 1+x 2+…+x 8)=5,∴19(x 1+x 2+…+x 8+5)=5, ∴x =5,由方差定义及意义可知加新数据5后,样本数据取值的稳定性比原来强,∴s 2<2.7.(2018·湖北模拟)下图为150辆汽车通过某路段时速度的频率分布直方图,则速度在[60,70)内的汽车大约有________辆.解析:由频率分布直方图可知,汽车速度在[60,70)内的频率为0.04×10=0.4,故速度在[60,70)内的汽车为150×0.4=60辆.答案:608.(2018·湖南高考)如图所示是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x 为x 1,x 2,…,x n 的平均数)解析:该运动员五场比赛中的得分为8,9,10,13,15,平均得分x =8+9+10+13+155=11,方差s 2=15[(8-11)2+(9-11)2+(10-11)2+(13-11)2+(15-11)2]=6.8.答案:6.89.(2018·北京海淀)甲和乙两个城市去年上半年每月的平均气温(单位:℃)用茎叶图记录如下,根据茎叶图可知,两城市中平均温度较高的城市是________,气温波动较大的城市是________.解析:根据茎叶图可知,甲城市上半年的平均温度为 9+13+17×2+18+226=16,乙城市上半年的平均温度为12+14+17+20+24+276=19,故两城市中平均温度较高的是乙城市,观察茎叶图可知,甲城市的温度更加集中在峰值附近,故乙城市的温度波动较大.答案:乙 乙10.(2018·郑州模拟)某中学共有1 000名学生参加了该地区高三第一次质量检测的数学考试,数学成绩如下表所示:(1)100名同学进行问卷调查,甲同学在本次测试中数学成绩为95分,求他被抽中的概率;(2)已知本次数学成绩的优秀线为110分,试根据所提供数据估计该中学达到优秀线的人数;(3)作出频率分布直方图,并估计该学校本次考试的数学平均分(同一组中的数据用该组区间的中点值作代表).解:(1)分层抽样中,每个个体被抽到的概率均为样本容量总体中个体总数,故甲同学被抽到的概率P =110. (2)由题意得x =1 000-(60+90+300+160)=390.故估计该中学达到优秀线的人数 m =160+390×120-110120-90=290.(3)频率分布直方图如图所示.该学校本次考试的数学平均分.x =60×15+90×45+300×75+390×105+160×1351 000=90.估计该学校本次考试的数学平均分为90分.11. (2018·江西重点中学联考)某日用品按行业质量标准分成五个等级,等级系数X 依次为1,2,3,4,5.现从一批该日用品中随机抽取20件,对其等级系数进行统计分析,得到频率分布表如下:(1)若所抽取的20件日用品中,等级系数为4的恰有3件,等级系数为5的恰有2件,求a ,b ,c 的值; (2)在(1)的条件下,将等级系数为4的3件日用品记为x 1,x 2,x 3,等级系数为5的2件日用品记为y 1,y 2,现从x 1,x 2,x 3,y 1,y 2这5件日用品中任取2件(假定每件日用品被取出的可能性相同),写出所有可能的结果,并求这2件日用品的等级系数恰好相等的概率.解:(1)由频率分布表得a +0.2+0.45+b +c =1, 即a +b +c =0.35.因为抽取的20件日用品中,等级系数为4的恰有3件,所以b =320=0.15.等级系数为5的恰有2件,所以c =220=0.1.从而a =0.35-b -c =0.1. 所以a =0.1,b =0.15,c =0.1.(2)从日用品x 1,x 2,x 3,y 1,y 2中任取2件,所有可能的结果为:{x 1,x 2},{x 1,x 3},{x 1,y 1},{x 1,y 2},{x 2,x 3},{x 2,y 1},{x 2,y 2},{x 3,y 1},{x 3,y 2},{y 1,y 2},共10个.设事件A 表示“从日用品x 1,x 2,x 3,y 1,y 2中任取2件,其等级系数相等”,则A 包含的基本事件为:{x 1,x 2},{x 1,x 3},{x 2,x 3},{y 1,y 2},共4个.故所求的概率P(A)=410=0.4.12.(2018·北京高考)近年来,某市为了促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱.为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1 000吨生活垃圾,数据统计如下(单位:吨):(1)试估计厨余垃圾投放正确的概率; (2)试估计生活垃圾投放错误的概率;(3)假设厨余垃圾在“厨余垃圾”箱、“可回收物”箱、“其他垃圾”箱的投放量分别为a ,b ,c ,其中a>0,a +b +c =600.当数据a ,b ,c 的方差s 2最大时,写出a ,b ,c 的值(结论不要求证明),并求此时s 2的值.( 注:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n-x )2],其中x 为数据x 1,x 2,…,x n的平均数 )解:(1)厨余垃圾投放正确的概率约为“厨余垃圾”箱里厨余垃圾量厨余垃圾总量=400400+100+100=23.(2)设“生活垃圾投放错误”为事件A ,则事件A 表示“生活垃圾投放正确”.事件A 的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P(A )约为400+240+601 000=0.7,所以P(A)约为1-0.7=0.3.(3)当a =600,b =c =0时,s 2取得最大值. 因为x =13(a +b +c)=200,所以s 2=13×[(600-200)2+(0-200)2+(0-200)2]=80 000.1.(2018·西宁模拟)已知一组数据:a 1,a 2,a 3,a 4,a 5,a 6,a 7构成公差为d 的等差数列,且这组数据的方差等于1,则公差d 等于( )A .±14B .±12C .±128D .无法求解解析:选B 这组数据的平均数为a 1+a 2+a 3+a 4+a 5+a 6+a 77=7a 47=a 4,又因为这组数据的方差等于1,所以17[(a 1-a 4)2+(a 2-a 4)2+(a 3-a 4)2+(a 4-a 4)2+(a 5-a 4)2+(a 6-a 4)2+(a 7-a 4)2] =2+2+2+0+2+2+27=1,即4d 2=1,解得d =±12.2.(2018·安徽高考)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则( )A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差解析:选C 由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以甲、乙的成绩的平均数均为6,A 错;甲、乙的成绩的中位数分别为6,5,B 错;甲、乙的成绩的方差分别为15×[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]=2,15×[(5-6)2+(5-6)2+(5-6)2+(6-6)2+(9-6)2]=125,C 对;甲、乙的成绩的极差均为4,D 错.3.(2018·山西山大附中月考)如图是某市有关部门根据该市干部的月收入情况,画出的样本频率分布直方图,已知图中第一组的频数为4 000,请根据该图提供的信息解答下列问题.(1)求样本中月收入在[2 500,3 500)的人数;(2)为了分析干部的收入与年龄、职业等方面的关系,必须从样本中按月收入用分层抽样方法抽出100人作进一步分析,则月收入在[1 500,2 000)的这组中应抽多少人?(3)试估计样本数据的中位数.解:(1)由题知,月收入在[1 000,1 500)的频率为0.000 8×500=0.4,又月收入在[1 000,1 500)的有4 000人,故样本容量n =4 0000.4=10 000. 又月收入在[1 500,2 000)的频率为0.000 4×500=0.2,月收入在[2 000,2 500)的频率为0.000 3×500=0.15,月收入在[3 500,4 000]的频率为0.000 1×500=0.05,所以月收入在[2 500,3 500)的频率为1-0.4-0.2-0.15-0.05=0.2.故样本中月收入在[2 500,3 500]的人数为0.2×10 000=2 000.(2)由(1)知,月收入在[1 500,2 000)的人数为0.2×10 000=2 000,再从10 000人中用分层抽样的方法抽出100人,则月收入在[1 500,2 000)的这组中应抽取100×2 00010 000=20(人). (3)由(1)知,月收入在[1 000,2 000)的频率为0.4+0.2=0.6>0.5,故样本数据的中位数为 1 500+0.5-0.40.000 4=1 500+250=1 750.1.(2018·陕西高考)对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A .46,45,56B .46,45,53C .47,45,56D .45,47,53解析:选A 从茎叶图中可以看出样本数据的中位数为中间两个数的平均数,即45+472=46,众数为45,极差为68-12=56.2.(2018·济南调研)如图是2019年在某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和方差分别为( )A .84,4.84B .84,1.6C .85,1.6D .85,4解析:选C 依题意得,去掉一个最高分和一个最低分后,所剩数据的平均数为80+15×(4×3+6+7)=85,方差为15×[3×(84-85)2+(86-85)2+(87-85)2]=1.6.。

2019届高三理科数学一轮复习学案 10.3 用样本估计总体

2019届高三理科数学一轮复习学案 10.3 用样本估计总体

第三节用样本估计总体1.作频率分布直方图的步骤(1)求极差(即一组数据中最大值与最小值的差);(2)决定组距与组数;(3)将数据分组;(4)列频率分布表;(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.3.茎叶图的优点茎叶图的优点是不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.[注意]茎叶图中茎是指中间的一列数,叶是从茎的旁边生长出来的数.4.样本的数字特征(1)众数、中位数、平均数(2)标准差、方差①标准差:样本数据到平均数的一种平均距离,一般用s 表示,s = 1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]. ②方差:标准差的平方s 2s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],其中x i (i =1,2,3,…,n )是样本数据,n是样本容量,x 是样本平均数.1.判断下列结论是否正确(请在括号中打“√”或“×”) (1)在频率分布直方图中,小矩形的高表示频率.( ) (2)频率分布直方图中各个长方形的面积之和为1.( )(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.( ) (4)平均数、众数与中位数从不同的角度描述了一组数据的集中趋势.( ) (5)一组数据的方差越大,说明这组数据的波动越大.( ) 答案:(1)× (2)√ (3)× (4)√ (5)√2.如图是某班8位学生诗词比赛得分的茎叶图,那么这8位学生得分的众数和中位数分别为________.解析:依题意,结合茎叶图,将题中的数由小到大依次排列得到:86,86,90,91,93,93,93,96,因此这8位学生得分的众数是93,中位数是91+932=92.答案:93 923.(教材习题改编)某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.解析:由频率分布直方图可知45岁以下的教师的频率为5×(0.040+0.080)=0.6,所以共有80×0.6=48(人).答案:484.已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差是________.解析:5个数的平均数x=4.7+4.8+5.1+5.4+5.55=5.1,所以它们的方差s2=15[(4.7-5.1)2+(4.8-5.1)2+(5.1-5.1)2+(5.4-5.1)2+(5.5-5.1)2]=0.1.答案:0.1考点一茎叶图(重点保分型考点——师生共研)某市为了考核甲、乙两部门的工作情况,随机访问了50位市民.根据这50位市民对这两部门的评分(评分越高表明市民的评价越高),绘制茎叶图如下:(1)分别估计该市的市民对甲、乙两部门评分的中位数;(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;(3)根据茎叶图分析该市的市民对甲、乙两部门的评价.解:(1)由所给茎叶图知,50位市民对甲部门的评分由小到大排序,排在第25,26位的是75,75,故样本中位数为75,所以该市的市民对甲部门评分的中位数的估计值是75.50位市民对乙部门的评分由小到大排序,排在第25,26位的是66,68,故样本中位数为66+682=67,所以该市的市民对乙部门评分的中位数的估计值是67.(2)由所给茎叶图知,50位市民对甲、乙部门的评分高于90的比率分别为550=0.1,850=0.16,故该市的市民对甲、乙部门的评分高于90的概率的估计值分别为0.1,0.16.(3)由所给茎叶图知,市民对甲部门的评分的中位数高于对乙部门的评分的中位数,而且由茎叶图可以大致看出对甲部门的评分的标准差要小于对乙部门的评分的标准差,说明该市市民对甲部门的评价较高、评价较为一致,对乙部门的评价较低、评价差异较大.[解题师说]某良种培育基地正在培育一小麦新品种A,将其与原有的一个优良品种B进行对照试验,两种小麦各种植了25亩,所得亩产数据(单位:千克)如下.品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454.品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430.(1)作出数据的茎叶图;(2)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解:(1)画出茎叶图如图所示:(2)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A 的亩产标准差(或方差)比品种B大,故品种A的亩产稳定性较差.考点二频率分布直方图(重点保分型考点——师生共研)(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.[学审题](1)分数小于70的频率即为其概率的估计值;(2)由于分数小于40的学生人数已知,因此要求[40,50)内的人数,只要求出小于50的人数或频率即可;(3)“样本中分数不小于70的男女生人数相等”,这是解题的关键,可先计算出分数不小于70的总人数,问题便迎刃而解.解:(1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6,所以样本中分数小于70的频率为1-0.6=0.4.所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计值为0.4. (2)根据题意,样本中分数不小于50的频率为 (0.01+0.02+0.04+0.02)×10=0.9, 故样本中分数小于50的频率为0.1,故分数在区间[40,50)内的人数为100×0.1-5=5. 所以总体中分数在区间[40,50)内的人数估计为 400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为 (0.02+0.04)×10×100=60,所以样本中分数不小于70的男生人数为60×12=30.所以样本中的男生人数为30×2=60, 女生人数为100-60=40,男生和女生人数的比例为60∶40=3∶2.所以根据分层抽样原理,总体中男生和女生人数的比例估计为3∶2.[解题师说]某网络营销部门随机抽查了某市200名网友在2017年11月11日的网购金额,所得数据如下表:已知网购金额不超过3千元与超过3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率分布直方图(如图);(2)该营销部门为了了解该市网友的购物体验,从这200名网友中,用分层抽样的方法从网购金额在(1,2]和(4,5]的两个群体中确定5人进行问卷调查,若需从这5人中随机选取2人继续访谈,则此2人来自不同群体的概率是多少?解:(1)根据题意有⎩⎪⎨⎪⎧16+24+x +y +16+14=200,16+24+x y +16+14=32,解得⎩⎪⎨⎪⎧x =80,y =50,∴p =0.4,q =0.25.补全频率分布直方图如图所示.(2)根据题意,抽取网购金额在(1,2]内的人数为2424+16×5=3(人),记为:a ,b ,c .抽取网购金额在(4,5]内的人数为1624+16×5=2(人),记为:A ,B .则从这5人中随机选取2人的选法为:(a ,b ),(a ,c ),(a ,A ),(a ,B ),(b ,c ),(b ,A ),(b ,B ),(c ,A ),(c ,B ),(A ,B )共10种.记2人来自不同群体的事件为M ,则M 中含有(a ,A ),(a ,B ),(b ,A ),(b ,B ),(c ,A ),(c ,B )共6种.∴P (M )=610=35,故此2人来自不同群体的概率为35.考点三 样本的数字特征 (题点多变型考点——追根溯源)样本的数字特征常与频率分布直方图、茎叶图等知识交汇命题.常见的命题角度有:(1)样本的数字特征与频率分布直方图交汇;(2)样本的数字特征与茎叶图交汇;(3)样本的数字特征与优化决策问题交汇.[题点全练]角度(一) 样本的数字特征与频率分布直方图交汇1.(2018·武昌调研)我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x (吨),用水量不超过x 的部分按平价收费,超出x的部分按议价收费,为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中a 的值;(2)若该市政府希望使85%的居民每月的用水量不超过标准x (吨),估计x 的值,并说明理由;(3)已知平价收费标准为4元/吨,议价收费标准为8元/吨.当x =3时,估计该市居民的月平均水费.(同一组中的数据用该组区间的中点值代替)解:(1)由频率分布直方图,可得(0.08+0.16+a +0.40+0.52+a +0.12+0.08+0.04)×0.5=1,解得a =0.30.(2)∵前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,而前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,∴2.5≤x <3.由0.3×(x -2.5)=0.85-0.73,解得x =2.9.因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准. (3)设居民月用水量为t 吨,相应的水费为y 元,则y =⎩⎪⎨⎪⎧ 4t ,0<t ≤3,3×4+(t -3)×8,t >3,即y =⎩⎪⎨⎪⎧4t ,0<t ≤3,8t -12,t >3.由题设条件及月均用水量的频率分布直方图,得居民每月的水费数据分组与频率分布表如下:根据题意,该市居民的月平均水费估计为1×0.04+3×0.08+5×0.15+7×0.20+9×0.26+11×0.15+14×0.06+18×0.04+22×0.02=8.42(元).[题型技法]频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标为众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.角度(二) 样本的数字特征与茎叶图交汇2.(2017·山东高考)如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x 和y 的值分别为( )A .3,5B .5,5C .3,7D .5,7解析:选A 由两组数据的中位数相等可得65=60+y ,解得y =5,又它们的平均值相等,所以15×[56+62+65+74+(70+x )]=15×(59+61+67+65+78),解得x =3.3.将某选手的9个得分去掉1个最高分,去掉1个最低分,7个剩余分数的平均分为91.现场作的9个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则7个剩余分数的方差为________.解析:由图可知去掉的两个数是87,99,所以87+90×2+91×2+94+90+x =91×7,解得x =4.故s 2=17[(87-91)2+(90-91)2×2+(91-91)2×2+(94-91)2×2]=367.答案:367[题型技法](1)在使用茎叶图时,一定要观察所有的样本数据,弄清楚这个图中数字的特点,不要漏掉了数据,也不要混淆茎叶图中茎与叶的含义.(2)茎叶图既可以表示两组数据,也可以表示一组数据,用它表示的数据是完整的数据,因此可以从茎叶图中看出数据的众数(数据中出现次数最多的数)、中位数(中间位置的一个数,或中间两个数的平均数)等.角度(三) 样本的数字特征与优化决策问题交汇4.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和方差如下表所示:( ) A .甲 B .乙 C .丙D .丁解析:选C 由表格中数据可知,乙、丙平均环数最高,但丙方差最小,说明成绩好,且技术稳定,选C.[题型技法]利用样本的数字特征解决优化决策问题的依据(1)平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.(2)用样本估计总体就是利用样本的数字特征来描述总体的数字特征.[冲关演练]1.(2018·长沙模拟)空气质量指数(Air Quality Index ,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI 大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士从当地某年的AQI 记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI 大于100的天数为________.(该年为365天)解析:该样本中AQI 大于100的频数为4,频率为25,以此估计此地全年AQI 大于100的频率为25,故此地该年AQI 大于100的天数约为365×25=146.答案:1462.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如表所示,求数学成绩在[50,90)之外的人数.解:(1)由频率分布直方图知(0.04+0.03+0.02+2a)×10=1,解得a=0.005.(2)估计这次语文成绩的平均分x=55×0.05+65×0.4+75×0.3+85×0.2+95×0.05=73.所以这100名学生语文成绩的平均分为73分.(3)分别求出语文成绩在分数段[50,60),[60,70),[70,80),[80,90)的人数依次为0.05×100=5,0.4×100=40,0.3×100=30,0.2×100=20.所以数学成绩分数段在[50,60),[60,70),[70,80),[80,90)的人数依次为5,20,40,25.所以数学成绩在[50,90)之外的人数有100-(5+20+40+25)=10(人).(一)普通高中适用作业A级——基础小题练熟练快1.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为() A.1B.2C.3 D.4解析:选B由图可知该组数据的极差为48-20=28,则该组数据的中位数为61-28=33,易得被污染的数字为2.2.(2016·全国卷Ⅲ)某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A点表示十月的平均最高气温约为15 ℃,B点表示四月的平均最低气温约为5 ℃.下面叙述不正确的是()A.各月的平均最低气温都在0 ℃以上B.七月的平均温差比一月的平均温差大C.三月和十一月的平均最高气温基本相同D.平均最高气温高于20 ℃的月份有5个解析:选D由图形可得各月的平均最低气温都在0 ℃以上,A正确;七月的平均温差约为10 ℃,而一月的平均温差约为5 ℃,故B正确;三月和十一月的平均最高气温都在10 ℃左右,基本相同,C正确,故D错误.3.(2018·宝鸡质检)对一批产品的长度(单位:毫米)进行抽样检测,样本容量为200,如图为检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则该样本中三等品的件数为()A.5 B.7C.10 D.50解析:选D根据题中的频率分布直方图可知,三等品的频率为(0.012 5+0.025 0+0.012 5)×5=0.25,因此该样本中三等品的件数为200×0.25=50.4.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).设甲、乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则()A.x 甲<x 乙,m 甲>m 乙B.x 甲<x 乙,m 甲<m 乙C.x 甲>x 乙,m 甲>m 乙D.x 甲>x 乙,m 甲<m 乙解析:选B 由茎叶图知m 甲=22+182=20,m 乙=27+312=29,∴m 甲<m 乙;x 甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516, x乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716,∴x 甲<x乙.5.(2018·内江模拟)某公司10个销售店某月销售某产品数量(单位:台)的茎叶图如图:分组为[11,20),[20,30),[30,39]时,所作的频率分布直方图是( )解析:选B 由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.6.(2018·邢台模拟)样本中共有五个个体,其值分别为0,1,2,3,m .若该样本的平均值为1,则其方差为( )A.105B.305C. 2 D .2解析:选D 依题意得m =5×1-(0+1+2+3)=-1,样本方差s 2=15(12+02+12+22+22)=2,即所求的样本方差为2.7.(2018·石家庄质检)设样本数据x 1,x 2,…,x 2 018的方差是4,若y i =2x i -1(i =1,2,…,2 018),则y 1,y 2,…,y 2 018的方差为________.解析:设样本数据的平均数为x ,则y i =2x i -1的平均数为2x -1,则y 1,y 2,…,y 2 018的方差为12 018[(2x 1-1-2x +1)2+(2x 2-1-2x +1)2+…+(2x 2 018-1-2x +1)2]=4×12 018[(x 1-x )2+(x 2-x )2+…+(x 2 018-x )2]=4×4=16. 答案:168.(2018·广州模拟)为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n ,因为后2个小组的频率之和为(0.037 5+0.012 5)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n =5+15+250.75=60.答案:609.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)频率分布直方图中x 的值为________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.解析:(1)由频率分布直方图中各小矩形的总面积为1,得(0.001 2+0.002 4×2+0.003 6+x +0.006 0)×50=1,解得x =0.004 4.(2)用电量在[100,250)内的频率为(0.003 6+0.004 4+0.006 0)×50=0.7,故用电量落在区间[100,250)内的户数为100×0.7=70.答案:(1)0.004 4(2)7010.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如表:解析:由数据表可得出乙班的数据波动性较大,则其方差较大,甲班的数据波动性较小,其方差较小,其平均值为7,所以方差s2=15(1+0+0+1+0)=25.答案:2 5B级——中档题目练通抓牢1.为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温数据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温;②甲地该月14时的平均气温高于乙地该月14时的平均气温;③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为()A.①③B.①④C.②③D.②④解析:选B∵x甲=26+28+29+31+315=29,x乙=28+29+30+31+325=30,∴x甲<x乙.又s2甲=9+1+0+4+45=185,s2乙=4+1+0+1+45=2,∴s甲>s乙.故可判断结论①④正确.2.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据.已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为()A.9 B.10C.11 D.12解析:选B不妨设样本数据为x1,x2,x3,x4,x5,且x1<x2<x3<x4<x5,则由样本平均数为7,样本方差为4,知(x1-7)2+(x2-7)2+(x3-7)2+(x4-7)2+(x5-7)2=20.若5个整数的平方和为20,则这5个整数的平方只能在0,1,4,9,16中选取(每个数最多出现2次),当这5个整数的平方中最大的数为16时,分析可知,总不满足和为20;当这5个整数的平方中最大的数为9时,0,1,1,9,9这组数满足要求,此时对应的样本数据为x1=4,x2=6,x3=7,x4=8,x5=10;当这5个整数的平方中最大的数不超过4时,总不满足要求,因此不存在满足条件的另一组数据.故选B.3.气象意义上从春季进入夏季的标志为“连续5天的日平均温度均不低于22 ℃”.现有甲、乙、丙三地连续5天的日平均温度的记录数据(数据都是正整数,单位:℃):①甲地:5个数据的中位数为24,众数为22;②乙地:5个数据的中位数为27,均值为24;③丙地:5个数据中有一个是32,均值为26,方差为10.8.则满足进入夏季标志的地区有()A.0个B.1个C.2个D.3个解析:选C①甲地:因为5个数据的中位数为24,众数为22,所以22至少出现两次,若有一天比22小,则24不可能为中位数,故甲地肯定进入夏季;②乙地:5个数据的中位数为27,均值为24,当5个数据为19,20,27,27,27时,其连续5天的日平均温度有低于22 ℃的,故不确定;③丙地:5个数据中有一个是32,均值为26,若有低于22,则取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22 ℃.故满足进入夏季标志的地区有甲、丙两地.故选C.4.一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为________.解析:由频率分布直方图可得第一组的频率是0.08,第二组的频率是0.32,第三组的频率是0.36,则中位数在第三组内,估计样本数据的中位数为10+0.10.36×4=1009.答案:10095.甲、乙两名同学在7次数学测试中的成绩如茎叶图所示,其中甲同学成绩的众数是85,乙同学成绩的中位数是83,则成绩较稳定的是________.解析:根据众数及中位数的概念易得x =5,y =3,故甲同学成绩的平均数为78+79+80+85+85+92+967=85,乙同学成绩的平均数为72+81+81+83+91+91+967=85,故甲同学成绩的方差为17×(49+36+25+49+121)=40,乙同学成绩的方差为17×(169+16+16+4+36+36+121)=3987>40,故成绩较稳定的是甲. 答案:甲6.(2018·张掖重点中学联考)张掖市旅游局为了了解大佛寺景点在大众中的熟知度,随机对15~65岁的人群抽样了n 人,问题是“大佛寺是几A 级旅游景点?”统计结果如下图表.(1)分别求出a ,b ,x ,y 的值;(2)从第2,3,4组回答正确的人中用分层抽样的方法抽取6人,求第2,3,4组每组各抽取多少人;(3)在(2)抽取的6人中随机抽取2人,求所抽取的人中恰好没有第3组人的概率.解:(1)由频率表中第4组数据可知,第4组总人数为90.36=25, 再结合频率分布直方图可知n =250.025×10=100,所以a =100×0.01×10×0.5=5, b =100×0.03×10×0.9=27, x =18100×0.02×10=0.9,y =3100×0.015×10=0.2.(2)因为第2,3,4组回答正确的共有54人,所以利用分层抽样在54人中抽取6人,每组分别抽取的人数为: 第2组:1854×6=2;第3组:2754×6=3;第4组:954×6=1.(3)设第2组的2人为A 1,A 2;第3组的3人为B 1,B 2,B 3;第4组的1人为C 1. 则从6人中随机抽取2人的所有可能的结果为:(A 1,A 2),(A 1,B 1),(A 1,B 2),(A 1,B 3),(A 1,C 1),(A 2,B 1),(A 2,B 2),(A 2,B 3),(A 2,C 1),(B 1,B 2),(B 1,B 3),(B 1,C 1),(B 2,B 3),(B 2,C 1),(B 3,C 1),共15种,其中恰好没有第3组人的结果为:(A 1,A 2),(A 1,C 1),(A 2,C 1),共3种,所以所抽取的人中恰好没有第3组人的概率P =315=15.7.为了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a 的值;(2)估计这种植物果实重量的平均数x 和方差s 2(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于32.5克的即为优质果实,用样本估计总体.若从这种植物果实中随机抽取3个,其中优质果实的个数为X,求X的分布列和数学期望E(X).解:(1)组距d=5,由5×(0.020+0.040+0.075+a+0.015)=1,得a=0.050.(2)各组中点值和相应的频率依次为:所以x=30×0.1+35×0.2+40×0.375+45×0.25+50×0.075=40,s2=(-10)2×0.1+(-5)2×0.2+02×0.375+52×0.25+102×0.075=28.75.(3)由已知,这种植物果实的优质率p=0.9,且X服从二项分布B(3,0.9),X=0,1,2,3,P(X=k)=C k3·0.9k·0.13-k,所以P(X=0)=0.13=0.001,P(X=1)=C13×0.9×0.12=0.027,P(X=2)=C23×0.92×0.1=0.243,P(X=3)=0.93=0.729,故X的分布列为所以E(X)=np=2.7.C级——重难题目自主选做1.在国际风帆比赛中,成绩以低分为优胜,比赛共11场,并以最佳的9场成绩计算最终的名次.在一次国际风帆比赛中,前7场比赛结束后,排名前8位的选手积分如下表:(1)根据表中的比赛数据,比较运动员A与B的成绩及稳定情况;(2)从前7场平均分低于6.5分的运动员中,随机抽取2个运动员进行兴奋剂检查,求至少1个运动员平均分不低于5分的概率;(3)请依据前7场比赛的数据,预测冠亚军选手,并说明理由.解:(1)由表中的数据,我们可以分别计算运动员A和B前7场比赛积分的平均数和方差,作为两运动员比赛的成绩及衡量两运动员稳定情况的依据.运动员A的平均分x1=17×21=3,方差s21=17×[(3-3)2+(2-3)2×4+(4-3)2+(6-3)2]=2;运动员B的平均分x2=17×28=4,方差s22=17×[(1-4)2×2+(3-4)2+(5-4)2+(10-4)2+(4-4)2×2]=8.从平均分和积分的方差来看,运动员A的平均分及积分的方差都比运动员B的小,也就是说,前7场比赛,运动员A的成绩优异,而且表现较为稳定.(2)由表可知,平均分低于6.5分的运动员共有5个,其中平均分低于5分的运动员有3个,分别为A,B,C,平均分不低于5分且低于6.5分的运动员有2个,分别为D,E.从这5个运动员中任取2个共有10种情况:AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,其中至少有1个运动员平均分不低于5分的有7种情况.设至少有1个运动员平均分不低于5分为事件A,则P(A)=7 10.(3)尽管此时还有4场比赛没有进行,但这里我们可以假定每位选手在各自的11场比赛中发挥的水平大致相同,因而可以把前7场比赛的成绩看作总体的一个样本,并由此估计每位运动员最后比赛的成绩.从已经结束的7场比赛的积分来看,运动员A的成绩最为优异,而且表现最为稳定,因此,预测运动员A将获得最后的冠军.而运动员B和C平均分相同,但运动员C得分总体呈下降趋势,所以预测运动员C将获得亚军.(说明:方案不唯一,其他言之有理的方案也给满分)2.在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图.(1)若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由;(2)若从甲的6次模拟测试成绩中随机选择2个,记选出的成绩中超过87分的个数为随机变量ξ,求ξ的分布列和数学期望.解:(1)学生甲的平均成绩x甲=68+76+79+86+88+956=82,学生乙的平均成绩x乙=71+75+82+84+86+946=82,又s2甲=16×[(68-82)2+(76-82)2+(79-82)2+(86-82)2+(88-82)2+(95-82)2]=77,s2乙=16×[(71-82)2+(75-82)2+(82-82)2+(84-82)2+(86-82)2+(94-82)2]=1673,则x甲=x乙,s2甲>s2乙,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.(2)随机变量ξ的所有可能取值为0,1,2,且P(ξ=0)=C24C26=25,P(ξ=1)=C14C12C26=815,P(ξ=2)=C22C26=115,则ξ的分布列为所以数学期望E (ξ)=0×25+1×815+2×115=23.(二)重点高中适用作业A 级——保分题目巧做快做1.(2018·湖南五市十校联考)某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n -m 的值是( )A .5B .6C .7D .8解析:选B 由甲组学生成绩的平均数是88,可得17[70+80×3+90×3+(8+4+6+8+2+m +5)]=88,解得m =3.由乙组学生成绩的中位数是89,可得n =9,所以n -m =6.2.(2016·山东高考)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是( )A .56B .60C .120D .140解析:选D 由直方图可知每周自习时间不少于22.5小时的频率为(0.16+0.08+0.04)×2.5=0.7,则每周自习时间不少于22.5小时的人数为0.7×200=140.3.如图是依据某城市年龄在20岁到45岁的居民上网情况调查而绘制的频率分布直方图,现已知年龄在[30,35),[35,40),[40,45]的上网人数呈现递减的等差数列分布,则年龄在[35,40)的网民出现的频。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第三节用样本估计总体总体分布的估计(1)了解分布的意义和作用,会列频率分布表,会画频率分布直方图、频率折线图、茎叶图,解它们各自的特点.(2)解样本据标准差的意义和作用,会计算据标准差.(3)能从样本据中提取基本的字特征(如平均、标准差),并给出合的解释.(4)会用样本的频率分布估计总体分布,会用样本的基本字特征估计总体的基本字特征,解用样本估计总体的思想.(5)会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.知识点一频率分布直方图1.作频率分布直方图的步骤(1)求极差(即一组据中最大值与最小值的差).(2)决定组距与组.(3)将据分组.(4)列频率分布表.(5)画频率分布直方图.2.频率分布折线图和总体密度曲线(1)频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(2)总体密度曲线:随着样本容量的增加,作图时所分组增加,组距减小,相应的频率折线图会越越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.易误提醒 (1)易把直方图与条形图混淆:两者的区别在于条形图是离散随机变量,纵坐标刻度为频或频率,直方图是连续随机变量,连续随机变量在某一点上是没有频率的.(2)易忽视频率分布直方图中纵轴表示的应为频率组距.必记结论 由频率分布直方图进行相关计算时,需掌握下列关系式:(1)频率组距×组距=频率. (2)频样本容量=频率,此关系式的变形为频频率=样本容量,样本容量×频率=频.[自测练习]1.某校100名学生期中考试学成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100],则图中a 的值为( )A .0.006B .0.005C .0.004 5D .0.002 5解析:由题意知,a =1-+0.03+2×10=0.005.答案:B2.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频为( )A .0.25B .0.5C .20D .16解析:设中间一组的频为x ,依题意有x80=14⎝ ⎛⎭⎪⎫1-x 80,解得x =16,应选D.答案:D知识点二 茎叶图 茎叶图的优点茎叶图的优点是可以保留原始据,而且可以随时记录,这对据的记录和表示都能带方便.易误提醒 在绘制茎叶图时,易遗漏重复出现的据,重复出现的据要重复记录,同时不要混淆茎叶图中茎与叶的含义.[自测练习]3.(2015·惠州模拟)某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们每场比赛得分的情况用如图所示的茎叶图表示,则甲、乙两名运动员的中位分别为( )A .19、13B .13、19C.20、18 D.18、20解析:由茎叶图可知,甲的中位为19,乙的中位为13.故选A. 答案:A知识点三样本的字特征1.众、中位、平均2.标准差、方差(1)标准差:样本据到平均的一种平均距离,一般用s表示,s=1nx1-x2+x2-x2+…+x n-x2].(2)方差:标准差的平方s2s2=1n[(x1-x)2+(x2-x)2+…+(x n-x)2],其中x i(i=1,2,3,…,n)是样本据,n是样本容量,x是样本平均.易误提醒(1)众、中位与平均都是描述一组据集中趋势的量,平均是最重要的量.(2)平均反映的是样本个体的平均水平,众和中位则反映样本中个体的“重心”.(3)实际问题中求得的平均、众和中位应带上单位.必备方法利用频率分布直方图求众、中位与平均时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标是众.(2)中位左边和右边的小长方形的面积和是相等的.(3)平均是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[自测练习]4.对于一组据x i(i=1,2,3,…,n),如果将它们改变为x i+C(i =1,2,3,…,n),其中C≠0,则下列结论正确的是( ) A.平均与方差均不变B.平均变,方差保持不变C.平均不变,方差变D.平均与方差均发生变解析:依题意,记原据的平均为x,方差为s2,则新据的平均为x 1+C+x2+C+…+x n+Cn=x+C,即新据的平均改变;新据的方差为1n{[(x1+C)-(x+C)]2+[(x2+C)-(x+C)]2+…+[(x n+C)-(x+C)]2}=s2,即新据的方差不变,故选B.答案:B5.(2015·高考陕西卷)中位为1 010的一组构成等差列,其末项为2 015,则该列的首项为________.解析:设等差列的首项为a1,根据等差列的性质可得,a1+2 015=2×1 010,解得a1=5.答案:5考点一频率分布直方图及应用|1.某班50位学生期中考试学成绩的频率分布直方图如图所示,其中成绩分组区间是:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],则图中x的值等于( )A.0.12 B.0.012C.0.18 D.0.018解析:依题意,0.054×10+10x+0.01×10+0.006×10×3=1,解得x=0.018,故选D.答案:D2.某市为了节约能,拟出台“阶梯电价”制度,即制订住户月用电量的临界值a.若某住户某月用电量不超过a度,则按平价计费;若某月用电量超过a度,则超出部分按议价计费,未超出部分按平价计费.为确定a的值,随机调查了该市100户的月用电量,工作人员已将90户的月用电量填在了下面的频率分布表中,最后10户的月用电量(单位:度)为:18,63,43,119,65,77,29,97,52,100.正正正正正正正正正正正正正正正(2)根据已有信息,试估计全市住户的平均月用电量(同一组据用该区间的中点值作代表);(3)若该市计划让全市75%的住户在“阶梯电价”出台前后缴纳的电费不变,试求临界值a.解:(1)正正正正正正⑤ [80,100) 正正正正正25 0.25 ⑥ [100,120]正50.05(2)由题意,用每小组的中点值代表该小组的平均月用电量,则100户住户组成的样本的平均月用电量为10×0.04+30×0.12+50×0.24+70×0.30+90×0.25+110×0.05=65(度).用样本估计总体,可知全市居民的平均月用电量约为65度. (3)计算累计频率,可得下表:分组 [0,20) [20,40) [40,60) [60,80) [80,100) [100,120] 频率 0.04 0.12 0.24 0.30 0.25 0.05 累计 频率0.040.160.400.700.951.00在临界值a 左侧小矩形的总面积(频率)为0.75,故有0.7+(a -80)×0.012 5=0.75,解得a =84,由样本估计总体,可得临界值a 为84.绘制频率分布直方图时需注意(1)制作好频率分布表后,可以利用各组的频率之和是否为1检验该表是否正确;(2)频率分布直方图的纵坐标是频率组距,而不是频率.考点二 茎叶图|1.如图所示的茎叶图是甲、乙两位同学在期末考试中的六科成绩,已知甲同学的平均成绩为85,乙同学的六科成绩的众为84,则x ,y 的值分别为( )A .2,4B .4,4C .5,6D .6,4 解析:x 甲=75+82+84++x +90+936=85,解得x =6,由图可知y =4,故选D.答案:D2.(2016·长沙一模)右面的茎叶图是某班学生在一次学测验时的成绩:根据茎叶图,得出该班男、女生学成绩的四个统计结论,其中错误的一项是( )A .15名女生成绩的平均分为78B .17名男生成绩的平均分为77C .女生成绩和男生成绩的中位分别为82,80D .男生中的高分段和低分段均比女生多,相比较男生两极分比较严重解析:对于A,15名女生成绩的平均分为115×(90+93+80+80+82+82+83+83+85+70+71+73+75+66+57)=78,A 正确;对于B,17名男生成绩的平均分为117×(93+93+96+80+82+83+86+86+88+71+74+75+62+62+68+53+57)=77,故B正确;对于D,观察茎叶图,对男生、女生成绩进行比较,可知男生两极分比较严重,D正确;对于C,根据女生和男生成绩据分析可得,两组据的中位均为80,C错误,故选C.答案:C使用茎叶图时,需注意:(1)“叶”的位置只有一个字,而“茎”的位置的字位一般不需要统一;(2)重复出现的据要重复记录,不能遗漏,特别是“叶”的位置上的据.考点三样本的字特征|(2015·高考广东卷)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众和中位;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?[解] (1)依题意,20×(0.002+0.009 5+0.011+0.012 5+x +0.005+0.002 5)=1,解得x =0.007 5.∴直方图中x 的值为0.007 5.(2)由图可知,最高矩形的据组为[220,240), ∴众为220+2402=230.∵[160,220)的频率之和为(0.002+0.009 5+0.011)×20=0.45,∴依题意,设中位为y ,∴0.45+(y -220)×0.012 5=0.5. 解得y =224,∴中位为224.(3)月平均用电量在[220,240)的用户在四组用户中所占比例为0.012 50.012 5+0.007 5+0.005+0.002 5=511,∴月平均用电量在[220,240)的用户中应抽取11×511=5(户).(1)平均与方差都是重要的字特征,是对总体的一种简明地描述,平均、中位、众描述其集中趋势,方差和标准差描述波动大小.(2)利用方差优比较时方差越小,效果越好.甲、乙两名射击运动员参加某大型运动会的预选赛,他们分别射击了5次,成绩如下表(单位:环):________.解析:x 甲=x 乙=9,s2甲=15×[(9-10)2+(9-8)2+(9-9)2+(9-9)2+(9-9)2]=25,s 2乙=15×[(9-10)2+(9-10)2+(9-7)2+(9-9)2+(9-9)2]=65>s 2甲,故甲更稳定. 答案:甲11.概率与统计的综合问题的答题模板【典例】 (12分)(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A ,B 两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A 地区用户满意度评分的频率分布直方图和B 地区用户满意度评分的频分布表.A 地区用户满意度评分的频率分布直方图B 地区用户满意度评分的频分布表图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);B 地区用户满意度评分的频率分布直方图(2)根据用户满意度评分,将用户的满意度分为三个等级:[思路点拨] (1)因为在频率分布直方图上,纵坐标表示的是频率与组距的比值,根据频求出频率,进而求出频率与组距的比值,根据频率分布直方图可看出满意度评分的平均值的大小和分散程度,中间的矩形面积越高越集中,越不分散;(2)B 地区可直接借助低于70分的频10求出不满意的概率,A 地区利用频率分布直方图中小矩形的面积即为频率,可求出不满意的概率,进而比较大小.[规范解答] (1)如图所示.通过两地区用户满意度评分的频率分布直方图可以看出,B地区用户满意度评分的平均值高于A地区用户满意度评分的平均值;B地区用户满意度评分比较集中,而A地区用户满意度评分比较分散.(6分)(2)A地区用户的满意度等级为不满意的概率大.(7分)记C A表示事件:“A地区用户的满意度等级为不满意”;C B表示事件:“B地区用户的满意度等级为不满意”.由直方图得P(C A)的估计值为(0.01+0.02+0.03)×10=0.6,(8分)P(C B)的估计值为(0.005+0.02)×10=0.25.(10分)所以A地区用户的满意度等级为不满意的概率大.(12分)[模板形成]分析图表、审核据↓作出频率分布直方图↓由直方图据分析相应问题↓利用直方图求概率,作出判断↓反思解题过程注意规范A组考点能力演练1.(2016·邢台摸底)样本中共有五个个体,其值分别为0,1,2,3,m.若该样本的平均值为1,则其样本方差为( )A.105B.305C. 2 D.2解析:依题意得m=5×1-(0+1+2+3)=-1,样本方差s2=1 5(12+02+12+22+22)=2,即所求的样本方差为2,选D.答案:D2.10名工人某天生产同一零件,生产的零件分别是15,17,14,10,15,17,17,16,14,12,设其平均为a,中位为b,众为c,则有( )A.a>b>c B.b>c>aC.c>a>b D.c>b>a解析:依题意,这些据由小到大依次是10,12,14,14,15,15,16,17,17,17,因此a<15,b=15,c=17,c>b>a,选D.答案:D3.(2015·高考全国卷Ⅱ)根据下面给出的2004年至2013年我国二氧硫年排放量(单位:万吨)柱形图,以下结论中不正确的是( )A.逐年比较,2008年减少二氧硫排放量的效果最显著B.2007年我国治二氧硫排放显现成效C .2006年以我国二氧硫年排放量呈减少趋势D .2006年以我国二氧硫年排放量与年份正相关解析:根据柱形图易得选项A ,B ,C 正确,2006年以我国二氧硫年排放量与年份负相关,选项D 错误.故选D.答案:D4.(2015·高考山东卷)为比较甲、乙两地某月14时的气温情况,随机选取该月中的5天,将这5天中14时的气温据(单位:℃)制成如图所示的茎叶图.考虑以下结论:①甲地该月14时的平均气温低于乙地该月14时的平均气温; ②甲地该月14时的平均气温高于乙地该月14时的平均气温; ③甲地该月14时的气温的标准差小于乙地该月14时的气温的标准差;④甲地该月14时的气温的标准差大于乙地该月14时的气温的标准差.其中根据茎叶图能得到的统计结论的编号为( ) A .①③ B .①④ C .②③D .②④解析:由题中茎叶图,知x 甲=26+28+29+31+315=29,s 甲=错误!=3105; x 乙=28+29+30+31+325=30,s 乙=错误!= 2.所以x 甲<x 乙,s 甲>s 乙,故选B. 答案:B5.(2016·内江模拟)某公司10个销售店某月销售某产品量(单位:台)的茎叶图如下:分组成[11,20),[20,30),[30,40]时,所作的频率分布直方图是( )解析:本题考查统计.利用排除法求解.由直方图的纵坐标是频率/组距,排除C 和D ;又第一组的频率是0.2,直方图中第一组的纵坐标是0.02,排除A ,故选B.答案:B6.(2015·郑州二检)已知甲、乙两组据如茎叶图所示,若它们的中位相同,平均也相同,则图中的m 、n 的比值mn=________.解析:由茎叶图可知甲的据为27、30+m 、39,乙的据为20+n 、32、34、38.由此可知乙的中位是33,所以甲的中位也是33,所以m =3.由此可以得出甲的平均为33,所以乙的平均也为33,所以有20+n +32+34+384=33,所以n =8,所以m n =38.答案:387.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次如下表:解析:由据表可得出乙班的据波动性较大,则其方差较大,甲班的据波动性较小,其方差较小,其平均值为7,方差s 2=15(1+0+0+1+0)=25.答案:258.(2015·高考湖北卷)某电子商务公司对10 000名络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a =________;(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人为________.解析:(1)0.1×1.5+0.1×2.5+0.1×a+0.1×2+0.1×0.8+0.1×0.2=1,解得a=3;(2)区间[0.5,0.9]内的频率为1-0.1×1.5-0.1×2.5=0.6,则该区间内购物者的人为10 000×0.6=6 000.答案:(1)3 (2)6 0009.甲、乙两人参加学竞赛培训.现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,画出茎叶图如图.(1)指出学生乙成绩的中位;(2)现要从中选派一人参加学竞赛,你认为应该派哪位学生参加?解:(1)依题意知,学生乙成绩的中位为83+852=84.(2)派甲参加比较合适,由如下:x甲=18(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,x乙=18(70×1+80×4+90×3+5+3+5+2+5)=85,s2甲=35.5,s2乙=41,∵x甲=x乙,且s2甲<s2乙,∴甲的成绩比较稳定.10.(2016·唐山统考)为了调查某校学生体质健康达标情况,现采用随机抽样的方法从该校抽取了m名学生进行体育测试.根据体育测试得到了这m名学生的各项平均成绩(满足100分),按照以下区间分为七组:[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],并得到频率分布直方图(如图).已知测试平均成绩在区间[30,60)内有20人.(1)求m的值及中位n;(2)若该校学生测试平均成绩小于n,则学校应适当增加体育活动时间.根据以上抽样调查据,该校是否需要增加体育活动时间?解:(1)由频率分布直方图知第1组,第2组和第3组的频率分别是0.02,0.02和0.06,则m×(0.02+0.02+0.06)=20,解得m=200.由直方图可知,中位n位于[70,80)内,则0.02+0.02+0.06+0.22+0.04(n-70)=0.5,解得n=74.5.(2)设第i(i=1,2,3,4,5,6,7)组的频率和频分别为p i和x i,由图知,p1=0.02,p2=0.02,p3=0.06,p4=0.22,p5=0.40,p6=0.18,p7=0.10,则由x i=200×p i,可得x1=4,x2=4,x3=12,x4=44,x5=80,x6=36,x7=20,故该校学生测试平均成绩是x=35x1+45x2+55x3+65x4+75x5+85x6+95x7200=74<74.5,所以学校应该适当增加体育活动时间.B组高考题型专练1.(2015·高考陕西卷)某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人为( )A.93 B.123C.137 D.167解析:由扇形统计图可得,该校女教师人为110×70%+150×(1-60%)=137.故选C.答案:C2.(2015·高考湖南卷)在一次马拉松比赛中,35名运动员的成绩(单位:分钟)的茎叶图如图所示.若将运动员按成绩由好到差编为1~35号,再用系统抽样方法从中抽取7人,则其中成绩在区间[139,151]上的运动员人是________.解析:由题意可知,这35名运动员的分组情况为,第一组(130,130,133,134,135),第二组(136,136,138,138,138),第三组(139,141,141,141,142),第四组(142,142,143,143,144),第五组(144,145,145,145,146),第六组(146,147,148,150,151),第七组(152,152,153,153,153),故成绩在区间[139,151]上的运动员恰有4组,故运动员人为4.答案:43.(2015·高考江苏卷)已知一组据4,6,5,8,7,6,那么这组据的平均为________.解析:由平均公式可得这组据的平均为4+6+5+8+7+66=6.答案:64.(2015·高考全国卷Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了20个用户,得到用户对产品的满意度评分如下:A地区:62 73 81 92 95 85 74 64 53 7678 86 95 66 97 78 88 82 76 89B地区:73 83 62 51 91 46 53 73 64 8293 48 65 81 74 56 54 76 65 79(1)根据两组据完成两地区用户满意度评分的茎叶图,并通过茎叶图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可);(2)根据用户满意度评分,将用户的满意度从低到高分为三个等级:等级”.假设两地区用户的评价结果相互独立.根据所给据,以事件发生的频率作为相应事件发生的概率,求C的概率.解:(1)两地区用户满意度评分的茎叶图如下通过茎叶图可以看出,A 地区用户满意度评分的平均值高于B 地区用户满意度评分的平均值;A 地区用户满意度评分比较集中,B 地区用户满意度评分比较分散.(2)记C A 1表示事件:“A 地区用户的满意度等级为满意或非常满意”;C A 2表示事件:“A 地区用户的满意度等级为非常满意”; C B 1表示事件:“B 地区用户的满意度等级为不满意”; C B 2表示事件:“B 地区用户的满意度等级为满意”,则C A 1与C B 1独立,C A 2与C B 2独立,C B 1与C B 2互斥,C =C B 1C A 1∪C B 2C A 2.P (C )=P (C B 1C A 1∪C B 2C A 2)=P (C B 1C A 1)+P (C B 2C A 2) =P (C B 1)P (C A 1)+P (C B 2)P (C A 2).由所给据得C A 1,C A 2,C B 1,C B 2发生的频率分别为1620,420,1020,820,故P (C A 1)=1620,P (C A 2)=420,P (C B 1)=1020,P (C B 2)=820,P (C )=1020×1620+820×420=0.48.。

相关文档
最新文档