历年高考数学真题精选40 频率分布直方图

合集下载

2024届新高考数学大题精选30题:概率统计(精选30题)(解析版)

2024届新高考数学大题精选30题:概率统计(精选30题)(解析版)

大题概率统计(精选30题)1(2024·浙江绍兴·二模)盒中有标记数字1,2的小球各2个.(1)若有放回地随机取出2个小球,求取出的2个小球上的数字不同的概率;(2)若不放回地依次随机取出4个小球,记相邻小球上的数字相同的对数为X(如1122,则X=2),求X的分布列及数学期望E X.【答案】(1)1 2;(2)分布列见解析,1.【分析】(1)根据组合知识求得取球的方法数,然后由概率公式计算概率;(2)确定X的所有可能取值为0,1,2,然后分别计算概率得分布列,再由期望公式计算出期望.【详解】(1)设事件A=“取出的2个小球上的数字不同”,则P A=C12C12+C12C12C14C14=12.(2)X的所有可能取值为0,1,2.①当相邻小球上的数字都不同时,如1212,有2×A22×A22种,则P X=0=2×A22×A22A44=13.②当相邻小球上的数字只有1对相同时,如1221,有2×A22×A22种,则P X=1=2×A22×A22A44=13.③当相邻小球上的数字有2对相同时,如1122,有2×A22×A22种,则P X=2=2×A22×A22A44=13.所以X的分布列为X012P 131313所以X的数学期望E X=0×13+1×13+2×13=1.2(2024·江苏扬州·模拟预测)甲、乙两人进行某棋类比赛,每局比赛时,若决出输赢则获胜方得2分,负方得0分;若平局则各得1分.已知甲在每局中获胜、平局、负的概率均为13,且各局比赛结果相互独立.(1)若比赛共进行了三局,求甲共得3分的概率;(2)规定比赛最多进行五局,若一方比另一方多得4分,则停止比赛,求比赛局数X的分布列与数学期望.【答案】(1)7 27;(2)分布列见解析,31781.【分析】(1)写出所有可能情形,利用互斥事件的概率和公式即可求出;(2)算出X为不同值时对应的概率并填写分布列,之后求出数学期望即可.【详解】(1)设“三局比赛后,甲得3分”为事件A,甲得3分包含以下情形:三局均为平局,三局中甲一胜一平一负,所以P A=133+A3313 3=727,故三局比赛甲得3分的概率为7 27 .(2)依题意知X的可能取值为2,3,4,5,P X=2=2×132=29,P X=3=2×C12133=427,P X=4=2×C12134+C1313 4=1081,P X=5=1-P X=2-P X=3-P X=4=1-29-427-1081=4181,故其分布列为:X2345P2942710814181期望E X=2×29+3×427+4×1081+5×4181=31781.3(2024·江苏南通·二模)某班组建了一支8人的篮球队,其中甲、乙、丙、丁四位同学入选,该班体育老师担任教练.(1)从甲、乙、丙、丁中任选两人担任队长和副队长,甲不担任队长,共有多少种选法?(2)某次传球基本功训练,体育老师与甲、乙、丙、丁进行传球训练,老师传给每位学生的概率都相等,每位学生传球给同学的概率也相等,学生传给老师的概率为17.传球从老师开始,记为第一次传球,前三次传球中,甲同学恰好有一次接到球且第三次传球后球回到老师手中的概率是多少?【答案】(1)9种(2)349.【分析】(1)法一,利用分步乘法计数原理集合组合数的计算,即可求得答案;法二,利用间接法,即用不考虑队长人选对甲的限制的所有选法,减去甲担任队长的选法,即可得答案;(2)考虑第一次传球,老师传给了甲还是传给乙、丙、丁中的任一位,继而确定第二次以及第三次传球后球回到老师手中的情况,结合乘法公式以及互斥事件的概率求法,即可求得答案.【详解】(1)法一,先选出队长,由于甲不担任队长,方法数为C13;再选出副队长,方法数也是C13,故共有方法数为C13×C13=9(种).方法二先不考虑队长人选对甲的限制,共有方法数为A 24=4×3=12(种);若甲任队长,方法数为C 13,故甲不担任队长的选法种数为12-3=9(种)答:从甲、乙、丙、丁中任选两人分别担任队长和副队长,甲不担任队长的选法共有9种.(2)①若第一次传球,老师传给了甲,其概率为14;第二次传球甲只能传给乙、丙、丁中的任一位同学,其概率为67;第三次传球,乙、丙、丁中的一位传球给老师,其概率为17,故这种传球方式,三次传球后球回到老师手中的概率为:14×67×17=398.②若第一次传球,老师传给乙、丙、丁中的任一位,其概率为34,第二次传球,乙、丙、丁中的一位传球给甲,其概率为27,第三次传球,甲将球传给老师,其概率为17,这种传球方式,三次传球后球回到老师手中的概率为34×27×17=398,所以,前三次传球中满足题意的概率为:398+398=349.答:前三次传球中,甲同学恰好有一次接到球且第三次传球后球回到老师手中的概率是349.4(2024·重庆·模拟预测)中国在第75届联合国大会上承诺,努力争取2060年之前实现碳中和(简称“双碳目标”).新能源电动汽车作为战略新兴产业,对于实现“双碳目标”具有重要的作用.赛力斯汽车有限公司为了调查客户对旗下AITO 问界M 7的满意程度,对所有的意向客户发起了满意度问卷调查,将打分在80分以上的客户称为“问界粉”.现将参与调查的客户打分(满分100分)进行了统计,得到如下的频率分布直方图:(1)估计本次调查客户打分的中位数(结果保留一位小数);(2)按是否为“问界粉”比例采用分层抽样的方法抽取10名客户前往重庆赛力斯两江智慧工厂参观,在10名参观的客户中随机抽取2名客户赠送价值2万元的购车抵用券.记获赠购车券的“问界粉”人数为ξ,求ξ的分布列和数学期望E ξ .【答案】(1)73.3分(2)分布列见解析;期望为35【分析】(1)根据频率分布直方图求解中位数的方法可得答案;(2)确定抽取的“问界粉”人数,再确定ξ的取值,求解分布列,利用期望公式求解期望.【详解】(1)由频率分布直方图可知:打分低于70分的客户所占比例为40%,打分低于80分的客户的所占比例为70%,所以本次调查客户打分的中位数在[70,80)内,由70+10×0.50-0.400.70-0.40=2203≈73.3,所以本次调查客户打分的中位数约为73.3分;(2)根据按比例的分层抽样:抽取的“问界粉”客户3人,“非问界粉”客户7人,则ξ的所有可能取值分别为0,1,2,其中:P (ξ=0)=C 03C 27C 210=715,P (ξ=1)=C 13C 17C 210=715,P (ξ=2)=C 23C 07C 210=115,所以ξ的分布列为:ξ012P715715115所以数学期望E (ξ)=0×715+1×715+2×115=35.5(2024·福建三明·三模)某校开设劳动教育课程,为了有效推动课程实施,学校开展劳动课程知识问答竞赛,现有家政、园艺、民族工艺三类问题海量题库,其中家政类占14,园艺类占14,民族工艺类占12.根据以往答题经验,选手甲答对家政类、园艺类、民族工艺类题目的概率分别为25,25,45,选手乙答对这三类题目的概率均为12.(1)求随机任选1题,甲答对的概率;(2)现进行甲、乙双人对抗赛,规则如下:两位选手进行三轮答题比赛,每轮只出1道题目,比赛时两位选手同时回答这道题,若一人答对且另一人答错,则答对者得1分,答错者得-1分,若两人都答对或都答错,则两人均得0分,累计得分为正者将获得奖品,且两位选手答对与否互不影响,每次答题的结果也互不影响,求甲获得奖品的概率.【答案】(1)35(2)4411000【分析】(1)利用全概率公式,即可求得答案;(2)求出乙答对的概率,设每一轮比赛中甲得分为X ,求出X 的每个值对应的概率,即可求得三轮比赛后,甲总得分为Y 的每个值相应的概率,即可得答案.【详解】(1)记随机任选1题为家政、园艺、民族工艺试题分别为事件A i i =1,2,3 ,记随机任选1题,甲答对为事件B ,则P A 1 =14,P A 2 =14,P A 3 =12,P B |A 1 =25,P B |A 2 =25,P B |A 3 =45,则P B =P A1 P B |A 1 +P A2 P B |A 2 +P A3 P B |A 3=14×25+14×25+12×45=35;(2)设乙答对记为事件C ,则P C =P A 1 P C |A 1 +P A 2 P C |A 2 +P A 3 P C |A 3 =14×12+14×12+12×12=12,设每一轮比赛中甲得分为X ,则P X =1 =P BC =P B P C =35×1-12 =310,P X =0 =P BC ∪BC =P BC +P CB=35×12+1-35 ×1-12 =12,P (X =-1)=P B C =1-35 ×12=15,三轮比赛后,设甲总得分为Y ,则P Y =3 =3103=271000,P Y =2 =C 23310 2×12=27200,P Y =1 =C 13×310×122+C 23×3102×15=2791000,所以甲最终获得奖品的概率为P =P Y =3 +P Y =2 +P Y =1 =271000+27200+2791000=4411000.6(2024·江苏南京·二模)某地5家超市春节期间的广告支出x (万元)与销售额y (万元)的数据如下:超市A B C D E 广告支出x 24568销售额y3040606070(1)从A ,B ,C ,D ,E 这5家超市中随机抽取3家,记销售额不少于60万元的超市个数为X ,求随机变量X 的分布列及期望E (X );(2)利用最小二乘法求y 关于x 的线性回归方程,并预测广告支出为10万元时的销售额.附:线性回归方程y =b x +a中斜率和截距的最小二乘估计公式分别为:b =ni =1x i y i -nx yni =1x 2i -nx2,a =y -b x .【答案】(1)X 的分布列见解析,期望E (X )=95(2)y=7x +17;预测广告费支出10万元时的销售额为87万元.【分析】(1)根据超几何分布的概率公式求解分布列,进而可求解期望,(2)利用最小二乘法求解线性回归方程即可.【详解】(1)从A ,B ,C ,D ,E 这5家超市中随机抽取3家,记销售额不少于60万元的超市有C ,D ,E 这3家超市,则随机变量X 的可能取值为1,2,3P (X =1)=C 13C 22C 35=310,P (X =2)=C 23C 12C 35=35,P (X =3)=C 33C 35=110,∴X 的分布列为:X123P31035110数学期望E (X )=1×310+2×35+3×110=95.(2)x =2+4+5+6+85=5,y =30+40+60+60+705=52,b=ni =1x i y i -nx yni =1x 2i -nx2=60+160+300+360+560-5×5×524+16+25+36+64-5×52=7,a=52-7×5=17.∴y 关于x 的线性回归方程为y=7x +17;在y =7x +17中,取x =10,得y =7×10+17=87.∴预测广告费支出10万元时的销售额为87万元.7(2024·重庆·三模)甲、乙、丙三人进行羽毛球练习赛,其中两人比赛,另一人当裁判,每局比赛结束时,负的一方在下一局当裁判,设各局中双方获胜的概率均为12,各局比赛的结果都相互独立,第1局甲当裁判.记随机变量X i =1,第i 局乙当裁判0,第i 局甲或丙当裁判, i =1,2,⋅⋅⋅,n ,p i =P X i =1 ,X 表示前n 局中乙当裁判的次数.(1)求事件“n =3且X =1”的概率;(2)求p i ;(3)求E X ,并根据你的理解,说明当n 充分大时E X 的实际含义.附:设X ,Y 都是离散型随机变量,则E X +Y =E X +E Y .【答案】(1)34;(2)p i =-13 ×-12i -1+13;(3)p i ,答案见解析。

高中数学复习典型题专题训练118---频率直方图

高中数学复习典型题专题训练118---频率直方图

高中数学复习典型题专题训练118频率直方图列出样本数据的频率分布表和频率分布直方图的步骤: ①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x 来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.知识内容典例分析板块二.频率直方图则这200名同学中成绩大于等于80分且小于90分的学生有______名.【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )频率A .[610),的频率为0.32 B .若样本容量为100,则[1014),的频数为40 C .若样本容量为100,则(10] ,的频数为40 D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位. ⑴求m ; 10 15 20 25 30 35产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】 考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )如下:⑴ 作出频率分布表; ⑵ 画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm 之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?O频率组距次数149.5124.599.574.549.5【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题:⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.85987654322198653328698765叶茎1009080706050分数频率组距0.040.0280.0160.008⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。

频率分布直方图考试题(汇编)

频率分布直方图考试题(汇编)

频率分布直方图北鲲五班练习题1.用样本估计总体,下列说法正确的是()A.样本的结果就是总体的结果B.样本容量越大,估计就越精确C.样本的标准差可以近似地反映总体的平均状态D.数据的方差越大,说明数据越稳定2.一支田径队有男队员56人,女队员42人,用分层抽样的方法从全体运动员中抽出一个容量为28的样本,则应抽取男队员的人数为()A.12 B.14 C.16 D.183.某学校有教职工共160人,其中有教师104人,管理人员32人,后勤服务人员24人,要从中抽取一个容量为20的样本,用分层抽样的方法抽取样本,则在20人的样本中应抽取后勤人员的人数为( )A. 3B. 4C. 5D. 64.某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人.为了了解该单位职工的健康情况,决定采用分层抽样的方法,从中抽取容量为15的样本.则从上述各层中依次抽取的人数分别是()A. 8,4,3B. 6,5,4C. 7,5,3D. 8,5,25. 某协会有200名会员,现要从中抽取40名会员作样本,采用系统抽样法等间距抽取样本,将全体会员随机按1~200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第1组至第3组抽出的号码依次是()A. 3,8,13B. 2,7,12C. 3,9,15D. 2,6,126.一个容量为n的样本,分成若干组,已知某组的频数和频率分别是40,0.125,则n的值为A. 640B.320C.240D. 1607.个容量为32的样本,已知某组样本的频率为0.125,则该组样本的频数为.A. 2B. 4C. 6D. 8 ( )8.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为( )A.45,75,15B. 45,45,45C.30,90,15D. 45,60,309.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别各抽取的人数是( )A. 6,12,18B. 7,11,19C. 6,13,17D. 7,12,1710.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是( ).A.简单随机抽样法B.系统抽样法C.分层抽样法D.抽签法11.某工厂生产A、B、C三种不同型号的产品,产品数量之比依次为2 :3 :5.现用分层抽n样方法抽出一个容量为n的样本,样本中A种型号产品有16件,那么此样本的容量12.某学校共有教师490人,其中不到40岁的有350人,40岁及以上的有140人,为了解普通话在该校教师中的推广普及情况,用分层抽样的方法,从全体教师中抽取一个容量为70人的样本进行普通话水平测试,其中不到40岁的教师中应抽取的人数是___________.13.在某次学生考试的成绩中随机抽取若干学生的成绩,分组与各组的频数如下:[40,50),4;[50,60),1;[60,70),10;[70,80),11;[80,90),18;[90,100),6,估计本次考试的及格率为__________ . 14.把容量是100的样本分成8组,从第1组到第4组的频数分别是15,17,11,13,第5组到第7组的频率之和是0.32,那么第8组的频率是.15.《中华人民共和国道路交通安全法》 规定:车辆驾驶员血液酒精浓度在20~80 mg/100mL (不含80)之间,属于酒后驾车;血液酒精浓度在80mg/100mL (含80)以上时,属醉酒驾车。

历年高考数学真题精选40 频率分布直方图

历年高考数学真题精选40 频率分布直方图

高考数学真题精选(按考点分类)专题40 频率分布直方图(学生版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140A.6B.8C.12D.18二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a .(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).m和使6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20, ,90],并整理得到如下频率分布直方图:30),[30,40),[80(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg箱产量50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附:2P K K0.0500.0100.001()K 3.841 6.63510.82822()()()()()n ad bc K a b c d a c b d -=++++. 9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.10.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w =时,估计该市居民该月的人均水费.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.历年高考数学真题精选(按考点分类)专题40 频率分布直方图(教师版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140【答案】D【解析】自习时间不少于22.5小时的频率为:(0.160.080.04) 2.50.7++⨯=,故自习时间不少于22.5小时的频数为:0.7200140⨯=A.6B.8C.12D.18【答案】C【解析】由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.【答案】(1)3 (2)6000【解析】(1)由题意,根据直方图的性质得(1.5 2.5 2.00.80.2)0.11+++++⨯=,解得3aa=(2)由直方图得(3 2.00.80.2)0.1100006000+++⨯⨯=4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.【答案】24【解析】由频率分布直方图知:底部周长小于100cm的频率为(0.0150.025)100.4+⨯=,⨯=(株).∴底部周长小于100cm的频数为600.424三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.则由频率分布直方图得:0.200.150.70.050.1510.7ab++=⎧⎨++=-⎩,解得乙离子残留百分比直方图中0.35a=,0.10b=.(2)估计甲离子残留百分比的平均值为:20.1530.2040.3050.2060.1070.05 4.05x=⨯+⨯+⨯+⨯+⨯+⨯=甲.乙离子残留百分比的平均值为:30.0540.150.1560.3570.280.15 6.00x=⨯+⨯+⨯+⨯+⨯+⨯=乙.6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)m和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解答】解:(1)根据使用了节水龙头50天的日用水量频数分布表,作出使用了节水龙头50天的日用水量数据的频率分布直方图,如下图:(2)根据频率分布直方图得:该家庭使用节水龙头后,日用水量小于30.35m 的概率为: (0.2 1.0 2.61)0.10.48p =+++⨯=.(3)由题意得未使用水龙头50天的日均水量为:1(10.0530.1520.2540.3590.45260.5550.65)0.4850⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 使用节水龙头50天的日均用水量为:1(10.0550.15130.25100.35160.4550.55)0.3550⨯+⨯+⨯+⨯+⨯+⨯=, ∴估计该家庭使用节水龙头后,一年能节省:3365(0.480.35)47.45m ⨯-=.7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),[80⋯,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1(0.040.02)100.4-+⨯=故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;(Ⅱ)已知样本中分数小于40的学生有5人,故样本中分数小于40的频率为:0.05,则分数在区间[40,50)内的频率为:1(0.040.020.020.01)100.050.05-+++⨯-=,估计总体中分数在区间[40,50)内的人数为4000.0520⨯=人,(Ⅲ)样本中分数不小于70的频率为:0.6,由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,故男生的频率为:0.6,即女生的频率为:0.4,即总体中男生和女生人数的比例约为:3:2.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg <箱产量50kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:2()P K K0.050 0.010 0.001 K3.8416.63510.8282()()()()()n ad bc K a b c d a c b d -=++++. 解:(1)根据题意,由旧养殖法的频率分布直方图可得:P (A )(0.0120.0140.0240.0340.040)50.62=++++⨯=;(2)根据题意,补全列联表可得:箱产量50kg <箱产量50kg总计 旧养殖法 62 38 100 新养殖法 34 66 100 总计96104200则有2200(62663834)15.705 6.63510010096104K ⨯-⨯=≈>⨯⨯⨯, 故有99%的把握认为箱产量与养殖方法有关; (3)由频率分布直方图可得: 旧养殖法100个网箱产量的平均数1(27.50.01232.50.01437.50.02442.50.03447.50.04052.50.03257.50.0262.50.01267.50.012)559.4247.1x =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=; 新养殖法100个网箱产量的平均数2(37.50.00442.50.02047.50.04452.50.05457.50.04662.50.01067.50.008)5510.4752.35x =⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=;比较可得:12x x <,故新养殖法更加优于旧养殖法.9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.解:()1(0.080.160.400.520.120.080.04)0.5I a a =++++++++⨯, 整理可得:2 1.42a =+,∴解得:0.3a =.()II 估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.120.080.04)0.50.12++⨯=,又样本容量为30万,则样本中月均用水量不低于3吨的户数为300.12 3.6⨯=万. (Ⅲ)根据频率分布直方图,得;0.080.50.160.50.300.50.420.50.480.5⨯+⨯+⨯+⨯=<,+⨯=>,0.480.50.50.740.5∴中位数应在[2,2.5)组内,设出未知数x,令0.080.50.160.50.300.50.420.50.50.5⨯+⨯+⨯+⨯+⨯=,x解得0.04x=;+=.∴中位数是20.04 2.0410.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w=时,估计该市居民该月的人均水费.解:(1)由频率分布直方图得:用水量在[0.5,1)的频率为0.1,用水量在[1,1.5)的频率为0.15,用水量在[1.5,2)的频率为0.2,用水量在[2,2.5)的频率为0.25,用水量在[2.5,3)的频率为0.15,用水量在[3,3.5)的频率为0.05,用水量在[3.5,4)的频率为0.05,用水量在[4,4.5)的频率为0.05,用水量小于等于3立方米的频率为85%,∴为使80%以上居民在该用的用水价为4元/立方米,w∴至少定为3立方米.(2)当3w=时,该市居民的人均水费为:(0.110.15 1.50.220.25 2.50.153)40.05340.050.5100.05340.051100.05340.05 1.51010.5⨯+⨯+⨯+⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,∴当3w=时,估计该市居民该月的人均水费为10.5元.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解:(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x++++++⨯=,解方程可得0.0075x=,∴直方图中x的值为0.0075;(2)月平均用电量的众数是2202402302+=,(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.0020.00950.011)200.0125(220)0.5a++⨯+⨯-=可得224a=,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.01252010025⨯⨯=,月平均用电量为[240,260)的用户有0.00752010015⨯⨯=,月平均用电量为[260,280)的用户有0.0052010010⨯⨯=,月平均用电量为[280,300)的用户有0.0025201005⨯⨯=,∴抽取比例为111 25151055=+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解:(Ⅰ)通过两个地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值,B 地区的用户满意度评分的比较集中,而A 地区的用户满意度评分的比较分散.(Ⅱ)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”, B C 表示事件:“B 地区用户的满意度等级为不满意”,由直方图得()(0.010.020.03)100.6A P C =++⨯= 得()(0.0050.02)100.25B P C =+⨯=A ∴地区用户的满意度等级为不满意的概率大.。

(整理)高考数学总复习专题系列——统计.板块二.频率直方图.学生版

(整理)高考数学总复习专题系列——统计.板块二.频率直方图.学生版

一.随机抽样1.随机抽样:满足每个个体被抽到的机会是均等的抽样,共有三种经常采用的随机抽样方法:⑴简单随机抽样:从元素个数为N 的总体中不放回地抽取容量为n 的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样. 抽出办法:①抽签法:用纸片或小球分别标号后抽签的方法.②随机数表法:随机数表是使用计算器或计算机的应用程序生成随机数的功能生成的一张数表.表中每一位置出现各个数字的可能性相同. 随机数表法是对样本进行编号后,按照一定的规律从随机数表中读数,并取出相应的样本的方法.简单随机抽样是最简单、最基本的抽样方法.⑵系统抽样:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本的抽样方法.抽出办法:从元素个数为N 的总体中抽取容量为n 的样本,如果总体容量能被样本容量整除,设Nk n=,先对总体进行编号,号码从1到N ,再从数字1到k 中随机抽取一个数s 作为起始数,然后顺次抽取第2(1)s k s k s n k +++-,,,个数,这样就得到容量为n 的样本.如果总体容量不能被样本容量整除,可随机地从总体中剔除余数,然后再按系统抽样方法进行抽样.系统抽样适用于大规模的抽样调查,由于抽样间隔相等,又被称为等距抽样.⑶分层抽样:当总体有明显差别的几部分组成时,要反映总体情况,常采用分层抽样,使总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样,这种抽样方法叫做分层抽样.分层抽样的样本具有较强的代表性,而且各层抽样时,可灵活选用不同的抽样方法,应用广泛.2.简单随机抽样必须具备下列特点:⑴简单随机抽样要求被抽取的样本的总体个数N 是有限的. ⑵简单随机样本数n 小于等于样本总体的个数N . ⑶简单随机样本是从总体中逐个抽取的. ⑷简单随机抽样是一种不放回的抽样.⑸简单随机抽样的每个个体入样的可能性均为nN.3.系统抽样时,当总体个数N 恰好是样本容量n 的整数倍时,取Nk n=;若Nn不是整数时,先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量n 整除.因为每个个体被剔除的机会相等,因而整个抽样过程中每个个体被抽取的机会仍知识内容板块二.频率直方图然相等,为N n.二.频率直方图列出样本数据的频率分布表和频率分布直方图的步骤:①计算极差:找出数据的最大值与最小值,计算它们的差;②决定组距与组数:取组距,用极差组距决定组数;③决定分点:决定起点,进行分组;④列频率分布直方图:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.⑤绘制频率分布直方图:以数据的值为横坐标,以频率组距的值为纵坐标绘制直方图,知小长方形的面积=组距×频率组距=频率.频率分布折线图:将频率分布直方图各个长方形上边的中点用线段连接起来,就得到频率分布折线图,一般把折线图画成与横轴相连,所以横轴左右两端点没有实际意义.总体密度曲线:样本容量不断增大时,所分组数不断增加,分组的组距不断缩小,频率分布直方图可以用一条光滑曲线()y f x =来描绘,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.三.茎叶图制作茎叶图的步骤:①将数据分为“茎”、“叶”两部分;②将最大茎与最小茎之间的数字按大小顺序排成一列,并画上竖线作为分隔线; ③将各个数据的“叶”在分界线的一侧对应茎处同行列出.四.统计数据的数字特征用样本平均数估计总体平均数;用样本标准差估计总体标准差. 数据的离散程序可以用极差、方差或标准差来描述.极差又叫全距,是一组数据的最大值和最小值之差,反映一组数据的变动幅度; 样本方差描述了一组数据平均数波动的大小,样本的标准差是方差的算术平方根. 一般地,设样本的元素为12n x x x ,,,样本的平均数为x , 定义样本方差为222212()()()n x x x x x x s n-+-++-=,样本标准差s =简化公式:22222121[()]n s x x x nx n=+++-.五.独立性检验1.两个变量之间的关系;常见的有两类:一类是确定性的函数关系;另一类是变量间存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有一定随机性的.当一个变量取值一定时,另一个变量的取值带有一定随机性的两个变量之间的关系叫做相关关系.2.散点图:将样本中的n 个数据点()(12)i i x y i n =,,,,描在平面直角坐标系中,就得到了散点图.散点图形象地反映了各个数据的密切程度,根据散点图的分布趋势可以直观地判断分析两个变量的关系.3.如果当一个变量的值变大时,另一个变量的值也在变大,则这种相关称为正相关;此时,散点图中的点在从左下角到右上角的区域.反之,一个变量的值变大时,另一个变量的值由大变小,这种相关称为负相关.此时,散点图中的点在从左上角到右下角的区域.散点图可以判断两个变量之间有没有相关关系.4.统计假设:如果事件A 与B 独立,这时应该有()()()P AB P A P B =,用字母0H 表示此式,即0:()()()H P AB P A P B =,称之为统计假设. 5.2χ(读作“卡方”)统计量:统计学中有一个非常有用的统计量,它的表达式为22112212211212()n n n n n n n n n χ++++-=,用它的大小可以用来决定是否拒绝原来的统计假设0H .如果2χ的值较大,就拒绝0H ,即认为A 与B 是有关的.2χ统计量的两个临界值:3.841、6.635;当2 3.841χ>时,有95%的把握说事件A 与B 有关;当2 6.635χ>时,有99%的把握说事件A 与B 有关;当23.841χ≤时,认为事件A 与B 是无关的.独立性检验的基本思想与反证法类似,由结论不成立时推出有利于结论成立的小概率事件发生,而小概率事件在一次试验中通常是不会发生的,所以认为结论在很大程度上是成立的. 1.独立性检验的步骤:统计假设:0H ;列出22⨯联表;计算2χ统计量;查对临界值表,作出判断.2.几个临界值:222()0.10( 3.841)0.05( 6.635)0.01P P P χχχ≈≈≈≥2.706,≥,≥.22⨯联表的独立性检验:如果对于某个群体有两种状态,对于每种状态又有两个情况,这样排成一张22⨯的表,如下:状态B 状态B 合计 状态A 11n 12n 1n + 状态A21n 22n 2n +1n +2n +n如果有调查得来的四个数据11122122n n n n ,,,,并希望根据这样的4个数据来检验上述的两种状态A 与B 是否有关,就称之为22⨯联表的独立性检验.六.回归分析1.回归分析:对于具有相关关系的两个变量进行统计分析的方法叫做回归分析,即回归分析就是寻找相关关系中这种非确定关系的某种确定性. 回归直线:如果散点图中的各点都大致分布在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线. 2.最小二乘法:记回归直线方程为:ˆy a bx =+,称为变量Y 对变量x 的回归直线方程,其中a b ,叫做回归系数.ˆy是为了区分Y 的实际值y ,当x 取值i x 时,变量Y 的相应观察值为i y ,而直线上对应于i x 的纵坐标是ˆi i ya bx =+. 设x Y ,的一组观察值为()i i x y ,,12i n =,,,,且回归直线方程为ˆya bx =+, 当x 取值i x 时,Y 的相应观察值为i y ,差ˆ(12)i i y yi n -=,,,刻画了实际观察值i y 与回归直线上相应点的纵坐标之间的偏离程度,称这些值为离差.我们希望这n 个离差构成的总离差越小越好,这样才能使所找的直线很贴近已知点. 记21()ni i i Q y a bx ==--∑,回归直线就是所有直线中Q 取最小值的那条.这种使“离差平方和为最小”的方法,叫做最小二乘法.用最小二乘法求回归系数a b ,有如下的公式: 1221ˆni ii nii x ynxy bxnx ==-=-∑∑,ˆˆa y bx =-,其中a b ,上方加“^”,表示是由观察值按最小二乘法求得的回归系数.3.线性回归模型:将用于估计y 值的线性函数a bx +作为确定性函数;y 的实际值与估计值之间的误差记为ε,称之为随机误差;将y a bx ε=++称为线性回归模型. 产生随机误差的主要原因有:①所用的确定性函数不恰当即模型近似引起的误差; ②忽略了某些因素的影响,通常这些影响都比较小; ③由于测量工具等原因,存在观测误差. 4.线性回归系数的最佳估计值:利用最小二乘法可以得到ˆˆab ,的计算公式为 1122211()()()()nnii iii i nniii i xx y y x ynxyb xx xn x ====---==--∑∑∑∑,ˆˆa y bx =-,其中11n i i x x n ==∑,11nii y y n ==∑ 由此得到的直线ˆˆya bx =+就称为回归直线,此直线方程即为线性回归方程.其中ˆa ,b 分别为a ,b 的估计值,ˆa称为回归截距,b 称为回归系数,ˆy 称为回归值. 5.相关系数:()()nnii i ixx y y x ynx yr ---==∑∑6.相关系数r 的性质: ⑴||1r ≤;⑵||r 越接近于1,x y ,的线性相关程度越强; ⑶||r 越接近于0,x y ,的线性相关程度越弱.可见,一条回归直线有多大的预测功能,和变量间的相关系数密切相关. 7.转化思想:根据专业知识或散点图,对某些特殊的非线性关系,选择适当的变量代换,把非线性方程转化为线性回归方程,从而确定未知参数. 8.一些备案 ①回归(regression )一词的来历:“回归”这个词英国统计学家Francils Galton 提出来的.1889年,他在研究祖先与后代的身高之间的关系时发现,身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们父母的平均身高高.Galton 把这种后代的身高向中间值靠近的趋势称为“回归现象”.后来,人们把由一个变量的变化去推测另一个变量的变化的方法称为回归分析.②回归系数的推导过程:22222[()]222i i i i i i i i Q y a bx y a y na b x y ab x b x =--=-+-++∑∑∑∑∑∑ 22222()2i i i i i i na a b x y b x b x y y =+-+-+∑∑∑∑∑,把上式看成a 的二次函数,2a 的系数0n >,因此当2()2i i i ib x y y b x a n n --=-=∑∑∑∑时取最小值. 同理,把Q 的展开式按b 的降幂排列,看成b 的二次函数,当2i iiix y a xb x-=∑∑∑时取最小值.解得:12221()()()ni iii i niii x ynxyx x y y b x x xnx==---==--∑∑∑∑,a y bx =-, 其中1i y y n =∑,1i x x n=∑是样本平均数. 9. 对相关系数r 进行相关性检验的步骤: ①提出统计假设0H :变量x y ,不具有线性相关关系;②如果以95%的把握作出推断,那么可以根据10.950.05-=与2n -(n 是样本容量)在相关性检验的临界值表中查出一个r 的临界值0.05r (其中10.950.05-=称为检验水平); ③计算样本相关系数r ;④作出统计推断:若0.05||r r >,则否定0H ,表明有95%的把握认为变量y 与x 之间具有线性相关关系;若0.05||r r ≤,则没有理由拒绝0H ,即就目前数据而言,没有充分理由认为变量y 与x 之间具有线性相关关系. 说明:⑴对相关系数r 进行显著性检验,一般取检验水平0.05α=,即可靠程度为95%.⑵这里的r 指的是线性相关系数,r 的绝对值很小,只是说明线性相关程度低,不一定不相关,可能是非线性相关的某种关系.⑶这里的r 是对抽样数据而言的.有时即使||1r =,两者也不一定是线性相关的.故在统计分析时,不能就数据论数据,要结合实际情况进行合理解释.题型一 频率分布直方图【例1】 (2010西城二模)某区高二年级的一次数学统考中,随机抽取200名同学的成绩,成绩全部在50分至100分之间,将成绩按如下方式分成5组:第一组,成绩大于等于50分且小于60分;第二组,成绩大于等于60分且小于70分;……第五组,成绩大于等于90分且小于等于100分,据此绘制了如图所示的频率分布直方图.则这200名同学中成绩大于等于80分且小于90分的学生有______名.典例分析【例2】 (2010东城二模)已知一个样本容量为100的样本数据的频率分布直方图如图所示,样本数据落在[6,10)内的样本频数为 ,样本数据落在[2,10)内的频率为 .【例3】 (2010北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a = .若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[]140,150内的学生中选取的人数应为 .【例4】 (2010江苏高考)某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[]540,中,其频率分布直方图如图所示,则其抽样的100根中,有____根在棉花纤维的长度小于20mm .(mm)频率组距【例5】 (2009湖北15)下图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[)610,内的频数为 ,数据落在[)210,内的概率约为 .【例6】 (2009福建3)一个容量为100的样本,其数据的分组与各组的频数如下: 组别 (]010,(]1020, (]2030, (]3040, (]4050, (]5060, (]6070,频数12 13 2415 16 137则样本数据落在(]1040,上的频率为( )A .0.13B .0.39C .0.52D .0.64【例7】 某校为了了解学生的课外阅读情况,随机调查了50名学生,得到他们在某一天各自课外阅读所用时间的数据,结果用下面的条形图表示,根据条形图可得这50名学生这一天平均每人的课外阅读时间为( )时间(h)A .0.6hB .0.9hC .1.0hD .1.5h【例8】 为了调查某厂工人生产某种产品的能力,随机抽查了20位工人某天生产该产品的数量.产品数量的分组区间为[)4555,,[)5565,,[)6575,,[)7585,,[)8595,由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)5575,的人数是 .产品数量0.0200.0150.0100.005【例9】 (2009山东8)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96106],,样本数据分组为[)9698,,[)98100,,[)100102,,[)102104,,[104106],.已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( )A .90B .75C .60D .45【例10】 某路段检查站监控录象显示,在某时段内,有1000辆汽车通过该站,现在随机抽取其中的200辆汽车进行车速分析,分析的结果表示为右图的频率分布直方图,则估计在这一时段内通过该站的汽车中速度不小于90km/h 的车辆数为( )A .200B .600C .500D .300【例11】 (2006年全国II )一个社会调查机构就某地居民的月收入调查了10000人,并根据所得数据画了样本频率分布直方图,为了分析居民的收入与年龄、学历、职业等方面的联系,要从这10000人中用分层抽样的方法抽出100人做进一步调查,则在[25003000],(元)月收入段应抽出_____人.0.00050.00040.00030.00020.0001频率组距月收入(元)【例12】 如图为某样本数据的频率分布直方图,则下列说法不正确的是( )0.1频率组距A .[610),的频率为0.32B .若样本容量为100,则[1014),的频数为40C .若样本容量为100,则(10]-∞,的频数为40D .由频率分布布直方图可得出结论:估计总体大约有10%分布在[1014),【例13】 (2006北京模拟)下面是某学校学生日睡眠时间的抽样频率分布表:睡眠时间 人数 频率 [6 6.5), 5 0.05 [6.57), 17 0.17 [77.5), 33 0.33 [7.58), 37 0.37 [88.5), 6 0.06 [8.59), 2 0.02合计 100 1画出频率分布直方图,估计该校学生的日平均睡眠时间.【例14】 (2010崇文一模)为了调查某厂2000名工人生产某种产品的能力,随机抽查了m 位工人某天生产该产品的数量,产品数量的分组区间为[)10,15,[)15,20,[)20,25,[)25,30,[30,35],频率分布直方图如图所示.已知生产的产品数量在[)20,25之间的工人有6位.⑴求m ;10 15 20 25 30 35 产品数量⑵工厂规定从各组中任选1人进行再培训,则选取5人不在同一组的概率是多少?【例15】考查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm)⑴作出频率分布表;⑵画出频率分布直方图.【例16】(2010陕西卷高考)为了解学生身高情况,某校以10%的比例对全校700名学生按性别进行出样检查,测得身高情况的统计图如下:/cm/cm⑴估计该小男生的人数;⑵估计该校学生身高在170~185cm之间的概率;⑶从样本中身高在165~180cm之间的女生..中任选2人,求至少有1人身高在170~180cm之间的概率.【例17】从某校高一年级的1002名新生中用系统抽样的方法抽取一个容量为100的身高样本,如下(单位:cm).作出该样本的频率分布表,画出频率分布直方图及折线图,并根据作出的频率分布直方图估计身高不小于170的同学的人数.【例18】为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得的数据整理后画出频率分布直方图(如下图),已知图中从左到右的前三个小组的频率分别是0.10.30.4,,.第一小组的频数是5.⑴求第四小组的频率和参加这次测试的学生人数;⑵在这次测试中,学生跳绳次数的中位数落在第几小组内?⑶参加这次测试跳绳次数在100次以上为优秀,试估计该校此年级跳绳成绩优秀率是多少?【例19】 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这次竞赛. 为了解本次竞赛成绩情况,从中抽取了部分学生的成绩(得分均为整数,满分为100分)进行统计. 请你根据尚未完成并有局部污损的频率分布表和频数分布直方图,解答下列问题: ⑴ 填充频率分布表的空格(将答案直接填在表格内); ⑵ 补全频数条形图;⑶ 若成绩在75.5~85.5分的学生为二等奖,问获得二等奖的学生约为多少人?【例20】 (2010丰台一模)某校高三(1)班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,但可见部分如下,据此解答如下问题.频率⑴求全班人数及分数在[)80,90之间的频数;⑵估计该班的平均分数,并计算频率分布直方图中[)80,90间的矩形的高;⑶若要从分数在[]80,100之间的试卷中任取两份分析学生失分情况,在抽取的试卷中,求至少有一份分数在[]90,100之间的概率.【例21】某地区为了了解70~80岁老人的日平均睡眠时间(单位:h).随机选择了50位老人的进行调查.下表是这50位老人日睡眠时间的频率分布表.在上述统计数据中,一部分计算见算法流程图(其中←可用=代替),则输出的S的值是.。

高中数学频率分布直方图

高中数学频率分布直方图

频率分布直方图作频率分布直方图的方法为:(1)把横轴分成若干段,每一线段对应一个组的组距;(2)以此线段为底作矩形,它的高等于该组的组距频率,这样得出一系列的矩形;(3)每个矩形的面积恰好是该组上的频率.频率折线图:如果将频率分布直方图中各相邻的矩形的上底边的中点顺次连接起,就得到一条折线,称这条折线为本组数据的频率折线图.作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出.知识点1:利用频率分布直方图分析总体分布例题1: 2000辆汽车通过某一段公路时的时速的频率分布直方图如右图所示,时速在[50,60)的汽车大约有 A .30辆 B .60辆 C .300辆 D .600辆变式:某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是 [96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是A.90B.75C. 60D.45变式:某初一年级有500名同学,将他们的身高(单位:cm )数据绘制成频率分布直方图(如图),若要从身高在[)120,130,[)130,140,[]140,150三组内的学生中,用分层抽样的方法选取30人参加一项活动,则从身高在[)130,140内的学生中选取的人数为 .知识点2:用样本分估计总体例题2某市2010年4月1日—4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45,96 98 100 102 104 106 0.1500.125 0.1000.0750.050 克 频率/组距100 110 120130 140 150 身高频率|组距0.0050.0100.020a0.035(Ⅰ) 完成频率分布表;(Ⅱ)作出频率分布直方图;(Ⅲ)根据国家标准,污染指数在0~50之间时,空气质量为优:在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染。

2019-2020年高中数学专题02频率分布直方图及其应用分项汇编含解析新人教A版必修

2019-2020年高中数学专题02频率分布直方图及其应用分项汇编含解析新人教A版必修

2019-2020年高中数学专题02频率分布直方图及其应用分项汇编含解析新人教A版必修一、选择题1.【xx年北京市首都师大附中高二期末】对高速公路某段上汽车行驶速度进行抽样调查,画出如下频率分布直方图.根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过80km/h的概率A. 75,0.25B. 80,0.35C. 77.5,0.25D. 77.5,0.35【答案】D故选D.2.【人教B版高中数学必修三同步测试】根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图(如图),从图中可以看出,该水文观测点平均至少100年才遇到一次的洪水的最低水位是()A. 48 mB. 49 mC. 50 mD. 51 m【答案】C【解析】由频率分布直方图知水位为50 m的为,即水文观测点平均至少一百年才遇到一次的洪水的最低水位是50 m.本题选择C选项.3.【福建省三明市A片区高中联盟校xx学年高二上学期阶段性考试】为了解某地区名高三男生的身体发育情况,抽查了该地区名年龄为~岁的高三男生体重(),得到频率分布直方图如图.根据图示,估计该地区高三男生中体重在kg的学生人数是( )A. B. C. D.【答案】C点睛:此题主要考查了频率分布直方图在实际问题中的应用,属于中低档题型,也是常考考点.在解决此类问题中,充分利用频率分布直方图的纵坐标的实际意义,其纵坐标值为:频率/组距,由此各组数据的频率=其纵坐标组距,各组频数=频率×总体,从而可估计出所求数据段的频数(即人数).4.【广东省中山一中、仲元中学等七校xx学年高二3月联考】某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为A. 10万元B. 12万元C. 15万元D. 30万元【答案】D【解析】9时至10时的销售额频率为0.1,因此所有销售总额为万元,故选D.5.【四川省成都外国语学校xx学年高二上学期期末考试】容量为100的样本,其数据分布在,将样本数据分为4组:,,,,得到频率分布直方图如图所示.则下列说法不正确的是A. 样本数据分布在的频率为B. 样本数据分布在的频数为40C. 样本数据分布在的频数为40D. 估计总体数据大约有分布在【答案】DD不正确.故选D.6.【四川省雅安市xx学年高二上学期期末考试】某高校进行自主招生,先从报名者中筛选出400人参加笔试,再按笔试成绩择优选出100人参加面试,现随机调查了24名笔试者的成绩,如下表所示:据此估计允许参加面试的分数线大约是()A. 75B. 80C. 85D. 90【答案】B故选7.【四川省成都市xx学年高二上学期期末调研考试】容量为100的样本,其数据分布在,将样本数据分为4组:[)[)[)[]2,6,6,10,10,14,14,18,得到频率分布直方图如图所示,则下列说法不正确的是()A. 样本数据分布在的频率为0.32B. 样本数据分布在的频数为40C. 样本数据分布在的频数为40D. 估计总体数据大约有10%分布在【答案】D【解析】总体数据分布在的概率为0.140% 0.020.080.10.05=+++故选D8.【广西南宁市第二中学(曲靖一中、柳州高中)xx学年高二上学期末期考试】xx年5月,国家统计局公布了《xx年农民工监测调查报告》,报告显示:我国农民工收入持续快速增长.某地区农民工人均月收入增长率如图1,并将人均月收入绘制成如图2的不完整的条形统计图.根据以上统计图来判断以下说法错误的是()A. xx年农民工人均月收入的增长率是.B. 2011年农民工人均月收入是元.C. 小明看了统计图后说:“农民工xx年的人均月收入比2011年的少了”.D. xx年到xx年这五年中xx年农民工人均月收入最高.【答案】C9.【四川省遂宁市xx学年高二上学期期末考试】供电部门对某社区位居民xx年12月份人均用电情况进行统计后,按人均用电量分为,,,,五组,整理得到如下的频率分布直方图,则下列说法错误的是A. 月份人均用电量人数最多的一组有人B. 月份人均用电量不低于度的有人C. 月份人均用电量为度D. 在这位居民中任选位协助收费,选到的居民用电量在一组的概率为【答案】C点睛:统计中利用频率分布直方图计算样本均值时,可利用组中值进行计算.10.【内蒙古赤峰市宁城县xx学年高二上学期期末考试】有关部门从甲、乙两个城市所有的自动售货机是随机抽取了16台,记录上午8:00~11:00间各自的销售情况(单位:元),用茎叶图表示:设甲、乙的平均数分别为,标准差分别为,则()A. ,B. ,C. ,D. ,【答案】D【解析】根据公式得到=()13078652014362225276041431616+++++++++++=()21477 1012182022462731326838424348 1616x=+++++++++++++=故,再将以上均值代入方差的公式得到.或者观察茎叶图,得到乙的数据更集中一些,故得到.故答案为:D.11.【陕西省黄陵中学xx学年高二(重点班)上学期期末考试】某篮球运动员在一个赛季的40场比赛中的得分的茎叶图如右下图所示:则中位数与众数分别为()A. 3与3B. 23与23C. 3与23D. 23与3【答案】B点睛:茎叶图的问题需注意:(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一;(2)重复出现的数据要重复记录,不能遗漏,特别是“叶”的位置的数据.12.【内蒙古鄂尔多斯市第一中学xx学年高二上学期第三次月考】如图是某次拉丁舞比赛七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、a2,则a1、a2的大小关系是()A. a1=a2B. a1>a2C. a2>a1D. 无法确定【答案】C【解析】由茎叶图,得甲、乙两名选手得分的平均数分别为18584858581845a++++==,28484868487855a++++==,即;故选C.填空题13.【吉林省辽源市田家炳高级中学xx学年高二下学期3月月考】上方右图是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空:(1)样本数据落在范围[5,9的可能性为__________;(2)样本数据落在范围[9,13的频数为__________.【答案】 0.32 72点睛:本题主要考查的知识点是频率分布直方图的意义以及应用图形解题的能力,属于基础题.对于根据频率即可求出结果,对于根据频数频率样本容量即可求出结果.14.【山西省临汾第一中学等五校xx学年高二上学期期末联考】目前北方空气污染越来越严重,某大学组织学生参加环保知识竞赛,从参加学生中抽取40名,将其成绩(均为整数)整理后画出的频率分布直方图如图,若从成绩是80分以上(包括80分)的学生中选两人,则他们在同一分数段的概率为_______.【答案】∵前三组的累积频率为:0.10+0.15+0.25=0.50,故这次环保知识竞赛成绩的中位数为70;成绩在[80,90)段的人数有10×0.010×40=4人,成绩在[90,100]段的人数有10×0.005×40=2人,从成绩是80分以上(包括80分)的学生中任选两人共有15种不同的基本事件,其中他们在同一分数段的基本事件有:7,故他们在同一分数段的概率为故答案为:.15.【黑龙江省大庆中学xx学年高二上学期期末考试】某高校在今年的自主招生考试成绩中随机抽取100名考生的笔试成绩,分为5组制出频率分布直方图如图所示.则__________, __________.【答案】 30 0.2点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.16.【辽宁省六校协作体xx学年高二上学期期初联考】从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高在[ 120 , 130),[130 ,140) , [140 , 150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140 ,150]内的学生中选取的人数应为【答案】3人【解析】试题分析:∵直方图中各个矩形的面积之和为1,∴10×(0.005+0.035+a+0.02+0.01)=1,解得a=0.03.由直方图可知三个区域内的学生总数为100×10×(0.03+0.02+0.01)=60人.其中身高在[140,150]内的学生人数为10人,所以身高在[140,150]范围内抽取的学生人数为人.考点:频率分布直方图.点评:本题考查频率分布直方图的相关知识.直方图中的各个矩形的面积代表了频率,所以各个矩形面积之和为1.同时也考查了分层抽样的特点,即每个层次中抽取的个体的概率都是相等的.解答题17.【xx学年人教A版数学必修三同步测试】我校对高二600名学生进行了一次知识测试,并从中抽取了部分学生的成绩(满分100分)作为样本,绘制了下面尚未完成的频率分布表和频率分布直方图.分组频数频率[50,60) 2 0.04[60,70) 8 0.16[70,80) 10[80,90)[90,100] 14 0.28合计1.00(1)填写频率分布表中的空格,补全频率分布直方图,并标出每个小矩形对应的纵轴数据;(2)请你估算该年级学生成绩的中位数;(3)如果用分层抽样的方法从样本分数在[60,70)和[80,90)的人中共抽取6人,再从6人中选2人,求2人分数都在[80,90)的概率.【答案】(1)答案见解析;(2)83.125;(3)【解析】试题分析:试题解析:(1)填写频率分布表中的空格,如下表:分组频数频率[50,60) 2 0.04 [60,70) 8 0.16 [70,80) 10 0.2 [80,90) 16 0.32 [90,100] 14 0.28 合计50 1.00 补全频率分布直方图,如下图:(2)设中位数为x,依题意得0.04+0.16+0.2+0.032×(x-80)=0.5,解得x=83.125,所以中位数约为83.125.(3)由题意知样本分数在[60,70)有8人,样本分数在[80,90)有16人,用分层抽样的方法从样本分数在[60,70)和[80,90)的人中共抽取6人,则抽取的分数在[60,70)和[80,90)的人数分别为2人和4人.记分数在[60,70)的为a1,a2,在[80,90)的为b1,b2,b3,b4.从已抽取的6人中任选两人的所有可能结果有15种,分别为{a1,a2},{a1,b1},{a1,b2},{a1,b3},{a1,b4},{a2,b1},{a2,b2},{a2,b3},{a2,b4},{b1,b2},{b1,b3},{b1,b4},{b2,b3},{ b2,b4},{b3,b4},设“2人分数都在[80,90)”为事件A,则事件A包括{b1,b2},{b1,b3},{b1,b4},{b2,b3},{b2,b4},{b3,b4}共6种,所以P(A)= .点睛:利用频率分布直方图求众数、中位数和平均数时,应注意三点:①最高的小长方形底边中点的横坐标即是众数;②中位数左边和右边的小长方形的面积和是相等的;③平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.18.【内蒙古自治区北方重工业集团有限公司第三中学xx学年高二3月月考】节能减排以来,兰州市100户居民的月平均用电量单位:度,以分组的频率分布直方图如图.求直方图中x的值;求月平均用电量的众数和中位数;估计用电量落在中的概率是多少?【答案】(1)5;(2)众数为,中位数为224;(3).月平均用电量在中的概率是.试题解析:的频率之和为,的频率之和为,∴中位数在设中位数为y,则解得故中位数为224.由频率分布直方图可知,月平均用电量在中的概率是.点睛:利用频率分布直方图估计样本的数字特征(1)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积相等,由此可以估计中位数值.(2)平均数:平均数的估计值等于每个小矩形的面积乘以矩形底边中点横坐标之和.(3)众数:最高的矩形的中点的横坐标.19.【河南师范大学附属中学xx学年高二4月月考】某重点中学100位学生在市统考中的理科综合分数,以,,,,,,分组的频率分布直方图如图.(1)求直方图中的值;(2)求理科综合分数的众数和中位数;(3)在理科综合分数为,,,的四组学生中,用分层抽样的方法抽取11名学生,则理科综合分数在的学生中应抽取多少人?【答案】(1) (2)230,(3)5人【解析】试题分析:(1)根据直方图求出x的值即可;(2)根据直方图求出众数,设中位数为a,得到关于a的方程,解出即可;(3)分别求出[220,240),[240,260),[260,280),[280,300]的用户数,根据分层抽样求出满足条件的概率即可.(2)理科综合分数的众数是,∵()0.0020.00950.011200.450.5++⨯=<,∴理科综合分数的中位数在内,设中位数为,则()()0.0020.00950.011200.01252200.5a++⨯+⨯-=,解得,即中位数为.(3)理科综合分数在的学生有(位),同理可求理科综合分数为,,的用户分别有15位、10位、5位,故抽取比为,∴从理科综合分数在的学生中应抽取人.点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.20.【河北省阜城中学 xx学年高二上学期期末考试】某校高一年级某次数学竞赛随机抽取100名学生的成绩,分组为[50,60),[60,70),[70,80),[80,90),[90,100],统计后得到频率分布直方图如图所示:(1)试估计这组样本数据的众数和中位数(结果精确到0.1);(2)年级决定在成绩[70,100]中用分层抽样抽取6人组成一个调研小组,对高一年级学生课外学习数学的情况做一个调查,则在[70,80),[80,90),[90,100]这三组分别抽取了多少人?(3)现在要从(2)中抽取的6人中选出正副2个小组长,求成绩在[80,90)中至少有1人当选为正、副小组长的概率.【答案】(1)65,73.3;(2)3,2,1;(3)【解析】试题分析:(1)由频率分布直方图中面积最大的矩形中点可得众数、左右面积各为0.5的分界处为中位数.(2)先求出成绩为[70,80)、[80,90)、[90,100]这三组的频率,由此能求出[70,80)、[80,90)、[90,100]这三组抽取的人数.(3)由(2)知成绩在[70,80)有3人,分别记为a,b,c;成绩在[80,90)有2人,分别记为d,e;成绩在[90,100]有1人,记为f.由此利用列举法能求出成绩在[80,90)中至少有1人当选为正、副小组长的概率.(2)成绩为[70,80)、[80,90)、[90,100]这三组的频率分别为0.3,0.2,0.1,∴[70,80)、[80,90)、[90,100]这三组抽取的人数分别为3人,2人,1人.(3)由(2)知成绩在[70,80)有3人,分别记为a,b,c;成绩在[80,90)有2人,分别记为d,e;成绩在[90,100]有1人,记为f.∴从(2)中抽取的6人中选出正副2个小组长包含的基本事件有种,分别为:ab,ba,ac,ca,ad,da,ae,ea,af,fa,bc,cb,bd,db,be,eb,bf,fb,cd,dc,ce,ec,cf,fc,de,ed,df,fd,ef,fe,记“成绩在[80,90)中至少有1人当选为正、副小组长”为事件Q,则事件Q包含的基本事件有18种,∴成绩在[80,90)中至少有1人当选为正、副小组长的概率P(Q)=.点睛:利用频率分布直方图求众数、中位数与平均数时,易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.21.【黑龙江省哈尔滨市第六中学xx学年高二3月月考】从某学校高三年级共800名男生中随机抽取50名测量身高,测量发现被测学生身高全部介于155cm和195cm之间,将测量结果按如下方式分成八组:第一组[155,160);第二组[160,165)、…、第八组[190,195],下图是按上述分组方法得到的频率分布直方图的一部分,已知第一组与第八组人数相同,第六组、第七组、第八组人数依次构成等差数列.(1)估计这所学校高三年级全体男生身高180cm以上(含180cm)的人数;(2)求第六组、第七组的频率并补充完整频率分布直方图(如需增加刻度请在纵轴上标记出数据,并用直尺作图);(3)由直方图估计男生身高的中位数.【答案】(1);(2)详见解析;(3).试题解析:(1)由直方图,前五组频率为(0.008+0.016+0.04+0.04+0.06)×5=0.82,后三组频率为1-0.82=0.18.这所学校高三男生身高在180cm以上(含180cm)的人数为800×0.18=144人.(2)由频率分布直方图得第八组频率为0.008×5=0.04,人数为0.04×50=2人,设第六组人数为m,则第七组人数为0.18×50-2-m=7-m,又m+2=2(7-m),所以m=4,即第六组人数为4人,第七组人数为3人,频率分别为0.08,0.06.频率除以组距分别等于0.016,0.012,见图.(3)设中位数为,由频率为,所以,,解得=174.522.【广东省中山一中、仲元中学等七校xx学年高二3月联考】某企业员工500人参加“学雷锋”志愿活动,按年龄分组:第1组[25,30),第2组[30,35),第3组[35,40),第4组[40,45),第5组[45,50],得到的频率分布直方图如图所示.(1)上表是年龄的频数分布表,求正整数的值;(2)现在要从年龄较小的第1,2,3组中用分层抽样的方法抽取6人,年龄在第1,2,3组的人数分别是多少?(3)在(2)的前提下,从这6人中随机抽取2人参加社区宣传交流活动,求至少有1人年龄在第3组的概率.【答案】(1);(2) 第1,2,3组分别抽取1人,1人,4人;(3).【解析】试题分析:(1))由题设可知,,;(2)由第1,2,3组的比例关系为1:1:4,则分别抽取1人,1人,4人;(3)设第1组的1位同学为,第2组的1位同学为,第3组的4位同学为,由穷举法,求得至少有1人年龄在第3组的概率为.(3)设第1组的1位同学为,第2组的1位同学为,第3组的4位同学为,则从6位同学中抽两位同学有:共种可能.其中2人年龄都不在第3组的有:共1种可能,所以至少有1人年龄在第3组的概率为.温馨提示:最好仔细阅读后才下载使用,万分感谢!。

高考数学专题统计《用频率直方图估计总体分布《百分位数》突破解析

高考数学专题统计《用频率直方图估计总体分布《百分位数》突破解析

14.4.3用频率直方图估计总体分布14.4.4百分位数必备知识基础练1.以下数据为参加数学竞赛决赛的15人的成绩(单位:分):78,70,72,86,88,79,80,81,94,84,56,98,83,90,91.这15人成绩的80百分位数是()A.90B.90.5C.91D.91.5=12,56,70,72,78,79,80,81,83,84,86,88,90,91,94,98,因为80×15100=90.5.所以这15人成绩的80百分位数是90+9122.如图是某工厂对一批新产品长度(单位:mm)检测结果的频率直方图.估计这批产品的平均数与中位数分别为()A.22.5,20B.22.5,22.75C.22.75,22.5D.22.75,25,这批产品的平均数为x=5×(0.02×12.5+0.04×17.5+0.08×22.5+0.03×27.5+0.03×32.5)=22.75,其中位数为=22.5.故选C.x0=20+0.5-(0.02+0.04)×50.083.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,50百分位数为b,则有()A.a=13.7,b=15.5B.a=14,b=15C.a=12,b=15.5D.a=14.7,b=1510,12,14,14,15,15,16,17,17,17,其平均数a=110×(10+12+14+14+15+15+16+17+17+17)=14.7,因为50×10100=5,所以这10名工人一小时内生产零件的50百分位数为b=15+152=15. 4.已知甲、乙两组数据(已按从小到大的顺序排列): 甲组:27,28,39,40,m ,50; 乙组:24,n ,34,43,48,52.若这两组数据的30百分位数,80百分位数分别相等,则mn等于( ) A.127 B.107C.43D.74因为30100×6=1.8,80100×6=4.8,所以30百分位数为n=28,80百分位数为m=48,所以mn =4828=127. 5.1,2,3,4,5,6,7,8,9,10这组数据的25百分位数为 ,75百分位数为 ,90百分位数为 .8 9.510,而且10×25%=2.5,10×75%=7.5,10×90%=9,所以该组数据的25百分位数为3,75百分位数为8,90百分位数为9+102=9.5. 6.某学校组织学生参加数学测试,成绩的频率直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],则60分为成绩的 百分位数.[20,40),[40,60)的频率之和为(0.005+0.01)×20=0.3,所以60分为成绩的30百分位数.7.某市要对两千多名出租车司机的年龄进行调查,现从中随机抽出100名司机,已知抽到的司机年龄都在[20,45]岁之间,根据调查结果得出司机的年龄情况残缺的频率直方图如图所示,利用这个残缺的频率直方图估计该市出租车司机年龄的中位数大约是 (保留一位小数)..6,所有矩形面积之和为1,所以,数据位于[25,30)的频率为1-(0.01+0.07+0.06+0.02)×5=0.2, 前两个矩形的面积之和为0.01×5+0.2=0.25, 前三个矩形的面积之和为0.25+0.07×5=0.6, 所以,中位数位于区间[30,35),设中位数为a , 则有0.25+(a-30)×0.07=0.5,解得a ≈33.6(岁). 8.求下列数据的四分位数. 13,15,12,27,22,24,28,30,31,18,19,20.12个数据按从小到大的顺序排列为12,13,15,18,19,20,22,24,27,28,30,31,计算25×12100=3,50×12100=6,75×12100=9, 所以数据的25百分位数为15+182=16.5, 50百分位数为20+222=21,75百分位数为27+282=27.5. 9.某网络营销部门随机抽查了某市200名网友在2019年11月11日的网购金额,所得数据如下表:已知网购金额低于3千元与不低于3千元的人数比恰为3∶2. (1)试确定x ,y ,p ,q 的值,并补全频率直方图;(2)估计网购金额的25百分位数(结果保留三位有效数字).根据题意有{16+24+x +y +16+14=200,16+24+x y+16+14=32,解得{x =80,y =50.所以p=0.4,q=0.25.补全频率直方图如图所示.(2)由(1)可知,网购金额低于2千元的频率为0.08+0.12=0.2,网购金额低于3千元的频率为0.2+0.4=0.6,所以网购金额的25百分位数在[2,3)内,则网购金额的25百分位数估计为2+0.25-0.20.6-0.2×1=2.125≈2.13. 关键能力提升练10.数据3.2,3.4,3.8,4.2,4.3,4.5,x ,6.6的65百分位数是4.5,则实数x 的取值范围是( ) A.[4.5,+∞) B.[4.5,6.6) C.(4.5,+∞)D.(4.5,6.6]65×8100=5.2,所以这组数据的65百分位数是第6个数据4.5,则x ≥4.5,故选A.11.港珠澳大桥于2018年10月24日正式通车,它是中国境内一座连接香港、珠海和澳门的桥隧工程.桥隧全长55千米,桥面为双向六车道高速公路,大桥通行限速100 km/h .现对大桥某路段上汽车行驶速度进行抽样调查,画出频率直方图(如图).根据直方图估计在此路段上汽车行驶速度的众数和行驶速度超过90 km/h 的频率分别为( )A.85,0.25B.90,0.35C.87.5,0.25D.87.5,0.35=87.5,由频率直方图估计在此路段由频率直方图估计在此路段上汽车行驶速度的众数为85+902上汽车行驶速度超过90 km/h的频率为(0.05+0.02)×5=0.35,所以由频率直方图估计在此路段上汽车行驶速度超过90 km/h的频率为0.35.12.某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示.估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以=29,可以估计棉花下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,由25+5×0.80-0.600.85-0.60纤维的长度的样本数据的80百分位数是29 mm.13.(多选)已知100个数据的75百分位数是9.3,则下列说法不正确的是()A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数=75为整数,所以第75个数据和76个数据的平均数为75百分位数,是9.3,则C正75×100100确,其他选项均不对,故选ABD.14.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的平均数等于乙的成绩的平均数C.甲的成绩的80百分位数等于乙的成绩的80百分位数D.甲的成绩的极差等于乙的成绩的极差,x 甲=4+5+6+7+85=6,x 乙=3×5+6+95=6,A 项错误,B 项正确;甲的成绩的80百分位数为7+82=7.5,乙的成绩的80百分位数为6+92=7.5,所以二者相等,所以C 项正确;甲的成绩的极差为4,乙的成绩的极差也为4,D 项正确.15.已知30个数据的60百分位数是8.2,这30个数据从小到大排列后第18个数据是7.8,则第19个数据是 ..660×30100=18,设第19个数据为x ,则7.8+x2=8.2,解得x=8.6,即第19个数据是8.6.16.如图是某市2020年4月1日至4月7日每天最高、最低气温的折线统计图,这7天的日最高气温的10百分位数为 ,日最低气温的80百分位数为 .℃ 16 ℃,把日最高气温按照从小到大排序,得24,24.5,24.5,25,26,26,27,因为共有7个数据,所以7×10100=0.7,不是整数,所以这7天日最高气温的10百分位数是第1个数据,为24 ℃.把日最低气温按照从小到大排序,得12,12,13,14,15,16,17,因为共有7个数据,所以7×80100=5.6,不是整数,所以这7天日最低气温的80百分位数是第6个数据,为16 ℃.17.某年级120名学生在一次百米跑测试中,成绩全部介于13秒与18秒之间,将测试结果分成5组,即[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率直方图,如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩的70百分位数约为 秒..570百分位数为x ,因为1+3+71+3+7+6+3=0.55,1+3+7+61+3+7+6+3=0.85,所以x ∈[16,17),所以0.55+(x-16)×61+3+7+6+3=0.70,解得x=16.5. 18.对某市“四城同创”活动中800名志愿者的年龄抽样调查统计后得到频率直方图(如图),但是年龄组为[25,30)的数据不慎丢失,则依据此图可得:(1)[25,30)年龄组对应小矩形的高度为 ;(2)由频率直方图估计志愿者年龄的85百分位数为 岁(结果保留整数)..04 (2)39设[25,30)年龄组对应小矩形的高度为h ,则5×(0.01+h+0.07+0.06+0.02)=1,解得h=0.04.(2)由图可知,年龄小于35岁的频率为(0.01+0.04+0.07)×5=0.6,年龄小于40岁的频率为(0.01+0.04+0.07+0.06)×5=0.9,所以志愿者年龄的85百分位数在[35,40)内,因此志愿者年龄的85百分位数为35+0.85-0.60.9-0.6×5≈39(岁). 19.(2021浙江宁波期末)首次实施新高考的八省(市)于2021年1月23日统一举行了新高考适应性考试,在联考结束后,根据联考成绩,考生可了解自己的学习情况,作出升学规划,决定是否参加强基计划.在本次适应性考试中,某学校为了解高三学生的联考情况,随机抽取了100名学生的联考数学成绩作为样本,并按照分数段[50,70),[70,90),[90,110),[110,130),[130,150]分组,绘制了如图所示的频率直方图.(1)求出图中a的值并估计本次考试及格率(“及格率”指得分为90分及以上的学生所占比例);(2)估计该校学生联考数学成绩的80百分位数;(3)估计该校学生联考数学成绩的众数、平均数.由(0.004+a+0.013+0.014+0.016)×20=1,解得a=0.003,则及格率为(0.016+0.014+0.003)×20=0.66=66%.(2)得分在110以下的学生所占比例为(0.004+0.013+0.016)×20=0.66,得分在130以下的学生所=120(分),估计占比例为0.66+0.014×20=0.94,所以80百分位数位于[110,130)内,由110+20×0.8-0.660.94-0.6680百分位数为120.(3)由图可得,众数估计值为100.平均数估计值为0.08×60+0.26×80+0.32×100+0.28×120+0.06×140=99.6(分).学科素养创新练20.2020年某地苹果出现滞销现象,为了帮助当地果农打开销路,当地政府与全国一些企业采用团购的方式带动销售链,使得当地果农积压的许多苹果有了销路.为了解果农们苹果的销售量情况,当地农业局随机对100名果农的苹果销售量进行统计,将数据按照[90,110),[110,130),[130,150),[150,170]分成4组,得到如图所示的频率直方图.(1)试估计这100名果农苹果销售量的平均数;(2)根据题中的频率直方图,估计销售量样本数据的80百分位数(结果精确到0.1);(3)假设这100名果农在未打开销路之前都积压了2万千克的苹果,通过团购的方式果农每千克苹果的纯利润为1.3元,而积压仍未售出的苹果每千克将损失2元的成本费,试估计这100名果农积压的苹果通过此次团购活动获得的总利润.设这100名果农苹果销售量的平均数为x百千克,则x=(100×0.002 5+120×0.01+140×0.0225+160×0.015)×20=140(百千克),故这100名果农苹果销售量的平均数为1.4万千克.(2)因为(0.002 5+0.010 0)×20=0.25<0.8,0.25+0.225×20=0.7<0.8,×20≈156.7.所以80百分位数在第4组内,且80百分位数为150+0.8-0.71-0.7(3)销售量在[90,110)的每位果农的利润为100×100×1.3-(2×104-100×100)×2=-0.7(万元);销售量在[110,130)的每位果农的利润为120×100×1.3-(2×104-120×100)×2=-0.04(万元);销售量在[130,150)的每位果农的利润为100×140×1.3-(2×104-140×100)×2=0.62(万元);销售量在[150,170]的每位果农的利润为100×160×1.3-(2×104-160×100)×2=1.28(万元).因为[90,110),[110,130),[130,150),[150,170)这4组的人数分别为5,20,45,30,所以这100名果农积压的苹果通过此次团购活动获得的总利润约为-0.7×5-0.04×20+0.62×45+1.28×30=62(万元).。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

历年高考数学真题精选(按考点分类)专题40 频率分布直方图(学生版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140 2.(2014•山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:)kPa的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组, ,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a .(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).m和使6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,⋯,90],并整理得到如下频率分布直方图:30),[30,40),[80(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A表示事件“旧养殖法的箱产量低于50kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg<箱产量50kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较.附: 2()P K K 0.0500.010 0.001 K3.841 6.635 10.828 22()()()()()n ad bc K a b c d a c b d -=++++. 9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.10.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w 时,估计该市居民该月的人均水费.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:估计哪个地区用户的满意度等级为不满意的概率大?说明理由.历年高考数学真题精选(按考点分类)专题40 频率分布直方图(教师版)一.选择题(共2小题)1.(2016•山东)某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56B.60C.120D.140【答案】D【解析】自习时间不少于22.5小时的频率为:(0.160.080.04) 2.50.7++⨯=,故自习时间不少于22.5小时的频数为:0.7200140⨯=2.(2014•山东)为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:)kPa的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,⋯,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为()A.6B.8C.12D.18【答案】C【解析】由直方图可得分布在区间第一组与第二组共有20人,分布在区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人,第三组的频率为0.36,所以第三组的人数:18人,第三组中没有疗效的有6人,第三组中有疗效的有12人.二.填空题(共2小题)3.(2015•湖北)某电子商务公司对10000名网络购物者2014年度的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)直方图中的a=.(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为.【答案】(1)3 (2)6000【解析】(1)由题意,根据直方图的性质得(1.5 2.5 2.00.80.2)0.11+++++⨯=,解得3aa=(2)由直方图得(3 2.00.80.2)0.1100006000+++⨯⨯=4.(2014•江苏)为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位:)cm,所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有株树木的底部周长小于100cm.【答案】24【解析】由频率分布直方图知:底部周长小于100cm的频率为(0.0150.025)100.4+⨯=,∴底部周长小于100cm的频数为600.424⨯=(株).三.解答题(共8小题)5.(2019•新课标Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A、B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如图直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).解:(1)C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.则由频率分布直方图得:0.200.150.70.050.1510.7ab++=⎧⎨++=-⎩,解得乙离子残留百分比直方图中0.35a=,0.10b=.(2)估计甲离子残留百分比的平均值为:20.1530.2040.3050.2060.1070.05 4.05x=⨯+⨯+⨯+⨯+⨯+⨯=甲.乙离子残留百分比的平均值为:30.0540.150.1560.3570.280.15 6.00x=⨯+⨯+⨯+⨯+⨯+⨯=乙.6.(2018•新课标Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:3)m和使用了节水龙头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数13249265使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数151310165(1)作出使用了节水龙头50天的日用水量数据的频率分布直方图;(2)估计该家庭使用节水龙头后,日用水量小于30.35m的概率;(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表)【解答】解:(1)根据使用了节水龙头50天的日用水量频数分布表,作出使用了节水龙头50天的日用水量数据的频率分布直方图,如下图:(2)根据频率分布直方图得:该家庭使用节水龙头后,日用水量小于30.35m 的概率为: (0.2 1.0 2.61)0.10.48p =+++⨯=.(3)由题意得未使用水龙头50天的日均水量为:1(10.0530.1520.2540.3590.45260.5550.65)0.4850⨯+⨯+⨯+⨯+⨯+⨯+⨯=, 使用节水龙头50天的日均用水量为:1(10.0550.15130.25100.35160.4550.55)0.3550⨯+⨯+⨯+⨯+⨯+⨯=, ∴估计该家庭使用节水龙头后,一年能节省:3365(0.480.35)47.45m ⨯-=.7.(2017•北京)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),[80⋯,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.解:(Ⅰ)由频率分布直方图知:分数小于70的频率为:1(0.040.02)100.4-+⨯=故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4;(Ⅱ)已知样本中分数小于40的学生有5人,故样本中分数小于40的频率为:0.05,则分数在区间[40,50)内的频率为:1(0.040.020.020.01)100.050.05-+++⨯-=,估计总体中分数在区间[40,50)内的人数为4000.0520⨯=人,(Ⅲ)样本中分数不小于70的频率为:0.6,由于样本中分数不小于70的男女生人数相等.故分数不小于70的男生的频率为:0.3,由样本中有一半男生的分数不小于70,故男生的频率为:0.6,即女生的频率为:0.4,即总体中男生和女生人数的比例约为:3:2.8.(2017•新课标Ⅱ)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100个网箱,测量各箱水产品的产量(单位:)kg,其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg ”,估计A 的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50kg <箱产量50kg旧养殖法 新养殖法(3)根据箱产量的频率分布直方图,对两种养殖方法的优劣进行比较. 附:2()P K K0.050 0.010 0.001 K3.8416.63510.8282()()()()K a b c d a c b d =++++. 解:(1)根据题意,由旧养殖法的频率分布直方图可得:P (A )(0.0120.0140.0240.0340.040)50.62=++++⨯=;(2)根据题意,补全列联表可得:箱产量50kg <箱产量50kg总计 旧养殖法 62 38 100 新养殖法 34 66 100 总计96104200则有2200(62663834)15.705 6.63510010096104K ⨯-⨯=≈>⨯⨯⨯,故有99%的把握认为箱产量与养殖方法有关; (3)由频率分布直方图可得: 旧养殖法100个网箱产量的平均数1(27.50.01232.50.01437.50.02442.50.03447.50.04052.50.03257.50.0262.50.01267.50.012)559.4247.1x =⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=; 新养殖法100个网箱产量的平均数2(37.50.00442.50.02047.50.04452.50.05457.50.04662.50.01067.50.008)5510.4752.35x =⨯+⨯+⨯+⨯+⨯+⨯+⨯⨯=⨯=;比较可得:12x x <,故新养殖法更加优于旧养殖法.9.(2016•四川)我国是世界上严重缺水的国家.某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),⋯,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(Ⅰ)求直方图中a 的值;(Ⅱ)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由; (Ⅲ)估计居民月均水量的中位数.解:()1(0.080.160.400.520.120.080.04)0.5I a a =++++++++⨯, 整理可得:2 1.42a =+,∴解得:0.3a =.()II 估计全市居民中月均用水量不低于3吨的人数为3.6万,理由如下:由已知中的频率分布直方图可得月均用水量不低于3吨的频率为(0.120.080.04)0.50.12++⨯=,又样本容量为30万,则样本中月均用水量不低于3吨的户数为300.12 3.6⨯=万. (Ⅲ)根据频率分布直方图,得;0.080.50.160.50.300.50.420.50.480.5⨯+⨯+⨯+⨯=<,+⨯=>,0.480.50.50.740.5∴中位数应在[2,2.5)组内,设出未知数x,令0.080.50.160.50.300.50.420.50.50.5⨯+⨯+⨯+⨯+⨯=,x解得0.04x=;+=.∴中位数是20.04 2.0410.(2016•北京)某市居民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如图频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当3w=时,估计该市居民该月的人均水费.解:(1)由频率分布直方图得:用水量在[0.5,1)的频率为0.1,用水量在[1,1.5)的频率为0.15,用水量在[1.5,2)的频率为0.2,用水量在[2,2.5)的频率为0.25,用水量在[2.5,3)的频率为0.15,用水量在[3,3.5)的频率为0.05,用水量在[3.5,4)的频率为0.05,用水量在[4,4.5)的频率为0.05,用水量小于等于3立方米的频率为85%,∴为使80%以上居民在该用的用水价为4元/立方米,w∴至少定为3立方米.(2)当3w=时,该市居民的人均水费为:(0.110.15 1.50.220.25 2.50.153)40.05340.050.5100.05340.051100.05340.05 1.51010.5⨯+⨯+⨯+⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=,∴当3w=时,估计该市居民该月的人均水费为10.5元.11.(2015•广东)某城市100户居民的月平均用电量(单位:度),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300)分组的频率分布直方图如图.(1)求直方图中x的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300)的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240)的用户中应抽取多少户?解:(1)由直方图的性质可得(0.0020.00950.0110.01250.0050.0025)201x++++++⨯=,解方程可得0.0075x=,∴直方图中x的值为0.0075;(2)月平均用电量的众数是2202402302+=,(0.0020.00950.011)200.450.5++⨯=<,∴月平均用电量的中位数在[220,240)内,设中位数为a,由(0.0020.00950.011)200.0125(220)0.5a++⨯+⨯-=可得224a=,∴月平均用电量的中位数为224;(3)月平均用电量为[220,240)的用户有0.01252010025⨯⨯=,月平均用电量为[240,260)的用户有0.00752010015⨯⨯=,月平均用电量为[260,280)的用户有0.0052010010⨯⨯=,月平均用电量为[280,300)的用户有0.0025201005⨯⨯=,∴抽取比例为111 25151055=+++,∴月平均用电量在[220,240)的用户中应抽取12555⨯=户.12.(2015•新课标Ⅱ)某公司为了解用户对其产品的满意度,从A,B两地区分别随机调查了40个用户,根据用户对产品的满意度评分,得到A地区用户满意度评分的频率分布直方图和B地区用户满意度评分的频数分布表B地区用户满意度评分的频数分布表满意度评分分组[50,60)[60,70)[70,80)[80,90)[90,100)频数2814106(1)做出B地区用户满意度评分的频率分布直方图,并通过直方图比较两地区满意度评分的平均值及分散程度(不要求计算出具体值,给出结论即可)(Ⅱ)根据用户满意度评分,将用户的满意度从低到高分为三个不等级:满意度评分低于70分70分到89分不低于90分满意度等级不满意满意非常满意估计哪个地区用户的满意度等级为不满意的概率大?说明理由.解:(Ⅰ)通过两个地区用户满意度评分的频率分布直方图可以看出,B 地区用户满意度评分的平均值高于A 地区用户满意度评分的平均值,B 地区的用户满意度评分的比较集中,而A 地区的用户满意度评分的比较分散.(Ⅱ)A 地区用户的满意度等级为不满意的概率大.记A C 表示事件:“A 地区用户的满意度等级为不满意”, B C 表示事件:“B 地区用户的满意度等级为不满意”,由直方图得()(0.010.020.03)100.6A P C =++⨯= 得()(0.0050.02)100.25B P C =+⨯=A ∴地区用户的满意度等级为不满意的概率大.。

相关文档
最新文档