2020版高考数学一轮复习课后限时集训54统计图表数据的数字特征用样本估计总体文含解析北师大版

合集下载

2020年高考数学(文科)一轮复习第57讲用样本估计总体

2020年高考数学(文科)一轮复习第57讲用样本估计总体

听课手册第57讲用样本估计总体课前双基巩固1•作频率分布直方图的步骤(1) ___________________________ 求极差(即一组数据中与的差).(2) 决定_______ 与组数.(3) 将数据分组•(4) 列___________ .(5) 画________________ .2•频率分布折线图和总体密度曲线(1) __________________________________________________________ 频率分布折线图:连接频率分布直方图中各小长方形上端的________________________________________________________ ,就得到频率分布折线图•⑵总体密度曲线:随着样本容量的增加,作图时所分的 _________ 增加, ________ 减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线•3•茎叶图(1) 茎叶图的概念:统计中还有一种被用来表示数据的图叫作茎叶图,茎是指中间的一列数,叶就是从茎的旁边生长出来的数•(2) 茎叶图的优点:茎叶图不但可以________ 所有的数据信息,而且可以________ 记录,方便记录和表示•4•样本的数字特征(1) 众数、中位数、平均数平均如果有n个数据X1,X2,…,x n,那么这n个数的平均数数"=______________(2) 标准差、方差①标准差是样本数据到平均数的一种平均距离,一般用s表示,S=- - -,其中x i(i= 1,2,3,…,n)是样本数据,n是样本容量,—是_______ .②方差:标准差的平方S2,S2=-[(X l-—)2+(X2-—)2+…+(X n-—)2].(3) 平均数、方差的性质:①若数据X i,X2,…,X n的平均数为一,则mx i+a,mx2+a,mx3+a,…,mx n+a的平均数是m^+a.②若数据x i,X2,…,x n的方差为s2,则x i+a,X2+a,…,x n+a的方差也为s2,ax i,ax2,…,ax n的方差为a2s2.题组一常识题1. [教材改编]2000辆汽车通过某一段公路时的时速的频率分布直方图如图10-57-1 所示,则时速(单位:km/h )在[50,60 )的频率为_______ ,此范围内的汽车大约有_______ 辆.运动员的发挥更稳定, ______ 运甲乙g0A 4 3128 6 32+ 5B 33 1 16 6 7 910-57-2所示,从茎叶图的分布情况看图10-57-32. [教材改编]某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图如图3.[教材改编]若某校高一年级 8个班参加合唱比赛的得分的茎叶图如图 10-57-3所示,则这组数据的中位数是 _________ ,平均数是 _______ .题组二常错题♦索引:频率分布直方图与茎叶图的识图不清 ;对方差、平均数的统计意义的认识有误.4.某人到甲、乙两市各7个小区调查空置房情况,将调查得到的小区空置房的套数绘制成了如图10-57-4所示的茎甲市乙出 0 6 99 4 3 7 斗2 1 8 23 1 9 0图 10-57-45•某学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为 n 的样本,其频率分布直方图如图 10-57-5所示,分组为[20,30),[30,40),[40,50),[50,60],其中支出(单位:元)在[50,60]内的学生有30人,则n 的值为 _________________________________________________________________________________________________________ 6•甲、乙、丙三人投掷飞镖,他们的成绩(环数)的频数条形统计图如图 10-57-6所示,则甲、乙、丙三人成绩的方差甲,乙,丙的大小关系是 _______7.若数据X 1,X 2,X 3,…,x n 的平均数 =5,方差s 2=2,则数据3x 1 + 1,3x 2+1,3x 3+1,…,3x n +1的平均数为 _____________ ,方差为 _________ ...... . .......... 课掌考点探究 ________________-里碉自血畫 也苗石童包-O 探究点一频率分布直方图例1 [2018 •内蒙古包头一模]从某食品厂生产的面包中抽取 100个,测量这些面包的一项质量指标值 ,由测量结果 得如下频数分布表:叶图,则调查中甲市空置房套数的中位数为,乙市空置房套数的中位数质量指标值分组[75,85)[85,95)[95,105)[105 ,115)[115,125]频数82237285 (1)在图10-57-7上作出这些数据的频率分布直方图(2) 估计这种面包质量指标值的平均数一(同一组中的数据用该组区间的中点值作代表(3) 根据以上抽样调查数据,能否认为该食品厂生产的这种面包符合“质量指标值不低于包的90% ”的规定?0.0^□.03&G.O32Q.030n.rait0.024D.G220.020O.OBXMMD.0I40^12o.oia0.00^ng0002图10-57-7).85的面包至少要占全部面巧W部IM LI3 IZ3盛只盘标散[总结反思](1)绘制频率分布直方图时的两个注意点①制作好频率分布表后,可以利用各组的频率之和为1来检验该表是否正确;频率②频率分布直方图的纵坐标是,而不是频率.组距(2)由频率分布直方图进行相关计算时,需掌握的两个关系式:频率频数频数①——y组距=频率;②=频率,此关系式的变形为=样本容量,样本容量冷组距样本容量频率变式题[2018 •河南八市测评]某校对高二(1)班的数学期末考试成绩进行了统计140之间,其频率分布直方图如图10-57-8所示.若分数在130〜140的人数为( )A.12B.28C.32D.40(2)[2018 •陕西榆林二中月考]某学校为了调查学生在学科教辅书方面的支出情况"频数.,发现该班学生的分数都在90到2则分数在100~120的人数为其频率分布直方图如图10-57-9 所示,分组为[10,20),[20,30),[30,40),[40,50],其中支出(单位:元)在[30,40)的同学比,抽出了一个容量为n的样本,支出在[10,20)的同学多26人,则n 的值为,随机访问了 50位市民.根据这50位市民对这两部门的评分(评分越 高表明市民的评价越高),绘制了如图10-57-10所示的茎叶图•甲部门10图 10.57.10(1)分别求出该市的市民对甲、乙两部门评分的中位数(3) 根据茎叶图分析该市的市民对甲、乙两部门的评价曲究点二茎叶图例2某市为了考核甲、乙两部门的工作情况乙部门(2)分别估计该市的市民对甲、乙两部门的评分高于90的概率;[总结反思]茎叶图的识别与绘制需注意 (1)“叶”的位置上的数字只能是一位数,而“茎”的位置上的数字位数一般不需要统一 ;(2)重复出现的数据要重复记录,不能遗漏,特别注意“叶”的位置上的数据•变式题(1)[2018 •石家庄二中三模]“五四青年节”活动中高三(1)班和高三(2)班进行了 3场知识辩论赛,比赛得分 情况的茎叶图如图10-57-11所示,其中高三(2)班得分有一个数字被污损,无法确认,假设这个数字x 具有随机性,那 么高三(2)班的平均得分大于高三(1)班的平均得分的概率为 ( ) A .— B .— C.- D.—高三⑴班HZ)盖9 1 2 S 8 X 1图 10-57-11甲乙6 77 2 6 1- 1 7 R 2 50 9 1图 10-57-126人,记录他们的期末考试成绩 (单位:分),得到如图10-57-12所示的茎82,乙班6名同学成绩的中位数为77,则x-y=(A. 3B. -3C. 4D. -4o 探究点三样本的数字特征例3某市有210名初中生参加数学竞赛预赛 ,随机调阅了 60名学生的答卷,将这60名学生的成绩(满分10分)进行统计,绘制如下表格:(1)求样本的平均值和标准差(精确到0.01);(2)某老师从自己所带的两个班级中各抽取叶图.已知甲班6名同学成绩的平均数为(2)若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以参加复赛[总结反思]平均数与方差都是重要的数字特征,是对总体的一种简明的描述,它们所反映的情况有着重要的实际意义,平均数、中位数、众数描述其集中趋势、平均水平,方差和标准差描述其波动大小、稳定性•例4为了弘扬民族文化,某中学举行了“我爱国学,传诵经典”考试,并从中随机抽取了60名学生的成绩(满分100分) 作为样本,其中成绩不低于80分的学生被评为优秀生,得到成绩的频率分布直方图如图10-57-13所示.(1) 若该所中学共有2000名学生,试利用样本估计全校这次考试中优秀生人数•(2) ①试估计这次参加考试的学生的平均成绩(同一组数据用该组区间的中点值作代表);②若在样本中,利用分层抽样的方法从成绩不低于70分的学生中随机抽取6人,再从中抽取3人赠送一套国学经典,试求恰好抽中2名优秀生的概率图10-57-13[总结反思]利用频率分布直方图估计样本的数字特征的方法①中位数:在频率分布直方图中,中位数左边和右边的小矩形的面积相等,由此可以估计中位数的值②平均数:平均数的估计值等于每个小矩形的面积分别乘小矩形底边中点的横坐标之和③众数:最高的矩形的中点的横坐标变式题(1)[2018 •重庆诊断]记5个互不相等的正实数的平均值为一,方差为A,去掉其中某个数后,记余下4个数的平均值为一,方差为B,则下列说法中一定正确的是()A.若一 =_,则A<BB.若一=一,则A>BC.若一<一,则A<BD.若一<一,则A>B(2)[2018 •福建龙岩质检]如图10-57-14是由某校高三(1)班上学期期末数学考试成绩整理得到的频率分布直方图,由此估计该班学生成绩的众数、中位数(精确到0.1)分别为()A.105 ,103B.115,125C.125 ,113 .3D.115,113.3完成课时作业(五十七)。

2020高考数学大一轮复习 第十章 复数、算法初步、统计与统计案例 第4节 用样本估计总体课件 文

2020高考数学大一轮复习 第十章 复数、算法初步、统计与统计案例 第4节 用样本估计总体课件 文

5.(2019·江苏徐州模拟)已知一组数据4.7,4.8,5.1,5.4,5.5,则该组数据的方差 是_0_.1______.
解析 这组数据的平均数=4.7+4.8+55.1+5.4+5.5=5.1, 则方差 s2=0.42+0.32+052+0.32+0.42 =0.16+0.09+05+0.09+0.16=0.1.
02 课堂互动·考点突破
考点一 茎叶图的应用
自主 完成
1.某学生在一门功课的22次考试中,所得分数茎叶图如图所示,则此学生
该门功课考试分数的极差与中位数之和为


(B )
A.117
5
6
6
2 335689
7
1 4667899
8 2 578
9
58
B.118
C.118.5
D.119.5
解析 22次考试中,所得分数最高的为98,最低的为56,所以极差为98-56 =42,将分数从小到大排列,中间两数为76,76,∴中位数为76,
(2)频率分布直方图:反映样本频率分布的直方图. 频率
横轴表示样本数据,纵轴表示组_距_____,每个小矩形的面积表示样本落在该组 内的频__率______.
(3)频率分布折线图和总体密度曲线 ①频率分布折线图:连接频率分布直方图中各小长方形上端的中__点______,就
得到频率分布折线图. ②总体密度曲线:随着样本容量的增加 ,作图时__所__分__的__组__数____增加,
__组__距____减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光
滑曲线为总体密度曲线.
(4)茎叶图的画法: 第一步:将每个数据分为茎(高位)和叶(低位)两部分; 第二步:将各个数据的茎按大__小______次序排成一列; 第三步:将各个数据的叶依次写在其茎的右(左)侧.

2020版高考数学一轮复习课时规范练54相关性最玄乘估计与统计案例理北师大版

2020版高考数学一轮复习课时规范练54相关性最玄乘估计与统计案例理北师大版

课时规范练54 相关性、最小二乘估计与统计案例基础巩固组1.(2018福建莆田模拟,3)设一个线性回归方程y=3+1.2,当变量每增加一个单位时,则y的变化情况正确的是()A.y平均增加约1.2个单位B.y平均增加约3个单位C.y平均减少约1.2个单位D.y平均减少约3个单位2.(2018黑龙江模拟十,6)下列表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为y=0.8-155,后因某未知原因使第5组数据的y值模糊不清,此位置数据记为m(如下表所示),则利用回归方程可求得实数m的值为()A.8.3B.8.2C.8.1D.83.(2018广东佛山二模,5)某同学用收集到的6组数据对(i,y i)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为y=b+a,相关系数为r.现给出以下3个结论;①r>0;②直线l恰好过点D;③b>1.其中正确结论是()A.①②B.①③C.②③D.①②③4.(2018辽南协作校一模,3)根据如下样本数据得到回归直线方程y=b+a,其中a=10.5,则当=6时,y的估计值是()A.57.5B.61.5C.64.5D.67.55.(2018黑龙江仿真模拟十一,5)某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表;附表;经计算χ2=10,则下列选项正确的是()A.有99%的把握认为使用智能手机对学习有影响B.有99%的把握认为使用智能手机对学习无影响C.有95%的把握认为使用智能手机对学习有影响D.有95%的把握认为使用智能手机对学习无影响6.(2018河南洛阳质检,13)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟订的价格进行试销,得到如下数据.由表中数据求得线性回归方程y=-4+a,则=10元时预测销量为件.7.(2018河南商丘模拟,19)已知具有线性相关关系的两个变量,y之间的几组数据如下表所示;(1)请根据上表提供的数据,用最小二乘法求出y关于的线性回归方程y=b+a,并估计当=20时,y 的值;(2)将表格中的数据看作五个点的坐标,则从这五个点中随机抽取2个点,求恰有1个点落在直线2-y-4=0右下方的概率.参考公式;b=,a=-b.综合提升组8.(2018河北保定一模,3)已知具有线性相关的变量,y,设其样本点为A i(i,y i)(i=1,2,…,8),回归直线方程为y=+a,若+…+=(6,2),(O为原点),则a=()A. B.- C. D.-9.(2018安徽合肥一中最后1卷,文13)为了研究某班学生的脚长(单位;cm)和身高y(单位;cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与之间有线性相关关系,设其回归直线方程为y=b+a.已知i=225,y i=1 600,b=4.该班某学生的脚长为24 cm,据此估计其身高为cm.10.(2018安徽蚌埠一模,文19)某图书公司有一款图书的历史收益率(收益率=利润÷每本收入)的频率分布直方图如图所示;(1)试估计平均收益率;(用区间中点值代替每一组的数值)(2)根据经验,若每本图书的收入在20元的基础上每增加元,对应的销量y(万本)与(元)有较强线性相关关系,从历史销售记录中抽样得到如下5组与y的对应数据;①求参数b的估计值;②若把回归方程y=10.0-b当作y与的线性关系,取何值时,此产品获得最大收益?求出该最大收益.11.(2018山东日照5月校际联考,19)为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是;①“盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近5个月参与竞拍的人数(见下表);(1)关系.请用最小二乘法求出y 关于t 的线性回归方程;y=bt+a ,并预测2018年5月份参与竞拍的人数.(2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价格进行了调查,得到如下频数分布表和频率分布直方图;①求a ,b 的值及这200位竞拍人员中报价大于5万元的人数;②若2018年5月份车牌配额数量为3 000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价. 参考公式及数据;①y=b+a ,其中b=,a=-b ;②=55,t i y i =18.8.创新应用组12.(2018黑龙江哈尔滨三中一模,10)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,哈三中积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计;根据上表可得回归方程y=b+a 中的b 为1.35,我校2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为( ) A.111B.115C.117D.123 13.(2018湖北七校联盟2月联考,19)已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度(单位;℃),对某种鸡的时段产蛋量y (单位;t)和时段投入成本(单位;万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度i 和产蛋量y i (i=1,2,…,7)的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.9.7 2935.135.0其中i=ln y i,i.(1)根据散点图判断,y=b+a与y=c1哪一个更适宜作为该种鸡的时段产蛋量y关于鸡舍时段控制温度的回归方程类型?(给判断即可,不必说明理由)(2)若用y=c1作为回归方程模型,根据表中数据,建立y关于的回归方程;(3)已知时段投入成本与,y的关系为=e-2.5y-0.1+10,当时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?附;①对于一组具有有线性相关关系的数据(μi,v i)(i=1,2,3,…,n),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为β=,α=-β②参考答案课时规范练54 相关性、最小二乘估计与统计案例1.A令=a,y=3+1.2a,令=a+1,则y=3+1.2(a+1)=4.2+1.2a,所以当变量每增加一个单位时,则y平均增加约1.2个单位,故选A.2.D由题意可得;==200,==,回归方程过样本中心点,则;=0.8×200-155,解得m=8,故选D.3.A由题图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数r>0;因为==3,==3,所以回归直线l的方程必过点(3,3),即直线l恰好过点D.因为直线l斜率接近于AD斜率,而==<1,所以③错误,综上正确结论是①②,故选A.AD4.C自变量的平均数==3.5,自变量y的平均数==42.∵线性回归直线方程y=b+a过样本中心点(,),其中a=10.5,∴42=b×3.5+10.5,即b=9.∴当=6时,y=9×6+10.5=64.5,故选C.5.A由于χ2=10>6. 635,据此结合独立性检验的思想可知;有99%的把握认为使用智能手机对学习有影响,故选A.6.66由已知得= (4+5+6+7+8+9)=,= (90+84+83+80+75+68)=80,∴a=80+4×=106,∴当=10时,y=106-40=66,故答案为66.7.解 (1)= (2+4+6+8+10)=6,= (3+6+7+10+12)=7.6,=4+16+36+64+100=220,i y i=6+24+42+80+120=272,b====1.1,∴a=7.6-6×1.1=1,∴回归直线方程为y=1.1+1,故当=20时,y=23.(2)可以判断,落在直线2-y-4=0右下方的点满足2-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),共有10种取法,满足条件的有6种,所以P==. 8.B因为++…+=(1+2+…+8,y1+y2+…+y8)=(8,8)=(6,2),所以8=6,8=2⇒=,=,因此=×+a,即a=-,故选B.9.166由i=225,y i=1 600,利用平均值公式求得=22.5,=160,∵b=4,∴a=160-4×22.5=70,从而当=24时,y=4×24+70=166,故答案为166.10.解 (1)区间中值依次为;0.05,0.15,0.25,0.35,0.45,0.55,取值的估计概率依次为;0.1,0.2,0.25,0.3,0.1,0.05,故平均收益率为0.05×0.10+0.15×0.20+0.25×0.25+0.35×0.30+0.45×0.10+0.55×0.05=0.275.(2)①===38,===6.2,将(38,6.2)代入y=10-b,得b==0.10.②设每本图书的收入是20+元,则销量为y=10-0.1,则图书总收入为f()=(20+)(10-0.1)=200+8-0.12=360-0.1(-40)2(万元),当=40时,图书公司总收入最大为360万元,预计获利为360×0.275=99万元.11.解 (1)易知==3,==1.04,b===0.32,a=-b=1.04-0.32×3=0.08,则y关于t的线性回归方程为y=0.32t+0.08,当t=6时,y=2.00,即2018年5月份参与竞拍的人数估计为2万人.(2)①由=0.20解得a=40.由频率和为1,得(0.05×2+0.10+2b+0.20+0.30)×1=1,解得b=0.15,200位竞拍人员报价大于5万元的人数为(0.05+0.10+0.15)×200=60人.②2018年5月份实际发放车牌数量为3 000,根据竞价规则,报价在最低成交价以上人数占总人数比例为×100%=15%;又由频率分布直方图知竞拍报价大于6万元的频率为0.05+0.10=0.15, 所以,根据统计思想(样本估计总体)可预测2018年5月份竞拍的最低成交价为6万元. 12.C由题意得==53,==103.5.∵数据的样本中心点在线性回归直线上,y=b+a中的b为1.35,∴103.5=1.35×53+a,即a=31.95,∴线性回归方程是y=1.35+31.95.∵2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,∴今年被清华、北大等世界名校录取的学生人数为1.35×63+31.95=117,故选C.13.解 (1)y=c1适宜.(2)由y=c1得ln y=c2+ln c1,令ln y=,c2=β,α=ln c1,由图表中的数据可知β==,α=-,∴=-,∴y关于的回归方程为y==0.47.(3)当=28时,由回归方程得y=0.47×1 096.63=515.4,=0.08×515. 4-2.8+10=48.432.即鸡舍的温度为28 ℃时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432.。

2020版高考数学一轮复习课时规范练53统计图表数据的数字特征用样本估计总体理北师大版28

2020版高考数学一轮复习课时规范练53统计图表数据的数字特征用样本估计总体理北师大版28

课时规范练53 统计图表、数据的数字特征、用样本估计总体基础巩固组1.(2018福建龙岩4月模拟,4)党的十八大以来,脱贫攻坚取得显著成绩.2013年至2016年4年间,累计脱贫5 564万人,2017年各地根据实际进行创新,精准、高效地完成了脱贫任务.某地区对当地3 000户家庭的2017年所有的年收入情况调查统计,年收入的频率分布直方图如图所示,数据(单位:千元)的分组依次为[20,40),[40,60),[60,80),[80,100],则年收入不超过6万的家庭大约为()A.900户B.600户C.300户D.150户2.(2018湖南长郡中学一模,7)某赛季甲、乙两名篮球运动员各13场比赛得分情况用茎叶图表示如图.根据上图,对这两名运动员的成绩进行比较,下列四个结论中,不正确的是()A.甲运动员得分的极差大于乙运动员得分的极差B.甲运动员得分的中位数大于乙运动员得分的中位数C.甲运动员的得分平均值大于乙运动员的得分平均值D.甲运动员的成绩比乙运动员的成绩稳定3.(2018四川成都考前模拟,3)某教育局为了解“跑团”每月跑步的平均里程,收集并整理了2017年1月至2017年11月期间“跑团”每月跑步的平均里程(单位:公里)的数据,绘制了下面的折线图.根据折线图,下列结论正确的是()A.月跑步平均里程的中位数为6月份对应的里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8、9月D.1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳4.(2018山东、湖北冲刺二,3)当5个正整数从小到大排列时,其中位数为4,若这5个数的唯一众数为6,则这5个数的均值不可能为()A.3.6B.3.8C.4D.4.25.(2018内蒙古呼和浩特一模,8)如图为某班35名学生的投篮成绩(每人投一次)的条形统计图,其中上面部分数据破损导致数据不完全.已知该班学生投篮成绩的中位数是5,则根据统计图,无法确定下列哪一选项中的数值()A.3球以下(含3球)的人数B.4球以下(含4球)的人数C.5球以下(含5球)的人数D.6球以下(含6球)的人数6.(2018四省名校大联三,6)某校李老师本学期任高一A班、B班两个班数学课教学,两个班都有50名学生,下图反映的是两个班在本学期5次数学检测中的班级平均分对比,根据图表信息,下列不正确的结论是()A.A班的数学成绩平均水平好于B班B.B班的数学成绩没有A班稳定C.下次B班的数学平均分高于A班D.在第一次考试中,A、B两个班总平均分为78分7.(2018四川达州四模,10)已知数据x1,x2,...,x10,2的平均值为2,方差为1,则数据x1,x2, (x10)对于原数据()A.一样稳定B.变得比较稳定C.变得比较不稳定D.稳定性不可以判断8.(2018江西景德镇盟校联考二,4)已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为,方差为s2,则()A.=4,s2=2B.=4,s2>2C.=4,s2<2D.>4,s2<29.(2018山东春季高考,24)在一批棉花中随机抽测了500根棉花纤维的长度(精确到1 mm)作为样本,并绘制了如图所示的频率分布直方图,由图可知,样本中棉花纤维的长度大于225 mm的频数是.10.(2018广东东莞考前冲刺,13)已知样本x1,x2,x3,…,x n的方差s2=2,则样本2x1+1,2x2+1,2x3+1,…,2x n+1的方差为.11.(2018河南天一大联考三,15)一组样本数据按从小到大的顺序排列为:-1,0,4,x,y,14,已知这组数据的平均数与中位数均为5,则其方差为.12.(2018东北师大附中五模,18)长春市统计局对某公司月收入在1 000~4 000元内的职工进行一次统计,并根据所得数据画出样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示职工月收入在区间[1 000,1 500)内,单位:元).(1)请估计该公司的职工月收入在[1 000,2 000)内的概率;(2)根据频率分布直方图估计样本数据的中位数和平均数.综合提升组13.(2018宁夏银川一中三模,4)甲、乙两组数据如茎叶图所示,若它们的中位数相同,平均数也相同,则图中的m,n的比值=()A. B. C.2 D.314.(2018湖南衡阳二模,4)已知样本x1,x2,…,x n的平均数为x;样本y1,y2,…,y m的平均数为y(x≠y),若样本x1,x2,…,x n,y1,y2,…,y m的平均数z=ax+(1-a)y,其中0<a<,则n,m(n,m∈N+)的大小关系为()A.n=mB.n≥mC.n<mD.n>m15.(2018安徽太和中学一模,16)已知样本数据a1,a2,a3,a4,a5的方差s2=-20),则样本数据2a1+1,2a2+1,2a3+1,2a4+1,2a5+1的平均数为.16.(2018新疆维吾尔自治区二模,19)某市有甲、乙两位航模运动员参加了国家队集训,现分别从他们在集训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲:8281797895889384乙:9295807583809085(1)画出甲、乙两位学生成绩的茎叶图,指出学生乙成绩的中位数;(2)现要从中派一人参加国际比赛,从平均成绩和方差的角度考虑,你认为派哪位学生参加合适?请说明理由.创新应用组17.(2018云南昆明二模,4)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.“搜索指数”越大,表示网民对该关键词的搜索次数越多,对该关键词相关的信息关注度也越高.下图是2017年9月到2018年2月这半年中,某个关键词的搜索指数变化的走势图.根据该走势图,下列结论正确的是()A.这半年中,网民对该关键词相关的信息关注度呈周期性变化B.这半年中,网民对该关键词相关的信息关注度不断减弱C.从网民对该关键词的搜索指数来看,去年10月份的方差小于11月份的方差D.从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值18.(2018河北衡水模拟三,19)“日行一万步,健康你一生”的养生观念已经深入人心,由于研究性学习的需要,某大学生收集了手机“微信运动”团队中特定甲、乙两个班级n名成员一天行走的步数,然后采用分层抽样的方法按照[20,30),[30,40),[40,50),[50,60)分层抽取了20名成员的步数,并绘制了如下尚不完整的茎叶图(单位:千步):已知甲、乙两班行走步数的平均值都是44千步.(1)求x,y的值;(2)①若n=100,求甲、乙两个班级100名成员中行走步数在[20,30),[30,40),[40,50),[50,60)各层的人数;②若估计该团队中一天行走步数少于40千步的人数比处于[40,50)千步的人数少12人,求n的值.参考答案课时规范练53 统计图表、数据的数字特征、用样本估计总体1.A由频率分布直方图可得年收入不超过6万的家庭的概率为(0.005+0.01)×20=0.3,所以年收入不超过6万的家庭数大约为3 000×0.3=900(户),故选A.2.D由茎叶图知甲的极差为47-18=29,乙的极差是33-17=16,A正确;甲中位数是30,乙中位数是26, B正确;甲均值为29,乙均值为25,C正确;只有D不正确,甲的方差大于乙的方差,应该是乙成绩稳定,故选D.3.D由折线图知,月跑步平均里程的中位数为5月份对应的里程数;月跑步平均里程不是逐月增加的;月跑步平均里程高峰期大致在9、10月份,故A,B,C错,故选D.4.A设五个数从小到大为a1,a2,a3,a4,a5,依题意得a3=4,a4=a5=6,a1,a2是1,2,3中两个不同的数,符合题意的五个数可能有三种情形:“1,2,4,6,6”,“1,3,4,6,6”,“2,3,4,6,6”,其平均数分别为3.8,4,4.2.均值不可能为3.6,故选A.5.C因为共有35人,而中位数应该是第18个数,所以第18个数是5,从题图中看出第四个柱状图的范围在6以上,所以投4个球的有7人.可得3球以下(含3球)的人数为10人,4球以下(含4球)的人数为10+7=17(人),6球以下(含6球)的人数为35-1=34(人).故只有5球以下(含5球)的人数无法确定,故选C.6.C A班的5次数学测试平均分分别为81,78,81,80,85,5次的平均分= (81+78+81+80+85)=81,B 班的5次数学测试平均分分别为75,80,76,85,80,5次的平均分为= (75+80+76+85+80)=79.2,A班的数学平均分好于B班,选项A正确;由于A班的成绩都在80分附近,而B班的平均分变化很大,所以A班成绩稳定些,选项B正确;下次考试A,B班的平均分不能预料,所以选项C错误;在第一次考试中,总平均分为==78分,选项D正确.故选C.7.C由题可得:=2,所以x1+x2+…+x10=20,所以平均值为2,由=1得=1.1>1,所以变得不稳定,故选C.8.C根据题意有==4,而s2=<2,故选C.9.235因为长度大于225 mm的频率为(0.004 4+0.005 0)×50=0.47,所以长度大于225 mm的频数是0.47×500=235.10.8由题意,样本数据x1,x2,x3,…,x n的方差s2=2,设样本2x1+1,2x2+1,2x3+1,…,2x n+1的方差为,则=22×s2=22×2=8.11. ∵-1,0,4,x,y,14的中位数为5,∴=5,∴x=6,∴这组数据的平均数是=5,即y=7,可得这组数据的方差是 (36+25+1+1+4+81)=,故答案为.12.解 (1)职工月收入在[1 000,2 000)内的概率为(0.000 2+0.000 4)×500=0.3.(2)根据条件可知,从左至右小矩形的面积分别是0.1、0.2,0.25,0.25,0.15,0.05,因此,中位数的估计值为2 000+=2 400;平均数的估计值为1 250×0.1+1 750×0.2+2 250×0.25+2 750×0.25+3 250×0.15+3 750×0.05=2 400.综上可知,中位数和平均数的估计值都是2 400.13.A由题意得,甲组数据为:24,29,30+m,42;乙组数据为:25,20+n,31,33,42,∴甲、乙两组数据的中位数分别为、31,且甲、乙两组数的平均数分别为==,==.由题意得解得∴==,故选A.14.C由题意得z=(nx+my)=x+1-y,∴a=.∵0<a<,∴0<<,∴n<m.故选C.15.5或-3设样本数据的平均数为a,则方差s2==(-2aa i+a2)=(-2aa i+5a2)=(-2a×5a+5a2)=(-5a2).结合s2=(++++-20)可得5a2=20,∴a=±2,即样本数据a1,a2,a3,a4,a5的平均数为2或-2,则样本数据2a1+1,2a2+1,2a3+1,2a4+1,2a5+1的平均数为2×2+1=5或2×(-2)+1=-3.16.解 (1)茎叶图如下:∴学生乙成绩的中位数为84.(2)派甲参加比较合适,理由如下:=(70×2+80×4+90×2+9+8+8+4+2+1+5+3)=85,=(70×1+80×4+90×3+5+3+5+2+5)=85,=[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(95-85)2+(93-85)2]=35.5, =[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85)2+(95-85)2]=41,因为=,<,∴甲的成绩比较稳定,派甲参加比较合适.17.D根据走势图可知,这半年中,网民对该关键词相关的信息关注度不呈周期性变化,A错;这半年中,网民对该关键词相关的信息关注度增减不确定,B错;从网民对该关键词的搜索指数来看,去年10月份的搜索指数的稳定性小于11月份的搜索指数的稳定性,所以去年10月份的方差大于11月份的方差,C错;从网民对该关键词的搜索指数来看,去年12月份的平均值大于今年1月份的平均值,D正确.故选D.18.解 (1)因为甲班的平均值为44,所以=×(26+32+42+40+x+45+46+48+50+52+53)=44,解得x=6.同理,因为乙班平均值为44,所以=×(26+34+30+y+41+42+46+50+52+57+58)=44,解得y=4.(2)①因为抽样比为=,且抽取的20名成员中行走步数在[20,30),[30,40),[40,50),[50,60)各层的人数依次为2,3,8,7,所以甲、乙两个班级100名成员中行走步数在[20,30),[30,40),[40,50),[50,60)各层的人数依次为10,15,40,35.②该团队中一天行走步数少于40千步的频率为=,处于[40,50)千步的频率为=,则估计该团队中一天行走步数少于40千步的人数与处于[40,50)千步的人数的频率之差为-=.又因为该团队中一天行走步数少于40千步的人数比处于[40,50)千步的人数少12人,所以n×=12,解得n=80.。

2020版高考数学一轮复习第九章算法初步、统计、统计案例第三节用样本估计总体学案文(含解析)新人教A版

2020版高考数学一轮复习第九章算法初步、统计、统计案例第三节用样本估计总体学案文(含解析)新人教A版

第三节 用样本估计总体2019考纲考题考情1.用样本的频率分布估计总体分布 (1)作频率分布直方图的步骤。

①求极差(即一组数据中最大值与最小值的差)。

②决定组距与组数。

③将数据分组。

④列频率分布表。

⑤画频率分布直方图。

(2)频率分布折线图和总体密度曲线。

①频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得频率分布折线图。

②总体密度曲线:随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率分布折线图会越来越接近于一条光滑曲线,即总体密度曲线。

(3)茎叶图。

茎是指中间的一列数,叶是从茎的旁边生长出来的数。

2.用样本的数字特征估计总体的数字特征 (1)众数:一组数据中出现次数最多的数。

(2)中位数:将数据按大小顺序排列,若有奇数个数,则最中间的数是中位数;若有偶数个数,则中间两数的平均数是中位数。

(3)平均数:x -=x 1+x 2+…+x n n,反映了一组数据的平均水平。

(4)标准差:是样本数据到平均数的一种平均距离,s =1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2]。

(5)方差:s 2=1n[(x 1-x -)2+(x 2-x -)2+…+(x n -x -)2](x n 是样本数据,n 是样本容量,x -是样本平均数)。

1.频率分布直方图中各小矩形的面积之和为1。

2.频率分布直方图与众数、中位数与平均数的关系 (1)最高的小长方形底边中点的横坐标即是众数。

(2)中位数左边和右边的小长方形的面积和是相等的。

(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和。

3.平均数、方差的公式推广(1)若数据x 1,x 2,…,x n 的平均数为x -,那么mx 1+a ,mx 2+a ,mx 3+a ,…,mx n +a 的平均数是m x -+a 。

(2)数据x 1,x 2,…,x n 的方差为s 2。

2020版高考数学大一轮复习第十章算法初步、统计、统计案例第54讲随机抽样课件文新人教A版

2020版高考数学大一轮复习第十章算法初步、统计、统计案例第54讲随机抽样课件文新人教A版
文科学生中抽取容量为120的样本,进行成绩分析,则应从B 校学生中抽取__________人.
解析
(1)依题意得
3 3+5+7
×n=18,解得n=90,即样本
容量为90.
(2)设A,B,C三所学校高三文科学生人数分别为x,y,
z,由题知x,y,z成等差数列,所以x+z=2y,又x+y+z=1
500,所以y=500,用分层抽样方法抽取B校学生人数为
参加座谈会的机会为( C )
A.110
B.511
5
1
C.51
D.50
答案 (1)①②③④ (2)01
考法二 系统抽样 归纳总结
解决系统抽样问题的两个关键点 (1)分组的方法应依据抽取比例而定,即根据定义每组抽 取一个样本. (2)起始编号的确定应用简单随机抽样的方法,一旦起始 编号确定,其他编号便随之确定了.
【例2】 (1)为了解1 000名学生的学习情况,采用系统抽 样的方法,从中抽取容量为40的样本,则分段的间隔为( )
120 1 500
×500=40.
答案 (1)B (2)40
[递进题组] 1.[考法一]在简单随机抽样中,某一个个体被抽到的可 能性( D ) A.与第n次有关,第一次可能性最大 B.与第n次有关,第一次可能性最小 C.与第n次无关,与抽取的第n个样本有关 D.与第n次无关,每次可能性相等
解析 因为在简单随机抽样中,每个个体被抽到的可能性
个部分组成时,往往选用分层抽样.
[对点检测]
1.思维辨析(在括号内打“√”或“ ”).
(1)从100件玩具中随机拿出一件,放回后再拿出一件,连 续拿5次,是简单随机抽样.( × )
(2)系统抽样适用于元素个数很多且均衡的总体.( √ ) (3)要从1 002个学生中用系统抽样的方法选取一个容量为 20的样本,需要剔除2个学生,这样对被剔除者不公 平.( × ) (4)分层抽样中,每个个体被抽到的可能性与层数及分层 有关.( × )

2020版高考数学一轮复习课时规范练54相关性最玄乘估计与统计案例理北师大版

课时规范练54 相关性、最小二乘估计与统计案例基础巩固组1.(2018福建莆田模拟,3)设一个线性回归方程y=3+1.2x,当变量x每增加一个单位时,则y的变化情况正确的是()A.y平均增加约1.2个单位B.y平均增加约3个单位C.y平均减少约1.2个单位D.y平均减少约3个单位2.(2018黑龙江模拟十,6)下列表格所示的五个散点,原本数据完整,且利用最小二乘法求得这五个散点的线性回归直线方程为y=0.8x-155,后因某未知原因使第5组数据的y值模糊不清,此位置数据记为m(如下表所示),则利用回归方程可求得实数m的值为()A.8.3B.8.2C.8.1D.83.(2018广东佛山二模,5)某同学用收集到的6组数据对(x i,y i)(i=1,2,3,4,5,6)制作成如图所示的散点图(点旁的数据为该点坐标),并由最小二乘法计算得到回归直线l的方程为y=bx+a,相关系数为r.现给出以下3个结论:①r>0;②直线l恰好过点D;③b>1.其中正确结论是()A.①②B.①③C.②③D.①②③4.(2018辽南协作校一模,3)根据如下样本数据得到回归直线方程y=bx+a,其中a=10.5,则当x=6时,y的估计值是()A.57.5B.61.5C.64.5D.67.55.(2018黑龙江仿真模拟十一,5)某研究型学习小组调查研究学生使用智能手机对学习的影响.部分统计数据如下表:附表:经计算χ2=10,则下列选项正确的是()A.有99%的把握认为使用智能手机对学习有影响B.有99%的把握认为使用智能手机对学习无影响C.有95%的把握认为使用智能手机对学习有影响D.有95%的把握认为使用智能手机对学习无影响6.(2018河南洛阳质检,13)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟订的价格进行试销,得到如下数据.由表中数据求得线性回归方程y=-4x+a,则x=10元时预测销量为件.7.(2018河南商丘模拟,19)已知具有线性相关关系的两个变量x,y之间的几组数据如下表所示:(1)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程y=bx+a,并估计当x=20时,y的值;(2)将表格中的数据看作五个点的坐标,则从这五个点中随机抽取2个点,求恰有1个点落在直线2x-y-4=0右下方的概率.参考公式:b=,a=-b.综合提升组8.(2018河北保定一模,3)已知具有线性相关的变量x,y,设其样本点为A i(x i,y i)(i=1,2,…,8),回归直线方程为y=x+a,若+…+=(6,2),(O为原点),则a=()A. B.- C. D.-9.(2018安徽合肥一中最后1卷,文13)为了研究某班学生的脚长x(单位:cm)和身高y(单位:cm)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为y=bx+a.已知x i=225,y i=1 600,b=4.该班某学生的脚长为24 cm,据此估计其身高为 cm.10.(2018安徽蚌埠一模,文19)某图书公司有一款图书的历史收益率(收益率=利润÷每本收入)的频率分布直方图如图所示:(1)试估计平均收益率;(用区间中点值代替每一组的数值)(2)根据经验,若每本图书的收入在20元的基础上每增加x元,对应的销量y(万本)与x(元)有较强线性相关关系,从历史销售记录中抽样得到如下5组x与y的对应数据:据此计算出的回归方程为y=10.0-bx.①求参数b的估计值;②若把回归方程y=10.0-bx当作y与x的线性关系,x取何值时,此产品获得最大收益?求出该最大收益.11.(2018山东日照5月校际联考,19)为了缓解日益拥堵的交通状况,不少城市实施车牌竞价策略,以控制车辆数量.某地车牌竞价的基本规则是:①“盲拍”,即所有参与竞拍的人都要网络报价一次,每个人不知晓其他人的报价,也不知道参与当期竞拍的总人数;②竞价时间截止后,系统根据当期车牌配额,按照竞拍人的出价从高到低分配名额.某人拟参加2018年5月份的车牌竞拍,他为了预测最低成交价,根据竞拍网站的数据,统计了最近5个月参与竞拍的人数(见下表):竞拍人数y(万人) 0.5 0.6 1 1.4 1.7(1)由收集数据的散点图发现,可用线性回归模型拟合竞拍人数y(万人)与月份编号t之间的相关关系.请用最小二乘法求出y关于t的线性回归方程:y=bt+a,并预测2018年5月份参与竞拍的人数.(2)某市场调研机构从拟参加2018年5月份车牌竞拍人员中,随机抽取了200人,对他们的拟报价价格进行了调查,得到如下频数分布表和频率分布直方图:①求a,b的值及这200位竞拍人员中报价大于5万元的人数;②若2018年5月份车牌配额数量为3 000,假设竞拍报价在各区间分布是均匀的,请你根据以上抽样的数据信息,预测(需说明理由)竞拍的最低成交价.参考公式及数据:①y=bx+a,其中b=,a=-b;②=55,t i y i=18.8.创新应用组12.(2018黑龙江哈尔滨三中一模,10)千年潮未落,风起再扬帆,为实现“两个一百年”奋斗目标、实现中华民族伟大复兴的中国梦奠定坚实基础,哈三中积极响应国家号召,不断加大拔尖人才的培养力度,据不完全统计:根据上表可得回归方程y=bx+a中的b为1.35,我校2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,据此模型预报我校今年被清华、北大等世界名校录取的学生人数为()A.111B.115C.117D.12313.(2018湖北七校联盟2月联考,19)已知鸡的产蛋量与鸡舍的温度有关,为了确定下一个时段鸡舍的控制温度,某企业需要了解鸡舍的温度x (单位:℃),对某种鸡的时段产蛋量y (单位:t)和时段投入成本z (单位:万元)的影响,为此,该企业收集了7个鸡舍的时段控制温度x i 和产蛋量y i (i=1,2,…,7)的数据,对数据初步处理后得到了如图所示的散点图和表中的统计量的值.其中k i =ln y i ,k i .(1)根据散点图判断,y=bx+a 与y=c 1哪一个更适宜作为该种鸡的时段产蛋量y 关于鸡舍时段控制温度x 的回归方程类型?(给判断即可,不必说明理由)(2)若用y=c 1作为回归方程模型,根据表中数据,建立y 关于x 的回归方程;(3)已知时段投入成本z 与x ,y 的关系为z=e -2.5y-0.1x+10,当时段控制温度为28 ℃时,鸡的时段产蛋量及时段投入成本的预报值分别是多少?附:①对于一组具有有线性相关关系的数据(μi ,v i )(i=1,2,3,…,n ),其回归直线v=βu+α的斜率和截距的最小二乘估计分别为β=,α=-β②参考答案课时规范练54 相关性、最小二乘估计与统计案例1.A令x=a,y=3+1.2a,令x=a+1,则y=3+1.2(a+1)=4.2+1.2a,所以当变量x每增加一个单位时,则y平均增加约1.2个单位,故选A.2.D由题意可得:==200,==,回归方程过样本中心点,则:=0.8×200-155,解得m=8,故选D.3.A由题图可知这些点分布在一条斜率大于零的直线附近,所以为正相关,即相关系数r>0;因为==3,==3,所以回归直线l的方程必过点(3,3),即直线l恰好过点D.因为直线l斜率接近于AD斜率,而k AD==<1,所以③错误,综上正确结论是①②,故选A.4.C自变量x的平均数==3.5,自变量y的平均数==42.∵线性回归直线方程y=bx+a过样本中心点(,),其中a=10.5,∴42=b×3.5+10.5,即b=9.∴当x=6时,y=9×6+10.5=64.5,故选C.5.A由于χ2=10>6. 635,据此结合独立性检验的思想可知:有99%的把握认为使用智能手机对学习有影响,故选A.6.66由已知得= (4+5+6+7+8+9)=,= (90+84+83+80+75+68)=80,∴a=80+4×=106,∴当x=10时,y=106-40=66,故答案为66.7.解 (1)= (2+4+6+8+10)=6,= (3+6+7+10+12)=7.6,=4+16+36+64+100=220,x i y i=6+24+42+80+120=272,b====1.1,∴a=7.6-6×1.1=1,∴回归直线方程为y=1.1x+1,故当x=20时,y=23.(2)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,故符合条件的点的坐标为(6,7),(8,10),(10,12),共有10种取法,满足条件的有6种,所以P==.8.B因为++…+=(x1+x2+…+x8,y1+y2+…+y8)=(8,8)=(6,2),所以8=6,8=2⇒=,=,因此=×+a,即a=-,故选B.9.166由x i=225,y i=1 600,利用平均值公式求得=22.5,=160,∵b=4,∴a=160-4×22.5=70,从而当x=24时,y=4×24+70=166,故答案为166.10.解 (1)区间中值依次为:0.05,0.15,0.25,0.35,0.45,0.55,取值的估计概率依次为:0.1,0.2,0.25,0.3,0.1,0.05,故平均收益率为0.05×0.10+0.15×0.20+0.25×0.25+0.35×0.30+0.45×0.10+0.55×0.05=0.275.(2)①===38,===6.2,将(38,6.2)代入y=10-bx,得b==0.10.②设每本图书的收入是20+x元,则销量为y=10-0.1x,则图书总收入为f(x)=(20+x)(10-0.1x)=200+8x-0.1x2=360-0.1(x-40)2(万元),当x=40时,图书公司总收入最大为360万元,预计获利为360×0.275=99万元.11.解 (1)易知==3,==1.04,b===0.32,a=-b=1.04-0.32×3=0.08,则y关于t的线性回归方程为y=0.32t+0.08,当t=6时,y=2.00,即2018年5月份参与竞拍的人数估计为2万人.(2)①由=0.20解得a=40.由频率和为1,得(0.05×2+0.10+2b+0.20+0.30)×1=1,解得b=0.15,200位竞拍人员报价大于5万元的人数为(0.05+0.10+0.15)×200=60人.②2018年5月份实际发放车牌数量为3 000,根据竞价规则,报价在最低成交价以上人数占总人数比例为×100%=15%;又由频率分布直方图知竞拍报价大于6万元的频率为0.05+0.10=0.15, 所以,根据统计思想(样本估计总体)可预测2018年5月份竞拍的最低成交价为6万元.12.C由题意得==53,==103.5.∵数据的样本中心点在线性回归直线上,y=bx+a中的b为1.35,∴103.5=1.35×53+a,即a=31.95,∴线性回归方程是y=1.35x+31.95.∵2018届同学在学科竞赛中获省级一等奖以上学生人数为63人,∴今年被清华、北大等世界名校录取的学生人数为1.35×63+31.95=117,故选C.13.解 (1)y=c1适宜.(2)由y=c1得ln y=c2x+ln c1,令ln y=k,c2=β,α=ln c1,由图表中的数据可知β==,α=-,∴k=x-,∴y关于x的回归方程为y==0.47.(3)当x=28时,由回归方程得y=0.47×1 096.63=515.4,z=0.08×515. 4-2.8+10=48.432.即鸡舍的温度为28 ℃时,鸡的时段产量的预报值为515.4,投入成本的预报值为48.432.。

(新课标)2020年高考数学一轮总复习第十章算法初步、统计、统计案例10_3用样本估计总体课件文新人教A版


名师点拨 由于茎叶图完全反映了所有的原始数据,解决由茎叶图给出的统计图 表试题时,就要充分使用这个图表提供的数据进行相关的计算或者是对某些问题 作出判断,这类试题往往伴随着对数据组的平均值或者是方差的计算等.
跟踪训练 (1)如图是某公司10个销售店某月销售某产品数量(单位:台)的茎叶 图,则数据落在区间[22,30)内的频率为( )
[解析] (1)甲组数据的中位数为65,由甲,乙两组数据的中位数相等,得y=5.又
甲,乙两组数据的平均值相等,∴
1 5
×(56+65+62+74+70+x)=
1 5
×(59+61+
67+65+78),∴x=3.故选A.
(2)①两地区用户满意度评分的茎叶图如下:
通过茎叶图可以看出,A地区用户满意度评分的平均值高于B地区用户满意度评分 的平均值;A地区用户满意度评分比较集中,B地区用户满意度评分比较分散. ②记CA1表示事件:“A地区用户的满意度等级为满意或非常满意”; CA2表示事件:“A地区用户的满意度等级为非常满意”; CB1表示事件:“B地区用户的满意度等级为不满意”; CB2表示事件:“B地区用户的满意度等级为满意”, 则CA1与CB1独立,CA2与CB2独立,CB1与CB2互斥,C=(CB1CA1)∪(CB2CA2).
名师点拨 1.平均数与方差都是重要的数字特征,是对总体的一种简明地描述, 平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小. 2.利用方差优化比较时方差越小,效果越好.
跟踪训练 (2018·漳平模拟)某企业有甲、乙两个研发小组,为了比较他们的研发
水平,现随机抽取这两个小组往年研发新产品的结果如下:(a,b),(a,
- b
),

--
--

2020届高三数学(文理)复习《 统计图表、用样本估计总体》

2020届高三复习《统计图表、用样本估计总体》专题练专题1 扇形图1.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________、________.2.某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:则下面结论中不正确的是()A.新农村建设后,种植收入减少B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半专题2 折线图1.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为x-甲,x-乙,标准差分别为σ甲,σ乙,则()A.x-甲<x-乙,σ甲<σ乙B.x-甲<x-乙,σ甲>σ乙C.x-甲>x-乙,σ甲<σ乙D.x-甲>x-乙,σ甲>σ乙2.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是()A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳3.空气质量指数(简称:AQI)是定量描述空气质量状况的无量纲指数,空气质量按照AQI大小分为六级:[0,50)为优,[50,100)为良,[100,150)为轻度污染,[150,200)为中度污染,[200,250)为重度污染,[250,300)为严重污染.下面记录了北京市22天的空气质量指数,根据图表,下列结论错误的是()A.在北京这22天的空气质量中,按平均数来考察最后4天的空气质量优于最前面4天的空气质量B.在北京这22天的空气质量中,有3天达到污染程度C.在北京这22天的空气质量中,12月29日空气质量最差D.在北京这22天的空气质量中,达到空气质量优的天数有7天专题3 茎叶图1.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为_______.2.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校400名授课教师中抽取20名,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图所示.据此可估计该校上学期400名教师中,使用多媒体进行教学次数在[16,30)内的人数为3.空气质量指数(Air Qu a li ty Inde x,简称AQI)是定量描述空气质量状况的指数,空气质量按照AQI大小分为六级,0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.从某地一环保人士某年的AQI记录数据中,随机抽取10个,用茎叶图记录如图.根据该统计数据,估计此地该年AQI大于100的天数约为________.(该年为365天)6.据了解,大学英语四级改革的一项重要内容就是总分改为710分,每个考生会有一个成绩,不再颁发“合格证”,这也意味着,不再有“及格”一说.大学英语四级考试成绩在425分及以上的考生可以报考大学英语六级考试,英语四级成绩在550分及以上的考生可以报考口语考试.如图是从某大学数学专业40人的英语四级成绩中随机抽取8人的成绩的茎叶图.(1)通过这8人的英语四级成绩估计该大学数学专业英语四级考试成绩的平均数和中位数;(2)在这8人中,从可以报考大学英语六级考试的学生中任取2人,求这2人都可以报考口语考试的概率.专题4 频率分布直方图1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为2.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民有____人.3.从某企业的某种产品中抽取1 000件,测量该种产品的一项质量指标值,由测量结果得到如图所示的频率分布直方图,假设这项指标在[185,215]内,则这项指标合格,估计该企业这种产品在这项指标上的合格率为__________.4.某学校组织学生参加数学测试,成绩(单位:分)的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100],若低于60分的人数是15,则该班的学生人数是________.5.某校为了了解教科研工作开展状况与教师年龄之间的关系,将该校不小于35岁的80名教师按年龄分组,分组区间为[35,40),[40,45),[45,50),[50,55),[55,60],由此得到频率分布直方图如图,则这80名教师中年龄小于45岁的有________人.6.某校高二(16)班共有50人,如图是该班在四校联考中数学成绩的频率分布直方图,则成绩在[100,120]内的学生人数为7.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.8.近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图所示,其中年龄在区间[30,40)内的有2 500人,在区间[20,30)内的有1200人,则m的值为9.为了解学生在课外活动方面的支出情况,抽取了n个同学进行调查,结果显示这些学生的支出金额(单位:元)都在[10,50]内,其中支出金额在[30,50]内的学生有117人,频率分布直方图如图所示,则n等于10.为了了解一批产品的长度(单位:毫米)情况,现抽取容量为400的样本进行检测,如图是检测结果的频率分布直方图,根据产品标准,单件产品长度在区间[25,30)的为一等品,在区间[20,25)和[30,35)的为二等品,其余均为三等品,则样本中三等品的件数为________.11.某学校为了调查学生在学科教辅书方面的支出情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出的钱数在[30,40)的同学比支出的钱数在[10,20)的同学多26人,则n的值为________.12.为了研究某药品的疗效,选取若干名志愿者进行临床试验.所有志愿者的舒张压数据(单位:kP a)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,……,第五组.如图是根据试验数据制成的频率分布直方图.已知第一组与第二组共有20人,第三组中没有疗效的有6人,则第三组中有疗效的人数为________.13.在样本的频率分布直方图中,共有7个小长方形,若中间一个小长方形的面积等于其他6个小长方形的面积的和的14,且样本容量为80,则中间一组的频数为14.在样本频率分布直方图中,共有9个小长方形.若中间一个小长方形的面积等于其他8个小长方形面积之和的25,且样本容量为140,则中间一组的频数为15.在样本的频率分布直方图中,共有11个小长方形,若中间一个小长方形的面积等于其他10个小长方形的面积和的14,且样本容量为160,则中间一组的频数为________.16.某市民用水拟实行阶梯水价,每人月用水量中不超过w 立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费,从该市随机调查了10 000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w 为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w 至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w =3时,估计该市居民该月的人均水费.17.某班100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)若在同一组数据中,将该组区间的中点值作为这组数据的平均分,根据频率分布直方图,估计这100名学生语文成绩的平均分;18.全世界越来越关注环境保护问题,某监测站点于2018年1月某日起连续n天监测空气质量指数(AQI),数据统计如下表:优20(1)根据所给统计表和频率分布直方图中的信息求出n,m的值,并完成频率分布直方图;(2)由频率分布直方图,求该组数据的平均数与中位数.19.某城市100户居民的月平均用电量(单位:千瓦时),以[160,180),[180,200),[200,220),[220,240),[240,260),[260,280),[280,300]分组的频率分布直方图如图.(1)求直方图中x的值.(2)求月平均用电量的众数和中位数.(3)在月平均用电量为[220,240),[240,260),[260,280),[280,300]的四组用户中,用分层抽样的方法抽取11户居民,则月平均用电量在[220,240]的用户中应抽取多少户?20.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题:(1)求a,b,c的值;(2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P(注:60分及60分以上为及格);(3)试估计这次数学测验的年级平均分.21.某大学生在开学季准备销售一种文具盒进行试创业,在一个开学季内,每售出1盒该产品获得的利润为30元,未售出的产品,每盒亏损10元.该大学生通过查询资料得到开学季市场需求量的频率分布直方图,如图所示.该大学生为这个开学季购进了160盒该产品,以x(单位:盒,100≤x≤200)表示这个开学季内的市场需求量,y(单位:元)表示这个开学季内经销该产品的利润.(1)根据直方图估计这个开学季内市场需求量x的众数和平均数;(2)将y表示为x的函数;(3)根据直方图估计利润y不少于4 000元的概率.专题5 样本的数字特征的计算与应用1.数据1,3,4,8的平均数与方差分别是2.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()甲乙A .甲的成绩的平均数小于乙的成绩的平均数B .甲的成绩的中位数等于乙的成绩的中位数C .甲的成绩的方差小于乙的成绩的方差D .甲的成绩的极差小于乙的成绩的极差3.某人5次上班途中所花的时间(单位:分钟)分别为x ,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为4.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为 5.已知某7个数的平均数为4,方差为2,现加入一个新数据4,此时这8个数的平均数为x -,方差为s 2,则( )A.x -=4,s 2=2B.x -=4,s 2>2C.x -=4,s 2<2D.x ->4,s 2<26.已知样本数据x 1,x 2,…,x n 的平均数x =5,则样本数据2x 1+1,2x 2+1,…,2x n +1的平均数为________.7.若数据x 1,x 2,x 3,…,x n 的平均数x =5,方差s 2=2,则数据3x 1+1,3x 2+1,3x 3+1,…,3x n +1的平均数和方差分别为 、8.已知正数x 1,x 2,x 3的方差s 2=13(x 21+x 22+x 23-12),则数据x 1+1,x 2+1,x 3+1的平均数为__9.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1■,那么这组数据的方差s 2可能的最大值是________.10.某企业有甲、乙两个研发小组,为了比较他们的研发水平,现随机抽取这两个小组往年研发新产品的结果如下:(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),(a ,b ),其中a ,a 分别表示甲组研发成功和失败;b ,b 分别表示乙组研发成功和失败.(1)若某组成功研发一种新产品,则给该组记1分,否则记0分.试计算甲、乙两组研发新产品的成绩的平均数和方差,并比较甲、乙两组的研发水平;(2)若该企业安排甲、乙两组各自研发一种新产品,试估计恰有一组研发成功的概率.5.1 与频率分布直方图交汇1.200辆汽车通过某一段公路时的速度的频率分布直方图如图所示,则速度的众数、中位数的估计值分别为2.一组样本数据的频率分布直方图如图所示,试估计此样本数据的中位数为3.如图是一容量为100的样本重量的频率分布直方图,则由图可估计样本重量的平均数与中位数分别为、5.2 与茎叶图交汇1.已知某班级部分同学一次测验的成绩统计如图所示,则其中位数和众数分别为、2.某班学生A,B在高三8次月考的化学成绩用茎叶图表示如图,其中学生A的平均成绩与学生B 的成绩的众数相等,则m=________.3.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为_____.4.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为、5.一次数学考试后,某老师从甲、乙两个班级中各抽取5人,记录他们的考试成绩,得到如图所示的茎叶图,已知甲班5名同学成绩的平均数为81,乙班5名同学成绩的中位数为73,则x-y的值为6.在如图所示一组数据的茎叶图中,有一个数字被污染后模糊不清,但曾计算得该组数据的极差与中位数之和为61,则被污染的数字为7.五四青年节活动中,高三(1)、(2)班都进行了3场知识辩论赛,比赛得分情况的茎叶图如图所示(单位:分),其中高三(2)班得分有一个数字被污损,无法确认,假设这个数字x具有随机性(x∈N),那么高三(2)班的平均得分大于高三(1)班的平均得分的概率为8.如图是某位篮球运动员8场比赛得分的茎叶图,其中一个数据染上污渍用x代替,那么这位运动员这8场比赛的得分平均数不小于得分中位数的概率为________.5.3 与优化决策问题交汇命题1.在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图.若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.2.甲、乙两人在相同条件下各射击10次,每次中靶环数情况如图所示:(1)请填写下表(写出计算过程):(2)①从平均数和方差相结合看(分析谁的成绩更稳定);②从平均数和命中9环及9环以上的次数相结合看(分析谁的成绩好些);③从折线图上两人射击命中环数的走势看(分析谁更有潜力).。

2020高考数学一轮复习 第10章第4节 用样本估计总体挑

2020高考数学一轮复习 第10章第4节 用样本估计总体挑战真题 文新课标版1.(2020·福建)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是 ( )A.91.5和91.5B.91.5和92C.91和91.5D.92和92解析:将此组数据按从小到大排列得到:87,89,90,91,92,93,94,96,易得到中位数为91.5;平均数=18×(87+89+90+91+92+93+94+96)=91.5,故选A. 答案:A2.(2020·陕西)如图,样本A 和B 分别取自两个不同的总体,它们的样本平均数分别为A x 和B x ,样本标准差分别为s A 和s B ,则 ( )A. A x > B x ,s A >s BB. A x < B x ,s A >s BC. A x > B x ,s A <s BD. A x < B x ,s A <s B解析:由图直接观察可得A x < B x ,s A >s B .答案:B3.(2020·北京)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a= .若要从身高在[120,130), [130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为 .解析:因为0.005×10+0.035×10+a ×10+0.020×10+0.010×10=1,所以a=0.030, 设身高在[120,130),[130,140),[140,150]分别有x,y,z 人, 所以100x =0.030×10,所以x=30,同理y=20,z=10, 所以在[140,150]内选取的人数为10302010++×18=3. 答案:0.030 34.(2020·安徽) 某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户.从普通家庭中以简单随机抽样方式抽取990户,从高收入家庭中以简单随机抽样方式抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是.解析:首先利用样本计算拥有3套或3套以上住房的比例,再去估计总体中的户数,计算所求比例,即5070990001000579901001000001000⨯+⨯==5.7%. 答案:5.7%5.(2020·浙江)在如图所示的茎叶图中,甲、乙两组数据的中位数分别是 , .解析:由茎叶图可知,甲图中共有9个数,分别为28,31,39,45,42,55,58,57,66,其中位数为45;乙图中共有9个数分别为29,34,35,48,42,46,53,55,67,其中位数为46. 答案:45 466.(2020·江苏)某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:则以上两组数据的方差中较小的一个为s 2= .解析:甲:平均数:677875++++=7,方差为:()()()222 6737787255 -+⨯-+-=.乙:平均数:676795++++=7,方差为:()()()222 26727797655⨯-+⨯-+-=.所以方差较小的为25.答案:2 57.(2020·广东)某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率. 解:(1)因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,所以经直观分析,收看新闻节目的观众与年龄是有关的.(2)应抽取大于40岁的观众人数为2745×5=35×5=3(名).(3)用分层抽样方法抽取的5名观众中,20至40岁有2名(记为Y1,Y2),大于40岁有3名(记为A1,A2,A3).5名观众中任取2名,共有10种不同取法:Y1Y2,Y1A1,Y1A2,Y1A3,Y2A1,Y2A2,Y2A3,A1A2,A1A3,A2A3.设A表示随机事件“5名观众中任取2名,恰有1名观众年龄为20至40岁”,则A中的基本事件有6种:Y1A1,Y1A2,Y1A3,Y2A1,Y2A2,Y2A3,。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

课后限时集训(五十四) (建议用时:60分钟) A组 基础达标 一、选择题 1.(2019·肇庆模拟)若6名男生和9名女生身高(单位:cm)的茎叶图如图,则男生的平均身高与女生身高的中位数分别为( )

A.181,166 B.181,168 C.180,166 D.180,168

B [6名男生的平均身高为173+176+178+180+186+1936=181,9名女生的身高按由低到高的顺序排列为162,163,166,167,168,170,176,184,185,故中位数为168.] 2.(2019·中山模拟)某商场在国庆黄金周的促销活动中,对10月1日9时至14时的销售额进行统计,其频率分布直方图如图所示.已知9时至10时的销售额为3万元,则9时至14时的销售总额为 ( )

A.10万元 B.12万元 C.15万元 D.30万元

D [9时至10时的销售额频率为0.1,因此9时至14时的销售总额为30.1=30(万元),故选D.] 3.(2019·惠州模拟)已知数据x1,x2,…,x10,2的平均值为2,方差为1,则数据x1,x2,…,x10相对于原数据( )

A.一样稳定 B.变得比较稳定 C.变得比较不稳定 D.稳定性不可以判断

C [数据x1,x2,…,x10,2的平均值为2,方差为1,故111[(x1-2)2+(x2-2)2+…+(x10-2)2

+(2-2)2]=1,数据x1,x2,…,x10的方差s2=110[(x1-2)2+(x2-2)2+…+(x10-2)2]>1,故相对于原数据变得比较不稳定,选C.] 4.中国诗词大会节目是央视首档全民参与的诗词节目,节目以“赏中华诗词、寻文化基因、 品生活之美”为基本宗旨,力求通过对诗词知识的比拼及赏析,带动全民重温那些曾经学过的古诗词,分享诗词之美,感受诗词之趣,从古人的智慧和情怀中汲取营养,涵养心灵.如图是2016年中国诗词大会中,七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有( )

A.a1>a2 B.a2>a1 C.a1=a2 D.a1,a2的大小与m的值有关 B [由茎叶图知,

a1=80+1+5+5+4+55=84,

a2=80+4+4+6+4+75=85,

故a2>a1.] 5.(2019·榆林模拟)为了反映各行业对仓储物流业务需求变化的情况,以及重要商品库存变化的动向,中国物流与采购联合会和中储发展股份有限公司通过联合调查,制定了中国仓储指数.由2017年1月至2018年7月的调查数据得出的中国仓储指数,绘制出如下的折线图. 中国仓储指数趋势图(%)

根据该折线图,下列结论正确的是 ( ) A.2017年各月的仓储指数最大值是在3月份 B.2018年1月至7月的仓储指数的中位数为55 C.2018年1月与4月的仓储指数的平均数为52 D.2017年1月至4月的仓储指数相对于2017年1月至4月,波动性更大 D [2017年各月的仓储指数最大值是在11月份,所以A错误;由图可知,2018年1月至7

月的仓储指数的中位数约为53,所以B错误;2018年1月与4月的仓储指数的平均数为51+552=53,所以C错误;由图可知,2017年1月至4月的仓储指数比2018年1月至4月的仓储指数波动更大,故选D.] 二、填空题 6.某次体检,5位同学的身高(单位:m)分别为1.72,1.78,1.80,1.69,1.76,则这组数据的中位数是________m. 1.76 [将这5位同学的身高按照从低到高排列:1.69,1.72,1.76,1.78,1.80,这五个数的中位数是1.76.] 7.(2019·衡水模拟)在高三某次数学测试中,40名学生的成绩如图所示:

若将成绩由低到高编为1~40号,再用系统抽样的方法从中抽取8人,则其中成绩在区间[123,134]上的学生人数为________. 3 [根据茎叶图,成绩在区间[123,134]上的数据有15个, 所以用系统抽样的方法从所有的40人中抽取8人,

成绩在区间[123,134]上的学生人数为8×1540=3.] 8.(2019·聊城模拟)某工厂从生产的一批产品中随机抽出一部分,对这些产品的一项质量指标进行了检测,整理检测结果得到如下频率分布表:

质量指标分组 [10,30) [30,50) [50,70] 频率 0.1 0.6 0.3 据此可估计这批产品的此项质量指标的方差为________. 144 [由题意得这批产品的此项质量指标的平均数为20×0.1+40×0.6+60×0.3=44,故方差为(20-44)2×0.1+(40-44)2×0.6+(60-44)2×0.3=144.] 三、解答题 9.某校1 200名高三年级学生参加了一次数学测验(满分为100分),为了分析这次数学测验的成绩,从这1 200人的数学成绩中随机抽取200人的成绩绘制成如下的统计表,请根据表中提供的信息解决下列问题: 成绩分组 频数 频率 平均分 [0,20) 3 0.015 16 [20,40) a b 32.1 [40,60) 25 0.125 55 [60,80) c 0.5 74 [80,100] 62 0.31 88 (1)求a、b、c的值; (2)如果从这1 200名学生中随机抽取一人,试估计这名学生该次数学测验及格的概率P(注: 60分及60分以上为及格); (3)试估计这次数学测验的年级平均分. [解] (1)由题意可得,b=1-(0.015+0.125+0.5+0.31)=0.05,a=200×0.05=10,c=200×0.5=100. (2)根据已知,在抽出的200人的数学成绩中,及格的有162人.

所以P=162200=81100=0.81. (3)这次数学测验样本的平均分为x= 16×3+32.1×10+55×25+74×100+88×62200=73,

所以这次数学测验的年级平均分大约为73分. 10.(2017·北京高考)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),…,[80,90],并整理得到如下频率分布直方图.

(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率; (2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例. [解] (1)根据频率分布直方图可知,样本中分数不小于70的频率为(0.02+0.04)×10=0.6, 所以样本中分数小于70的频率为1-0.6=0.4, 所以从总体的400名学生中随机抽取一人,其分数小于70的概率估计为0.4. (2)根据题意,样本中分数不小于50的频率为(0.01+0.02+0.04+0.02)×10=0.9,分数在区间[40,50)内的人数为100-100×0.9-5=5,所以总体中分数在区间[40,50)内的人数估计为

400×5100=20. (3)由题意可知,样本中分数不小于70的学生人数为(0.02+0.04)×10×100=60, 所以样本中分数不小于70的男生人数为60×12=30, 所以样本中的男生人数为30×2=60,女生人数为100-60=40,所以样本中男生和女生人数的比例为60∶40=3∶2,所以根据分层抽样原理,估计总体中男生和女生人数的比例为3∶2. B组 能力提升 1.(2019·天水模拟)甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均 数分别为x甲,x乙,标准差分别为σ甲,σ乙,则( ) A.x甲σ乙 C.x甲>x乙,σ甲x乙,σ甲>σ乙 C [由图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知x甲>x乙.图中数据显示甲同学的成绩比乙同学稳定,故σ甲2.在一个容量为5的样本中,数据均为整数,已测出其平均数为10,但墨水污损了两个数据,其中一个数据的十位数字1未被污损,即9,10,11,1,那么这组数据的方差s2可能的最大值是________. 32.8 [由题意可设两个被污损的数据分别为10+a,b(a,b∈Z,0≤a≤9),则10+a+b+9

+10+11=50,即a+b=10,b=10-a,所以s2=15[(9-10)2+(10-10)2+(11-10)2+(10+a-

10)2+(b-10)2]=15[2+a2+(b-10)2]=25(1+a2)≤25×(1+92)=32.8.] 3.从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表: 质量指标 值分组 [75,85) [85,95) [95,105) [105,115) [115,125]

频数 6 26 38 22 8 (1)作出这些数据的频率分布直方图:

(2)估计这种产品质量指标值的平均数及方差(同一组十的数据用该组区间的中点值作代表);

相关文档
最新文档