【全程复习方略】全国高考数学(理)一轮复习练习:第九章统计(含答案解析)
2020年高考数学理科一轮复习:第9章 统计与统计案例 第3讲 课后作业 Word版含解析

姓名,年级:时间:A组基础关1.观察下列各图形:其中两个变量x,y具有相关关系的图是( )A.①② B.①④ C.③④ D.②③答案C解析观察散点图可知,两个变量x,y具有相关关系的图是③④.2.设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i,y i)(i=1,2,…,n),用最小二乘法建立的回归方程为错误!=0.85x-85。
71,则下列结论中不正确的是( )A.y与x具有正的线性相关关系B.回归直线过样本点的中心(错误!,错误!)C.若该大学某女生身高增加1 cm,则其体重约增加0.85 kgD.若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg 答案D解析D选项中,若该大学某女生身高为170 cm,根据回归方程只能近似认为其体重为58.79 kg,但不是绝对的.故D不正确.故选D。
3.甲、乙、丙、丁四位同学各自对A,B两变量的线性相关性做试验,并用回归分析方法分别求得相关系数r与残差平方和m如下表:则哪位同学的试验结果体现A,B两变量有更强的线性相关性()A.甲 B.乙 C.丙 D.丁答案D解析在验证两个变量之间的线性相关关系时,相关系数的绝对值越接近1,相关性越强,在四个选项中只有丁的相关系数最大;残差平方和越小,相关性越强,只有丁的残差平方和最小,综上可知丁的试验结果体现了A,B两个变量有更强的线性相关性.故选D。
4.(2018·江西南城一中、高安中学联考)随着国家二孩政策的全面放开,为了调查一线城市和非一线城市的二孩生育意愿,某机构用简单随机抽样方法从不同地区调查了100位育龄妇女,结果如下表.由K2=n ad-bc2a+b c+d a+c b+d,得K2=错误!≈9.616。
参照下表,正确的结论是()A.在犯错误的概率不超过0。
1%的前提下,认为“生育意愿与城市级别有关”B.在犯错误的概率不超过0.1%的前提下,认为“生育意愿与城市级别无关”C.有99%以上的把握认为“生育意愿与城市级别有关”D.有99%以上的把握认为“生育意愿与城市级别无关”答案C解析k≈9.616>6.635,∴有99%以上的把握认为“生育意愿与城市级别有关”.故选C.5.(2018·河南天一大联考)已知变量x,y之间满足线性相关关系y^=1.3x-1,且x,y之间的相关数据如下表所示:则m=()A.0.8 B.1。
高考数学第九章统计测试解析版

第九章统计测试一.选择题(每题5分,共60分)1.①某学校高二年级共有526人,为了调查学生每天用于休息的时间,决定抽取10%的学生进行调查;②一次数学考试中,某班有10人的成绩在100分以上,32人的成绩在90~100分,12人的成绩低于90分,现从中抽取9人了解有关情况;③运动会的工作人员为参加4×100 m接力赛的6支队伍安排跑道.针对这三件事,恰当的抽样方法分别为( )A.分层抽样,分层抽样,简单随机抽样B.系统抽样,系统抽样,简单随机抽样C.分层抽样,简单随机抽样,简单随机抽样D.系统抽样,分层抽样,简单随机抽样【来源】沈阳市2016-2017学年度(下)部分市级重点高中协作校期中测试高一数学试题【答案】D【解析】①某学校高二年级共有526人,为了调查学生每天用于休息的时间,决定抽取10%的学生进行调查,此项调查的总体数目较多,而且差异不大,符合系统抽样的适用范围.②一次数学月考中,某班有10人在100分以上,32人在90∼100分,12人低于90分,现从中抽取9人了解有关情况,此项抽查的总体数目较多,而且差异很大,符合分层抽样的适用范围.③运动会工作人员为参加4×100m接力赛的6支队伍安排跑道,此项抽查,的总体个数不多,而且差异不大,符合简单随机抽样的适用范围.本题选择D选项.2.某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ).A.90 B.75 C.60 D.45【答案】A【解析】样本中产品净重小于100克的频率为(0.050+0.100)×2=0.3,频数为36,∴样本总数为.∵样本中净重大于或等于98克并且小于104克的产品的频率为(0.100+0.150+0.125)×2=0.75,∴样本中净重大于或等于98克并且小于104克的产品的个数为120×0.75=90.3.某中学有高中生3000人,初中生2000人,男、女生所占的比例如下图所示.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是()A.12B.15C.20D.21【来源】河南省信阳高级中学2019届高三第一次大考数学(文)试题【答案】A【解析】分析:首先确定分层抽样的抽取比例,然后求解初中生中抽取的男生人数即可.详解:因为分层抽样的抽取比例为211 30000.7100=⨯,所以初中生中抽取的男生人数是20000.612100⨯=人.本题选择A选项.4.某影院有60排座位,每排70个座号,一次报告会坐满了听众,会后留下座号为15的所有听众60人进行座谈,这是运用了( )A .抽签法B .随机数法C .系统抽样法D .分层抽样法【来源】陕西省黄陵中学2016-2017学年高一(普通班)下学期期末考试数学试题【答案】C【解析】∵听众人数比较多,∵把每排听众从1到70号编排,要求每班编号为15的同学留下进行交流,这样选出的样本是采用系统抽样的方法,故选C.5.甲、乙两名运动员在某项测试中的6次成绩的茎叶图如图所示,12,x x 分别表示甲、乙两名运动员这项测试成绩的平均数,2212,s s 分别表示甲、乙两名运动员这项测试成绩的方差,则有( )A .221212,x x s s ><B .221212,x x s s =>C .221212,x x s s ==D .221212,x x s s =<【来源】2018年春人教A 版高中数学必修三单元测试:第二章 统计【答案】D【解析】由甲、乙两名运动员在某项测试中的6次成绩的茎叶图可得,1914151516216x +++++==15,2813151517226x +++++==15, 2116s =×[(-6)2+(-1)2+02+02+12+62]=2237136s =,×[(-7)2+(-2)2+02+02+22+72]=533. 所以 221212,x x s s =<.选D .6.(2016•浦东新区一模)某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x﹣y|的值为()A.1 B.2 C.3 D.4【来源】2015-2016学年云南省景洪市三中高二上学期期中考试数学试卷(带解析)【答案】D【解析】由题意这组数据的平均数为10,方差为2可得:x+y=20,(x﹣10)2+(y﹣10)2=8,解这个方程组需要用一些技巧,因为不要直接求出x、y,只要求出|x﹣y|,设x=10+t,y=10﹣t,由(x﹣10)2+(y﹣10)2=8得t2=4;∴|x﹣y|=2|t|=4,故选D.7.为了节能减排,发展低碳经济,我国政府从2001年起就通过相关扶植政策推动新能源汽车产业发展.下面的图表反映了该产业发展的相关信息:2019年2月份新能源汽车销量结构图根据上述图表信息,下列结论错误的是()A.2018年4月份我国新能源汽车的销量高于产量B.2017年3月份我国新能源汽车的产量不超过3.4万辆C.2019年2月份我国插电式混合动力汽车的销量低于1万辆D.2017年我国新能源汽车总销量超过70万辆【来源】山东省济南市2019届高三5月学习质量针对性检测理科数学试题【答案】C【解析】由图表可知:对于选项A中,2018年4月份我国新能源汽车的销量为8.2万辆,产量为8.1万辆,所以是正确的;对于选项B中,2017年3月份我国新能源汽车的产量为6.83.312.05≈万辆,所以是正确的;对于选项C中,2019年2月份我国插电混合动力汽车的销量为5.325% 1.325⨯=万辆,所以不正确;对于D中,2017年我国新能源汽车总销量为125.677.671.617≈万辆,所以是正确的,故选C.8.某厂家生产甲、乙、丙三种不同类型的饮品・产量之比为2:3:4.为检验该厂家产品质量,用分层抽样的方法抽取一个容量为72的样本,则样本中乙类型饮品的数量为()A.16 B.24 C.32 D.48【来源】河南省洛阳市2018-2019学年高一下学期期末数学试题【答案】B【解析】因为分层抽样总体和各层的抽样比例相同,所以各层在总体的比例与在样本的比例相同,所以样本中乙类型饮品的数量为37224234⨯=++.故选B.9.某校高一年级某班共有60名学生,现采用系统抽样的方法从中抽取6名学生做“跑操与健康”的调查,为此将学生编号为1,2,...,60,选取的这6名学生的编号可能是()A.1,2,3,4,5,6B.6,16,26,36,46,56C.1,2,4,8,16,32D.3,9,13,27,36,54【来源】2013届河北省石家庄市高中毕业班第一次模拟考试文科数学试卷A(带解析)【答案】B【解析】根据系统抽样的定义,从60名学生中抽取6名学生,编号的间隔为60106=,∴编号组成的数列应是公差为10的等差数列,故选B.10.将参加数学竞赛决赛的名同学编号为001,002,,500,采用系统抽样的方法抽取一个容量为50的样本,且随机抽到的号码为005,这500名同学分别在三个考试点考试,从001到200在第一考点,从201到365在第二考点,从366到500在第三考点,则第二考点被抽中的人数为()A.15B.16C.17D.18【来源】江西省新八校2019届高三第二次联考文科数学试题【答案】C【解析】系统抽样的分段间隔为5001050=,在随机抽样中,首次抽到005号,以后每隔10个号抽到一个人,则,在201至365号中共有17人被抽中,其编号分别为205,215,225,,365⋯.故选C11.一个蜂巢里有1只蜜蜂,第一天,它飞出去带回了5个伙伴;第二天,6只蜜蜂飞出去各自带回了5个伙伴........如果这个过程继续下去,那么第6天所有的蜜蜂归巢后,蜂巢中共有蜜蜂多少只()A.()666161--B.66C.36D.26【来源】陕西省渭南市尚德中学2017-2018学年高二第一次教学质量检测数学试卷【答案】B【解析】第一天归巢后共有6个,第二天归巢后,共有26656+⨯=,第三天归巢后,共有3363656+⨯=,以此类推,第六天归巢后,共有66,故选B.12.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s1,s2分别表示甲、乙选手分数的标准差,则s1与s2的关系是( ).A.s1>s2B.s1=s2C.s1<s2D.不确定【来源】吉林省长春外国语学校2018-2019学年高二上学期第一次月考数学试题【答案】C【解析】乙选手分数的平均数分别为7885848192767780949384,84, 55++++++++====因此s1<s2,选C.二.填空题(每题5分,共20分)13.某校女子篮球队7名运动员身高(单位:cm)分布的茎叶图如图,已知记录的平均身高为175 cm,但记录中有一名运动员身高的末位数字不清晰,如果把其末位数字记为x,那么x的值为________.【来源】9-3用样本估计总体(高效训练)-2019版导学教程一轮复习数学(人教版)【答案】2【解析】由题意,可得1170(12451011)1757x+++++++=,即1(33)57x+=,解得2x=.14.某校高三年级500名学生中,血型为O型的有200人,A型的有125人,B型的有125人,AB型的有50人.为研究血型与色弱之间的关系,现用分层抽样的方法从这500名学生中抽取一个容量为60的样本,则应抽取____名血型为AB的学生.【来源】江苏省丹阳高级中学2018届高三上学期期中考试数学试题【答案】6【解析】由题意603 50025=,故AB型血抽:350625⨯=人.15.空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的质量指数.空气质量按照AQI大小分为六级:0~50为优;51~100为良;101~150为轻度污染;151~200为中度污染;201~300为重度污染;大于300为严重污染.一环保人士记录去年某地某月10天的AQI的茎叶图如图.利用该样本估计该地本月空气质量优良(100AQI≤)的天数(按这个月总共30天计算)为________.【来源】步步高高一数学暑假作业:作业7 用样本的频率分布估计总体分布【答案】18【解析】根据茎叶图中,可得该样本中空气质量优的天数为2,空气质量良的天数为4, 故该样本中空气质量优良的频率为63105=,估计该地本月空气质量优良的频率为35, 从而估计该地本月空气质量优良的天数为330185⨯=. 16.校开展“爱我南阳、爱我家乡”摄影比赛,9位评委为参赛作品A 给出的分数如茎叶图所示.记分员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若记分员计算无误,则数字x 应该是__________.【来源】2011年湖北省荆州中学高二上学期期末考试数学理卷【答案】1【解析】由题意可知17(89+89+92+93+m +92+91)=91,解得x =91,所以x =1,故选A. 三.解答题(17题10分,其余12分/题,共70分)17.某校高二某班的一次数学测试成绩的茎叶图和频率分布直方图都受到不同程度的破坏,其可见部分如图所示.据此解答如下问题:(1)计算频率分布直方图中)8090,⎡⎣间的矩形的高;(2)根据茎叶图和频率分布直方图估计这次测试的平均分.【来源】黑龙江省海林市朝鲜族中学人教版高中数学必修三同步练习:第二章 统计单元测评【答案】(1)0.016 ; (2)73.8分.【解析】(1)设该班的数学测试成绩统计的人数为m ,则由茎叶图及频率分布直方图第一个矩形框知,2m =0.008×10,得到m =25,所以频率分布直方图中[80,90)间的矩形的高为252112510-⨯=0.016. (2)设这次测试的平均分为,则=55×0.08+65×0.28+75×0.4+85×0.16+95×0.08=73.8, 所以,根据茎叶图和频率分布直方图估计这次测试的平均分为73.8分.18.一微商店对某种产品每天的销售量(x 件)进行为期一个月的数据统计分析,并得出了该月销售量的直方图(一个月按30天计算)如图所示.假设用直方图中所得的频率来估计相应事件发生的概率.(1)求频率分布直方图中a 的值;(2)求日销量的平均值(同一组中的数据用该组区间的中点值作代表);(3)若微商在一天的销售量超过25件(包括25件),则上级商企会给微商赠送100元的礼金,估计该微商在一年内获得的礼金数.【来源】河北省枣强中学2018-2019学年高二上学期期末考试数学(文)试题【答案】(1)0.02;(2)22.5;(3)10800元【解析】(1)由题意可得()110.010.060.070.0450.025a ⎡⎤=-+++⨯=⎣⎦ (2)根据已知的频率分布直方图,日销售量的平均值为()12.50.0117.50.0622.50.0727.50.0432.50.02522.5⨯+⨯+⨯+⨯+⨯⨯=.(3)根据频率分布直方图,日销售量超过25件(包括25件)的天数为()0.040.025309+⨯⨯=,可获得的奖励为900元,依次可以估计一年内获得的礼金数为9001210800⨯=元.19.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁~18岁的男生体重(kg),得到频率分布直方图如下:求:(1)根据直方图可得这100名学生中体重在(56,64)的学生人数.(2)请根据上面的频率分布直方图估计该地区17.5-18岁的男生体重.(3)若在这100名男生中随意抽取1人,该生体重低于62的概率是多少?【来源】四川省广元市万达中学、八二一中学2018-2019高二下学期期中考试数学(理)试题【答案】(1)40;(2)65.2kg ;(3)P=0.28【解析】(1)根据频率直方图得,这100名学生中体重在(56,64)的学生人数为:(0.030.052007)21000.410040+⨯+⨯⨯=⨯=(人);(2)根据频率分布直方图得,样本的平均数是:(550.01570.03590.05610.05630.07650.08670.06⨯+⨯+⨯+⨯+⨯+⨯+⨯()690.05710.04730.04750.02)265.2kg +⨯+⨯+⨯+⨯⨯=即利用平均数来衡量该地区17.5-18岁的男生体重是65.2kg ;(3)根据频率分布直方图得,样本数据中低于62kg 的频率是(0.010.030.052)++⨯ 20.28⨯=, ∴这100名男生中随意抽取1人,该生体重低于62kg 的概率是0.28P =.20.如图是某单位职工的月收入情况画出的样本频率分布直方图,已知图中第一组的频数为4 000,请根据该图提供的信息,解答下列问题.(1)为了分析职工的收入与年龄、学历等方面的关系,必须从样本中按月收入用分层抽样方法抽出100人作进一步分析,则月收入在[1 500,2 000)的这组中应抽取多少人?(2)试估计样本数据的中位数与平均数.【来源】河南信阳市息县第一高级中学、第二高级中学、息县高中2018-2019学年高一下学期期中联考数学(文)试题【答案】(1)20(2)17750,1962.5【解析】(1)由题知,月收入在[1000,1500)的频率为0.0008×500=0.4,又月收入在[1000,1500)的有4 000人,故样本容量n40000.4==10000.又月收入在[1500,2000)的频率为0.000 4×500=0.2,月收入在[1 500,2 000)的人数为0.2×10000=2 000,从10 000人中用分层抽样的方法抽出100人,则月收入在[1500,2000)的这组中应抽取100×200010000=20(人).(2)月收入在[1000,2000)的频率为0.4+0.2=0.6>0.5,故样本数据的中位数为1500+0.50.40.0004-=1500+250=1750.由频率分布直方图可知,月收入在[3000,3500)的频率为()10.00080.00040.00030.000250.00015000.075-++++⨯=故样本数据的平均数为12500.417500.222500.1527500.12532500.07537500.051962.5⨯+⨯+⨯+⨯+⨯+⨯=21.某企业为了解下属某部门对本企业职工的服务情况,随机访问50名职工,根据这 50名职工对该部门的评分,绘制频率分布直方图(如图所示),其中样本数据分组区间为[)[)[)[]40,50,50,60,,80,90,90,100⋯(1)求频率分布图中a 的值,并估计该企业的职工对该部门评分不低于80的概率;(2)从评分在[)40,60的受访职工中,随机抽取2人,求此2人评分都在[)50,60 的概率.【来源】安徽省阜阳市临泉县第一中学2016-2017学年高一下学期学科竞赛数学(文)试题【答案】(1)0.006,0.4; (2)310【解析】(1)由频率分布直方图知()100.0040.0220.0280.0220.0181a +++++=, 所以0.006a =.该企业的职工对该部分评分不低于80的概率为()100.0220.0180.4+=.(2)在[)40,60的受访职工人数为()100.0040.006505+⨯=,此2人评分都在[)50,60的概率为310. 22.某城市100户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,260,[)260,280,[]280,300分组的频率分布直方图如图.(1)求直方图中的值;(2)求月平均用电量的众数和中位数;(3)在月平均用电量为[)220,240,[)240,260,[)260,280,[]280,300的四组用户中,用分层抽样的方法抽取户居民,则月平均用电量在[)220,240的用户中应抽取多少户?【来源】2015年全国普通高等学校招生统一考试文科数学(广东卷带解析)【答案】(1)0.0075;(2)230,224;(3)5.【解析】(1)由直方图的性质可得(0.002+0.0095+0.011+0.0125+x+0.005+0.0025)×20=1得:x=0.0075,所以直方图中x的值是0.0075. ------------- 3分(2)月平均用电量的众数是2202402+=230. ------------- 5分因为(0.002+0.0095+0.011)×20=0.45<0.5,所以月平均用电量的中位数在[220,240)内,设中位数为a,由(0.002+0.0095+0.011)×20+0.0125×(a-220)=0.5得:a=224,所以月平均用电量的中位数是224. ------------ 8分(3)月平均用电量为[220,240]的用户有0.0125×20×100=25户,月平均用电量为[240,260)的用户有0.0075×20×100=15户,月平均用电量为[260,280)的用户有0. 005×20×100=10户,月平均用电量为[280,300]的用户有0.0025×20×100=5户, -------------10分抽取比例=112515105+++=15,所以月平均用电量在[220,240)的用户中应抽取25×15=5户.-- 12分。
2024版新教材高考数学全程一轮总复习第九章统计与成对数据的统计分析第二节成对数据的统计分析课件

必备知识·夯实双基
关键能力·题型突破
【课标标准】
1.了解样本相关系数的统计意义. 2.了解最小二乘原理,掌握一元线性回归模型参数的最小二乘估计 方法,会用一元线性回归模型进行预测. 3.理解2×2列联表的统计意义,了解2×2列联表独立性检验及其应 用.
必备知识·夯实双基
巩固训练3 [2023·广东汕头模拟]汕头某药企为评估一款新药的药效和安全性, 组织一批志愿者进行临床用药实验,结果显示临床疗效评价指标A的 数量y与连续用药天数x具有相关关系.刚开始用药时,指标A的数量y 变化明显,随着天数增加,y的变化趋缓.根据志愿者的临床试验情 况,得到了一组数据(xi,yi),i=1,2,3,4,5,…,10,xi表示连 续用药i天,yi表示相应的临床疗效评价指标A的数值.该药企为了进 一步研究药物的临床效果,建立了y关于x的两个回归模型: 模型①:由最小二乘公式可求得y与x的经验回归方程:yො =2.50x- 2.50; 模型②:由图中样本点的分布,可以认为样本点集中在曲线:y= b ln x+aො 的附近 ,令 t=ln x,则 有 σi1=01 ti =22.00,σi1=01 yi =230, σi1=01 tiyi=569.00,σi1=01 ti2=50.92.
坚持慢跑可以促进新陈代谢,增加肺活量以及增强心脏功能,提升人 体免疫力,因此深受青年人喜爱.如图统计了小明这100天每天慢跑 的时间情况(单位:分钟).
(1)求m的值. (2)如表是小明的同事小强本月前7次慢跑的时间情况;由散点图可 知,小强的慢跑次数x和慢跑时间y(单位:分钟)之间线性相关, ①求y关于x的经验回归方程yො =b x+aො ,其中b ,aො 使用分数形式表示; ②根据①中的运算结果预测小强第9次的慢跑时间是否会超过小明这 100天慢跑的平均时间.
2024届高考数学一轮复习 第九章《统计与成对数据的统计分析》 第一节 随机抽样、统计图表

例1
(1) ①某小区有800户家庭,其中高收入家庭有200户,中等收入家庭有480户,低收入家庭有120户,为了解有关家用轿车购买力的某个指标,从中抽取一个容量为100的样本;②从10名学生中抽取3名参加座谈会.问题和抽样方法配对正确的是( )
A. ①简单随机抽样,②分层随机抽样 B. ①分层随机抽样,②简单随机抽样C. ①简单随机抽样,②简单随机抽样 D. ①分层随机抽样,②分层随机抽样
1.总体与样本
(1)总体与样本的定义统计的研究对象是数据,获取数据的方法有__________和__________,调查对象的全体称为总体,组成总体的每一个调查对象称为个体,从总体中抽取的部分个体称为样本,样本中包含的个体数称为样本量.
全面调查
抽样调查
(2)总体均值与样本均值的定义一般地,总体中有 个个体,它们的变量值分别为 , , , ,则总体均值(总体平均数) _ __________________.若从总体中抽取一个容量为 的样本,它们的变量值分别为 , , , ,则样本均值(样本平均数) ________________总体含有 ( 为正整数)个个体,从中逐个抽取 个个体作为样本,如果抽取是放回的,且每次抽取时总体内的各个个体被抽到的概率都______,我们把这样的抽样方法叫做放回简单随机抽样;如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都______,我们把这样的抽样方法叫做不放回简单随机抽样.放回简单随机抽样和不放回简单随机抽样统称为简单随机抽样.通过简单随机抽样获得的样本称为简单随机样本.
0.75
[解析] 4次射击中至少有2次没有击中目标的有 , , , , ,所以所求概率 .
方法感悟1.简单随机抽样的特点(1)被抽取的总体中的个体数有限.(2)等可能抽取.2.抽签法与随机数法的适用情况(1)抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况.(2)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否容易搅匀.
2024届高考数学一轮复习 第九章《统计与成对数据的统计分析》第三节 成对数据的统计分析

2. 已知变量 和 满足关系式 ,变量 与 正相关,则下列结论中正确的是( )
A. 与 正相关, 与 负相关 B. 与 正相关, 与 正相关C. 与 负相关, 与 负相关 D. 与 负相关, 与 正相关
C
3. 变量 与 相对应的一组数据为 , , , , ;变量 与 相对应的一组数据为 , , , , 表示变量 与 之间的线性相关系数, 表示变量 与 之间的线性相关系数,则( )
1
2
3
4
5
32.0
31.0
33.0
36.0
37.0
25.0
30.0
34.0
37.0
39.0
6
7
8
9
10
38.0
39.0
43.0
45.0
41.0
42.0
44.0
48.0
(1) 求第10年该城市的居民年收入 ;
[解析] 因为 ,所以 ,解得 .
(2) 若该城市的居民年收入 与该种商品的销售额 之间满足经验回归方程 .
3. (新教材改编题)如图所示的散点图中,两个变量的相关关系为正相关的是________.
图(4)
[解析] 只有题图(4)中随着 的增大, 值也呈现增加的趋势,故题图(4)中变量关系为正相关.
A. B. C. D.
C
4. 一位同学分别对甲、乙、丙、丁四组变量进行线性相关试验,并分别计算出决定系数 ,则线性相关程度最高的一组变量是( )
甲
乙
丙
丁
0.87
0.91
0.58
0.83
A. 甲 B. 乙 C. 丙 D. 丁
B
[解析] 越大,两个变量的线性相关程度越高. ,则线性相关程度最高的是乙,故选B.
2025届高考数学一轮复习人教A版多选题专题练:第九章-统计(含解析)

2025届高考数学一轮复习人教A 版多选题专题练:第九章 统计一、多项选择题1.2020年上半年,中国养猪企业受猪价高位的利好影响,大多收获史上最佳半年报业绩,部分企业半年报营业收入同比增长超过1倍.某养猪场抓住机遇,加大了生猪养殖规模,为了检测生猪的养殖情况,该养猪场对2000头生猪的体重(单位:kg )进行了统计,得到如图所示的频率分布直方图,则下列说法正确的是( )A.这2000头生猪体重的众数为160kgB.这2000头生猪中体重不低于200kg 的有80头C.这2000头生猪体重的中位数落在区间[140,160)内D.这2000头生猪体重的平均数为152.8kg2.某公司为了解用户对其产品的满意度,从甲、乙两地区分别随机调查了100个用户,根据用户对产品的满意度评分,分别得到甲地区和乙地区用户满意度评分的频率分布直方图,如图所示.若甲地区和乙地区用户满意度评分的中位数分别为1m ,2m ,平均数分别为1s ,2s ,则下面正确的是( )A.12m m >B.12m m <C.D.3.在某次高中学科竞赛中,4000名考生的参赛成绩统计如图所示,60分以下视为不及格,若同一组中数据用该组区间的中点值作代表,则下列说法中正确的是( )A.成绩在[70,80)内的考生人数最多B.不及格的考生人数为1000C.考生竞赛成绩的平均分约为70.5分D.考生竞赛成绩的中位数为75分4.在我们发布的各类统计数据中,同比和环比都是反映增长速度的核心数据指标.如图是某专业机构统计的2022年1-12月中国校车销量走势图,则下列结论正确的是( )A.8月校车销量的同比增长率与环比增长率都是全年最高B.1-12月校车销量的同比增长率的平均数小于环比增长率的平均数C.1-12月校车销量的环比增长率的极差大于同比增长率的极差D.1-12月校车销量的环比增长率的方差大于同比增长率的方差12s s <12s s >5.某院校教师情况如下表所示.关于2020年、2021年、2022年这三年该院校的教师情况,下面说法正确的是( )A.2021年的男教师最多B.该校教师最多的是2022年C.2021年中年男教师比2020年中年男教师多80人D.2020年到2022年,该校青年年龄段的男教师人数增长率为220%6.某市2023年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后的年经济收入构成比例,得到如下扇形图.则下列结论中正确的是( )A.招商引资后,工资净收入较前一年减少B.招商引资后,转移净收入是前一年的2.5倍D.招商引资后,经营净收入较前一年增加了一倍7.为了调查,两种药物预防某种疾病的效果,某研究所进行了动物试验.已知参与两种药物试验的动物的品种,状态,数量均相同,图1是药物试验结果对应的等高堆积条形图,图2是药物试验结果对应的等高堆积条形图,则( )A.服用药物的动物的患病比例低于未服用药物的动物的患病比例B.服用药物对预防该疾病没有效果C.在对药物的试验中,患病动物的数量约占参与药物试验动物总数量的D.药物比药物预防该种疾病的效果好当月增速100%-=⨯去年同期产量当月产量去年同期产量.C.2021年4月至2021年12月我国规模以上工业天然气产量当月增速的极差为12.6%D.2021年4月至2021年12月我国规模以上工业天然气日均产量的40%分位数为5.3亿立方米9.下列说法正确的是( )A.已知随机变量X 服从二项分布14,2B ⎛⎫ ⎪⎝⎭,则()1D X =B.设随机变量X 服从正态分布()0,1N ,若(1)0.15P X >=,则(10)0.15P X -<<=C.已知一组数据为1,2,3,4,5,6,7,8,9,10,则它的第70百分位数为7D.若事件A ,B 满足()0P A >,()0P B >,(|)()P B A P B =,则事件A ,B 相互独立10.“体育强则中国强,国运兴则体育兴”.为行战2024年巴黎奥运会,运动员们都在积极参加集训,已知某跳水运动员在一次集训中7位裁判给出的分敕分别为:9.1,9.3,9.4,9.6,9.8,10,10,则这组数据的( )A.平均数为9.6B.众数为1011.小明在家独自用下表分析高三前5次月考中数学的班级排名y 与考试次数x 的相关性时,忘记了6=,于是分别用6m =和8m =得到了两条回归直线方程:11y b x a =+,22y b x a =+,对应的相关系数分别为1r 、2r ,排名y 对应的方差分别为21s 、22s ,则下列结论正确的是( )(附:b =y =-A.12r r < B.2212s s < C.12b b < D.12a a <12.第75届联合国大会上,我国向世界郑重承诺力争在2030年前实现碳达峰,努力争取在2060年前实现碳中和.2021年全国两会的政府工作报告明确提出要扎实做好碳达峰、碳中和的各项工作,大力发展新能源.常见的新能源主要有潮汐能、风能、太阳能和地热能等.下图为2015年与2020年我国新增电力装机结构对比,则( )A.2015年我国新增电力装机中,火电装机占比最大B.2020年我国新增电力装机中,风电装机数多于火电装机数C.2020年我国水电新增装机数少于2015年D.2020年我国新增电力装机结构中,新能源装机占比大于2015年13.已知样本11:p ax ,,…,的均值为4,标准差为2,样本,,…,21n x -的方差为4,则样本和样本的( )A.平均数相等B.方差相等C.极差相等D.中位数相等14.某学校开展消防安全知识培训,对甲、乙两班学员进行消防安全知识测试,绘制测试成绩的频率分布直方图,如图所示:( )A.甲班成绩的平均数<甲班成绩的中位数B.乙班成绩的平均数<乙班成绩的中位数C.甲班成绩的平均数<乙班成绩的平均数D.乙班成绩的中位数<甲班成绩的中位数15.某校为了了解学生的身体素质,对2022届初三年级所有学生仰卧起坐一分钟的个数情况进行了数据统计,结果如图1所示.该校2023届初三学生人数较2022届初三学生人数上升了10%,2023届初三学生仰卧起坐一分钟的个数分布条形图如图2所示,则( )A.该校2022届初三年级学生仰卧起坐一分钟的个数在[)30,60内的学生人数占70%B.该校2023届初三学生仰卧起坐一分钟的个数在[]60,80内的学生人数比2022届初三学生仰卧起坐一分钟个数同个数段的学生人数的2.2倍还多C.该校2023届初三学生仰卧起坐一分钟个数和2022届初三学生仰卧起坐一分钟个数的中位数均在[)50,60内2ax n ax 12:21p x -221x -1p 2pD.相比于2022届初三学生仰卧起坐一分钟个数不小于50的人数,2023届初三学生仰卧起坐一分钟个数不小于50的人数占比增加16.有一组样本数据1x ,2x ,…,6x ,其中1x 是最小值,6x 是最大值,则( )A.2x ,3x ,4x ,5x 的平均数等于1x ,2x ,…,6x ,的平均数B.2x ,3x ,4x ,5x 的中位数等于1x ,2x ,…,6x ,的中位数C.2x ,3x ,4x ,5x 的标准差不小于1x ,2x ,…,6x ,的标准差D.2x ,3x ,4x ,5x 的极差不大于1x ,2x ,…,6x ,的极差17.我国居民收入与经济同步增长,人民生活水平显著提高.“三农”工作重心从脱贫攻坚转向全面推进乡村振兴,稳步实施乡村建设行动,为实现农村富强目标而努力.2017年~2021年某市城镇居民、农村居民年人均可支配收入比上年增长率如下图所示.根据下面图表,下列说法一定正确的是( )A.该市农村居民年人均可支配收入高于城镇居民B.对于该市居民年人均可支配收入比上年增长率的极差,城镇比农村的大C.对于该市居民年人均可支配收入比上年增长率的中位数,农村比城镇的大D.2021年该市城镇居民、农村居民年人均可支配收入比2020年有所上升18.某短视频平台以讲故事,赞家乡,聊美食,展才艺等形式展示了丰富多彩的新时代农村生活,吸引了众多粉丝,该平台通过直播带货把家乡的农产品推销到全国各地,从而推进了“新时代乡村振兴”.从平台的所有主播中,随机选取300人进行调查,其中青年人,中年人,其他人群三个年龄段的比例饼状图如图1所示,各年龄段主播的性别百分比等高堆积条形图如图2所示,则下列说法正确的有( )A.该平台女性主播占比的估计值为0.4B.从所调查的主播中,随机抽取一位参加短视频剪辑培训,则被抽到的主播是中年男性的概率为0.7C.按年龄段把所调查的主播分为三层,用分层抽样法抽取20名主播担当平台监管,若样本量按比例分配,则中年主播应抽取6名D.从所调查的主播中,随机选取一位作为幸运主播,已知该幸运主播是青年人的条件下,又是女性的概率为0.619.下列统计量中可用于度量样本1x,2x ,…,n x 离散程度的有( )A.1x ,2x ,…,n x 的标准差B.1x ,,…,的中位数C.1x ,2x ,…,n x 的极差D.1x ,2x ,…,n x 的平均数20.我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产.下面是某地连续11天的复工、复产指数折线图.根据该折线图,( )A.这11天复工指数和复产指数均逐日增加B.在这11天期间,复产指数的增量大于复工指数的增量C.第3天至第11天,复工指数和复产指数都超过80%D.第9天至第11天,复产指数的增量大于复工指数的增量2x n x参考答案1.答案:BCD解析:由频率分布直方图可知,[140,160)这一组的数据对应的小长方形最高,所以这2000头生猪的体重的众数为150kg ,A 错误;这2000头生猪中体重不低于200kg 的有0.00220200080⨯⨯=(头),B 正确;因为生猪的体重在[80,140)内的频率为(0.0010.0040.01)200.3++⨯=,在[140,160)内的频率为0.016200.32⨯=,且0.30.320.620.5+=>,所以这2000头生猪体重的中位数落在区间[140,160)内,C 正确;这2000头生猪体重的平均数为(0.001900.004110⨯+⨯0.011300.0161500.0121700.0051900.002210)20152.8(kg)+⨯+⨯+⨯+⨯+⨯⨯=,D 正确.故选BCD.2.答案:BC解析:由题中频率分布直方图得,甲地区[40,60)的频率为(0.0150.020)100.35+⨯=,[60,70)的频率为0.025100.25⨯=,所以甲地区用户满意度评分的中位数10.50.356010660.25m -=+⨯=,甲地区的平均数1450.01510550.02010650.02510750.02010s =⨯⨯+⨯⨯+⨯⨯+⨯⨯850.01010950.0101067+⨯⨯+⨯⨯=.乙地区[50,70)的频率为(0.0050.020)100.25+⨯=,[70,80)的频率为0.035100.35⨯=,所以乙地区用户满意度评分的中位数20.50.25701077.10.35m -=+⨯≈,乙地区的平均数2550.00510650.02010750.03510850.02510950.01510s =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯77.5=,所以12m m <,12s s <.故选BC.3.答案:ABC解析:由频率分布直方图可得,成绩在[70,80)内的频率最高,因此考生人数最多,故A 正确;由频率分布直方图可得,成绩在[40,60)内的频率为10(0.010.015)0.25⨯+=,因此不及格的人数为40000.251000⨯=,故B 正确;由频率分布直方图可得,平均分约为450.1550.15650.2750.3850.15950.170.5⨯+⨯+⨯+⨯+⨯+⨯=(分),故C 正确;因为成绩在[40,70)内的频率为10(0.010.0150.02)0.45⨯++=,在[70,80)内的频率为0.3,所以中位数为0.50.45701071.670.3-+⨯≈,故D 错误.故选ABC.4.答案:BCD解析:2022年8月校车销量的同比增长率比9月的低,故A 错误;由校车销量走势图知1-12月校车销量的同比增长率的平均数为负数,环比增长率的平均即招商引资后,转移净收入是前一年的2.5倍,可得B 正确;对于C ,由招商引资后的年经济收入构成比例可知转移净收入与财产净收入的总和占比为33%,小对于D ,招商引资后的经营净收入为230%0.6a a ⨯=,招商引资前的经营净收入为30%0.3a a ⨯=,可得招商引资后,经营净收入较前一年增加了一倍,即D 正确.故选:BD7.答案:AD解析:根据题中两组等高堆积条形图,可知服用药物的动物的患病比例低于未服用药物的动物的患病比例,所以正确;服用药物未患病的动物的频率明显大于未服用药物的,所以可以认为服用药物对预防该疾病有一定效果,所以B 不正确;在对药物的试验中,患病动物的数量占参与药物试验动物总数量的比例为100%204302000%60%⨯=+<,所以C 不正确;药物试验结果对应的等高堆积条形图显示未服用药与服用药动物的患病数量的差异较药物试验的大,所以药物比药物预防该种疾病的效果好,所以D 正确.故选:AD.8.答案:ACD解析:2021年10月份我国规模以上工业天然气产量当月增速为0.5个百分点,9月份增速为7.1个百分点,比上月放缓6.6个百分点.故A 正确;2021年8月我国规模以上工业天然气产量为亿立方米,故B 错误;2021年4月至12月我国规模以上工业天然气产量当月增速的极差为13.1%0.5%12.6%-=.故C 正确;2021年4月至12月我国规模以上工业天然气日均产量从小到大为5.1,5.1,5.2,5.3,5.4,5.6,5.7,5.9,6.2,因为,所以该组数据的40%分位数为5.3亿立方米,故D 正确.9.答案:AD解析:因为随机变量X 服从二项分布,则()114(1)122D X =⨯⨯-=,故A 正确;因为随机变量X 服从正态分布()0,1N ,则对称轴为0μ=,1(10)[12(1)]0.352P X P X -<<=->=,故B 错误;7.5=,故C 错误;因为()(|)()()P AB P B A P B P A ==,所以()()()P AB P A P B =,所以事件A ,B 相互独立.故选:AD.10.答案:ABD解析:对于A,平均数1(9.19.39.49.69.81010)9.67=++++++=,故A 正确;对于B,出现次数最多5.131158.1⨯=90.4 3.6⨯=14,2B ⎛⎫ ⎪⎝⎭的数为10,故B正确;对于C,70.8 5.6⨯=,第80百分位数为第6位,即10,故C错误;对于D,方差为正确.故选ABD.11.答案:BD解析:当m=123455++++==11066265n++++==,解得16n=,同理,当时,,,,,所以,,,,故选:BD.12.答案:ABD2222221(9.19.6)(9.39.6)(9.49.6)(9.69.6)(9.89.6)2(109.6)7⎡⎤-+-+-+-+-+-=⎣⎦16-223)(26)12-= 8m=22b=-212a=2r=228s=12r r>2212s s<12b b>12a a<解析:对于A ,2015年我国新增电力装机中火电装机占比50.65%,显然占比最大,故A 正确;对于B ,2020年我国新增电力装机中风电装机占比37.55%,火电装机占比29.53%,所以新增电力装机中风电装机数大于火电装机数,故B 正确;对于C ,虽然相对于2015年,2020年我国核电新增装机占比减少,但由于总装机数不确定,所以不能得出核电装机数减少的结论,故C 错误;对于D ,2015年我国新增电力装机中火电装机占比50.65%,所以新能源装机占比不超过50%,但2020年我国风电和太阳能新增装机占比和为62.8%大于50%,所以2020年我国新增电力装机结构中清洁能源占比增加,故D 正确.故选ABD.13.答案:BC解析:对于选项A,B,C,设样本1x ,2x ,…,x 2,极差为M ,中位数为q ,则4ax =,224a s =,244s =,所以21s =,2a =±,当2a =时,样本11:2p x ,22x ,…,2n x ;样本12:21p x -,221x -,…,21n x -,可得样本1p 的平均数为24x =,样本2p 的平均数为213x -=,样本1p 和样本2p 的极差相等为2M ,方差也相等为4,故B,C 正确;选项D,设样本1p 的中位数为2q ,则样本2p 的中位数为21q -,故D 错误.当2a =-时,样本11:2p x -,22x -,…,2n x -;样本12:21p x -,221x -,…,21n x -,可得样本1p 的平均数为24x -=,样本2p 的平均数为215x -=-,样本1p 和样本2p 的极差相等为2M ,方差也相等为4,故B,C 正确;选项D,设样本1p 的中位数为,则样本的中位数为,故D 错误.故选:BC.14.答案:BC解析:15.答案:ABD解析:2022届初三年级学生仰卧起坐一分钟的个数在[)30,60内的学生人数占比为20%25%25%70%++=,A 正确.由于2023届初三学生人数较2022届上升了10%,假设2q -2p 21q -2022届初三学生人数为(0)a a >,则仰卧起坐一分钟的个数在[]60,80内的学生人数为0.2a ,2023届初三学生仰卧起坐一分钟的个数在[]60,80内的学生人数为()110%41%0.451,0.4510.2 2.2a a a a ⨯+⨯=>⨯,B 正确.2022届初三学生仰卧起坐一分钟个数的中位数在[)40,50内,2023届初三学生仰卧起坐一分钟个数的中位数在[)50,60内,C 错误.2022届初三学生仰卧起坐一分钟个数不小于50的人数占由表中数据,可知增长率为正,即D 正确.故选:BCD18.答案:AC解析:A 选项,由图1可以看出选取300人中其他人群人数为30010%30⨯=,青年人人数为30060%180⨯=,中年人人数为()300110%60%90⨯--=,由图2可以看出青年人中女性人数为1804072⨯%=,中年人中女性人数为9030%27⨯=,其他人群中,女性人数为3070%21⨯=,0.4=,A 正确;B 选项,中年人中男性人数为9070%63⨯=,故从所调查的主播中,随机抽取一位参加短视频剪辑培训,则被抽到的主播是中年男性0.21=,B 错误;C 选项,三个年龄段人数比例为青年主播,中年主播和其他人群主播比例为6:3:1,故用分层抽样法抽取20名主播担当平台监管,若样本量按比例分配,则中年主播应抽取3206631⨯=++名,C 正确;D 选项,从所调查的主播中,随机选取一位作为幸运主播,设幸运主播是青年人为事件A ,随机选取一位作为幸运主播,设幸运主播是女性主播为事件B ,则()180n A =,()72n AB =,()()()720.4180n AB P B A n A ===,D 错误.19.答案:AC解析:平均数和中位数反映的是一组数据的平均水平,标准差和极差则体现了一组数据的离散程度.故选AC.20.答案:CD解析:由题图可知第8,9天复工指数和复产指数均减小,故A 错误;第1天时复工指数小于复产指数,第11天时两指数相等,故复产指数的增量小于复工指数的增量,故B 错误;由题图可知第3天至第11天,复工复产指数都超过80%,故C 正确;第9天至第11天,复产指数的增量大于复工指数的增量,故D 正确.。
2024版新教材高考数学全程一轮总复习第九章统计与成对数据的统计分析第一节随机抽样用样本估计总体课件

夯实双基
1.思考辨析(正确的打“√”,错误的打“×”)
(1)在简单随机抽样中,某一个个体被抽到的可能性与第几次抽取有
关,第一次被抽到的可能性最大.( × )
(2)在分层随机抽样中,每个个体被抽到的可能性与层数及分层有
关.( × )
(3)一组数据的众数可以是一个或几个,那么中位数也有相同的结
的个体数分别为M和N,抽取的样本量分别为m和n,第1层和第2层的
样本平均数分别为തx,തy,样本平均数为w,则
ഥ
M
N
m
n
w=
ഥ
xത +
yത =
xത +
yത .
M+N
M+N
m+n
m+n
2.在频率分布直方图中:
(1)最高的小矩形底边中点的横坐标即是众数;
(2)中位数左边和右边的所有小矩形的面积和是相等的;
②决定________与________.
组距
组数
③将数据________.
分组
④列频率分布表.
⑤画频率分布直方图.
(2)常见的统计图表有条形图、扇形图、折线图、频率分布直方图.
4.总体百分位数的估计
(1)第p百分位数的定义
一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中
p%
至少有________的数据小于或等于这个值,且至少有__________的数
(2)将身高在[170,175),[175,180),[180,185]
区间内的学生依次记为A,B,C三个组,用分层随
机抽样的方法从这三个组中抽取6人,求这三个组
分别抽取的学生人数;
2022版高考一轮总复习数学(理)习题 第9章 统计、统计案例及算法初步 9-1 Word版含答案

(时间:40分钟)1.对一个容量为N的总体抽取容量为n的样本,当选取简洁随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p1,p2,p3,则( )A.p1=p2<p3B.p2=p3<p1C.p1=p3<p2D.p1=p2=p3答案 D解析随机抽样包括:简洁随机抽样,系统随机抽样和分层随机抽样.随机抽样的特点就是每个个体被抽到的概率相等.2.某工厂生产甲、乙、丙三种型号的产品,产品数量之比为3∶5∶7,现用分层抽样的方法抽出容量为n的样本,其中甲种产品有18件,则样本容量n=( )A.54 B.90C.45 D.126答案 B解析依题意得33+5+7×n=18,解得n=90,即样本容量为90.3.某工厂平均每天生产某种机器零件10000件,要求产品检验员每天抽取50件零件,检查其质量状况,接受系统抽样方法抽取,将零件编号为0000,0001,0002,…,9999,若抽取的第一组中的号码为0010,则第三组抽取的号码为( )A.0210 B.0410C.0610 D.0810答案 B解析将零件分成50段,分段间隔为200,因此,第三组抽取的号码为0010+2×200=0410,选B.4.为了调查老师对微课堂的了解程度,某市拟接受分层抽样的方法从A,B,C三所中学抽取60名老师进行调查,已知A,B,C三所学校中分别有180,270,90名老师,则从C学校中应抽取的人数为 ( ) A.10 B.12C.18 D.24答案 A解析依据分层抽样的特征,从C学校中应抽取的人数为90180+270+90×60=10.5.接受系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组接受简洁随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间的人做问卷A,编号落入区间的人做问卷B,其余的人做问卷C,则抽到的人中,做问卷B的人数为( )A.7 B.9C.10 D.15答案 C解析接受系统抽样方法从960人中抽取32人,将整体分成32组,每组30人,即l=30,则k组的号码为30(k-1)+9,令451≤30(k-1)+9≤750,而k∈Z,解得16≤k≤25,则满足16≤k≤25的整数k有10个,故答案应选C.6.某校高一班级有900名同学,其中女生400名,按男女比例用分层抽样的方法,从该班级同学中抽取一个容量为45的样本,则应抽取的男生人数为________.答案25解析设男生抽取x人,则有45900=x900-400,解得x=25.7.200名职工年龄分布如图所示,从中随机抽取40名职工作样本,接受系统抽样方法,按1~200编号分为40组,分别为1~5,6~10,…,196~200,第5组抽取号码为22,第8组抽取号码为________.若接受分层抽样,40岁以下年龄段应抽取________人.答案37 20解析将1~200编号分为40组,则每组的间隔为5,其中第5组抽取号码为22,则第8组抽取的号码应为22+3×5=37;由已知条件200名职工中40岁以下的职工人数为200×50%=100,设在40岁以下年龄段中应抽取x人,则40200=x100,解得x=20.8.利用随机数表法对一个容量为500,编号为000,001,002,…,499的产品进行抽样检验,抽取一个容量为10的样本,选取方法是从随机数表第12行第5列、第6列、第7列数字开头由左到右依次选取三个数字(下面摘取了随机数表中的第11行至第12行),依据下表,读出的第3个数是________.18 18 07 92 45 44 17 16 58 09 79 83 86 19 62 06 76 50 03 10 55 23 64 05 0526 62 38 97 75 84 16 07 44 99 83 11 46 32 24 20 14 85 88 45 10 93 72 88 71答案 114解析 最先读到的数据的编号是389,向右读下一个数是775,775大于499,故舍去,再下一个数是841,舍去,再下一个数是607,舍去,再下一个数是449,再下一个数是983,舍去,再下一个数是114.故读出的第3个数是114.9.海关对同时从A ,B ,C 三个不同地区进口的某种商品进行抽样检测,从各地区进口此种商品的数量(单位:件)如下表所示.工作人员用分层抽样的方法从这些商品中共抽取6件样品进行检测.(1)求这6件样品中来自A ,B ,C 各地区商品的数量;(2)若在这6件样品中随机抽取2件送往甲机构进行进一步检测,求这2件商品来自相同地区的概率.解 (1)由于样本容量与总体中的个体数的比是50+150+100=50,所以样本中包含三个地区的个体数量分别是:50×150=1,150×150=3,100×150=2,所以A ,B ,C 三个地区的商品被选取的件数分别为1,3,2.(2)设6件来自A ,B ,C 三个地区的样品分别为:A ;B 1,B 2,B 3;C 1,C 2, 则抽取的这2件商品构成的全部基本大事为:{A ,B 1},{A ,B 2},{A ,B 3},{A ,C 1},{A ,C 2},{B 1,B 2},{B 1,B 3},{B 1,C 1},{B 1,C 2},{B 2,B 3},{B 2,C 1},{B 2,C 2},{B 3,C 1},{B 3,C 2},{C 1,C 2},共15个.每个样品被抽到的机会均等,因此这些基本大事的消灭是等可能的.记大事D :“抽取的这2件商品来自相同地区”,则大事D 包含的基本大事有{B 1,B 2},{B 1,B 3},{B 2,B 3},{C 1,C 2},共4个. 所以P (D )=415,即这2件商品来自相同地区的概率为415.10.某校进入高中数学竞赛复赛的同学中,高一班级有6人,高二班级有12人,高三班级有24人,现接受分层抽样的方法从这些同学中抽取7人进行采访.(1)求应从各班级分别抽取的人数;(2)若从抽取的7人中再随机抽取2人做进一步了解. ①列出全部可能的抽取结果;②求抽取的2人均为高三班级同学的概率.解 (1)由于高一,高二,高三的人数比为6∶12∶24=1∶2∶4,用分层抽样的方法从这些同学中抽取7人,则高一,高二,高三抽取的人数分别为1,2,4.(2)①若抽取的7人中高一同学记为a ,高二的两个同学记为b ,c ,高三的四个同学记为A ,B ,C ,D ,则抽取2人的结果是(a ,b ),(a ,c ),(a ,A ),(a ,B ),(a ,C ),(a ,D ),(b ,c ),(b ,A ),(b ,B ),(b ,C ),(b ,D ),(c ,A ),(c ,B ),(c ,C ),(c ,D ),(A ,B ),(A ,C ),(A ,D ),(B ,C ),(B ,D ),(C ,D ),共21种.②抽取的2人均为高三班级同学的有(A ,B ),(A ,C ),(A ,D ),(B ,C ),(B ,D ),(C ,D ),共6种. 则抽取的2人均为高三班级同学的概率P =621=27.(时间:20分钟)11.福利彩票“双色球”中红色球的号码由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表选取6组数作为6个红色球的编号,选取方法是从随机数表第1行的第10列和第11列数字开头由左到右依次选取两个数字,则选出来的第6个红色球的编号为( )A .23 C .02 D .17答案 C解析 从随机数表第1行的第10列和第11列数字开头由左到右依次选取两个数字,则选出的6个红色球的编号依次为21,32,09,16,17,02,故选出的第6个红色球的编号为02.12.从编号为001,002,…,500的500个产品中用系统抽样的方法抽取一个样本,已知样本中编号最小的两个编号分别为007,032,则样本中最大的编号应当为 ( )A .480B .481C .482D .483 答案 C解析 依据系统抽样的定义可知样本的编号成等差数列,令a 1=7,a 2=32,d =25,所以7+25(n -1)≤500,所以n ≤20,最大编号为7+25×19=482.13.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号挨次平均分成10个小组,组号依次为1,2,…,10.现用系统抽样方法抽取一个容量为10的样本,规定假如在第1组随机抽取的号码为m ,那么在第k 组中抽取的号码个位数字与m +k 的个位数字相同.若m =6,则在第7组中抽的号码是________.答案 63解析 由题设知,若m =6,则在第7组中抽取的号码个位数字与13的个位数字相同,而第7组中数字编号顺次为60,61,62,63,…,69,故在第7组中抽取的号码是63.14.某大路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参与市里召开的科学技术大会.假如接受系统抽样和分层抽样的方法抽取,不用剔除个体,假如参会人数增加1个,则在接受系统抽样时,需要在总体中先剔除1个个体,求n .解 总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n ,分层抽样的比例是n 36,抽取的工程师人数为n36×6=n6,技术员人数为n36×12=n3,技工人数为n36×18=n2,所以n应是6的倍数,36的约数,即n=6,12,18. 当样本容量为(n+1)时,总体容量剔除以后是35人,系统抽样的间隔为35n+1,由于35n+1必需是整数,所以n只能取6,即样本容量n=6.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第九章统计
一、随机抽样
1.简单随机抽样:
(1)定义:设一个总体含有N个个体,从中逐个________地抽取n个个体作为样
本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会________的
抽样方法.
(2)方法:________法和________法.
2.系统抽样:
3.分层抽样:
一般地,在抽样时,将总体分成________的层,然后按照________,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样.
二、用样本估计总体
1.用样本的频率分布估计总体分布:
(1)频率分布直方图:
在频率分布直方图中,纵轴表示________,数据落在各个小组内的频率用频数/样本容量表示,各小长方形的面积总和为________.
(2)茎叶图:茎是指________的一列数,叶就是从茎的________生长出来的数.一般地,中间的数字表示数据的十位数,旁边的数字分别表示两组数据的个位数.
2.用样本的数字特征估计总体的数字特征:
(1)众数:一组数据中重复出现次数________的数.
(2)中位数:把一组数据按大小顺序排列,处在________位置的一个数据(或两个数据的平均数).
(3)平均数:如果有n个数x1,x2,x3,…,x n,那么这n个数的平均数=________.
(4)方差:s2=________________.
(5)标准差:s=________________.
三、变量间的相关关系
1.相关关系的判断:
根据给出的数据作出散点图,然后根据散点图判断两个变量是否具有相关关系.
2.回归直线及方程:
(1)回归直线:如果散点图中点的分布从整体上看大致在________附近,就称这两个变量之间具有________关系,这条直线叫做回归直线.
(2)回归方程:________对应的方程叫做回归直线的方程,简称回归方程.
热点一抽样方法
【例1】(1)(2015·湖南学业水平考试真题)某班有50名学生,将其编为1,2,3,…,50号,并按编号从小到大平均分成5组,现从该班抽取5名学生进行某项调查,若用系统抽样方法,从第1组抽取学生的号码为5,则抽取5名学生的号码是()
A.5,15,25,35,45
B.5,10,20,30,40
C.5,8,13,23,43
D.5,15,26,36,46
(2)(2013·湖南学业水平考试真题)某学校高一、高二、高三年级的学生人数分别为600,400,800.为了了解教师的教学情况.该校采用分层抽样的方法从这三个年级中抽取45名学生进行座谈,则高一、高二、高三年级抽取的人数分别
为()
A.15,5,25
B.15,15,15
C.10,5,30
D.15,10,20
解决分层抽样问题的两种技巧
对于分层抽样中的比值问题,常利用以下关系式巧解.
(1)=.
(2)总体中某两层的个体数之比=样本中这两层抽取的个体数之比.
热点二用样本的频率分布估计总体分布
【例2】(2013·湖南学业水平考试真题)某公司为了了解本公司职员的早餐费用情况,抽样调查了100位职员的早餐日平均费用(单位:元),得到如图所示的频率分布直方图,图中标注a的数字模糊不清.
(1)试根据频率分布直方图求a的值,并估计该公司职员早餐日平均费用的众数.
(2)已知该公司有1000名职员,试估计该公司有多少职员早餐日平均费用不少于8元?
在解决与频率分布直方图有关的读图问题时,要注意其纵坐标是,不要误认为是频率.
热点三用样本的数字特征估计总体的数字特征
【例3】(1)(2015·长沙学业水平模拟)样本数据3,9,5,2,6的中位数是________.
(2)(2012·湖南学业水平考试真题)一批食品,每袋的标准重量是50g,为了了解这批食品的实际重量情况,从中随机抽取10袋食品,称出各袋的重量(单位:g),并得到其茎叶图(如图).
①求这10袋食品重量的众数,并估计这批食品实际重量的平均数;
②若某袋食品的实际重量小于或等于47g,则视为不合格产品,试估计这批食品重量的合格率.
热点四两个变量间的相关关系
【例4】(2015·醴陵学业水平模拟)若回归直线的方程为=2-1.5x,则变量x增加一个单位时()
A.y平均减少1.5个单位
B.y平均增加2个单位
C.y平均增加1.5个单位
D.y平均减少2个单位
一、选择题
1.(考点1)某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是()
A.40
B.50
C.120
D.150
2.(考点2)(2012·湖南学业水平考试真题)某班有50名同学,将其编为1,2,3,…,50号,并按编号从小到大平均分成5组.现用系统抽样方法,从该班抽取5名同学进行某项调查,若第1组抽取的学生编号为3,第2组抽取的学生编号为13,则第4组抽取的学生编号为()
A.14
B.23
C.33
D.43
3.(考点3)(2015·衡阳学业水平模拟)某校有学生2000人,其中高三学生500人,为了解学生的身体素质情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为()
A.20
B.30
C.40
D.50
4.(考点4)如图是容量为100的样本的频率分布直方图,则样本数据在[6,10)内的频率和频数分别是()
A.0.32,32
B.0.08,8
C.0.24,24
D.0.36,36
5.(考点4,5)(2015·湘潭学业水平模拟)如图是某运动员在某个赛季得分的茎叶统计图,则该运动员得分的中位数是()
A.2
B.3
C.22
D.23
6.(考点5)10名工人某天生产同一种零件,生产的件数依次是15,17,14,10,
15,17,17,16,14,12.设其平均数为a,中位数为b,众数为c,则有()
A.a>b>c
B.b>c>a
C.c>a>b
D.c>b>a
7.(考点6)下列两个变量之间的关系,不是函数关系的为()
A.角度和它的余弦值
B.正方形的边长和面积
C.正n边形的边数和内角度数之和
D.人的身高和年龄
8.(考点7)一位母亲记录了她儿子3岁到9岁的身高,建立了儿子身高(单位:cm)与年龄的回归方程=7.19x+73.93,用这个方程预测儿子10岁时的身高,则下面的叙述正确的是()
A.她儿子10岁时的身高一定是145.83cm
B.她儿子10岁时的身高在145.83cm以上
C.她儿子10岁时的身高在145.83cm左右
D.她儿子10岁时的身高在145.83cm以下
二、填空题
9.(考点3)某公司生产三种型号的轿车,产量分别为1200辆、6000辆和2000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应抽取________辆、________辆、________辆.
10.(考点4)学校为了调查学生在课外读物方面的支出(单位:元)情况,抽出了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)元的同学有30人,则n的值为________.
11.(考点5)(2014·湖南学业水平考试真题)样本数据-2,0,6,3,6的众数是________.
12.(考点7)若施化肥量x(千克/亩)与水稻产量y(千克/亩)的回归方程为=5x+250,当施化肥量为80千克/亩时,预计的水稻产量为________.
三、解答题
13.(考点1,2)(2015·衡阳学业水平模拟)下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:
本村人口:1200人,户数300,每户平均人口数4人;应抽户数:30户;抽样间隔:=40;
确定随机数字:取一张人民币,编码的后两位数为02;
确定第一样本户:编码的后两位数为02的户为第一样本户;
确定第二样本户:02+40=42,42号为第二样本户;
……
(1)该村委采用了何种抽样方法?
(2)抽样过程中存在哪些问题,并修改;
(3)何处是用简单随机抽样.
14.(考点4,5)为了了解某校高一学生的身体健康状况,随机从甲、乙两个班各抽取了10名学生,测量他们的体重(单位:kg),并获得体重数据的茎叶图.
根据茎叶图,估计这两个班的学生体重的平均值.
15.(考点4)(2015·邵阳学业水平模拟)某省为了确定合理的阶梯电价分档方案,对全省居民用量进行了一次抽样调查,得到居民月用电量(单位:度)的频率分布直方图(如图所示).求:
(1)由频率分布直方图可估计,居民月用电量的众数是多少?
(2)若要求80%的居民能按基本档的电量收费,则基本档的月用电量应定为多少度?
16.(考点6,7)一机器可以按各种不同速度运转,但生产的物件有一些会有问题,每小时生产有问题物件的多少随机器运转速度的变化而变化,试验结果如下表:
(1)求出机器速度影响每小时生产有问题物件数的线性回归方程.
(2)若实际生产中所允许的每小时最大问题物件数为10,那么,机器的速度不得超过多少转/秒?。