人教A版高中数学必修三试卷高一《统计》单元测试
(好题)高中数学必修三第一章《统计》测试卷(答案解析)(4)

一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,152.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量3.某中学有学生300人,其中一年级120人,二,三年级各90人,现要利用抽样方法取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一,二,三年级依次统一编号为1,2,…,300;使用系统抽样时,将学生统一编号为1,2,…,300,并将整个编号依次分为10段.如果抽得的号码有下列四种情况:①7,37,67,97,127,157,187,217,247,277;②5,9,100,107,121,180,195,221,265,299;③11,41,71,101,131,161,191,221,251,281;④31,61,91,121,151,181,211,241,271,299.关于上述样本的下列结论中,正确的是()A.②④都不能为分层抽样B.①③都可能为分层抽样C .①④都可能为系统抽样D .②③都不能为系统抽样4.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格99.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.55.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .986.网上大型汽车销售某品牌A 型汽车,在2017年“双十一”期间,进行了降价促销,该型汽车的价格与月销量之间有如下关系 价格(万元) 25 23.5 22 20.5 销售量(辆)30333639已知A 型汽车的购买量y 与价格x 符合如下线性回归方程:8ˆ0ˆybx =+,若A 型汽车价格降到19万元,预测月销量大约是( ) A .39B .42C .45D .507.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08158.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >9.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5010.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元11.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .712.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=14.已知一组样本数据1210,x x x ,且22212102020x x x +++=,平均数9=x ,则该组数据的标准差为__________.15.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中B 高中C 高中D 高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.16.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.17.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
高中数学人教A版必修三 统计 测试 (8)

第二章测试(时间:120分钟满分:150分)一、选择题(本大题共12小题,每小题5分,满分60分.在每小题给出的四个选项中,有且只有一项是符合题目要求的)1.某商场想通过检查发票及销售记录的2%来快速估计每月的销售总额.采取如下方法:从某本50张的发票存根中随机抽一张,如15号,然后按顺序往后将65号,115号,165号,…抽出,发票上的销售额组成一个调查样本.这种抽取样本的方法是()A.简单随机抽样B.系统抽样C.分层抽样D.其他方式的抽样答案 B2.①某学校高二年级共有526人,为了调查学生每天用于休息的时间,决定抽取10%的学生进行调查;②一次数学月考中,某班有10人在100分以上,32人在90~100分,12人低于90分,现从中抽取9人了解有关情况;③运动会工作人员为参加4×100 m接力赛的6支队伍安排跑道.就这三件事,恰当的抽样方法分别为()A.分层抽样、分层抽样、简单随机抽样B.系统抽样、系统抽样、简单随机抽样C.分层抽样、简单随机抽样、简单随机抽样D.系统抽样、分层抽样、简单随机抽样解析①中总体容量较多,抽取的样本容量较大,用系统抽样比较恰当;②中考试成绩各分数段之间的同学有明显的差异,应按分层抽样比较恰当;③中个体较少,按简单随机抽样比较恰当.答案 D3.某中学有高一学生400人,高二学生300人,高三学生500人,现用分层抽样的方法在这三个年级中抽取120人进行体能测试,则从高三抽取的人数应为()A.40 B.48 C.50 D.80解析 ∵一、二、三年级的人数比为4:3:5,∴从高三应抽取的人数为120×512=50.答案 C4.将一个样本容量为100的数据分组,各组的频数如下:(17,19],1;[19,21),1;(21,23],3;(23,25],3;(25,27],18;(27,29],16;(29,31],28;(31,33],30.根据样本频率分布,估计小于或等于29的数据大约占总体的( ) A .58% B .42% C .40%D .16%解析 依题意可得1+1+3+3+18+16100=42%.答案 B5.工人的月工资y (元)与劳动生产率x (千元)的回归方程为y ^=50+80x ,下列判断正确的是( )A .劳动生产率为1000元时,工资为130元B .劳动生产率提高1000元,则工资提高80元C .劳动生产率提高1000元,则工资提高130元D .当月工资为210元时,劳动生产率为2000元解析 由回归系数b^的意义知,当b ^>0时,自变量和因变量正相关,当b ^<0时,自变量和因变量负相关,回归直线的斜率b^=80,所以x 每增加1个单位(千元),工人工资y 平均增加80个单位(元),即劳动生产率提高1000元时,工资提高80元,故选B.答案 B6.甲、乙两名同学在五次数学测试中的成绩统计用茎叶图表示如下,若甲、乙两人的平均成绩分别用X 甲,X 乙表示,则下列结论正确的是( )A .X 甲>X 乙,甲比乙成绩稳定B .X 甲>X 乙,乙比甲成绩稳定C .X 甲<X 乙,甲比乙成绩稳定D .X 甲<X 乙,乙比甲成绩稳定 解析 由茎叶图知,X 甲=15×(68+69+70+71+72)=70, X 乙=15×(63+68+69+69+71)=68, ∴X 甲>X 乙,且甲比乙成绩稳定. 答案 A7.如果在一次实验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是( )A.y ^=x +1.9B.y ^=1.04x +1.9C.y ^=0.95x +1.04D.y ^=1.05x -0.9解析 x -=14(1+2+3+4)=2.5,y -=14(3+3.8+5.2+6)=4.5. 因为回归直线方程过样本点中心(x -,y -),代入验证知,应选B. 答案 B8.从存放号码分别为1,2,…,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5C.0.47 D.0.37解析取到号码为奇数的频数为13+5+6+18+11=53,故频率为0.53.答案 A9.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数是1.8,全年进球数的标准差为0.3.下列说法中,正确的个数为()①甲队的技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏.A.1B.2C.3 D.4解析由平均数及方差的意义知,①,②,③,④都正确.答案 D10.10名工人某天生产同一种零件,生产的件数分别是15,17,14,10,15,17,17,16,14,12,设其平均数为a,中位数为b,众数为c,则有() A.a>b>c B.b>c>aC.c>a>b D.c>b>a解析把10个数据从小到大排列为10,12,14,14,15,15,16,17,17,17.∴中位数b=15,众数c=17,平均数a=110×(10+12+14×2+15×2+16+17×3)=14.7.∴a<b<c.答案 D11.观察新生婴儿的体重,其频率分布直方图如图,则新生婴儿体重在(2700,3000)的频率为()A.0.001 B.0.1 C.0.2 D.0.3解析由直方图可知,所求频率为0.001×300=0.3. 答案 D12.设矩形的长为a,宽为b,其比满足b a=5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本:甲批次:0.5980.6250.6280.5950.639乙批次:0.6180.6130.5920.6220.620根据上述两个样本来估计两个批次的总体平均数与标准值0.618比较,正确结论是()A.甲批次的总体平均数与标准值更接近B.乙批次的总体平均数与标准值更接近C.两个批次总体平均数与标准值接近程度相同D.两个批次总体平均数与标准值接近程度不能确定解析甲批次的样本平均数为15×(0.598+0.625+0.628+0.595+0.639)=0.617;乙批次的样本平均数为15×(0.618+0.613+0.592+0.622+0.620)=0.613.所以可估计:甲批次的总体平均数与标准值更接近.答案 A二、填空题(本大题共4小题,每小题5分,满分20分.把答案填在题中横线上)13.将某班的60名学生编号为:01,02,…,60,采用系统抽样方法抽取一个容量为5的样本,且随机抽得的一个号码为04,则剩下的四个号码依次是________.解析由于从60个中抽取5个,故分组的间距为12,又第一组的号码为04,所以其他四个号码依次是16,28,40,52.答案16,28,40,5214.如图是CBA篮球联赛中,甲、乙两名运动员某赛季一些场次得分的茎叶图,则平均得分高的运动员是________.解析由茎叶图知平均得分高的运动员是甲,或计算得x甲=20.4,x2=19.3,x甲>x乙.答案甲15.防疫站对学生进行身体健康调查,采用分层抽样法抽取.某中学共有学生1600名,抽取一个容量为200的样本,已知女生比男生少抽了10人,则该校的女生人数应为________人.解析由题意知,样本中有女生95人,男生105人,则全校共有女生为95÷2001600=760人.答案76016.某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90人,则90~100分数段的人数为________.解析 由频率分布图知,设90~100分数段的人数为x ,则0.40x =0.0590,∴x =720.答案 720三、解答题(本大题共6小题,满分70分.解答应写出必要的文字说明、证明过程或演算步骤)17.(10分)已知一组数据从小到大的顺序排列,得到-1,0,4,x,7,14,中位数为5,求这组数据的平均数与方差.解 由于数据-1,0,4,x,7,14的中位数为5, 所以4+x2=5,x =6.设这组数据的平均数为x -,方差为s 2,由题意得 x -=16×(-1+0+4+6+7+14)=5,s 2=16×[(-1-5)2+(0-5)2+(4-5)2+(6-5)2+(7-5)2+(14-5)2]=743. 18.(12分)为了了解小学生的体能情况,抽取了某校一个年级的部分学生进行一分钟跳绳次数测试,将取得数据整理后,画出频率分布直方图(如图).已知图中从左到右前三个小组频率分别为0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生有多少人;(3)若次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率是多少.解(1)由累积频率为1知,第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,∴x=50.即参加这次测试的学生有50人.(3)达标率为0.3+0.4+0.2=90%,所以估计该年级学生跳绳测试的达标率为90%.19.(12分)对某400件元件进行寿命追踪调查情况频率分布如下:(2)估计元件寿命在[500,800)内的频率;(3)估计元件寿命在700 h以上的频率.解(1)寿命与频数对应表:0.10+0.15+0.40=0.65.(3)估计该元件寿命在700 h 以上的频率为 0.40+0.20+0.15=0.75.20.(12分)两台机床同时生产一种零件,在10天中,两台机床每天的次品数如下:甲 1,0,2,0,2,3,0,4,1,2 乙 1,3,2,1,0,2,1,1,0,1(1)哪台机床次品数的平均数较小? (2)哪台机床的生产状况比较稳定?解 (1)x 甲=(1+0+2+0+2+3+0+4+1+2)×110=1.5, x 乙=(1+3+2+1+0+2+1+1+0+1)×110=1.2. ∵x 甲>x 乙,∴乙车床次品数的平均数较小.(2)s 2甲=110[(1-1.5)2+(0-1.5)2+(2-1.5)2+(0-1.5)2+(2-1.5)2+(3-1.5)2+(0-1.5)2+(4-1.5)2+(1-1.5)2+(2-1.5)2]=1.65,同理s 2乙=0.76,∵s 2甲>s 2乙,∴乙车床的生产状况比较稳定.21.(12分)某学校暑假中组织了一次旅游活动,分两组,一组去武夷山,另一组去海南,且每个职工至多参加其中一组.在参加旅游活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.去武夷山组的职工占参加活动总人数的14,且该组中,青年人占50%,中年人占40%,老年人占10%.为了了解各组不同的年龄层次的职工对本次活动的满意程度,现用分层抽样的方法从参加活动的全体职工中抽取一个容量为200的样本.试确定:(1)去海南组中,青年人、中年人、老年人分别所占的比例;(2)去海南组中,青年人、中年人、老年人分别应抽取的人数.解 (1)设去武夷山组的人数为x ,去海南组中,青年人、中年人、老年人各占比例分别为a ,b ,c ,则有x ·40%+3x ·b 4x =47.5%,x ·10%+3x ·c4x =10%,解得b =50%,c =10%.所以a =100%-b -c =40%.故去海南组中,青年人、中年人、老年人各占比例分别为40%、50%、10%. (2)去海南组中,抽取的青年人数为200×34×40%=60(人);抽取的中年人数为200×34×50%=75(人);抽取的老年人数为200×34×10%=15(人).22.(12分)某个体服装店经营各种服装,在某周内获纯利润y (元)与该周每天销售这种服装件数x 之间的一组数据关系如下表:已知:∑i =17x 2i =280,∑i =17x i y i =3487.(1)求x ,y ; (2)画出散点图;(3)观察散点图,若y 与x 线性相关,请求纯利润y 与每天销售件数x 之间的回归直线方程.解 (1)x =3+4+5+6+7+8+97=6,y =66+69+73+81+89+90+917=5597≈79.86.(2)散点图如图所示.11(3)观察散点图知,y 与x 线性相关.设回归直线方程为y ^=b^x +a ^. ∵∑i =17x 2i =280,∑i =17x i y i =3487, x =6,y =5597,∴b ^=3487-7×6×5597280-7×36=13328=4.75. a ^=5597-6×4.75≈51.36. ∴回归直线方程为y ^=4.75x +51.36.。
(压轴题)高中数学必修三第一章《统计》测试卷(含答案解析)(3)

一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差3.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.通过实验,得到一组数据如下:2,5,8,9,x ,已知这组数据的平均数为6,则这组数据的方差为( ) A .3.2B .4C .6D .6.55.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .08156.甲、乙两名同学在五次数学考试中的成绩统计如下面的茎叶图所示,若甲、乙两人的平均成绩分别是1x ,2x ,观察茎叶图,下列结论正确的是( )A .12x x <,乙比甲成绩稳定B .12x x >,乙比甲成绩稳定C .12x x <,甲比乙成绩稳定D .12x x >,甲比乙成绩稳定7.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.18.为了了解某社区居民是否准备收看电视台直播的“龙舟大赛”,某记者分别从社区60~70岁,40~50岁,20~30岁的三个年龄段中的128,192,x 人中,采用分层抽样的方法共抽出了30人进行调查,若60~70岁这个年龄段中抽查了8人,那么x 为( ) A .64B .96C .144D .1609.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A .40B .45C .48D .5010.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .711.下列说法:①设有一个回归方程35y x =-,变量x 增加一个单位时,y 平均增加5个单位;②线性回归直线ˆybx a =+必过必过点(),x y ;③在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患肺病;其中错误的个数是( ) A .0B .1C .2D .312.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.已知一组数据6,7,8,x ,y 的平均数是8,且90xy =,则该组数据的方差为_______. 15.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.16.下表为生产A 产品过程中产量x (吨)与相应的生产耗能y (吨)的几组相对应数据:x34 5 6y23.555.5根据上表提供的数据,得到y 关于x 的线性回归方程为0.7y x a =+,则a =__________. 17.某种活性细胞的存活率y (%)与存放温度x (℃)之间具有线性相关关系,样本数据如下表所示 存放温度x (℃) 10 4 -2 -8 存活率y (%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.18.某校高三年级共有800名学生,现采用系统抽样的方法,抽取25名学生做问卷调查,将这800名学生按1,2,...,800随机编号,按编号顺序平均分组.若从第5组抽取的编号为136,则从第2组中抽取的编号为__________.19.某校高一年级10个班级参加国庆歌咏比赛的得分(单位:分)如茎叶图所示,若这10个班级的得分的平均数是90,则19a b+的最小值为__________.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.已知某校6个学生的数学和物理成绩如下表: 学生的编号i 1 2 3 4 5 6 数学i x 89 87 79 81 78 90 物理i y797577737274(1)若在本次考试中,规定数学在80分以上(包括80分)且物理在75分以上(包括75分)的学生为理科小能手.从这6个学生中抽出2个学生,设X 表示理科小能手的人数,求X 的分布列和数学期望;(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程.参考数据和公式:ˆˆˆybx a =+,其中1122211()()ˆ()n niii ii i nniii i x x y y x y nx yb x x xnx====---⋅==--∑∑∑∑,ˆˆay bx =-. 22.“水是生命之源”,但是据科学界统计可用淡水资源仅占地球储水总量的2.8%,全世界近80%人口受到水荒的威胁.某市为了鼓励居民节约用水,计划调整居民生活用水收费方案,拟确定一个合理的月用水量标准x (吨):一位居民的月用水量不超过x 的部分按平价收费,超出x 的部分按议价收费.为了了解居民用水情况,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照00.50.51,...,[[[44.5,),,),)分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有60万居民,估计全市居民中月均用水量不低于2.5吨的人数,并说明理由;(3)若该市政府希望使82%的居民每月的用水不按议价收费,估计x 的值,并说明理由.23.2020年新冠肺炎疫情肆虐全球,各地医疗部门迅速进行防控意识宣传和流行病学调查.某疫区随机抽取100人调查其外出时佩戴口罩的情况,结果如下表. 分类 佩戴口罩人数/人 不佩戴口罩人数/人 年轻人 45 25 中老年人1020(1)是否有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)该疫区某新冠肺炎定点治疗医院统计了确诊患者中年龄x (单位:岁)的重症患者比例(单位:%),得到下表: 年龄x /岁 70 65 63 53 52 45 40 32 重症比例y /%10.57.57.55.54.53.51.50.5若y 与x 之间具有线性相关关系,请用最小二乘法求出y 关于x 的线性回归方程y bx a =+,并预测该医院76岁确诊患者中的重症比例.参考公式和数据:用最小二乘法求线性回归方程系数公式:1221ni ii nii x y nx yb xn x=-=-=-∑∑,a y bx =-.817010.5657.5637.553 5.552 4.545 3.540 1.5320.52454i ii x y==⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=∑.82222222217065635345403223256i i x==++++++=∑.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.24.某大学为了了解数学专业研究生招生的情况,对近五年的报考人数进行了统计,得到如下统计数据:(1)经分析,y 与x 存在显著的线性相关性,求y 关于x 的线性回归方程ˆˆˆybx a =+并预测2020年(按6x =计算)的报考人数;(2)每年报考该专业研究生的考试成绩大致符合正态分布()2,Nμσ,根据往年统计数据385μ=,2225σ=,录取方案:总分在400分以上的直接录取,总分在[]385,400之间的进入面试环节,录取其中的80%,低于385分的不予录取,请预测2020年该专业录取的大约人数(最后结果四舍五入,保留整数).参考公式和数据:()()()121ˆniii nii x x y y bx x ==--=-∑∑,ˆˆay bx =-,()()51360iii x x y y =--=∑.若随机变量()2~,X Nμσ,则()0.6826P X μσμσ-<<+=,()220.9544P X μσμσ-<<+=,()330.9974P X μσμσ-<<+=.25.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:x2 3 4 5 6 y 2.23.85.56.57.0若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)26.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:()1求频率分布直方图中a 的值;()2以频率作为概率,试求消费者月饼购买量在600g 1400g ~的概率;()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【分析】根据平均数和方差公式计算比较即可. 【详解】设这个班有n 个同学,分数分别是123,,,,n a a a a ⋅⋅⋅,假设第i 个同学的成绩没录入,这一次计算时,总分是()1n x -,方差为()()()()()222222121111i i n s a x a x a x a x a x n -+⎡⎤=-+-+⋅⋅⋅+-+-+⋅⋅⋅+-⎣⎦-; 第二次计算时,()11n nxx x -+=x =,方差为()()()()()()222222221121111++i i i n n s a x a x a x a x a x a x s n n-+-⎡⎤=-+-⋅⋅⋅-+-+-+⋅⋅⋅+-=⎣⎦故有1x x =,221s s >.故选:C 【点睛】本题主要考查样本的平均数和方差公式;属于中档题.2.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 3.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=) ()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.4.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.5.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.6.A解析:A 【解析】 【分析】根据茎叶图中的数据,即可计算出两人平均分,再根据茎叶图的分布情况可知乙成绩稳定. 【详解】 由茎叶图知, 甲的平均数是110210410511413391.65x ++++==,乙的平均数是2108115116122123116.85x ++++==,所以12x x <,从茎叶图上可以看出乙的数据比甲的数据集中,乙比甲成绩稳定 故选:A . 【点睛】本题考查茎叶图中两组数据的平均数和稳定程度,平均数要进行计算,稳定程度可通过计算方差或通过数据排布形状作出比较.7.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可. 8.D解析:D【解析】【分析】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816,因为共抽出30人,所以总人数为3016=480⨯人,即可求出20~30岁年龄段的人数.【详解】根据60~70岁这个年龄段中128人中抽查了8人,可知分层抽样的抽样比为81=12816, 因为共抽出30人,所以总人数为3016=480⨯人,所以,20~30岁龄段的人有480128192160--=,故选D.【点睛】本题主要考查了分层抽样,抽样,样本容量,属于中档题 9.C解析:C【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数.【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=,则前3小组的频率之和为10.250.75-=,则该校报名学生的总人数为360.7548÷=,故选C.【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.10.B解析:B【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果. 详解:由题意可知,学生的成绩如下:111,111,112,113,113; 116,117,117,118,118;120,120,121,122,122; 123,124,124,126127;128,128,129,129,129; 131,131,131,132,132;132,133,134,134,135; 137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人, 则所抽取的学生的成绩在区间[]120,135上的学生人数为5.本题选择B 选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力. 11.C解析:C【解析】分析:利用回归方程和独立性检验对每一个命题逐一判断.详解:对于①,一个回归方程35y x =-,变量x 增加一个单位时,y 应平均减少5个单位,所以该命题是错误的;对于②,线性回归直线ˆybx a =+必过必过点(),x y ,是正确的;对于③,在吸烟与患肺病这两个分类变量的计算中,从独立性检验知,有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,并不能说明他有99%的可能患肺病,所以该命题是错误的.故答案为:C.点睛:本题主要考查回归方程和独立性检验,意在考查学生对这些知识的掌握水平和分析推理能力.12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53100=. 本题选择A 选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力. 二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应 解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等. 14.2【分析】根据题意列出关于的等量关系式结合求得的值利用方差公式求得结果【详解】一组数据的平均数是8且所以化简得又所以的值分别为或所以该组数据的方差为:故答案是:2【点睛】该题考查的是有关求一组数据的 解析:2【分析】根据题意,列出关于,x y 的等量关系式,结合90xy =,求得,x y 的值,利用方差公式求得结果.【详解】一组数据6,7,8,,x y 的平均数是8,且90xy =,所以6788540x y ++++=⨯=,化简得19x y +=,又90xy =,所以,x y 的值分别为10,9或9,10,所以该组数据的方差为:222222110[(68)(78)(88)(98)(108)]255s =-+-+-+-+-==, 故答案是:2.【点睛】该题考查的是有关求一组数据的方差的问题,涉及到的知识点有方差公式,属于简单题目. 15.1【解析】分析:根据平均数与对应概率乘积的和得总平均数计算结果详解:点睛:本题考查平均数考查基本求解能力解析:1【解析】分析:根据平均数与对应概率乘积的和得总平均数,计算结果.详解:7245%74(145%)72.1⨯+⨯-=.点睛:本题考查平均数,考查基本求解能力.16.【解析】分析:首先求得样本中心点然后利用回归方程的性质求得实数a的值即可详解:由题意可得:线性回归方程过样本中心点则:解得:点睛:本题主要考查线性回归方程的性质及其应用等知识意在考查学生的转化能力和 解析:0.85【解析】分析:首先求得样本中心点,然后利用回归方程的性质求得实数a 的值即可. 详解:由题意可得:34569==42x +++,2 3.55 5.544y +++==, 线性回归方程过样本中心点9,42⎛⎫⎪⎝⎭,则:940.72a =⨯+, 解得:0.85a =.点睛:本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.17.34【解析】分析:根据表格中数据求出代入公式求得的值从而得到回归直线方程将代入回归方程即可得到结果详解:设回归直线方程由表中数据可得代入归直线方程可得所以回归方程为当时可得故答案为点睛:求回归直线方 解析:34【解析】 分析:根据表格中数据求出,x y ,代入公式求得a 的值,从而得到回归直线方程,将6x =代入回归方程即可得到结果.详解:设回归直线方程3,ˆ2yx a =-+, 由表中数据可得1,50x y ==,代入归直线方程可得53.2a =,所以回归方程为3,253.ˆ2yx =-+ 当6x =时,可得 3.2653.4ˆ23y=-⨯+=,故答案为34. 点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,n n i ii i i x y x x y ==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 18.8【解析】由题意得从名学生中采用系统抽样的方法抽取名学生需要把名学生平均分成组每组人设第一组抽取的号码为则第组抽取的号码为解得点睛:本题考查了抽样方法中的系统抽样问题对于系统抽样的抽法是先对总体编号 解析:8【解析】由题意得,从800名学生中采用系统抽样的方法抽取25名学生,需要把800名学生平均分成25组,每组8003225=人, 设第一组抽取的号码为x ,则第5组抽取的号码为432136x +⨯=,解得8x =. 点睛:本题考查了抽样方法中的系统抽样问题,对于系统抽样的抽法是先对总体编号,根据样本平均分组,确定组距,再在第一组中抽取一个编号,依次等距抽取,其中把握系统抽样的原则是解答此类问题的关键.19.2【解析】由茎叶图及10个班级的得分的平均数是90可得∴当且仅当即时取等号故答案为2解析:2【解析】由茎叶图及10个班级的得分的平均数是90可得8a b += ∴1911919191()()(19)(10)(1023)28888b a b a a b a b a b a b a b +=⨯++=+++=++≥+⨯=,当且仅当9b a a b=,即36b a ==时,取等号 故答案为2 20.【解析】因为平均数为所以方差为 解析:45【解析】因为平均数为8,所以9,x = 方差为222214[10111]55++++= 三、解答题21.(1)见解析;(2)129155y x =+ 【分析】(1)由题意得1号学生、2号学生为理科小能手,从而得到X 的可能取值为0,1,2,分别求出相应的概率,由此能求出X 的分布列和数学期望; (2)利用最小二乘法分别求出ˆb,ˆa ,由此能求出y 与x 的回归直线方程. 【详解】(1)由题意得1号学生、2号学生为理科小能手.X 的可能取值为:0,1,2P (X =0)242625C C ==, P (X =1)112426815C C C ==,P (X =2)2226115C C ==, X 的分布列为()0+1+2=515153E X =⨯⨯⨯ (2)84,75x y ==,61 i =∑x i y i =37828,61 i =∑x i2=42476, ∴ˆb=(61 i i i x y =-∑6xy )÷(6221 6i n x x =-∑) 2378286847542476684-⨯⨯=-⨯ 15=, ˆˆa y bx =-=75﹣15×84=2915, 回归方程为129155y x =+ 【点睛】本题考查离散型随机变量的分布列和数学期望的求法,考查回归直线方程的求法,是中档题,解题时要认真审题,注意最小二乘法的合理运用.22.(1)0.3;(2)16.2万;(3)2.8吨.【分析】(1)通过频率之和为1,构造方程求得结果;(2)计算出样本中不低于2.5吨人数占比,从而求得全市的人数;(3)由频率分布直方图频率分布可知2.53x <<,然后根据平均分布列方程求得相应结果.【详解】(1)由概率统计相关知识,可知各组频率之和的值为1即频率分布直方图各小矩形面积之和为1 ()0.50.080.160.40.520.120.080.0421a ∴⨯+++++++=解得:0.3a =(2)由图可知,不低于2.5吨人数所占百分比为()0.50.30.120.080.0427%⨯+++= ∴全市月均用水量不低于2.5吨的人数为:600.2716.2⨯=(万)(3)由(2)可知,月均用水量小于2.5吨的居民人数所占百分比为:73%即73%的居民月均用水量小于2.5吨,同理,88%的居民月均用水量小于3吨故2.53x <<假设月均用水量平均分布,则()82%73%2.5 2.80.3x -=+=(吨) 注:本次估计默认组间是平均分布,与实际可能会产生一定误差【点睛】本题考查补全频率分布直方图、利用频率分布直方图估计总体数据特征的问题,属于基础题.23.(1)有把握;(2)1ˆ84y x =-,11%. 【分析】(1)根据列联表,利用公式计算2K ,对照附表得出结论;(2)计算x 、y ,求出回归系数,写出线性回归方程,利用方程计算76x =时ˆy的值. 【详解】(1)根据题意,计算22100(45201025)8.1297.89770305545K ⨯⨯-⨯=≈>⨯⨯⨯; 所以有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)计算1105(7065635352454032)82x =⨯+++++++=, 141(10.57.57.5 5.5 4.5 3.5 1.50.5)88y =⨯+++++++=; 所以122211054124548128ˆ1054232568()2n ii i n i i x y nxyb xnx ==--⨯⨯===-⨯-∑∑; 411105ˆˆ8842a y bx =-=-⨯=-; 所以y 关于x 的线性回归方程是1ˆ84y x =-, 计算76x =时,1ˆ768114y =⨯-=, 可以预测该医院76岁确诊患者中的重症比例为11%.【点睛】本题考查了列联表与独立性检验的应用问题,也考查了线性回归方程的应用问题,是中档题.24.(1)ˆ368yx =-;208人;(2)90. 【分析】(1)由已知表格中的数据求得ˆb与ˆa 的值,则线性回归方程可求,取6x =求得y 值即可;(2)研究生的考试成绩大致符合正态分布(385N ,215),求出(400)P X >,乘以208可得直接录取人数,再求出[385,400]之间的录取人数,则答案可求.【详解】解:(1)()11234535x =++++= ()130601001401701005y =++++= 可求:()25110i i x x =-=∑, 由()()()121360ˆ3610niii n i i x x y y b x x ==--===-∑∑, ˆˆ1003638ay bx =-=-⨯=- ∴y 关于x 的线性回归方程是ˆ368yx =-. 当2020年即6x =时,ˆ3668208y=⨯-=人 即2020年的报考人数大约为208人(2)研究生的考试成绩大致符合正态分布()2385,15N , 则400=385+15,()10.68264000.15872P x ->==, 直接录取人数为2800.158733.0133⨯=≈人[]385,400之间的录取人数为0.68262800.856.8572⨯⨯=≈ 所以2020年该专业录取的大约为33+57=90人【点睛】本题考查线性回归方程的求法,考查正态分布曲线的特点及所表示的意义,考查运算求解能力,属于中档题.25.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值.【详解】(1)4x =,5y =,52190ii x==∑,51112.3i i i x y ==∑, 12215 1.235n ii i n ii x y xy b xx ==-==-∑∑,0.08a y bx =-=,所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元.【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221n ii i n i i x y nxy b xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.26.(1)a 0.001=;(2)0.62;(3)12.08吨【分析】(1)由频率分布直方图列出方程能求出a .(2)由频率分布直方图先求出满足题意的频率,即得概率.(3)由频率分布直方图先求出人均月饼购买量,由此能求出该超市应准备12.08吨月饼恰好能满足市场需求.【详解】()1由()0.00020.00055a 0.00050.000254001++++⨯=,解得a 0.001=.()2消费者月饼购买量在600g 1400g ~的频率为:()0.000550.0014000.62+⨯=,∴消费者月饼购买量在600g 1400g ~的概率为0.62.()3由频率分布直方图得人均月饼购买量为:()4000.00028000.0005512000.00116000.000520000.000254001208g ⨯+⨯+⨯+⨯+⨯⨯=,∴2012085%1208⨯⨯=万克12.08?=吨,∴该超市应准备12.08吨月饼恰好能满足市场需求.【点睛】本题考查用样本的频率分布估计总体分布及识图的能力,求解的重点是对题设条件及直方图的理解,了解直方图中每个小矩形的面积的意义,是中档题.。
(好题)高中数学必修三第一章《统计》测试题(含答案解析)(1)

一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A.45,75,15 B.45,45,45 C.45,60,30 D.30,90,152.为了解一片经济树林的生长情况,随机测量了其中100株树木的底部周长(单位:cm),根据所得数据画出样本的频率分布直方图如图所示.那么在这100株树木中,底部周长小于110cm的株数n是()A.30 B.60C.70 D.803.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A.40 B.50 C.80 D.100a a>得到一组新4.一组数据的平均数为x,方差为2s,将这组数据的每个数都乘以()0数据,则下列说法正确的是()A.这组新数据的平均数为x B.这组新数据的平均数为a x+C .这组新数据的方差为2asD .这组新数据的标准差为2a s5.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .66.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表: 价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.77.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( ) x 8 10 11 12 14 y2125m2835A .26B .27C .28D .298.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.将1000名学生的编号如下:0001,0002,0003,…,1000,若从中抽取50个学生,用系统抽样的方法从第一部分0001,0002,…,0020中抽取的号码为0015时,抽取的第40个号码为( ) A .0795B .0780C .0810D .081510.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A .消耗1升汽油,乙车最多可行驶5千米B .以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C .甲车以80千米/小时的速度行驶1小时,消耗10升汽油D .某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油 11.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.给出下列命题:①函数()π4cos 23f x x ⎛⎫=+ ⎪⎝⎭的一个对称中心为5π,012⎛⎫- ⎪⎝⎭;②若,αβ为第一象限角,且αβ>,则tan tan αβ>;③设一组样本数据12,,,n x x x ⋅⋅⋅的平均数是2,则数据1221,21,,21n x x x --⋅⋅⋅-的平均数为3;④函数sin 2y x =的图象向左平移π4个单位长度,得到πsin 24y x ⎛⎫=+ ⎪⎝⎭的图象.其中正确命题的序号是_____________(把你认为正确的序号都填上).14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1).17.某种活性细胞的存活率y (%)与存放温度x (℃)之间具有线性相关关系,样本数据如下表所示 存放温度x (℃) 10 4 -2 -8 存活率y (%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.18.设一个回归方程为0.4 1.8y x =-,则当25x =时,y 的估计值是_______. 19.已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________.20.已知下列命题:①在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好; ②两个变量相关性越强,则相关系数r 就越接近于1;③在回归直线方程0.52y x ∧=-+中,当解释变量x 每增加一个单位时,预报变量y ∧平均减少0.5个单位;④两个模型中残差平方和越小的模型拟合的效果越好.⑤回归直线ˆˆˆy bx a =+恒过样本点的中心(),x y ,且至少过一个样本点;⑥若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;⑦从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误. 其中正确命题的序号是__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x 1 2 3 4 5 6 7 人均纯收入y2.93.33.64.44.85.25.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.学校食堂统计了最近5天到餐厅就餐的人数x (百人)与食堂向食材公司购买所需食材(原材料)的数量y (袋),得到如下统计表:第一天 第二天 第三天 第四天 第五天 就餐人数x (百人) 13 9 8 10 12 原材料y (袋)3223182428(1)根据所给的5组数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)已知购买食材的费用C (元)与数量y (袋)的关系为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,投入使用的每袋食材相应的销售单价为700元,多余的食材必须无偿退还食材公司,据悉下周一大约有1500人到食堂餐厅就餐,根据(1)中求出的线性回归方程,预测食堂应购买多少袋食材,才能获得最大利润,最大利润是多少?(注:利润L =销售收入-原材料费用)参考公式:()()()1122211nniii ii i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-参考数据:511343i ii x y==∑,521558i i x ==∑,5213237i i y ==∑23.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)24.某学校进行体验,现得到所有男生的身高数据,从中随机抽取50人进行统计(已知这50个身高介于155cm 到195cm 之间),现将抽取结果按如下方式分成八组:第一组[155,160),第二组[160,165),...,第八组[190,195],并按此分组绘制如图所示的频率分布直方图,其中第六组[180,185)和第七组[185,190)还没有绘制完成,已知第一组与第八组人数相同,第六组和第七组人数的比为5:2.(1)补全频率分布直方图;(2)根据频率分布直方图估计这50位男生身高的中位数;(3)用分层抽样的方法在身高为[170,180]内抽取一个容量为5的样本,从样本中任意抽取2位男生,求这两位男生身高都在[175,180]内的概率.25.某科研课题组通过一款手机APP软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:周跑量(/km周)[)10,15[)15,20[)20,25[)25,30[)30,35[)35,40[)40,45[)45,50[)50,55人数100120130180220150603010(1)在答题卡上补全该市1000名跑步爱好者周跑量的频率分布直方图:注意:请用2B铅笔在答题卡上作图,并将所作条形图涂黑.(2)根据以上图表数据,试求样本的中位数(保留一位小数).(3)根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如下表:周跑量 小于20公里 20公里到40公里 不小于40公里 类别休闲跑者 核心跑者 精英跑者 装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?26.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数: 温度(单位:C ︒)21 23 24 27 29 32死亡数y (单位:株)6 11 20 27 57 77经计算:611266i i x x ===∑,611336i i y y ===∑,()()61557i i i x x y y =--=∑,()62184i i x x =-=∑,()6213930i i y y =-=∑,()621ˆ236.64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(结果精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程0.2303ˆ0.06x ye =,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i ni i uu v v u u β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.C解析:C 【解析】解:由图可知:则底部周长小于110cm 段的频率为(0.01+0.02+0.04)×10=0.7, 则频数为100×0.7=70人. 故选C .3.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =, 所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.4.D解析:D 【分析】根据平均数及方差的定义可知,一组数据的每个数都乘以a 得到一组新数据,平均值变为原来a 倍,方差变为原来2a 倍. 【详解】设一组数据1234,,,,,n x x x x x ⋯的平均数为x ,方差为2s ,则平均值为()12341n ax ax ax ax ax ax n++++⋯+=, ()()()()()22222212341n s x xxxxxxxx x n ⎡⎤=-+-+-+-+⋯+-⎢⎥⎣⎦,()()()()()222222212341n ax axaxaxaxaxaxaxax ax a s n ⎡⎤∴-+-+-+-+⋯+-=⋅⎢⎥⎣⎦故选:D. 【点睛】本题主要考查了方差,平均数的概念,灵活运用公式计算是解题关键,属于中档题.5.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.6.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.7.A解析:A 【解析】 【分析】首先求得x 的平均值,然后利用线性回归方程过样本中心点求解m 的值即可. 【详解】 由题意可得:810111214115x ++++==,由线性回归方程的性质可知:99112744y =⨯+=, 故21252835275m++++=,26m ∴=.故选:A . 【点睛】本题考查回归分析,考查线性回归直线过样本中心点,在一组具有相关关系的变量的数据间,这样的直线可以画出许多条,而其中的一条能最好地反映x 与y 之间的关系,这条直线过样本中心点.8.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A 【解析】分析:先确定间距,再根据等差数列通项公式求结果.详解:因为系统抽样的方法抽签,所以间距为10002050= 所以抽取的第40个数为1520(401)795+⨯-=选A.点睛:本题考查系统抽样概念,考查基本求解能力.10.D解析:D【详解】解:对于A,由图象可知当速度大于40km/h时,乙车的燃油效率大于5km/L,∴当速度大于40km/h时,消耗1升汽油,乙车的行驶距离大于5km,故A错误;对于B,由图象可知当速度相同时,甲车的燃油效率最高,即当速度相同时,消耗1升汽油,甲车的行驶路程最远,∴以相同速度行驶相同路程,三辆车中,甲车消耗汽油最少,故B错误;对于C,由图象可知当速度为80km/h时,甲车的燃油效率为10km/L,即甲车行驶10km时,耗油1升,故行驶1小时,路程为80km,燃油为8升,故C错误;对于D,由图象可知当速度小于80km/h时,丙车的燃油效率大于乙车的燃油效率,∴用丙车比用乙车更省油,故D正确故选D.考点:1、数学建模能力;2、阅读能力及化归思想.11.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】乙选手分数的平均数分别为7885848192767780949384,84, 55++++++++====因此s1<s2,选C.【点睛】本题考查标准差,考查基本求解能力.12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.①③【分析】求解的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④【详解】解:对于①函数的一个对称中心为故①正确;对于②取为第一象限角且但故②错误;对于③一组样本数据的平均数解析:①③ 【分析】 求解5()12f π-的值判断①;举例说明②错误;求解平均数判断③;利用函数图象的平移变换判断④. 【详解】 解:对于①,55()4cos()4cos()012632f ππππ-=-+=-=, ∴函数()4cos(2)3f x x π=+的一个对称中心为5(,0)12π-,故①正确;对于②,取94πα,3πβ=,α,β为第一象限角,且αβ>,但tan tan αβ<,故②错误;对于③,一组样本数据1x ,2x ,⋯,n x 的平均数是2,则数据121x -,221x -,⋯,21n x -的平均数为22132⨯-=,故③正确; 对于④,函数sin 2y x =的图象向左平移4π个单位长度,得到sin 2()sin(2)cos242y x x x ππ=+=+=的图象,故④错误.∴正确命题的序号是①③.故答案为:①③. 【点睛】本题考查命题的真假判断与应用,考查三角函数的图象与性质,训练了平均数的求法,属于中档题.14.或【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为8284848689则平均数方差故答案为:或【点睛】本题考查茎叶图考查平均数与方差的计算是基础题解析:5.6或285【分析】利用平均数与方差公式直接求解即可【详解】由题去掉最高与最低分后的测试成绩为82,84,84,86,89,则平均数8284848689855x ++++==方差()()()()()2222221288582858485848586858955s ⎡⎤=-+-+-+-+-=⎣⎦ 故答案为:5.6或285【点睛】本题考查茎叶图,考查平均数与方差的计算,是基础题15.【分析】首先求出xy 的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a 的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直 解析:214【分析】首先求出x ,y 的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a 的一元一次方程,解方程即可. 【详解】:14x =(1+2+3+4)=2.5,14y =(4.5+4+3+2.5)=3.5, 将(2.5,3.5)代入线性回归直线方程是ˆy=-0.7x +a ,可得3.5=﹣1.75+a , 故a =214. 故答案为214【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+, 55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.34【解析】分析:根据表格中数据求出代入公式求得的值从而得到回归直线方程将代入回归方程即可得到结果详解:设回归直线方程由表中数据可得代入归直线方程可得所以回归方程为当时可得故答案为点睛:求回归直线方解析:34 【解析】分析:根据表格中数据求出,x y ,代入公式求得a 的值,从而得到回归直线方程,将6x =代入回归方程即可得到结果.详解:设回归直线方程3,ˆ2yx a =-+, 由表中数据可得1,50x y ==, 代入归直线方程可得53.2a =,所以回归方程为3,253.ˆ2yx =-+ 当6x =时,可得 3.2653.4ˆ23y=-⨯+=,故答案为34. 点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+;回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.18.2【解析】分析:直接利用回归方程将代入即可求得的估计值详解:∵回归方程为∴当时的估计值为故答案为82点睛:本题考查回归方程的运用考查学生的计算能力属于基础题解析:2 【解析】分析:直接利用回归方程,将25x =代入,即可求得y 的估计值. 详解:∵回归方程为0.4 1.8y x =-,∴当25x =时,y 的估计值为 0.425 1.88.2y =⨯-=.故答案为8.2.点睛:本题考查回归方程的运用,考查学生的计算能力,属于基础题.19.【解析】分析:先由茎叶图得数据再根据平均数公式求平均数详解:由茎叶图可知5位裁判打出的分数分别为故平均数为点睛:的平均数为解析:【解析】分析:先由茎叶图得数据,再根据平均数公式求平均数.详解:由茎叶图可知,5位裁判打出的分数分别为8989909191,,,,,故平均数为89+89+90+91+91905=.点睛:12,,,n x x x 的平均数为12nx x x n+++.20.①③④⑦【分析】根据线性回归分析的概念进行分析即可【详解】在线性回归模型中相关指数越接近于1表示回归效果越好①正确;两个变量相关性越强则相关系数r 的绝对值就越接近于1②错误;③正确;两个模型中残差平解析:①③④⑦ 【分析】根据线性回归分析的概念进行分析即可. 【详解】在线性回归模型中,相关指数2R 越接近于1,表示回归效果越好,①正确;两个变量相关性越强,则相关系数r 的绝对值就越接近于1,②错误;③正确;两个模型中残差平方和越小的模型拟合的效果越好,④正确;回归直线ˆˆˆybx a =+恒过样本点的中心(),x y ,不一定过样本点,⑤错误;若2K 的观测值满足2K ≥6.635,我们有99%的把握认为吸烟与患肺病有关系,并不能说在100个吸烟的人中必有99人患有肺病,⑥错误;从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误,⑦正确.故答案为①③④⑦. 【点睛】本题考查线性回归分析的有关概念,掌握相关概念是解题基础,属于基础题.三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.94.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.22.(1) 2.51y x =-;(2)食堂购买36袋食,能获得最大利润,最大利润为11520元. 【分析】(1)本题首先可根据题中所给数据求出x 、y ,然后根据51522155i ii ii x y x yb xx==-⋅=-∑∑求出b ,最后根据a y bx =-求出a ,即可得出结果;(2)本题首先可根据 2.51y x =-得出预计需要购买食材36.5袋,然后分为36y <、36y ≥两种情况进行讨论,分别求出最大值后进行比较,即可得出结果.【详解】(1)由所给数据可得:1398101210.45x ++++==,3223182428255y ++++==,515222151343510.4252.5558510.45i ii ii x y x yb xx==-⋅-⨯⨯===-⨯-∑∑,25 2.510.41a y bx =-=-⨯=-,故y 关于x 的线性回归方程为 2.51y x =-.(2)因为 2.51y x =-,所以当15x =时36.5y =,即预计需要购买食材36.5袋,因为()()40020,036380,36y y x N C y y y N ⎧-<<∈⎪=⎨≥∈⎪⎩,所以当36y <时,利润()7004002030020L y y y =--=+, 此时当35y =时,max 300352010520L =⨯+=, 当36y ≥时,由题意可知,剩余的食材只能无偿退还, 此时当36y时,700363803611520L =⨯-⨯=,当37y =时,利润70036.53803711490L =⨯-⨯=,综上所述,食堂应购买36袋食,才能获得最大利润,最大利润为11520元. 【点睛】本题考查线性回归直线方程,考查回归方程的应用,考查学生的数据处理能力以及运算求解能力.考查分类讨论思想,属于中档题. 23.(1)0.36 6.24y x =+;(2)8.76万吨. 【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量. 【详解】(1)由题知 3.5t =,7.5=y ,()62117.5i i t t =-=∑,()()()616216.30.3617.5ˆiii i i t t y y bt t ==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨. 【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 24.(1)见解析;(2)174.5cm ;(3)0.3. 【详解】试题分析:(1)先分别算出第六组和第七组的人数,进而算出其频率与组距的比,补全直方图;(2)利用中位数两边频率相等,求出中位数的值;(3)先借助分层抽样的特征求出第四、第五组的人数,再运用列举法列举出所有可能数及满足题设的条件的数,运用古典概型的计算公式求解:解:(1)第六组与第七组频率的和为:∵第六组和第七组人数的比为5:2.∴第六组的频率为0.1,纵坐标为0.02;第七组频率为0.04,纵坐标为0.008.(2)设身高的中位数为,则∴估计这50位男生身高的中位数为174.5(3)由于第4,5组频率之比为2:3,按照分层抽样,故第4组中应抽取2人记为1,2,第5组应抽取3人记为3,4,5则所有可能的情况有:{1,2},{1,3},{1,4},{1,5},{2,3},{2,4},{2,5},{3,4},{3,5},{4,5}共10种满足两位男生身高都在[175,180]内的情况有{3,4},{3,5},{4,5}共3种,因此所求事件的概率为.25.(1)作图见解析;(2)中位数是29.2;(3)平均需要3720元.【分析】(1)由频数分布表能补全该市1000名跑步爱好者周跑量的频率分布直方图.(2)由频率分布直方图能求出样本的中位数.(3)分别求出休闲跑者、核心跑者、精英跑者的人数,由此能估计该市每位跑步爱好者购买装备平均需要花费多少钱.【详解】(1)补全该市1000名跑步爱好者周跑量的频率分布直方图,如下:(2)中位数的估计值:由50.0250.02450.0260.350.5⨯+⨯+⨯=<,0.3550.0360.530.5+⨯=>, 所以中位数位于区间[)25,30中,设中位数为x ,则()0.35250.0360.5x +-⨯=, 解得29.2x ≈.即样本中位数是29.2.(3)依题意可知,休闲跑者共有()50.0250.024*******⨯+⨯⨯=人, 核心跑者()50.02650.03650.04450.0301000680⨯+⨯+⨯+⨯⨯=人, 精英跑者1000220680100--=人, 所以该市每位跑步爱好者购买装备,平均需要22025006804000100450037201000⨯+⨯+⨯=元.即该市每位跑步爱好者购买装备,平均需要3720元. 【点睛】本题考查频率分布直方图的作法,考查样本的中位数、平均数的求法,考查运算求解能力,是基础题.26.(1)ˆy=6.6x −139.4;(2)(i )回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好;(ii )190. 【分析】(1)根据公式,结合已知数据,分别求得ˆˆ,ba ,则问题得解; (2)根据相关指数的计算公式,结合已知数据,求得2R ,再进行比较即可; (3)将35x =代入回归方程,即可求得结果.【详解】(Ⅰ)由题意得,()()()121557ˆ 6.6384n i i i n i i x x y y b xx ==--==≈-∑∑ ∴ˆa =33−6.6326=−139.4,∴y 关于x 的线性回归方程为:ˆy=6.6x −139.4. (Ⅱ) (i )线性回归方程ˆy=6.6x −138.6对应的相关指数为: ()()6221621ˆ236.641110.06020.93983930i i i i i i y y R yy ==-=-=-≈-=-∑∑, 因为0.9398<0.9522,所以回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好. (ii )由(i )知,当温度35C x ︒=时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35C 时该批紫甘薯死亡株数为190.【点睛】本题考查线性回归直线方程的求解、相关指数的求解,以及用回归直线方程进行估算,属综合中档题.。
(典型题)高中数学必修三第一章《统计》测试卷(包含答案解析)

一、选择题1.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差2.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .163.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D 674.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是A.8号学生B.200号学生C.616号学生D.815号学生5.学校为了解新课程标准提升阅读要求对学生阅读兴趣的影响情况,随机抽取了100名学生进行调查.根据调查结果绘制学生周末阅读时间的频率分布直方图如图所示:将阅读时间不低于30分钟的观众称为“阅读霸”,则下列命题正确的是()A.抽样表明,该校有一半学生为阅读霸B.该校只有50名学生不喜欢阅读C.该校只有50名学生喜欢阅读D.抽样表明,该校有50名学生为阅读霸6.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是()A.45 B.47 C.48 D.637.通过实验,得到一组数据如下:2,5,8,9,x,已知这组数据的平均数为6,则这组数据的方差为( )A.3.2 B.4 C.6 D.6.58.总体由编号为01,02,,29,30的30个个体组成,利用下面的随机数表选取4个个体.选取的方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出的第4个个体的编号为().78066572080263142947182198003204923449353623486969387481A.02B.14C.18D.299.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1810.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是( )A .4B .5C .6D .711.有一个同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经统计,得到一个卖出的热饮杯数与当天气温的对比表: 温度℃ -5 0 4 7 12 15 19 23 27 31 36 热饮杯数15615013212813011610489937654根据上表数据确定的线性回归方程应该是( )A .ˆ 2.352147.767yx =-+ B .ˆ 2.352127.765yx =-+ C .ˆ 2.35275.501yx =+D .ˆ 2.35263.674yx =+ 12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.下列说法正确的是__________(填序号)(1)已知相关变量(),x y 满足回归方程ˆ24yx =-,若变量x 增加一个单位,则y 平均增加4个单位(2)若,p q 为两个命题,则“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件(3)若命题0:p x R ∃∈,20010x x -+<,则:p x R ⌝∀∉,210x x -+≥(4)已知随机变量()22X N σ~,,若()0.32P X a <=,则()40.68P X a >-=14.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.15.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.16.由茎叶图可知,甲组数据的众数和乙组数据的极差分别是__________.17.某种活性细胞的存活率y (%)与存放温度x (℃)之间具有线性相关关系,样本数据如下表所示 存放温度x (℃) 10 4 -2 -8 存活率y (%)20445680经计算得回归直线方程的斜率为-3.2,若存放温度为6℃,则这种细胞存活的预报值为_____%.18.对具有线性相关关系的变量x ,y ,有一组观察数据(,)(1,2,9)i i x y i =⋅⋅⋅,其回归直线方程是:2y x a =+,且919ii x==∑,9118i i y ==∑,则实数a 的值是__________.19.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.20.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.三、解答题21.某电视机的广告支出x (单位:万元)与销售收入y (单位:万元)之间有下表所对应的关系:(1)求出y 对x 的回归直线方程;(2)若广告费为9万元,则销售收入为多少万元? (参考公式:1122222212n n n x y x y x y nx yb x x x nx +++-⋅=+++-,a y bx =-) 22.已知某校6个学生的数学和物理成绩如下表: 学生的编号i 1 2 3 4 5 6 数学i x 89 87 79 81 78 90 物理i y797577737274(1)若在本次考试中,规定数学在80分以上(包括80分)且物理在75分以上(包括75分)的学生为理科小能手.从这6个学生中抽出2个学生,设X 表示理科小能手的人数,求X 的分布列和数学期望;(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程.参考数据和公式:ˆˆˆybx a =+,其中1122211()()ˆ()nniii ii i nniii i x x y y x y nx yb x x xnx====---⋅==--∑∑∑∑,ˆˆay bx =-. 23.某城市100户居民的月平均用水量(单位:吨),以[0,2)[2,4)[4,6)[6,8)[8,10)[10,12)[12,14)分组的频率分布直方图如图.(1)求直方图中x的值;并估计出月平均用水量的众数.(2)求月平均用水量的中位数及平均数;(3)在月平均用水量为[6,8),[8,10),[10,12),[12,14)的四组用户中,用分层抽样的方法抽取22户居民,则应在[10,12)这一组的用户中抽取多少户?(4)在第(3)问抽取的样本中,从[10,12)[12,14)这两组中再随机抽取2户,深入调查,则所抽取的两户不是来自同一个组的概率是多少?24.某校为了了解甲、乙两班的数学学习情况,从两班各抽出10名学生进行数学水平测试,成绩如下(单位:分):甲班:82848589798091897974乙班:90768681848786828583(1)求两个样本的平均数;(2)求两个样本的方差和标准差;(3)试分析比较两个班的学习情况.25.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x(分钟)时刻的细菌个数为y个,统计结果如下:x12345y23445(Ⅰ)在给出的坐标系中画出x,y的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆybx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 26.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x (吨)对价格y (万元/吨)和年利润z (万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y =.x1 2 3 4 5y 8764c(1)求表格中c 的值;(2)求y 关于x 的线性回归方程y bx a =+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z 取得最大值?参考公式:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.【参考答案】***试卷处理标记,请不要删除一、选择题1.D 解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 2.A解析:A 【分析】先弄清楚程序框图中是统计成绩不低于90分的学生人数,然后从茎叶图中将不低于90分的个数数出来,即为输出的结果. 【详解】176A =,1i =,16i ≤成立,190A ≥不成立,112i =+=; 279A =,2i =,16i ≤成立,290A ≥不成立,112i =+=;792A =,7i =,16i ≤成立,790A ≥成立,011n =+=,718i =+=;依此类推,上述程序框图是统计成绩不低于90分的学生人数,从茎叶图中可知,不低于90分的学生数为10,故选A . 【点睛】本题考查茎叶图与程序框图的综合应用,理解程序框图的意义,是解本题的关键,考查理解能力,属于中等题.3.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.4.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.5.A解析:A【分析】根据频率分布直方图得到各个时间段的人数,进而得到结果. 【详解】根据频率分布直方图可列下表:故选A. 【点睛】这个题目考查了频率分布直方图的实际应用,以及样本体现整体的特征的应用,属于基础题.6.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.7.C解析:C 【解析】分析:利用平均数的公式,求得6x =,得到数据2,5,8,9,6,再利用方差的计算公式,即求解数据的方差.详解:由题意,一组数据2,5,8,9,x 的平均数为6,即258924655x xx +++++===,解得6x =,所以数据2,5,8,9,6的方差为2222221[(26)(56)(86)(96)(66)]65s =-+-+-+-+-=,故选C.点睛:本题主要考查了数据的数字特的计算,其中熟记数据的平均数的公式和数据的方差的计算公式是解答的关键,着重考查了推理与运算能力,属于基础题.8.D解析:D【解析】分析:根据随机数表法则取数:取两个数,不小于30的舍去,前面已取的舍去.详解:从表第1行5列,6列数字开始由左到右依次选取两个数字中小于30的编号为:08,02,14,29.∴第四个个体为29.选D.点睛:本题考查随机数表,考查对概念基本运用能力.9.C解析:C【解析】【分析】根据分层抽样的定义求出在各层中的抽样比,即样本容量比上总体容量,按此比例求出在高三年级中抽取的人数.【详解】根据题意得,用分层抽样在各层中的抽样比为421 105020=,则在高三年级抽取的人数是14001625⨯=人,故选C.【点睛】该题所考查的是有关分层抽样的问题,在解题的过程中,需要明确无论采用哪种抽样方法,都必须保证每个个体被抽到的概率是相等的,所以注意成比例的问题.10.B解析:B【解析】分析:首先写出所有学生的乘积,然后结合系统抽样的方法整理计算即可求得最终结果.详解:由题意可知,学生的成绩如下:111,111,112,113,113;116,117,117,118,118;120,120,121,122,122;123,124,124,126127;128,128,129,129,129;131,131,131,132,132;132,133,134,134,135;137,138,138,138,139;140,142,142,143,144.用系统抽样方法从中抽取9人,则每5人中抽取一人,即上述分组中每组抽取一人,则所抽取的学生的成绩在区间[]120,135上的学生人数为5.本题选择B选项.点睛:本题主要考查系统抽样的概念及其应用,茎叶图的识别等知识,意在考查学生的转化能力和计算求解能力.11.A解析:A【解析】分析:先观察表中数据的规律,确定回归系数b的符号,再计算x和y,代入选项确定正确答案.详解:由表中数据规律发现:热饮杯数y随当天气温x升高而减少,则0b<,排除C、D.计算1169=(504712151923273136)1111x-++++++++++=11228=(15615013212813011610489937654)111.64 1111y++++++++++=≈将x代入选项A,得1692.352147.767111.6311ˆy=-⨯+=将x代入选项B,得1692.352127.76591.6311ˆy=-⨯+=所以选项A正确.故选A.点睛:本题考查线性回归方程的求法与应用,一次项系数b符号的判断和回归直线过样本中心点(,)x y是解题关键.12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.【分析】(1)由回归方程知相关变量与成负相关(2)为假命题则同时为假命题为假命题则中至少有一假命题(3)全称命题与特称命题转换条件不变结论变相反(4)由正态曲线的对称性可解【详解】(1)由回归方程知解析:(2)【分析】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题(3)全称命题与特称命题转换条件不变,结论变相反 (4)由正态曲线的对称性可解. 【详解】(1)由回归方程ˆ24yx =-知相关变量y 与x 成负相关,若变量x 增加一个单位,则y 平均增加4-个单位,故(1)错误(2) “p q ∨”为假命题则,p q 同时为假命题,“p q ∧”为假命题则,p q 中至少有一假命题,所以“p q ∨”为假命题是“p q ∧”为假命题的充分不必要条件是正确的.故(2)正确 (3)全称命题与特称命题转换条件不变,结论变相反,故(3)错误 (4)由正态曲线的对称性知,随机变量()22X N σ~,,若()0.32P X a <=,对称轴是2x = ,则()40.32P X a >-=,故(4)错误. 故答案为; (2) 【点睛】利用正态曲线的对称性求概率是常见的正态分布应用问题.解题的关键是利用对称轴=x μ确定所求概率对应的随机变量的区间与已知概率对应的随机变量的区间的关系,必要时可借助图形判断.对于正态分布2()N μσ,,由=x μ是正态曲线的对称轴知:(1)对任意的a ,有()()P X a P X a μμ<->+=; (2)()001;()P X x P X x -≥=<;(3)()()=()P a X b P X b P X a <<<≤-.14.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为s =【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题.15.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1解析:1 【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.16.【分析】首先从茎叶图中找到出现次数最多的数从而得到甲组数据的众数找出乙组数据的最大值和最小值两者作差求得极差得到结果【详解】根据众数的定义可以断定甲组数据的众数是21;从茎叶图中可以发现其最大值为其 解析:21,43【分析】首先从茎叶图中找到出现次数最多的数,从而得到甲组数据的众数,找出乙组数据的最大值和最小值,两者作差求得极差,得到结果. 【详解】根据众数的定义,可以断定甲组数据的众数是21;从茎叶图中可以发现,其最大值为52,其最小值为9,所以极差为52943-=, 故答案为21,,43. 【点睛】该题考查的是茎叶图的应用,涉及到的知识点有一组数据的众数和极差的概念,只要明确众数是数据中出现次数最多的数,极差是最大值和最小值的差距,从而求得结果.17.34【解析】分析:根据表格中数据求出代入公式求得的值从而得到回归直线方程将代入回归方程即可得到结果详解:设回归直线方程由表中数据可得代入归直线方程可得所以回归方程为当时可得故答案为点睛:求回归直线方解析:34 【解析】分析:根据表格中数据求出,x y ,代入公式求得a 的值,从而得到回归直线方程,将6x =代入回归方程即可得到结果.详解:设回归直线方程3,ˆ2yx a =-+, 由表中数据可得1,50x y ==, 代入归直线方程可得53.2a =,所以回归方程为3,253.ˆ2yx =-+ 当6x =时,可得 3.2653.4ˆ23y=-⨯+=,故答案为34. 点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+;回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.18.0【解析】分析:根据回归直线方程过样本中心点计算平均数代入方程求出的值详解:根据回归直线方程过样本中心点即答案为0点睛:本题考查了线性回归方程过样本中心点的应用问题是基础题解析:0 【解析】分析:根据回归直线方程过样本中心点x y (,), 计算平均数代入方程求出a 的值. 详解:根据回归直线方程ˆ2y x a =+过样本中心点x y (,),191191,99i i x x ==∑=⨯=191118299i i y y ==∑=⨯=,22210a y x ∴=-=-⨯=;即答案为0.点睛:本题考查了线性回归方程过样本中心点的应用问题,是基础题.19.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15 解析:15【解析】依次选取两个数字为23,75,93,21,15,04,…… 所以选出来的第3个个体的编号为15.20.【解析】因此 解析:4.7【解析】18914779,0.80.1424222ˆx y a====∴=-⨯=- 因此0.860.1 4.7y =⨯-= 三、解答题21.(1)7325y x =-(2)129.4 【解析】试题分析:(1)观察散点图可知各点大致分布在一条直线附近,得到这组数据符合线性相关,求出利用最小二乘法所需要的数据,做出线性回归方程的系数,得到方程;(2)把x=9代入线性回归方程,估计出当广告费为9万元时,销售收入约为129.4万元 试题(1)52x =,692y =,所以735b = 2a y bx =-=-故y 对x 的回归直线方程为7325y x =- (2)当9x =时,129.4y =,故若广告费为9万元,则销售收入为129.4万元 考点:回归方程22.(1)见解析;(2)129155y x =+ 【分析】(1)由题意得1号学生、2号学生为理科小能手,从而得到X 的可能取值为0,1,2,分别求出相应的概率,由此能求出X 的分布列和数学期望;(2)利用最小二乘法分别求出ˆb,ˆa ,由此能求出y 与x 的回归直线方程. 【详解】(1)由题意得1号学生、2号学生为理科小能手.X 的可能取值为:0,1,2P (X =0)242625C C ==,P (X =1)112426815C C C ==, P (X =2)2226115C C ==,X 的分布列为()0+1+2=515153E X =⨯⨯⨯(2)84,75x y ==,61i =∑x i y i=37828,61i =∑x i2=42476, ∴ˆb=(61i ii x y =-∑6xy )÷(62216i n x x =-∑) 2378286847542476684-⨯⨯=-⨯ 15=, ˆˆay bx =-=75﹣15×84=2915, 回归方程为129155y x =+ 【点睛】本题考查离散型随机变量的分布列和数学期望的求法,考查回归直线方程的求法,是中档题,解题时要认真审题,注意最小二乘法的合理运用. 23.(1) x =0.075,7;(2) 6.4,5.36;(3) 2;(4)23. 【分析】(1)根据频率和为1,列方程求出x 的值;(2)根据频率分布直方图中,每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值,由最高矩形的数据组中点为众数;中位数两边的频率相等,由此求出中位数;(3)求出抽取比例数,计算应抽取的户数;(4)利用列举法,由古典概型概率公式可得结果. 【详解】(1)根据频率和为1,得2×(0.02+0.095+0.11+0.125+x +0.05+0.025)=1, 解得x =0.075;由图可知,最高矩形的数据组为[6,8),所以众数为()16872+=; (2) [2,6)内的频率之和为 (0.02+0.095+0.11)×2=0.45;设中位数为y ,则0.45+(y −6)×0.125=0.5, 解得y =6.4,∴中位数为6.4;平均数为()210.0230.09550.1170.12590.075110.025 5.36⨯+⨯+⨯+⨯+⨯+⨯= (3)月平均用电量为[10,12)的用户在四组用户中所占的比例为0.0520.1250.0750.050.02511=+++,∴月平均用电量在[10,12)的用户中应抽取11×211=2(户). (4)月平均用电量在[12,14)的用户中应抽取11×111=1(户), 月平均用电量在[10,12)的用户设为A 、B , 月平均用电量在[12,14)的用户设为C ,从[10,12),[12,14)这两组中随机抽取2户共有 ,,AB AC BC ,3种情况, 其中,抽取的两户不是来自同一个组的有,,AC BC ,2种情况, 所以,抽取的两户不是来自同一个组的概率为23. 【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标、组距相乘后求和可得平均值;(4)直方图左右两边面积相等处横坐标表示中位数.24.(1)=83.2x 甲,=84x 乙;(2)22=26.36=13.2S S 甲乙,,=5.13S 甲,=3.63S 乙;(3)乙班的总体学习情况比甲班好 【解析】试题分析:每组样本数据有10个,求样本的平均数利用平均数公式,10个数的平均数等于这10个数的和除以10;比较平均分的大小可以看出两个班学生平均水平的高低,求样本的方差只需使用方差公式,求这10个数与平均数的差的平方方和再除以10;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 . 试题 (1)x 甲=110×(82+84+85+89+79+80+91+89+79+74)=83. 2,x 乙=110×(90+76+86+81+84+87+86+82+85+83)=84. (2)2S 甲=110×[(82-83. 2)2+(84-83. 2)2+(85-83. 2)2+(89-83. 2)2+(79-83. 2)2+(80-83. 2)2+(91-83. 2)2+(89-83. 2)2+(79-83. 2)2+(74-83. 2)2]=26. 36,2S 甲=110[(90-84)2+(76-84)2+(86-84)2+(81-84)2+(84-84)2+(87-84)2+(86-84)2+(82-84)2+(85-84)2+(83-84)2]=13. 2,则s 甲=26.36≈5. 13,s 乙=13.2≈3. 63.(3)由于x x <甲乙,则甲班比乙班平均水平低.由于S S >甲乙,则甲班没有乙班稳定. 所以乙班的总体学习情况比甲班好【点睛】怎样求样本的平均数,n 个数的平均数等于这n 个数的和除以n ;比较平均数的大小可以看出两个样本平均水平的高低,怎样求样本的方差,就是求这n 个数与平均数的差的平方方和再除以n ;比较两组数据方差的大小就可得出两组数据的标准差的大小,标准差较小者成绩较稳定 .25.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555ni i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题.26.(1)2.5;(2) 1.49.7y x =-+;(3)年产量约为3.5吨时,年利润z 取得最大值. 【分析】(1)由均值概念求得c ; (2)根据所给数据计算系数即得;(3)利用(2)中回归直线方程作出预估值进行计算利润后,再由二次函数性质得最大值. 【详解】 (1)8764 5.55cy ++++==,解得 2.5c =;(2)1234535x ++++==,5118275 2.568.5i ii x y==⨯+⨯++⨯=∑,1222222168.553 5.51.4(125)53ni ii nii x y nx yb xnx==--⨯⨯===-+++-⨯-∑∑,5.5(1.4)39.7a y bx =-=--⨯=,所以回归直线方程为 1.49.7y x =-+.(3)由(2)2(2)(1.49.7) 1.49.7z y x x x x x =-=-+=-+, 所以9.73.52( 1.4)x =-≈⨯-(吨)利润最大.【点睛】本题考查线性回归直线方程,考查回归方程的实际应用.考查学生的数据处理能力,运算求解能力.。
(好题)高中数学必修三第一章《统计》测试题(包含答案解析)(2)

一、选择题1.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是()A.B.C.D.2.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为()A.600 B.1225 C.1530 D.18553.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是()A.华为的全年销量最大B.苹果第二季度的销量大于第三季度的销量C.华为销量最大的是第四季度D.三星销量最小的是第四季度4.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .185.某班有50名学生,在一次考试中统计出平均分数为70,方差为75,后来发现有2名学生的成绩统计有误,学生甲实际得分是80分却误记为60分,学生乙实际得分是70分却误记为90分,更正后的平均分数和方差分别是( ) A .70和50B .70和67C .75和50D .75和676.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.97.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s > 8.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.19.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元10.某产品的广告费用x 与销售额y 的统计数据如下表:广告费用x (万元)2345销售额y (万元)25 37 44 54根据上表可得回归方程ˆˆˆybx a =+中的ˆb 为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元B .62.5万元C .63.5万元D .65.0万元11.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1312.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.某老师从星期一到星期五收到信件数分别是10,6,8,5,6,则该组数据的方差2s =___________________.17.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.18.某种活性细胞的存活率(%)y 与存放温度()x C ︒之间具有线性相关关系,样本数据如下表所示: 存放温度()x C ︒ 10 4 -2 -8 存活率(%)y20445680经计算得回归直线的斜率为-3.2.若存放温度为6C ︒,则这种细胞存活率的预报值为__________%.19.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.20.已知某人连续5次射击的环数分别是8,9,10,x ,8,若这组数据的平均数是9,则这组数据的方差为 . 三、解答题21.已知某校6个学生的数学和物理成绩如下表:(1)若在本次考试中,规定数学在80分以上(包括80分)且物理在75分以上(包括75分)的学生为理科小能手.从这6个学生中抽出2个学生,设X 表示理科小能手的人数,求X 的分布列和数学期望;(2)通过大量事实证明发现,一个学生的数学成绩和物理成绩具有很强的线性相关关系,在上述表格是正确的前提下,用x 表示数学成绩,用y 表示物理成绩,求y 与x 的回归方程.参考数据和公式:ˆˆˆybx a =+,其中1122211()()ˆ()nniii ii i nniii i x x y y x y nx yb x xxnx====---⋅==--∑∑∑∑,ˆˆay bx =-. 22.某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:(1)当20b ∧=-时,求回归直线方程y b x a ∧∧∧=+;(2)预计在今后的销售中,销量与单价服从(1)中的关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)23.班主任为了对本班学生的考试成绩进行分析,决定从本班24名女同学,18名男同学中随机抽取一个容量为7的样本进行分析.(1)如果按照性别比例分层抽样,可以得到多少个不同的样本?(写出算式即可,不必计算出结果)(2)如果随机抽取的7名同学的数学,物理成绩(单位:分)对应如下表:①若规定85分以上(包括85分)为优秀,从这7名同学中抽取3名同学,记3名同学中数学和物理成绩均为优秀的人数为ξ,求ξ的分布列和数学期望;②根据上表数据,求物理成绩y 关于数学成绩x 的线性回归方程(系数精确到0.01);若班上某位同学的数学成绩为96分,预测该同学的物理成绩为多少分? 附:线性回归方程y bx a =+,其中121()()()niii nii x x y y b x x ==--=-∑∑,a y bx =-.24.全世界越来越关注环境保护问题,某监测站点于2016年8月某日起连续n 天监测空气质量指数(AQI ),数据统计如下: (1)根据所给统计表和频率分布直方图中的信息求出,n m 的值,并完成频率分布直方图;(2)在空气质量指数分别为51-100和151-200的监测数据中,用分层抽样的方法抽取5天,从中任意选取2天,求事件A “两天空气都为良”发生的概率.25.为响应党中央“扶贫攻坚”的号召,某单位指导一贫困村通过种植紫甘薯来提高经济收入.紫甘薯对环境温度要求较高,根据以往的经验,随着温度的升高,其死亡株数成增长的趋势.下表给出了2017年种植的一批试验紫甘薯在温度升高时6组死亡的株数: 温度(单位:C ︒)21 23 24 27 29 32死亡数y (单位:株)6 11 20 27 57 77经计算:611266i i x x ===∑,611336i i y y ===∑,()()61557i i i x x y y =--=∑,()62184ii x x =-=∑,()6213930i i y y =-=∑,()621ˆ236.64i i y y=-=∑,8.0653167e ≈,其中i x ,i y 分别为试验数据中的温度和死亡株数,1,2,3,4,5,6i =.(1)若用线性回归模型,求y 关于x 的回归方程ˆˆˆybx a =+(结果精确到0.1); (2)若用非线性回归模型求得y 关于x 的回归方程0.2303ˆ0.06x ye =,且相关指数为20.9522R =.(i )试与(1)中的回归模型相比,用2R 说明哪种模型的拟合效果更好; (ii )用拟合效果好的模型预测温度为35C ︒时该紫甘薯死亡株数(结果取整数). 附:对于一组数据()11,u v ,()22,u v ,,(),n n u v ,其回归直线ˆˆˆvu αβ=+的斜率和截距的最小二乘估计分别为:()()()121ˆnii i nii uu v v uu β==--=-∑∑,ˆˆav u β=-;相关指数为:()()22121ˆ1ni i i niii v vR v v ==-=--∑∑.26.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据.地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z Nμσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个,[20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.3.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A . 【点睛】本题主要考查对销量百分比堆积图的理解.4.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案.【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.5.B解析:B 【解析】 【分析】根据平均数、方差的概念表示出更正前的平均数、方差和更正后的平均数、方差,比较其异同,然后整体代入即可求解. 【详解】设更正前甲,乙,…的成绩依次为a 1,a 2,…,a 50, 则a 1+a 2+…+a 50=50×70,即60+90+a 3+…+a 50=50×70, (a 1﹣70)2+(a 2﹣70)2+…+(a 50﹣70)2=50×75, 即102+202+(a 3﹣70)2+…+(a 50﹣70)2=50×75. 更正后平均分为x =150×(80+70+a 3+…+a 50)=70; 方差为s 2=150×[(80﹣70)2+(70﹣70)2+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+(a 3﹣70)2+…+(a 50﹣70)2] =150×[100+50×75﹣102﹣202]=67. 故选B . 【点睛】本题考查平均数与方差的概念与应用问题,是基础题.6.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立, 故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.7.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础8.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X ==方差为:224 4.4, 1.1σσ==,故选B .【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可. 9.B解析:B【详解】 试题分析:4235492639543.5,4244x y ++++++====, ∵数据的样本中心点在线性回归直线上,回归方程ˆˆˆy bx a =+中的ˆb 为9.4, ∴42=9.4×3.5+a ,∴ˆa =9.1,∴线性回归方程是y=9.4x+9.1,∴广告费用为6万元时销售额为9.4×6+9.1=65.5考点:线性回归方程10.C解析:C【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa ,得到线性回归方程,把6x =代入即可求出答案.【详解】由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1ay bx =-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=,故答案为C.【点睛】本题考查了线性回归方程的求法与应用,属于基础题.11.C解析:C【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论.【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19,由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25,∴做问卷C 的人数为25﹣14+1=12,故选C .【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.12.A解析:A【分析】可以通过n P 与0P 之间的大小关系进行判断.【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001n n P P k P =+<,呈下降趋势.【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断. 二、填空题13.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题 解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差.【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题. 14.5【解析】【分析】由茎叶图直接可以求出甲的中位数和乙的平均数求和即可【详解】由茎叶图知甲加工零件个数的中位数为乙加工零件个数的平均数为则【点睛】本题主要考查利用茎叶图求中位数和平均数解析:5【解析】【分析】由茎叶图直接可以求出甲的中位数和乙的平均数,求和即可.【详解】 由茎叶图知,甲加工零件个数的中位数为()1212221.52a =⨯+=, 乙加工零件个数的平均数为()11917112124222430323010b =⨯+++++++++23=,则21.52344.5a b +=+=.【点睛】本题主要考查利用茎叶图求中位数和平均数.15.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数.【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人, 故答案是:5000.【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目. 16.【解析】试题分析:由平均数及方差的定义可得;考点:样本数据的数字特征:平均值与方差 解析:165【解析】 试题分析:由平均数及方差的定义可得10685675x ++++==; 222222116[(107)(67)(87)(57)(67)] 3.255s =-+-+-+-+-==. 考点:样本数据的数字特征:平均值与方差.17.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意 解析:3【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果.详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力. 18.34【解析】分析:由题意求出代入公式求值从而得到回归直线方程代入代入即可得到答案详解:由题意设回归方程由表中数据可得:;代入回归方程可得当时可得故答案为34点睛:该题考查的是有关回归直线的有关问题在 解析:34【解析】 分析:由题意求出,x y ,代入公式求值^a ,从而得到回归直线方程,代入6x =代入即可得到答案. 详解:由题意,设回归方程 3.2ˆ,ˆyx a =-+ 由表中数据可得:1,50x y ==;代入回归方程可得ˆ53.2a=. 当6x =时,可得3.2653.234y =-⨯+=,故答案为34.点睛:该题考查的是有关回归直线的有关问题,在解题的过程中,涉及到的知识点有回归直线过均值点,即样本中心点,利用题中所给的表格中的数据,计算得出相应的量,代入式子求得对应的结果.19.【解析】分析:根据方差与均值的关系求解即可详解:剔除最高分和最低分后的则原始平均分 原始原始方差即原始方差为88点睛:本题考查方差与均值的关系属基础题解析:88【解析】分析:根据方差与均值的关系()()()22D x E xE x ⎡⎤=-⎣⎦ 求解即可.详解:剔除最高分和最低分后的 222()()()92168480,E x E x D x =+=+=22()8480(152)110240,x E x n ∑=⨯=⨯-=则原始平均分()921?3? 96? 589015E x ;⨯++== 原始 22229658()8188,15x E x ∑++== 原始方差 222()?()?()81889088.D x E X E X =-=-=原始原始 即原始方差为 88 .点睛:本题考查方差与均值的关系,属基础题.20.【解析】分析:先根据平均数求x 的值再求数据的方差详解:由题得所以数据的方差为故答案为点睛:(1)本题主要考查平均数和方差的计算意在考查学生对这些基础知识的掌握水平(2)方差公式为 解析:45【解析】分析:先根据平均数求x 的值,再求数据的方差. 详解:由题得8+9+8109,10.5x x ++=∴= 所以数据的方差为22222214[(89)(99)(109)(109)(89)]55S =-+-+-+-+-=.故答案为45. 点睛:(1)本题主要考查平均数和方差的计算,意在考查学生对这些基础知识的掌握水平.(2) 方差公式为222121[()()()]n S x x x x x x n =-+-+⋅⋅⋅+-. 三、解答题21.(1)见解析;(2)129155y x =+ 【分析】(1)由题意得1号学生、2号学生为理科小能手,从而得到X 的可能取值为0,1,2,分别求出相应的概率,由此能求出X 的分布列和数学期望; (2)利用最小二乘法分别求出ˆb,ˆa ,由此能求出y 与x 的回归直线方程. 【详解】(1)由题意得1号学生、2号学生为理科小能手.X 的可能取值为:0,1,2P (X =0)242625C C ==,P (X =1)112426815C C C ==, P (X =2)2226115C C ==, X 的分布列为()0+1+2=515153E X =⨯⨯⨯ (2)84,75x y ==,61 i =∑x i y i =37828,61 i =∑x i2=42476, ∴ˆb=(61 i i i x y =-∑6xy )÷(6221 6i n x x =-∑) 2378286847542476684-⨯⨯=-⨯ 15=, ˆˆa y bx =-=75﹣15×84=2915, 回归方程为129155y x =+ 【点睛】本题考查离散型随机变量的分布列和数学期望的求法,考查回归直线方程的求法,是中档题,解题时要认真审题,注意最小二乘法的合理运用. 22.(1)20250ˆyx =-+;(2)应定为354元. 【分析】 (1)利用公式求解出,x y 的值,求解b ,代入回归方程求得a 的值,即可得到回归直线的方程;(2)设工厂获得的利润为L 元,得到关于L 的函数关系式,利用二次函数求最值即可得出答案.【详解】(1)根据表中数据,计算()188.28.48.68.898.56x =⨯+++++=,()1908483807568806y =⨯+++++=, 且20b =-, ∴()80208.5250a y bx =-=--⨯=,∴y 关于x 的线性回归方程为20250y x =-+.(2)设工厂获得的利润为L 元,则()()2352025052025020281.254L x x x x ⎛⎫=-+--+=--+ ⎪⎝⎭, 则该产品的单价应定为354元时,工厂获得的利润最大. 【点睛】本题主要考查了回归直线的方程的求解,以及利用二次函数求最值,其中解答中熟记基本计算公式,准确计算,以及认真审题,得到函数的关系式是解答的关键,着重考查了分析问题和解答问题的能力,属于中档题.23.(1)不同的样本的个数为432418C C .(2)①分布列见解析,()E ξ97=. ②线性回归方程为0.6533.60y x =+.可预测该同学的物理成绩为96分.【分析】(1)按比例抽取即可,再用乘法原理计算不同的样本数.(2)7名学生中物理和数学都优秀的有3名学生,任取3名学生,都优秀的学生人数ξ服从超几何分布,故可得其概率分布列及其数学期望.而线性回归方程的计算可用给出的公式计算,并利用得到的回归方程预测该同学的物理成绩.【详解】(1)依据分层抽样的方法,24名女同学中应抽取的人数为724442⨯=名, 18名男同学中应抽取的人数为718342⨯=名, 故不同的样本的个数为432419C C .(2)①∵7名同学中数学和物理成绩均为优秀的人数为3名,∴ξ的取值为0,1,2,3.∴()34374035C P C ξ===,()21433711835C C C P ξ===, ()12433712235C C C P ξ===,()33375313C C P ξ===. ∴ξ的分布列为ξ 0 1 2 3 P435 1835 1235 135 ∴()0123353535357E ξ=⨯+⨯+⨯+⨯=. ②∵5260.65912b =≈,830.657633.60a y b x =-⨯=-⨯=. ∴线性回归方程为0.6533.60y x =+.当96x =时,0.659633.6096y =⨯+=.可预测该同学的物理成绩为96分.【点睛】在计算离散型随机变量的概率时,注意利用常见的概率分布列来简化计算(如二项分布、超几何分布等).24.(1)答案见解析;(2)35. 【解析】【试题分析】(1)借助题设中提供的频率分布直方图,算出0-50的频率为0.004500.2⨯=,进而求出样本容量200.2100n =÷=,从而求出25m =,最后完成频率分布直方图;(2)先运用分层抽样的方法求出空气质量指数为51-100和151200-的监测天数中分别抽取4天和1天,即将空气质量指数为51-100的4天分别记为,,,a b c d ;将空气质量指数为151-200的1天记为e ,算出从中任取2天的基本事件数为10种和其中事件A “两天空气都为良”包含的基本事件数为6种,进而算得事件A “两天都为良”发生的概率是()63105P A ==: (1)由频率分布直方图可知0-50的频率为0.004500.2⨯=,所以200.2100n =÷=,从而25m =,频率分布直方图补充如下图所示.(2)在空气质量指数为51-100和151200-的监测天数中分别抽取4天和1天,在所抽取的5天中,将空气质量指数为51-100的4天分别记为,,,a b c d ;将空气质量指数为151-200的1天记为e ,从中任取2天的基本事件分别为:(),a b ,(),a c ,(),a d ,(),a e ,(),b c ,(),b d ,(),b e ,(),c d ,(),c e ,(),d e ,共10种.其中事件A “两天空气都为良”包含的基本事件为:(),a b ,(),a c ,(),a d ,(),b c ,(),b d 共6种,所以事件A “两天都为良”发生的概率是()63105P A ==. 25.(1)ˆy=6.6x −139.4;(2)(i )回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好;(ii )190. 【分析】(1)根据公式,结合已知数据,分别求得ˆˆ,ba ,则问题得解; (2)根据相关指数的计算公式,结合已知数据,求得2R ,再进行比较即可;(3)将35x =代入回归方程,即可求得结果.【详解】(Ⅰ)由题意得,()()()121557ˆ 6.6384ni i i n i i x x y y b x x ==--==≈-∑∑ ∴ˆa =33−6.6326=−139.4,∴y 关于x 的线性回归方程为:ˆy=6.6x −139.4. (Ⅱ) (i )线性回归方程ˆy=6.6x −138.6对应的相关指数为: ()()6221621ˆ236.641110.06020.93983930i i i i i i y y R y y ==-=-=-≈-=-∑∑, 因为0.9398<0.9522,所以回归方程0.2303ˆ0.06x y e =比线性回归方程ˆy=6.6x −138.6拟合效果更好. (ii )由(i )知,当温度35C x ︒=时,0.2303358.06050.060.060.063167190ˆye e ⨯==≈⨯≈, 即当温度为35C 时该批紫甘薯死亡株数为190.【点睛】本题考查线性回归直线方程的求解、相关指数的求解,以及用回归直线方程进行估算,属综合中档题.26.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15人,再结合排列组合与古典概型即可得解;(2)先求出样本中的100名学生预赛成绩的平均值,即为μ,从而推出~(53Z N ,219),再根据正态分布的性质即可得解;(3)以随机变量ξ表示甲答对的题数,则~B ξ(,0.75)n ,记甲答完n 题所得的分数为随机变量X ,则2X ξ=,为了获取答n 道题的资格,甲需要“花”掉的分数为20.1()n n +,设甲答完n 题后的复赛成绩的期望值为()f n ,则2()1000.1()()f n n n E X =-++,最后利用配方法即可得解.【详解】解:(1)由题意得样本中成绩不低于60分的学生共有40分,其中成绩优良的人数为15人,记“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”为事件A ,则()1125152402552C C P A C == 答:“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”的概率为2552(2)由题意知样本中的100名学生预赛成绩的平均值为:100.1300.2500.3700.25900.1533x =⨯+⨯+⨯+⨯+⨯=,则53μ=,由2361σ=得19σ=,所以()()()()17210.158652P Z P Z P Z μσμσμσ≥=≥+=--<≤+≈, 所以,估计全市参加参赛的全体学生中,成绩不低于72分的人数为20000×0.15865=3173,即全市参赛学生中预赛成绩不低于72分的人数为3173.(3)以随机变量ξ表示甲答对的题数,则()~,0.75B n ξ,且()0.75E n ξ=, 记甲答完n 题所加的分数为随机变量X ,则2X ξ=,∴()()2 1.5E X E n ξ==, 依题意为了获取答n 道题的资格,甲需要“花”掉的分数为:()()20.2123...0.1n n n ⨯++++=+,设甲答完n 题后的复赛成绩的期望值为()f n ,则()()()221000.1 1.50.17104.9f n n n n n =-++=--+, 由于*n N ∈,所以当7n =时,()f n 取最大值104.9.即当他的答题数量7n =时,他的复赛成绩的期望值最大.【点睛】本题考查古典概型、正态分布的性质、二项分布的性质及数学期望的实际应用,考查学生对数据的分析与处理能力,属于中档题.。
(必考题)高中数学必修三第一章《统计》测试题(包含答案解析)(1)
一、选择题1.我校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为 ( ) A .45,75,15B .45,45,45C .45,60,30D .30,90,152.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .6753.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y +的值是( )A .12B .14C .16D .184.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .635.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .986.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是A.81.2,4.4B.40.6,1.1C.48.8,4.4D.78.8,1.17.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表:收入x(万元)8.28.610.011.311.9支出y(万元)6.27.58.08.59.8根据上表可得回归直线方程ˆˆˆy bx a=+,其中ˆˆˆ0.76,b a y bx==-,据此估计,该社区一户收入为15万元家庭年支出为()A.11.4万元B.11.8万元C.12.0万元D.12.2万元8.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755的人数为()A.10 B.11C.12 D.139.设有一个直线回归方程为2 1.5y x=-,则变量x增加一个单位时()A.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位10.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为()A.127 B.128 C.128.5 D.12911.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37 12.根据如下样本数据 x 3 4 5 6 7 8 y﹣4.0﹣2.50.5﹣0.52.03.0得到的回归方程为y bx a =+,则( ) A .a >0,b <0B .a >0,b >0C .a <0,b <0D .a <0,b >0二、填空题13.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.14.若1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21,则1a ,2a ,…,20a ,x 这21个数据的方差为__________.15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.现有10个数,其平均数为3,且这10个数的平方和是100,则这组数据的标准差是______.17.某次测试共有100名考生参加,测试成绩的频率分布直方图如下图所示,则成绩在80分以上的人数为__________.18.已知一组数据为2,3,4,5,6,则这组数据的方差为______.19.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.20.已知一组数据x ,8,7,9,7,若这组数据的平均数为8,则它们的方差为______.三、解答题21.据了解,温带大陆性气候,干燥,日照时间长,昼夜温差大,有利于植物糖分积累.某课题研究组欲研究昼夜温差大小()/x ℃与某植物糖积累指数()/y GI 之间的关系,得到如下数据:组数 第一组 第二组第三组第四组第五组第六组昼夜温差/℃x1011 13 12 8 6某植物糖积累指数/y GI20 24 30 28 18 15下的2组数据进行检验,假设这剩下的2组数据恰好是第一组与第六组数据.(1)求y 关于x 的线性回归方程ˆˆˆybx a =+ (2)若由线性回归方程得到的估计数据与所选出的检验数据的差的绝对值均不超过2.58,则认为得到的线性回归方程是理想的,试问(1)中所得线性回归方程是否理想?(参考公式:回归直线方程ˆˆˆybx a =+的斜率和截距的最小二乘估计()()()211ˆˆˆ,iii ni ni x x y y bay bx x x ==--==--∑∑ 22.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y关于x的线性回归方程;(2)根据(1)中的回归方程,若A,B两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a=+的斜率和截距的最小二乘估计分别为1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.23.某校高一年级举行“抗击新冠肺炎”在线知识问答比赛,现将60名参赛学生的成绩(满分100分)统计如下:分组频数频率[50,60)180.30[60,70)240.40[70,80)90.15[80,90)60.10[90,100]30.05(1)根据上面的统计表,作出这些数据的频率分布直方图;(2)求这60名参赛学生成绩的平均数(同一组中的数据用该组区间的中间值作代表)和中位数.24.某校2011年到2019年参加“北约”“华约”考试而获得加分的学生人数(每位学生只能参加“北约”“华约”中的一种考试)可以通过以下表格反映出来.(为了方便计算,将2011年编号为1,2012年编号为2,依此类推)(1)求这九年来,该校参加“北约”“华约”考试而获得加分的学生人数的平均数和方差; (2)根据最近五年的数据,利用最小二乘法求出y 与x 的线性回归方程,并依此预测该校2020年参加“北约”“华约”考试而获得加分的学生人数.(最终结果精确至个位) 参考数据:回归直线的方程是y bx a =+,其中()()()1221121niii nnin i i ii ii x y nx y b n x x x xy x xy ====-=---=-∑∑∑∑,a y bx =-.95293i ii x y==∑,925255i ix ==∑.25.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆybx a =+; (2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆnni i i i i i nn i i i i x x y y x y nxy bx x x nx====---==--∑∑∑∑,ˆˆay bx =-) 26.2018年中秋节到来之际,某超市为了解中秋节期间月饼的销售量,对其所在销售范围内的1000名消费者在中秋节期间的月饼购买量(单位:g)进行了问卷调查,得到如下频率分布直方图:()1求频率分布直方图中a 的值;()2以频率作为概率,试求消费者月饼购买量在600g 1400g ~的概率;()3已知该超市所在销售范围内有20万人,并且该超市每年的销售份额约占该市场总量的5%,请根据这1000名消费者的人均月饼购买量估计该超市应准备多少吨月饼恰好能满足市场需求(频率分布直方图中同一组的数据用该组区间的中点值作代表)?【参考答案】***试卷处理标记,请不要删除一、选择题 1.C 解析:C 【解析】因为共有学生2700,抽取135,所以抽样比为1352700,故各年级分别应抽取135900452700⨯=,1351200602700⨯=,135600302700⨯=,故选C. 2.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为:S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.3.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.4.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可. 【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63, 最中间的数为:45,所以,中位数为45. 本题选择A 选项. 【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.5.C解析:C 【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可. 【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等.6.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.7.B解析:B 【解析】 试题分析:由题,,所以.试题 由已知,又因为ˆˆˆybx a =+,ˆˆˆ0.76,b a y bx ==- 所以,即该家庭支出为万元.考点:线性回归与变量间的关系.8.C解析:C 【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论. 【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列, ∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19, 由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25, ∴做问卷C 的人数为25﹣14+1=12, 故选C . 【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.9.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位, 即减少1.5个单位,故选C. 【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目.10.D解析:D 【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数. 详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129. 故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..11.A解析:A 【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53100=. 本题选择A 选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.12.D解析:D 【解析】分析:利用公式求出ˆb,ˆa ,即可得出结论. 详解:样本平均数x =5.5,y =﹣0.25, ∴()()61i i i x x y y =--∑=23,621()i i x x =-∑=17.5,∴ˆb=2317.5=4635>0, ∴ˆa =﹣0.25﹣4635•5.5<0, 故选:D .点睛:求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族解析:20 【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果. 【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05, 则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==,解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20. 【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题.14.【分析】根据平均数与方差的概念利用公式准确计算即可求解【详解】由题意数据…这20个数据的平均数为方差为由方差的公式可得所以所以故答案为:【点睛】本题主要考查了平均数与方差的概念及应用其中解答中熟记平 解析:0.20【分析】根据平均数与方差的概念,利用公式,准确计算,即可求解. 【详解】由题意,数据1a ,2a ,…,20a 这20个数据的平均数为x ,方差为0.21, 由方差的公式,可得222212201[()()()]0.2120s a x a x a x =⨯-+-++-=,所以2221220()()() 4.2a x a x a x -+-++-=,所以22222122011[()()()()] 4.20.202121s a x a x a x x x '=⨯-+-++-+-=⨯=, 故答案为:0.20. 【点睛】本题主要考查了平均数与方差的概念及应用,其中解答中熟记平均数和方差的计算公式,准确运算是解答的关键,着重考查了计算能力,属于基础题.15.5000【分析】由题意其他年级抽取200人其他年级共有学生2000人根据题意列出等式即可求出该校学生总人数【详解】由题意其他年级抽取200人其他年级共有学生2000人则该校学生总人数为人故答案是:5解析:5000 【分析】由题意,其他年级抽取200人,其他年级共有学生2000人,根据题意列出等式,即可求出该校学生总人数. 【详解】由题意,其他年级抽取200人,其他年级共有学生2000人, 则该校学生总人数为20005005000200⨯=人,故答案是:5000. 【点睛】该题考查的是有关分层抽样的问题,涉及到的知识点有分层抽样要求每个个体被抽到的概率是相等的,属于简单题目.16.1【解析】【分析】设这10个数为则这组数据的方差为:由此能求出这组数据的标准差【详解】现有10个数其平均数为3且这10个数的平方和是100设这10个数为则这组数据的方差为:这组数据的标准差故答案为1【解析】 【分析】设这10个数为1x ,2x ,3x ,⋯,10x ,则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,这组数据的方差为:()()22222222212310123101231011[()()())69101010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯ ⎥⎥⎢⎦⎣⎝⎦,由此能求出这组数据的标准差. 【详解】现有10个数,其平均数为3,且这10个数的平方和是100, 设这10个数为1x ,2x ,3x ,⋯,10x , 则12310310x x x x +++⋯+=,222212310100x x x x +++⋯+=,∴这组数据的方差为:()()22222222212310123101231011[()()())691011010S x x x x x x x x x x x x x x x x ⎛⎤⎤⎡=-+-+-+⋯+-=+++⋯+-+++⋯++⨯= ⎥⎥⎢⎦⎣⎝⎦,∴这组数据的标准差1S =.故答案为1. 【点睛】本题考查一组数据的标准差的求法,考查平均数、方差等基础知识,考查运算求解能力,考查函数与方程思想,是基础题.17.25【解析】分析:先求成绩在80分以上的概率再根据频数等于总数与对应概率乘积求结果详解:因为成绩在80分以下的概率为所以成绩在80分以上的概率为因此成绩在80分以上的人数为点睛:频率分布直方图中小长解析:25 【解析】分析:先求成绩在80分以上的概率,再根据频数等于总数与对应概率乘积求结果.详解:因为成绩在80分以下的概率为(0.0050.03+0.0410=0.75+⨯),所以成绩在80分以上的概率为10.750.25-=,因此成绩在80分以上的人数为0.25100=25.⨯点睛:频率分布直方图中小长方形面积等于对应区间的概率,所有小长方形面积之和为1; 频率分布直方图中组中值与对应区间概率乘积的和为平均数; 频率分布直方图中小长方形面积之比等于对应概率之比,也等于对应频数之比.18.2【解析】分析:根据方差的计算公式先算出数据的平均数然后代入公式计算即可得到结果详解:平均数为:即答案为2点睛:本题考查了方差的计算解题的关键是方差的计算公式的识记它反映了一组数据的波动大小方差越大【解析】分析:根据方差的计算公式,先算出数据的平均数,然后代入公式计算即可得到结果. 详解:平均数为:2345645+++++=,()22222211[2434445464]4114255s =⨯-+-+-+-+-=⨯+++=()()()()().即答案为2.点睛:本题考查了方差的计算,解题的关键是方差的计算公式的识记.它反映了一组数据的波动大小,方差越大,波动性越大,反之也成立.19.5【解析】根据频率分布直方图得;∵002×5+004×5=03<0503+008×5=07>05;∴中位数应在20∼25内设中位数为x 则03+(x−20)×008=05解得x=225;∴这批产品的中解析:5 【解析】根据频率分布直方图,得; ∵0.02×5+0.04×5=0.3<0.5, 0.3+0.08×5=0.7>0.5; ∴中位数应在20∼25内, 设中位数为x ,则 0.3+(x −20)×0.08=0.5, 解得x =22.5;∴这批产品的中位数是22.5. 故答案为22.5.点睛:用频率分布直方图估计总体特征数字的方法: ①众数:最高小长方形底边中点的横坐标;②中位数:平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标; ③平均数:频率分布直方图中每个小长方形的面积乘小长方形底边中点的横坐标之和.20.【解析】因为平均数为所以方差为解析:45【解析】因为平均数为8,所以9,x = 方差为222214[10111]55++++=三、解答题21.(1)171277y =⨯;(2)该小组所得线性回归方程是理想的.(1)根据数据求出ˆb与ˆa 的值,即可求出y 关于x 的线性回归方程; (2)分别计算出1月份和6月份对应的预测值,与检验数据作差取绝对值,再与2.58进行比较即可得到结论. 【详解】(1)由表中2月至5月份的数据, 得11(1113128)11,(24302818)2544x y =+++==+++=,故有()()520(1)2513(3)(7)34iii x x y y =--=⨯-+⨯+⨯+-⨯-=∑,()5222222021(3)14i i x x =-=+++-=∑,34171712,251114777b a y bx ∴===-=-⨯=-, 即y 关于x 的线性回归方程为171277y =⨯; (2)由171277y =⨯,当10x =时,171215810777y =⨯-=, 1581820 2.5877-=<, 当6x =时,1712906777y =⨯=, 901515 2.5877-=<, 则该小组所得线性回归方程是理想的. 【点睛】方法点睛:该题考查的是有关回归分析的问题,解题方法如下:(1)结合题中所给的数据,根据最小二乘法系数公式起的ˆb与ˆa 的值,得到回归直线方程;(2)将相应的变量代入,得到的值域题中条件比较,得到结论. 22.(1) 1.60.2y x =+;(2)B 项目的收益更好. 【分析】(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出b 的值,最后将样本中心点的坐标代入回归方程求得a 的值即可;(2)分别利用所给关系式以及所求回归方程,求出A ,B 两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好. 【详解】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8, 所以1234535x ++++==,2357855y ++++==,22222212233547585351.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯, 则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元; 因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元. 因为9.89.7>,所以可预测B 项目的收益更好. 【点睛】方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a=+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 23.(1)直方图见解析;(2)67分,65分. 【分析】(1)由统计表算出各频率,作出频率分布直方图;(2)取各组数据中间值乘以频率再相加可得总平均值,求出频率0.5对应的成绩(此成绩在[60,70)之间]. 【详解】(1)根据统计表,作出这些数据的频率分布直方图如图:(2)由表中数据可知,这60名参赛学生成绩的平均数550.3650.4750. 15850.1950.0567x =⨯+⨯+⨯+⨯+⨯=分.因为这60名参赛学生成绩在[50,60)的频率为0.30.5<,成绩在[50,70)的频率为0.70.5>,所以这60名.参赛学生成绩的中位数在[60,70)之间.设这60名参赛学生成绩的中位数为x ,则()0.04600.2x ⨯-=,解得65x =, 故这60名参赛学生成绩的中位数为65分. 【点睛】本题考查频率分布直方图,考查由频率分布直方图求均值和中位数.考查了学生的数据处理能力,运算求解能力,属于中档题. 24.(1)6;689;(2) 1.3 1.1y x =-,12人. 【分析】(1)由表格中的数据,利用平均数和方差的公式,即可求解;(2)由表中近五年的数据,利用公式,求得ˆˆ,ba ,求得回归直线方程,代入10x =,即可作出结论. 【详解】(1)由表格中的数据,利用平均数的计算公式,可得2354578101069++++++++=.由方差的公式,可得()()()2222168263610699s ⎡⎤=-+-++-=⎣⎦.(2)由表中近五年的数据知,7x =,8y =,95293i ii x y ==∑,925255i i x ==∑,9592255293578ˆ 1.32555495i ii i i x y xybx x==--⨯⨯===-⨯-∑∑,又a y bx =-,所以8 1.37 1.1a =-⨯=-, 故y 与x 的线性回归方程为 1.3 1.1y x =-, 当10x =时, 1.310 1.111.912y =⨯-=≈,故估计该校2020年参加“北约”“华约”考试而获得加分的学生有12人. 【点睛】本题主要考查了平均数与方差的计算,以及回归直线方程的求解及应用,其中解答中认真审题,根据公式准确计算是解答的关键,着重考查运算与求解能力.25.(1)5ˆ32yx =-(2)可靠 【分析】(1)根据所给的数据,先做出,y x 的平均数,即做出本组数据的样本中心点,根据最小二乘法求出线性回归方程的系数,写出线性回归方程;(2)根据估计数据与所选出的检验数据的误差均不超过2颗,就认为得到的线性回归方程是可靠的,根据求得的结果和所给的数据进行比较,得到所求的方程是可靠的.【详解】 (1)由题意:111312123x ++==,253026273y ++==, ()()()()()()()()()()()()31122331322221231ˆi i i i i x x y y x x y y x x y y x x y y b x x x x x x x x ==----+--+--==-+-+--∑∑ ()()()()()()()()()22211122527131230271212262752111213121212-⨯-+-⨯-+-⨯-==-+-+-. 527123ˆˆ2ay bx =-=-⨯=-, 故回归直线方程为:ˆ532yx =-. (2)当10x =时,510322,2223122y =⨯-=-=<, 当8x =时,58317,1716122y =⨯-=-=<,所以(1)中所得的回归直线方程是可靠的. 【点睛】本题主要考查线性回归方程的求解与应用,属于中档题.求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,nniiii i x y x x y==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势. 26.(1)a 0.001=;(2)0.62;(3)12.08吨 【分析】(1)由频率分布直方图列出方程能求出a .(2)由频率分布直方图先求出满足题意的频率,即得概率.(3)由频率分布直方图先求出人均月饼购买量,由此能求出该超市应准备12.08吨月饼恰好能满足市场需求. 【详解】()1由()0.00020.00055a 0.00050.000254001++++⨯=,解得a 0.001=. ()2消费者月饼购买量在600g 1400g ~的频率为: ()0.000550.0014000.62+⨯=,∴消费者月饼购买量在600g 1400g ~的概率为0.62.()3由频率分布直方图得人均月饼购买量为:()4000.00028000.0005512000.00116000.000520000.000254001208g⨯+⨯+⨯+⨯+⨯⨯=,∴2012085%1208⨯⨯=万克12.08?=吨, ∴该超市应准备12.08吨月饼恰好能满足市场需求. 【点睛】本题考查用样本的频率分布估计总体分布及识图的能力,求解的重点是对题设条件及直方图的理解,了解直方图中每个小矩形的面积的意义,是中档题.。
(好题)高中数学必修三第一章《统计》测试卷(含答案解析)(2)
一、选择题1.某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是()A.5 B.4 C.3 D.22.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A.海水稻根系深度的中位数是45.5B.普通水稻根系深度的众数是32C.海水稻根系深度的平均数大于普通水稻根系深度的平均数D.普通水稻根系深度的方差小于海水稻根系深度的方差3.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已9,11的学生人数为25,则n的值为()知学习时长在[)A .40B .50C .80D .1004.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.55.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .166.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )x 8 10 11 12 14 y2125m2835A .26B .27C .28D .297.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .988.已知变量,x y 之间的线性回归方程为0.47.6=-+y x ,且变量,x y 之间的一组相关数据如表所示,则下列说法错误的是( )A .变量,x y 之间呈现负相关关系B .m 的值等于5C .变量,x y 之间的相关系数0.4=-rD .由表格数据知,该回归直线必过点()9,49.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4 D .78.8,1.110.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是( )A .91.5和91.5B .91.5和92C .91和91.5D .92和9211.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变12.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).若要从身高[)120130,,[)130140,,[]140,150三组内的学生中,用分层抽样的方法抽取18人参加一项活动,则从身高在[]140,150内的学生中抽取的人数应为________.15.对两个变量y 和x 进行回归分析,得到一组样本数据()11,x y ,()22,x y ,…,(),n n x y ,则下列说法中正确的序号是______.①由样本数据得到的回归直线方程y bx a =+必过样本点的中心 ②残差平方和越小的模型,拟合的效果越好③用相关指数2R 来刻画回归效果,2R 越小说明拟合效果越好④若变量y 和x 之间的相关系数为0.946r =-,则变量y 和x 之间线性相关性强 16.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示:现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.17.已知由样本数据集合(){}11,1,2,3,...,x y i n =,求得的回归直线方程为1.2308ˆ.0y x =+,且ˆ4x =,若去掉两个数据点 (4.1,5.7)和(3.9,4.3)后重新求得的回归直线方程l 的斜率估计值为1.2,则此回归直线l 的方程为_______. 18.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程ˆ35yx =-,若变量x 增加一个单位时,则y 平均增加5个单位; ③线性回归方程^^^y b x a =+所在直线必过(),x y ; ④曲线上的点与该点的坐标之间具有相关关系;⑤在一个22⨯列联表中,由计算得213.079K =,则其两个变量之间有关系的可能性是0090.其中错误的是________. 19.已知由样本数据点集合(){},|1,2,3,,i ix y i n =,求得的回归直线方程为1.230.08y x Λ=+ ,且4x =。
(好题)高中数学必修三第一章《统计》测试(包含答案解析)(1)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆybx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.2020年2月,受新冠肺炎的影响,医卫市场上出现了“一罩难求”的现象.在政府部门的牵头下,部分工厂转业生产口罩,下表为某小型工厂2-5月份生产的口罩数(单位:万) 月份x 2 3 4 5 口罩数y4.5432.5口罩数y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 的值为( ) A .6.1B .5.8C .5.95D .6.753.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm ),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是( )A .海水稻根系深度的中位数是45.5B .普通水稻根系深度的众数是32C .海水稻根系深度的平均数大于普通水稻根系深度的平均数D .普通水稻根系深度的方差小于海水稻根系深度的方差4.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高5.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18556.在2018年1月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价元和销售量件之间的一组数据如下表所示: 价格99.510.5 11销售量 1186 5由散点图可知,销售量与价格之间有较强的线性相关关系,其线性回归方程是,且,则其中的( ) A .10B .11C .12D .10.57.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差8.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >10.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为()A.2,5 B.5,5 C.5,8 D.8,811.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为()A.127 B.128 C.128.5 D.129二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.东汉·王充《论衡·宜汉篇》:“且孔子所谓一世,三十年也.”,清代·段玉裁《说文解字注》:“三十年为一世.按父子相继曰世”.“一世”又叫“一代”,到了唐朝,为了避李世民的讳,“一世”方改为“一代”,当代中国学者测算“一代”平均为25年.另据美国麦肯锡公司的研究报告显示,全球家庭企业的平均寿命其实只有24年,其中只有约30%的家族企业可以传到第二代,能够传到第三代的家族企业数量为总量的13%,只有5%的家族企业在第三代后还能够继续为股东创造价值.根据上述材料,可以推断美国学者认为“一代”应为__________年.15.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______. 16.下表是某厂1~4月份用水量(单位:百吨)的一组数据: 月份x 1 2 3 4 用水量y4.5432.5由散点图可知,用水量y 与月份x 之间有较好的线性相关关系,其线性回归直线方程是0.7y x a =-+,则a 等于___17.对具有线性相关关系的变量,x y ,有一组观测数据(,)i i x y (1,2,3,,10i =),其回归直线方程是3ˆ2ˆybx =+,且121012103()30x x x y y y +++=+++=,则b =______.18.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.19.为了了解某学校男生的身体发育情况,随机抽查了该校100名男生的体重情况,整理所得数据并画出样本的频率分布直方图.根据此图估计该校2000名男生中体重在7078()kg ~的人数为__________.20.总体由编号为01,02,⋅⋅⋅,29,30的30个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第2行的第6列数字开始由左到右依次选取两个数字,则选出来的第3个个体的编号为__________.三、解答题21.某家庭2015-2019年的年收入和年支出情况统计如下表:(1)已知y 与x 具有线性相关关系,求y 关于x 的线性回归方程(精确到0.01); (2)假设受新冠肺炎疫情影响,该家庭2020年的年收入为9.5万元,请根据(1)中的线性回归方程预测该家庭2020年的年支出金额.(参考公式:回归方程ˆˆy bxa =+中斜率和截距的最小二乘估计分别为()()()1122211ˆn niii ii i nniii i x x y y x y n x ybx x xn x ====---⋅⋅==--⋅∑∑∑∑,ˆˆay bx =-) 22.2019年2月13日《西安市全民阅读促进条例》全文发布,旨在保障全民阅读权利,培养全民阅读习惯,提高全民阅读能力,推动文明城市和文化强市建设.某高校为了解条例发布以来全校学生的阅读情况,随机调查了200名学生每周阅读时间X (单位:小时)并绘制如图所示的频率分布直方图.(1)求这200名学生每周阅读时间的样本平均数;(2)为查找影响学生阅读时间的因素,学校团委决定从每周阅读时间为[6.5,7.5),[7.5,8.5)的学生中抽取9名参加座谈会.(i )你认为9个名额应该怎么分配?并说明理由;(ii )座谈中发现9名学生中理工类专业的较多.请根据200名学生的调研数据,填写下面的22⨯列联表,并判断是否有95%的把握认为学生阅读时间不足(每周阅读时间不足8.5小时)与“是否理工类专业”有关?(精确到0.1)阅读时间不足8.5小时 阅读时间超过8.5小时附:22()()()()()n ad bc K a b c d a c b d -=++++(n a b c d =+++).临界值表:23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据: (1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.近年来,国家对西部发展出台了很多优惠政策,为了更有效促进发展,需要对一种旧能源材料进行技术革新,为了了解此种材料年产量x (吨)对价格y (万元/吨)和年利润z (万元)的影响,有关部门对近五年此种材料的年产量和价格统计如表,若 5.5y =.(1)求表格中c 的值;(2)求y 关于x 的线性回归方程y bx a =+;(3)若每吨该产品的成本为2万元,假设该产品可全部卖出,预测当年产量为多少时,年利润z 取得最大值?参考公式:1221ni iiniix y nx ybx nx==-=-∑∑,a y bx=-.25.某学校高一100名学生参加数学竞赛,成绩均在40分到100分之间.学生成绩的频率分布直方图如图:(1)估计这100名学生分数的中位数与平均数;(精确到0.1)(2)某老师抽取了10名学生的分数:12310,,,...,x x x x,已知这10个分数的平均数90x=,标准差6s=,若剔除其中的100和80两个分数,求剩余8个分数的平均数与标准差.(参考公式:221niix nxsn=-=∑(3)该学校有3座构造相同教学楼,各教学楼高均为20米,东西长均为60米,南北宽均为20米.其中1号教学楼在2号教学楼的正南且楼距为40米,3号教学楼在2号教学楼的正东且楼距为72米.现有3种型号的考试屏蔽仪,它们的信号覆盖半径依次为35,55,105米,每个售价相应依次为1500,2000,4000元.若屏蔽仪可在地下及地上任意位置安装且每个安装费用均为100元,求让各教学楼均被屏蔽仪信号完全覆盖的最小花费.(参考数据:22221044100,19236864,11012100===)26.某城市200户居民的月平均用电量(单位:度),以[)160,180,[)180,200,[)200,220,[)220,240,[)240,280,[)280,300分组的频率分布直方图如图:(1)求直方图中x 的值;(2)在月平均用电量为[)220,240,[)240,260,[)260,280的三组用户中,用分层抽样的方法抽取20户居民,则月平均用电量在[)220,240的用户中应抽取多少户? (3)求月平均用电量的中位数和平均数.【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.C解析:C 【分析】求得 3.5x y ==,得到样本中心点(3.5,3.5),再把样本中心点代入回归直线方程得解. 【详解】由表可得 3.5x y ==,带入线性回归方程中有 3.50.7 3.5 5.95=+⨯=a , 故选:C . 【点睛】本题考查利用线性相关关系求回归直线方程,属于基础题.3.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确;选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误 故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题. 4.D解析:D 【分析】根据茎叶图和折线图依次判断每个选项得到答案. 【详解】A. 甲得分的极差是28919-=,A 错误;B. 乙得分的中位数是161716.52+=,B 错误; C. 甲运动员得分在区间[]20,30上有3个,C 错误; D. 甲运动员得分的平均值为:912131315202628178+++++++=,乙运动员得分的平均值为:914151617181920168+++++++=,故D 正确.故选:D . 【点睛】本题考查了茎叶图和折线图,意在考查学生的计算能力和理解能力.5.C解析:C 【分析】根据系统抽样所得的编号为等差数列,再用等差数列的求和公式求解即可. 【详解】由系统抽样的定义可知,在区间[201,319]内抽取的编号数构成以205为首项,公差为20的等差数列,并且项数为6,所以6(61)62052015302⨯-⨯+⨯=. 故选:C 【点睛】本题考查系统抽样的知识,考查数据处理能力和应用意识.6.A解析:A 【解析】 【分析】由表求得,,代入回归直线方程,联立方程组,即可求解,得到答案.【详解】由题意,5家商场的售价元和销售量件之间的一组数据, 可得,,又由回归直线的方程,则,即,又因为,解得,故选A. 【点睛】本题主要考查了回归直线方程的特征及其应用,其中解答中熟记回归直线方程的特征,准确计算是解答的关键,着重考查了推理与运算能力,属于基础题.7.A解析:A 【分析】可不用动笔,直接得到答案,亦可采用特殊数据,特值法筛选答案. 【详解】设9位评委评分按从小到大排列为123489x x x x x x ≤≤≤≤≤.则①原始中位数为5x ,去掉最低分1x ,最高分9x ,后剩余2348x x x x ≤≤≤,中位数仍为5x ,∴A 正确.②原始平均数1234891()9x x x x x x x =+++++,后来平均数234817x x x x x '=+++() 平均数受极端值影响较大,∴x 与x '不一定相同,B 不正确 ③()()()222219119S x x x x x x ⎡⎤=-+-++-⎣⎦()()()222223817s x x x x x x ⎡⎤'=-'+-'++-'⎢⎥⎣⎦由②易知,C 不正确. ④原极差91=x -x ,后来极差82=x -x 可能相等可能变小,D 不正确. 【点睛】本题旨在考查学生对中位数、平均数、方差、极差本质的理解.8.B解析:B 【解析】 分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.26 4.5,4y +++== ∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A【分析】 由题意计算出加入新数据后的平均数,然后比较方差【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定故22s <故选A【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础 10.C解析:C【解析】试题分析:由题意得5x =,116.8(915101824)85y y =+++++⇒=,选C. 考点:茎叶图 11.B解析:B【解析】【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标.【详解】根据题意可得,,由线性回归方程一定过样本中心点,. 故选:B .【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题. 12.D解析:D【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数.详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129.故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应 解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名, 故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等. 14.20【分析】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为然后利用平均数公式列方程解出的值即可得出所求结果【详解】设美国学者认为的一代为年然后可得出寿命在的家族企业的频率分别为则家族 解析:20【分析】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,然后利用平均数公式列方程解出x 的值,即可得出所求结果.【详解】设美国学者认为的一代为x 年,然后可得出寿命在(]0,x 、(],2x x 、(]2,3x x 、(]3,4x x 的家族企业的频率分别为0.52、0.3、0.13、0.05,则家族企业的平均寿命为0.5(10.30.130.05) 1.50.3 2.50.13 3.50.0512.124x x x x x ⨯---+⨯+⨯+⨯==, 解得20x ≈,因此,美国学者认为“一代”应为20年,故答案为20.【点睛】本题考查平均数公式的应用,解题的关键要审清题意,将题中一些关键信息和数据收集起来,结合相应的条件或公式列等式或代数式进行求解,考查运算求解能力,属于中等题. 15.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:265【分析】先根据平均数计算出m 的值,再根据方差的计算公式计算出这组数的方差.【详解】 依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题. 16.【分析】首先求出xy 的平均数根据样本中心点满足线性回归方程把样本中心点代入得到关于a 的一元一次方程解方程即可【详解】:(1+2+3+4)=25(45+4+3+25)=35将(2535)代入线性回归直 解析:214【分析】首先求出x ,y 的平均数,根据样本中心点满足线性回归方程,把样本中心点代入,得到关于a 的一元一次方程,解方程即可.【详解】 :14x =(1+2+3+4)=2.5,14y =(4.5+4+3+2.5)=3.5, 将(2.5,3.5)代入线性回归直线方程是ˆy =-0.7x +a ,可得3.5=﹣1.75+a , 故a =214. 故答案为214 【点睛】本题考查回归分析,考查样本中心点满足回归直线的方程,考查求一组数据的平均数,是基础题17.【解析】【分析】由题意求得样本中心点代入回归直线方程即可求出的值【详解】由已知代入回归直线方程可得:解得故答案为【点睛】本题考查了线性回归方程求出横坐标和纵坐标的平均数写出样本中心点将其代入线性回归 解析:16- 【解析】【分析】由题意求得样本中心点,代入回归直线方程即可求出b 的值【详解】由已知,()12101210330x x x y y y +++=+++= ()12101310x x x x ∴=⨯+++=()12101110y y y y =⨯+++= 代入回归直线方程可得:3132b =+解得16b =- 故答案为16-【点睛】本题考查了线性回归方程,求出横坐标和纵坐标的平均数,写出样本中心点,将其代入线性回归方程即可求出结果18.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140解析:140【解析】 根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.19.240【解析】该校2000名男生中体重在的人数为解析:240【解析】该校2000名男生中体重在()7078kg ~的人数为2000(0.020.01)4240⨯+⨯=. 20.【解析】依次选取两个数字为237593211504……所以选出来的第个个体的编号为15解析:15【解析】依次选取两个数字为23,75,93,21,15,04,……所以选出来的第3个个体的编号为15.三、解答题21.(1)0.780.24y x =+;(2)7.65万元.【分析】(1)利用回归直线方程计算公式,计算出回归直线方程.(2)将9.5x =代入回归直线方程,求得预测值.【详解】(1)由题可得()199.61010.411105x =⨯++++=, ()17.37.588.58.785y =⨯++++=, ()()()5222222110.400.41 2.32ii x x =-=-+-+++=∑, ()()()()()()5110.70.40.5000.40.510.7 1.8i ii x x y y =--=-⨯-+-⨯-+⨯+⨯+⨯=∑,()()()51521 1.845ˆ0.782.3258i ii i i x x y y b x x ==--===≈-∑∑, 45ˆˆ8100.2458x a y b =-⋅=-⨯≈, 则y 关于x 的线性回归方程为0.780.24y x =+.(2)当2020年的年收入为9.5x =万元时,0.789.50.247.65y =⨯+=.所以预测该家庭2020年的年支出金额为7.65万元.【点睛】本小题主要考查回归直线方程的计算,考查利用回归直线方程进行预测,属于中档题. 22.(1)9, (2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由见解析, (ii )有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【分析】(1)取各区间中点值乘以频率再相加即得;(2)(i )两组差异明显,用分层抽样计算.(ii )求出两组的人数,填写列联表,计算2K 可得.【详解】(1)60.0370.180.290.35100.19110.09120.049⨯+⨯+⨯+⨯+⨯+⨯+⨯=(2)(i )每周阅读时间为[6.5,7.5)的学生中抽取3名,每周阅读时间为[7.5,8.5)的学生中抽取6名.理由:每周阅读时间为[6.5,7.5)与每周阅读时间为[7.5,8.5)是差异明显的两层,为保持样本结构与总体结构的一致性,提高样本的代表性,宜采用分层抽样的方法抽取样本;因为两者频率分别为0.1,0.2,所以按照1:2进行名额分配(ii )22⨯列联表为:2K 200(40742660) 4.4 3.84166134100100⨯⨯-⨯=≈>⨯⨯⨯, 所以有95%的把握认为学生阅读时间不足与“是否理工类专业”有关.【点睛】本题考查频率分布直方图,分层抽样,考查独立性检验.属于基础题.23.(1) 1.4518.7y x =-+;(2)3【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值.【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=, 1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b ⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10(1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)根据题意,利润函数为:22( 1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95; 即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大.【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力. 24.(1)2.5;(2) 1.49.7y x =-+;(3)年产量约为3.5吨时,年利润z 取得最大值.【分析】(1)由均值概念求得c ;(2)根据所给数据计算系数即得;(3)利用(2)中回归直线方程作出预估值进行计算利润后,再由二次函数性质得最大值.【详解】(1)8764 5.55c y ++++==,解得 2.5c =; (2)1234535x ++++==, 5118275 2.568.5ii i x y ==⨯+⨯++⨯=∑, 1222222168.553 5.5 1.4(125)53n i ii n i i x y nx y b x nx==--⨯⨯===-+++-⨯-∑∑,5.5(1.4)39.7a y bx =-=--⨯=,所以回归直线方程为 1.49.7y x =-+.(3)由(2)2(2)(1.49.7) 1.49.7z y xx x x x =-=-+=-+,所以9.7 3.52( 1.4)x =-≈⨯-(吨)利润最大. 【点睛】本题考查线性回归直线方程,考查回归方程的实际应用.考查学生的数据处理能力,运算求解能力.25.(1)中位数为71.4;平均数为71;(2)平均数为90;标准差为3)3700元.【分析】(1)利用频率分布直方图能求出中位数、平均分;(2)由题意,求出剩余8个分数的平均值,由10个分数的标准差,能求出剩余8个分数的标准差;(3)求出将3座教学楼完全包裹的球的最小直径、将一座教学楼完全包裹的球的最小直径和将1号教学楼与2号教学楼完全包裹的球的最小直径,由此能求出让各教学楼均被屏蔽仪信号完全覆盖的最小花费.【详解】 (1)因为0.050.150.250.450.5++=<0.050.150.250.350.80.5+++=>所以中位数为x 满足7080x <<由80()0.350.10.10.510x -⨯++=,解得608071.47x =-≈ 设平均分为y ,则0.05450.15550.25650.35750.1850.19571y =⨯+⨯+⨯+⨯+⨯+⨯=(2)由题意,剩余8个分数的平均值为010********x x --==因为10个分数的标准差6s == 所以2222110...10(6)10(90)81360x x ++=⨯+⨯=所以剩余8个分数的标准差为0s ===(3)将3座教学楼完全包裹的球的最小直径为:210=<=因此若用一个覆盖半径为105米的屏蔽仪则总费用为4100元;70<= 因此若用3个覆盖半径为35米的屏蔽仪则总费用为4800元;将1号教学楼与2号教学楼完全包裹的球的最小直径为:110=<=70>=因此若用1个覆盖半径为55米和1个覆盖半径为35米的屏蔽仪则总费用为3700元; 所以,让各教学楼均被屏蔽仪信号完全覆盖的最小花费为3700元.【点睛】本题考查中位数、平均数、标准差、最小费用的求法,考查频率分布直方图的性质等基础知识,考查运算求解能力,是中档题.26.(1)0.0075;(2)10户;(3)224a =,225.6x =.【分析】(1)由频率和为1列出方程求解x ;(2)求出三组用户的月平均用电量的频率推出比例关系,用20乘以月平均用电量在[)220,240的用户所占比例即可得解;(3)根据中位数左边和右边的直方图面积相等列出等式估计中位数,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.【详解】(1)由直方图的性质可得 ()0.0020.00950.0110.01250.0050.0025201x ++++++⨯=,解得0.0075x =,所以直方图中x 的值是0.0075.(2)因为月平均用电量为[)220,240,[)240,260,[)260,280的三组用户的频率分别为0.25、0.15、0.1,所以这三组用户的月平均用电量比例为5:3:2,所以月平均用电量在[)220,240的用户中应抽取5201010⨯=(户). (3)因为()0.0020.00950.011200.450.5++⨯=<,所以月平均用电量的中位数在[)220,240内,设中位数为a ,则()()0.0020.00950.011200.01252200.5a ++⨯+⨯-=,解得224a =.平均数 1700.041900.192100.222300.252500.152700.12900.05x =⨯+⨯+⨯+⨯+⨯+⨯+⨯ 225.6=,所以月平均用电量的中位数为224,平均数为225.6.【点睛】本题考查统计案例、分层抽样、根据频率分布直方图估计总体的数字特征,属于中档题.。
(压轴题)高中数学必修三第一章《统计》测试卷(答案解析)
一、选择题1.某教研机构随机抽取某校20个班级,调查各班关注汉字听写大赛的学生人数,根据所得数据的茎叶图,以组距为5将数据分组成[)[)[)[)[)[)[)[]0,5,5,10,10,15,15,20,20,25,25,30,30,35,35,40时,所作的频率分布直方图如图所示,则原始茎叶图可能是( )A .B .C .D .2.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.53.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .64.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是( )A .24B .48C .56D .645.有200人参加了一次会议,为了了解这200人参加会议的体会,将这200人随机号为001,002,003,…,200,用系统抽样的方法(等距离)抽出20人,若编号为006,036,041,176, 196的5个人中有1个没有抽到,则这个编号是( ) A .006B .041C .176D .1966.有一个容量为200的样本,样本数据分组为[50,70),[70,90),[90,110),[110,130),[130,150),其频率分布直方图如图所示.根据样本的频率分布直方图估计样本数据落在区间[90,110)内的频数为( )A .48B .60C .64D .727.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生8.某同学10次测评成绩的数据如茎叶图所示,总体的中位数为12,若要使该总体的标准差最小,则42x y 的值是( )A .12B .14C .16D .189.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是A .81.2,4.4B .40.6,1.1C .48.8,4.4D .78.8,1.110.高二某班共有学生60名,座位号分别为01, 02, 03,···, 60.现根据座位号,用系统抽样的方法,抽取一个容量为4的样本.已知03号、18号、48号同学在样本中,则样本中还有一个同学的座位号是( ) A .31号B .32号C .33号D .34号11.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.212.从8名女生4名男生中,选出3名学生组成课外小组,如果按性别比例分层抽样,则不同的抽取方法数为( ) A .112种B .100种C .90种D .80种二、填空题13.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.14.已知样本数据为40,42,40,a ,43,44,且这个样本的平均数为43,则该样本的标准差为_________.15.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.16.为了了解2100名学生早晨到校时间,计划采用系统抽样的方法从全体学生中抽取容量为100栋样本,则分段间隔为__________. 17.给出下列命题:①若函数()y f x =满足(1)(1)f x f x -=+,则函数()f x 的图象关于直线1x =对称; ②点(2,1)关于直线10x y -+=的对称点为(0,3);③通过回归方程y bx a =+可以估计和观测变量的取值和变化趋势;④正弦函数是奇函数,2()sin(1)f x x =+是正弦函数,所以2()sin(1)f x x =+是奇函数,上述推理错误的原因是大前提不正确. 其中真命题的序号是__________.18.变量X 与Y 相对应的5组数据和变量U 与V 相对应的5组数据统计如表:X1011.311.812.513U1011.311.812.513 Y12345V54321用b1表示变量Y与X之间的回归系数,b2表示变量V与U之间的回归系数,则b1与b2的大小关系是___.19.抽样统计甲、乙两位同学5次数学成绩绘制成如下图所示的茎叶图,则成绩较稳定的那位同学成绩的方差为__________.20.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa)的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.三、解答题21.某地区2007年至2013年农村居民家庭纯收入y(单位:千元)的数据如下表:年份2007200820092010201120122013年份代号x1234567人均纯收入y 2.9 3.3 3.6 4.4 4.8 5.2 5.9 x(2)预测该地区2015年农村居民家庭人均纯收入.附:77211134.4,140i i ii ix y x====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-22.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t ==--=-∑∑,a y bt =-.(参考数据:()()616.3ii i tty y =--=∑)23.为了提高生产效益,某企业引进了一批新的生产设备,为了解设备生产产品的质量情况,分别从新、旧设备所生产的产品中,各随机抽取100件产品进行质量检测,所有产品质量指标值均在(]15,45以内,规定质量指标值大于30的产品为优质品,质量指标值在(]15,30的产品为合格品,旧设备所生产的产品质量指标值如频率分布直方图所示,新设备所生产的产品质量指标值如频数分布表所示.质量指标值频数(]15,202(]20,258(]25,3020(]30,3530(]35,4025(]40,4515合计100(1)请分别估计新、旧设备所生产的产品的优质品率.(2)优质品率是衡量一台设备性能高低的重要指标,优质品率越高说明设备的性能越高,根据已知图表数据填写下面列联表(单位:件),并判断是否有95%的把握认为“产品质量高于新设备有关”.非优质品优质品合计新设备产品旧设备产品合计附:P0.150.100.050.0250.0100.005()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++. (3)已知每件产品的纯利润y (单位:元)与产品质量指标值t 的关系式为2,3045,1,1530,t y t <≤⎧=⎨<≤⎩若每台新设备每天可以生产1000件产品,买一台新设备需要80万元,请估计至少需要生产多少天方可以收回设备成本.24.二手车经销商小王对其所经营的某一型号二手汽车的使用年数()010x x <≤与销售价格y (单位:万元/辆)进行整理,得到如表的对应数据:(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大. 25.2020年新冠肺炎疫情肆虐全球,各地医疗部门迅速进行防控意识宣传和流行病学调查.某疫区随机抽取100人调查其外出时佩戴口罩的情况,结果如下表.(1)是否有99.5%的把握认为“是否佩戴口罩与年龄有关”;(2)该疫区某新冠肺炎定点治疗医院统计了确诊患者中年龄x (单位:岁)的重症患者比例(单位:%),得到下表:若y 与x 之间具有线性相关关系,请用最小二乘法求出y 关于x 的线性回归方程y bx a =+,并预测该医院76岁确诊患者中的重症比例.参考公式和数据:用最小二乘法求线性回归方程系数公式:1221ni ii nii x y nx yb xn x=-=-=-∑∑,a y bx =-.817010.5657.5637.553 5.552 4.545 3.540 1.5320.52454i ii x y==⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯=∑.82222222217065635345403223256i i x==++++++=∑.()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.26.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据. 地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z Nμσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【解析】由频率分布直方图可知:第一组的频数为20×0.01×5=1个, [0,5)的频数为20×0.01×5=1个, [5,10)的频数为20×0.01×5=1个, [10,15)频数为20×0.04×5=4个, [15,20)频数为20×0.02×5=2个, [20,25)频数为20×0.04×5=4个, [25,30)频数为20×0.03×5=3个, [30,35)频数为20×0.03×5=3个, [35,40]频数为20×0.02×5=2个, 则对应的茎叶图为A , 本题选择A 选项.点睛:茎叶图、频率分布表和频率分布直方图都是用来描述样本数据的分布情况的.茎叶图由所有样本数据构成,没有损失任何样本信息,可以随时记录;而频率分布表和频率分布直方图则损失了样本的一些信息,必须在完成抽样后才能制作.2.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+,即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.3.C解析:C 【分析】设出最后两个数,然后根据已知条件列方程,求得方程2s 的表达式,根据表达式的结构求得2s 的最大值. 【详解】设这组数据的最后2个分别是10x +,y 则5781085x y +++++=⨯, 得10x y +=,故10y x =-. ∴()222211910(2)(2)21855s x x x ⎡⎤=+++++-=+⎣⎦, 显然当9x =时,2s 最大,最大为36. 故选:C 【点睛】本小题主要考查平均数和方差的计算,考查方程的思想,属于基础题.4.B解析:B 【分析】根据频率分布直方图可知从左到右的前3个小组的频率之和,再根据频率之比可求出第二组频率,结合频数即可求解. 【详解】 由直方图可知,从左到右的前3个小组的频率之和为1(0.01250.0375)510.250.75-+⨯=-=, 又前3个小组的频率之比为1:2:3, 所以第二组的频率为20.750.256⨯=, 所以学生总数120.2548n =÷=,故选B. 【点睛】本题主要考查了频率分布直方图,频率,频数,总体,属于中档题.5.B解析:B 【解析】 【分析】求得抽样的间隔为10,得出若在第1组中抽取的数字为6,则抽取的号码满足104n -,即可出判定,得到答案. 【详解】由题意,从200人中用系统抽样的方法抽取20人,所以抽样的间隔为2001020=, 若在第1组中抽取的数字为006,则抽取的号码满足6(1)10104n n +-⨯=-,其中n N +∈,其中当4n =时,抽取的号码为36;当18n =时,抽取的号码为176;当20n =时,抽取的号码为196,所以041这个编号不在抽取的号码中,故选B. 【点睛】本题主要考查了系统抽样的应用,其中解答中熟记系统抽样的抽取方法是解答的关键,着重考查了运算与求解能力,属于基础题.6.B解析:B 【分析】由(0.00500.00750.01000.0125)201a ++++⨯=,求出a ,计算出数据落在区间[90,110)内的频率,即可求解.【详解】由(0.00500.00750.01000.0125)201a ++++⨯=, 解得0.015a =,所以数据落在区间[90,110)内的频率为0.015200.3⨯=, 所以数据落在区间[90,110)内的频数2000.360⨯=, 故选B. 【点睛】本题主要考查了频率分布直方图,频率、频数,属于中档题.7.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C .本题主要考查系统抽样.8.A解析:A 【分析】由题,中位数为12,求得4x y +=,再求得平均数,利用总体标准差最小和基本不等式求得x ,y 的值,即可求得答案. 【详解】由题,因为中位数为12,所以242x yx y +=∴+= 数据的平均数为:1(22342019192021)11.410x y ++++++++++= 要使该总体的标准最小,即方差最小,所以222222.8(1011.4)(1011.4)( 1.4)( 1.4)2()0.722x y x y x y +-+-++-=-+-≥= 当且紧当 1.4 1.4x y -=-,取等号,即2x y ==时,总体标准差最小 此时4212x y += 故选A 【点睛】本题考查了茎叶图,熟悉茎叶图,清楚中位数、标准差的求法是解题的关键,属于中档题型.9.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.10.C解析:C 【解析】根据系统抽样知,组距为604=15÷,即可根据第一组所求编号,求出各组所抽编号. 【详解】学生60名,用系统抽样的方法,抽取一个容量为4的样本,所以组距为604=15÷, 已知03号,18号被抽取,所以应该抽取181533+=号, 故选C. 【点睛】本题主要考查了抽样,系统抽样,属于中档题.11.C解析:C 【分析】首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可. 【详解】由题意可得:12345305x x x x x x ++++==,线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==. 本题选择C 选项. 【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.12.A解析:A 【解析】分析:根据分层抽样的总体个数和样本容量,做出女生和男生各应抽取的人数,得到女生要抽取2人,男生要抽取1人,根据分步计数原理得到需要抽取的方法数. 详解:∵8名女生,4名男生中选出3名学生组成课外小组, ∴每个个体被抽到的概率是14, 根据分层抽样要求,应选出8×14=2名女生,4×14=1名男生, ∴有C 82•C 41=112. 故答案为:A .点睛:本题主要考查分层抽样和计数原理,意在考查学生对这些知识的掌握水平.二、填空题13.5【解析】【分析】由茎叶图直接可以求出甲的中位数和乙的平均数求和即可【详解】由茎叶图知甲加工零件个数的中位数为乙加工零件个数的平均数为则【点睛】本题主要考查利用茎叶图求中位数和平均数解析:5 【解析】 【分析】由茎叶图直接可以求出甲的中位数和乙的平均数,求和即可. 【详解】由茎叶图知,甲加工零件个数的中位数为()1212221.52a =⨯+=, 乙加工零件个数的平均数为()11917112124222430323010b =⨯+++++++++23=,则21.52344.5a b +=+=. 【点睛】本题主要考查利用茎叶图求中位数和平均数.14.【分析】由平均数的公式求得再利用方差的计算公式求得即可求解【详解】由平均数的公式可得解得所以方差为所以样本的标准差为【点睛】本题主要考查了样本的平均数与方差标准差的计算着重考查了运算与求解能力属于基【分析】由平均数的公式,求得49a =,再利用方差的计算公式,求得2283s =,即可求解. 【详解】由平均数的公式,可得1(4042404344)436a +++++=,解得49a =, 所以方差为2222222128[(4043)(4243)(4043)(4943)(4343)(4443)]63s =-+-+-+-+-+-=,所以样本的标准差为3s =. 【点睛】本题主要考查了样本的平均数与方差、标准差的计算,着重考查了运算与求解能力,属于基础题.15.60【分析】采用分层抽样的方法从该校四个年级的本科生中抽取一个容量为300的样本进行调查的【详解】∵该校一年级二年级三年级四年级的本科生人数之比为4:5:5:6∴应从一年级本科生中抽取学生人数为:故解析:60 【分析】采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查的. 【详解】∵该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6, ∴应从一年级本科生中抽取学生人数为:4300604556⨯=+++.故答案为60.16.【解析】【分析】根据系统抽样的特征求出分段间隔即可【详解】根据系统抽样的特征得:从2100名学生中抽取100个学生分段间隔为故答案是21【点睛】该题所考查的是有关系统抽样的组距问题应用总体除以样本容 解析:21【解析】 【分析】根据系统抽样的特征,求出分段间隔即可. 【详解】根据系统抽样的特征,得:从2100名学生中抽取100个学生,分段间隔为210021100=, 故答案是21. 【点睛】该题所考查的是有关系统抽样的组距问题,应用总体除以样本容量等于组距,得到结果,属于简单题目.17.②③【解析】分析:根据函数的周期性可判断①;根据垂直平分线的几何特征可判断②;根据回归直线的实际意义可判断③;根据演绎推理及正弦函数的定义可判断④详解:①若函数满足则函数是周期为2的周期函数但不一定解析:②③ 【解析】分析:根据函数的周期性,可判断① ;根据垂直平分线的几何特征,可判断②;根据回归直线的实际意义,可判断③;根据演绎推理及正弦函数的定义,可判断④.详解:①若函数()y f x =满足()()11f x f x -=+,则函数()f x 是周期为2的周期函数,但不一定具有对称性,①错误;②点()()2,1?0,3确定直线的斜率为1-,与直线 10x y -+=垂直,且中点()1,2在直线10x y -+=上,故点()()2,1?0,3关于直线10x y -+=的对称,②正确; ③通过回归方程ˆˆˆybx a =+可以估计和观测变量的取值和变化趋势,③正确;④正弦函数是奇函数,()()2sin 1f x x =+是正弦函数,所以()()2sin 1f x x =+是奇函数,上述推理错误的原因是小前提不正确,④错误,故答案为②③.点睛:本题主要通过对多个命题真假的判断,主要综合考查函数的周期性、点关于直线对称、以及回归分析与“三段论”,属于难题.这种题型综合性较强,也是高考的命题热点,同学们往往因为某一处知识点掌握不好而导致“全盘皆输”,因此做这类题目更要细心、多读题,尽量挖掘出题目中的隐含条件,另外,要注意从简单的自己已经掌握的知识点入手,然后集中精力突破较难的命题.18.【解析】分析:根据回归系数几何意义得详解:因为Y 与X 之间正增长所以因为V 与U 之间负增长所以因此点睛:函数关系是一种确定的关系相关关系是一种非确定的关系事实上函数关系是两个非随机变量的关系而相关关系是解析:12b b >. 【解析】分析:根据回归系数几何意义得120b b >> 详解:因为Y 与X 之间正增长,所以10b > 因为V 与U 之间负增长,所以20b < 因此120b b >>,点睛:函数关系是一种确定的关系,相关关系是一种非确定的关系.事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系.如果线性相关,则直接根据用公式求,a b ,写出回归方程,回归直线方程恒过点(,)x y .b 的正负,决定正相关与负相关.19.2【解析】分析:由茎叶图的分布可知乙同学的成绩会比较稳定先求出乙同学的平均成绩利用求方差的公式即可求得方差值详解:由茎叶图中成绩的分布情况可知乙同学的最低成绩比甲高乙同学的最高成绩比甲低所以成绩分布解析:2 【解析】分析:由茎叶图的分布可知,乙同学的成绩会比较稳定.先求出乙同学的平均成绩,利用求方差的公式即可求得方差值.详解:由茎叶图中成绩的分布情况可知,乙同学的最低成绩比甲高,乙同学的最高成绩比甲低,所以成绩分布相对较为集中,所以乙同学成绩的方差小,成绩较稳定. 设乙同学的平均成绩为x ,则8889909192905x ++++==所以乙同学成绩的方差()()()()()2222221889089909090919092905s ⎡⎤=-+-+-+-+-⎣⎦()14101425=++++=所以乙同学成绩的方差为2点睛:方差体现了数据的离散程度,茎叶图中都保留了原始数据,因此可以从茎叶图中直接观察来比较方差的大小.要熟练掌握方差的计算公式.本题主要考查了简单的概念和计算,属于简单题.20.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12 【解析】 分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.三、解答题21.(1)0.5 2.3y x =+;(2)6800元. 【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程; (2)将9x =代入即可预测. 【详解】解:(1)由表可得:123456747++++++==x ,2.93.3 3.64.4 4.85.2 5.9 4.37y ++++++==,又77211134.4,140i ii i i x yx ====∑∑,71722217134.474 4.30.5140747i ii i i x y x yb x x==--⨯⨯∴===-⨯-∑∑4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元. 【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题. 22.(1)0.36 6.24y x =+;(2)8.76万吨. 【分析】(1)由题意求得知 3.5t =,7.5=y ,()62117.5ii tt=-=∑,运用公式求得b ,代入可求得y 关于t 的线性回归方程.(2)由(1)得的线性回归方程,代入年份代码7t =计算,可预测2020年该地区小龙虾的年产量. 【详解】(1)由题知 3.5t =,7.5=y ,()62117.5ii tt=-=∑,()()()616216.30.3617.5ˆiii i i t t y y bt t==--===-∑∑, 又 6.24=-=a y bt .所以,y 关于t 的线性回归方程为0.36 6.24y x =+.(2)由(1)得,当年份为2020年时,年份代码7t =,此时0.367 6.248.76=⨯+=y .所以,可预测,2020年该地区小龙虾的年产量为8.76万吨. 【点睛】本题考查线性回归方程的求解,利用线性回归方程对总体进行估计,属于中档题. 23.(1)70%,55%;(2)列联表见解析,有95%的把握认为产品质量高与新设备有关;(3)471天方. 【分析】(1)根据旧设备所生产的产品质量指标值的频率分布直方图中后3组的频率之和即为旧设备所生产的产品的优质品率,根据新设备所生产的产品质量指标值的频数分布表即可估计新设备所生产的产品的优质品率;(2)根据题目所给的数据填写22⨯列联表,计算K 的观测值2K ,对照题目中的表格,得出统计结论;(3)根据新设备所生产的产品的优质品率,分别计算1000件产品中优质品的件数和合格品的件数,得到每天的纯利润,从而计算出至少需要生产多少天方可以收回设备成本. 【详解】 解:(1)估计新设备所生产的产品的优质品率为:3025150.770%100++==,估计旧设备所生产的产品的优质品率为:()50.060.030.020.5555%⨯++==. (2)由列联表可得,()220030554570 4.8 3.84175125100100K ⨯⨯-⨯==>⨯⨯⨯, ∴有95%的把握认为产品质量高与新设备有关. (3)新设备所生产的产品的优质品率为0.7∴每台新设备每天所生产的1000件产品中,估计有10000.7700⨯=件优质品, 有1000700300-=件合格品.∴估计每台新设备一天所生产的产品的纯利润为700230011700⨯+⨯=(元). 8000001700471÷≈(天),∴估计至少需要生产471天方可以收回设备成本. 【点睛】本题考查了独立性检验的应用问题,考查了频率分布直方图,也考查了计算能力的应用问题,属于中档题.24.(1) 1.4518.7y x =-+;(2)3x =. 【分析】(1)计算出x 和y 的值,将表格中的数据代入最小二乘法公式,求得b 和a 的值,进而可求得y 关于x 的回归方程;(2)由题意可得20.050.3 1.5z x x =-++,利用二次函数的基本性质可求得z 的最大值及其对应的x 值. 【详解】(1)设y 关于x 的回归直线方程为y bx a =+, 由表中数据得24681065x ++++==,16139.57 4.5105y ++++==,所以22222221641369.58710 4.556101.4524681056b ⨯+⨯+⨯+⨯+⨯-⨯⨯==-++++-⨯,()10 1.45618.7a =--⨯=.所以y 关于x 的回归直线方程为 1.4518.7y x =-+;(2)()()221.4518.70.05 1.7517.20.050.3 1.5z y w x x x x x =-=-+--+=-++,当()0.3320.05x =-=⨯-时,二次函数20.050.3 1.5z x x =-++取得最大值,即预测当3x =时,小王销售一辆该型号汽车所获得的利润z 最大. 【点睛】本题考查利用最小二乘法求回归直线方程,同时也考查了利用回归直线方程对总体数据进行估计,考查计算能力,属于中等题. 25.(1)有把握;(2)1ˆ84yx =-,11%. 【分析】(1)根据列联表,利用公式计算2K ,对照附表得出结论;(2)计算x 、y ,求出回归系数,写出线性回归方程,利用方程计算76x =时ˆy的值. 【详解】(1)根据题意,计算22100(45201025)8.1297.89770305545K ⨯⨯-⨯=≈>⨯⨯⨯; 所以有99.5%的把握认为“是否佩戴口罩与年龄有关”; (2)计算1105(7065635352454032)82x =⨯+++++++=,141(10.57.57.5 5.5 4.5 3.5 1.50.5)88y =⨯+++++++=; 所以122211054124548128ˆ1054232568()2ni ii nii x ynxy bxnx ==--⨯⨯===-⨯-∑∑; 411105ˆˆ8842ay bx =-=-⨯=-; 所以y 关于x 的线性回归方程是1ˆ84yx =-, 计算76x =时,1ˆ768114y =⨯-=, 可以预测该医院76岁确诊患者中的重症比例为11%. 【点睛】本题考查了列联表与独立性检验的应用问题,也考查了线性回归方程的应用问题,是中档题.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
-------------------------------------------------------------------奋斗没有终点任何时候都是一个起点----------------------------------------------------- 信达 2009年龙泉中学高一数学必修三《统计》单元测试
(满分:100分时间:90分钟) 一、选择题:(本大题共10小题,每小题4分,共40分) 1.某学校为了了解高一年级学生对教师教学的意见,打算从高一年级2007名学生中抽取50
名进行抽查,若采用下面的方法选取:先用简单随机抽样从2007人中剔除7人,剩下2000人再按系统抽样的方法进行,则每人入选的机会() A.不全相等B.均不相等C.都相等D.无法确定 2.有20位同学,编号从1至20,现在从中抽取4人作问卷调查,用系统抽样方法确定所抽的编号为( ) A.5,10,15,20 B.2,6,10,14C.2,4,6,8 D.5,8,11,14 3.某公司在甲、乙、丙、丁四个地区分别有150个、120个、180个、150个销售点,公司为了调查产品销售的情况,需从这600个销售点中抽取一个容量为100的样本,记这项调查为(1);在丙地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务情况,记这项调查为(2)。则完成(1)、(2)这两项调查宜采用的抽样方法依次是() A.分层抽样法,系统抽样法B.分层抽样法,简单随机抽样法 C.系统抽样法,分层抽样法D.简单随机抽样法,分层抽样法
4.已知两组样本数据nxxx,......,21的平均数为h,myyy,......,21的平均数为k,则把两组数据合并成一组以后,这组样本的平均数为() A.2khB.nmmknhC.nmmhnkD.nmkh 5.下列说法中,正确的个数是() (1)在频率分布直方图中,中位数左边和右边的直方图的面积相等。 -------------------------------------------------------------------奋斗没有终点任何时候都是一个起点----------------------------------------------------- 信达 (2)平均数是频率分布直方图的“重心”。 (3)如果一组数中每个数减去同一个非零常数,则这一组数的平均数改变,方差不改变。 (4)一个样本的方差s2=201[(x1一3)2+-(X2—3)2+…+(Xn一3)2],则这组数据等总和等于60. (5)数据123,,,...,naaaa的方差为2,则数据1232,2,2,...,2naaaa的方差为24 A.5B.4C.3D.2 6.在下列各图中,每个图的两个变量具有相关关系的图是()
(1)(2)(3)(4) A.(1)(2)B.(1)(3) C.(2)(4)D.(2)(3) 7.下表是某小卖部一周卖出热茶的杯数与当天气温的对比表: 气温/℃ 18 13 10 4 -1 杯数 24 34 39 51 63 若热茶杯数y与气温x近似地满足线性关系,则其关系式最接近的是()
A.6yxB.42yxC.260yxD.378yx 8.根据某水文观测点的历史统计数据,得到某条河流水位的频率分布直方图如下.从图中可以看出,该水文观测点平均至少一百年才遇到一次的洪水的最低水位是() A.48米 B.49米 C.50米 D.51米
9.由小到大排列的一组数据:54321,,,,xxxxx,其中每个数据都小于2,则样本 1,2x,5432,,,xxxx
的中位数可以表示为()
频率组距
0.5% 1% 2% 水位(米) 30 31 32 33 48 49 50 51 -------------------------------------------------------------------奋斗没有终点任何时候都是一个起点-----------------------------------------------------
信达 A.232xxB.212xxC.225xD.2
43
xx
10.图l是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为1A、2A、…、mA(如2A表示身高(单位:cm)在[150,155)内的学生人数).图2是统计 图l中身高在一定范围内学生人数的一个 算法流程图.现要统计身高在 160~180cm(含160cm,不含180cm) 的学生人数,那么在流程图中的判断框 内应填写的条件是() A.9iB.8i C.7iD.6i
二、填空题:(本大题共5小题,每小题4分,共20分) 11.管理人员从一池塘内捞出30条鱼,做上标记后放回池塘。10天后,又从池塘内捞出50条 鱼,其中有标记的有2条。根据以上数据可以估计该池塘内共有 条鱼。
12.某校高中部有三个年级,其中高三有学生1000人,现采用分层抽样法抽取一个容量为185的
样本,已知在高一年级抽取了75人,高二年级抽取了60人,则高中部共有__ __学生。 13已知200辆汽车通过某一段公路时的时速 的频率分布直方图如右图所示,则时速在
[60,70]的汽车大约有_________辆.
14.已知x与y之间的一组数据为 x 0 1 2 3
y 1 3 5-a 7+a
则y与x的回归直线方程abxy必过定点______
15.已知样本9,10,11,,xy的平均数是10,标准差是2,则xy 三、解答题:(本大题分3小题共40分) 16.(本题13分)在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)
分组 频数 [1.301.34), 4
时速(km) 0 01 0 02 0 03 0 04 频率 组距 40 50 60 70 80 -------------------------------------------------------------------奋斗没有终点任何时候都是一个起点----------------------------------------------------- 信达 共有100个数据,将数据分组如右表: (1)画出频率分布表,并画出频率分布直方图;
(2)估计纤度落在[1.381.50),中的概率及纤度小于1.40的概率是多
少? (3)从频率分布直方图估计出纤度的众数、中位数和平均数.
17.(本题13分)在2007全运会上两名射击运动员甲、乙在比赛中打出如下成绩: 甲:9.4,8.7,7.5,8.4,10.1,10.5,10.7,7.2,7.8,10.8;
乙:9.1,8.7,7.1,9.8,9.7,8.5,10.1,9.2,10.1,9.1; (1)用茎叶图表示甲,乙两个成绩;并根据茎叶图分析甲、乙两人成绩;
(2)分别计算两个样本的平均数x和标准差s,并根据计算结果估计哪位运动员的成绩比较稳定。
[1.341.38), 25 [1.381.42), 30 [1.421.46), 29 [1.461.50), 10 [1.501.54), 2 合计 100 -------------------------------------------------------------------奋斗没有终点任何时候都是一个起点-----------------------------------------------------
信达 18.(本题14分)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量(x吨)与 相应的生产能耗y(吨)标准煤的几组对照数据: x 3 4 5 6
y 2.5 3 4 4.5
(1)请画出上表数据的散点图; (2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程abxyˆ; (3)已知该厂技术改造前100吨甲产品能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技术改造前降低多少吨标准煤?
(参考:用最小二乘法求线性回归方程系数公式1221ˆniiiniixynxybxnx,ˆaybx)
2009年龙泉中学高一数学必修三《统计》单元测试参考答案 一、选择题:CABBA,DCCCB
二、填空题:11、75012、370013、8014、)4,23(15、96 三、解答题: 16.(Ⅰ) 分组 频数 频率
1.301.34,
4 0.04
1.341.38,
25 0.25
1.381.42,
30 0.30
1.421.46,
29 0.29
样本数据
频率/组距
1.31.31.31.41.41.51.5