高中数学 第一章 统计测评(A卷)北师大版必修3
最新北师大版高中数学必修三第一章《统计》测试卷(有答案解析)

一、选择题1.某商场为了了解毛衣的月销售量y(件)与月平均气温x(C︒)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:︒171382月平均气温x C月销售量y(件)24334055由表中数据算出线性回归方程y bx a=+中的2b=-,气象部门预测下个月的平均气温为6C︒,据此估计该商场下个月毛衣销售量约为()A.58件B.40件C.38件D.46件2.为了了解某同学的数学学习情况,对他的6次数学测试成绩进行统计,作出的茎叶图如图所示,则下列关于该同学数学成绩的说法正确的是( )A.中位数为83 B.众数为85 C.平均数为85 D.方差为193.如图1为某省2019年1~4月快递业务量统计图,图2是该省2019年1~4月快递业务收入统计图,下列对统计图理解错误的是( )A.2019年1~4月的业务量,3月最高,2月最低,差值接近2000万件B.2019年1~4月的业务量同比增长率超过50%,在3月最高C.从两图来看2019年1~4月中的同一个月快递业务量与收入的同比增长率并不完全一致D.从1~4月来看,该省在2019年快递业务收入同比增长率逐月增长4.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()A .成绩B .视力C .智商D .阅读量5.已知某样本的容量为50,平均数为70,方差为75.现发现在收集这些数据时,其中的两个数据记录有误,一个错将80记录为60,另一个错将70记录为90.在对错误的数据进行更正后,重新求得样本的平均数为x ,方差为2s ,则( ) A .270,75x s =< B .270,75x s => C .270,75x s ><D .270,75x s <>6.某赛季甲、乙两名篮球运动员每场比赛得分用茎叶图表示,茎叶图中甲得分的部分数据丢失(如图),但甲得分的折线图完好,则下列结论正确的是( )A .甲得分的极差是11B .乙得分的中位数是18.5C .甲运动员得分有一半在区间[]20,30上D .甲运动员得分的平均值比乙运动员得分的平均值高7.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.58.图1是某学习小组学生数学考试成绩的茎叶图,1号到16号的同学的成绩依次为1A ,216,,A A ⋯,图2是统计茎叶图中成绩在一定范围内的学生情况的程序框图,那么该程序框图输出的结果是( )A .10B .6C .7D .169.为了了解我校今年准备报考飞行员的学生的体重情况,将所得的数据整理后,画出了频率分布直方图(如图),已知图中从左到右的前3个小组的频率之比为1:2:3,第2小组的频数为12,则抽取的学生总人数是( )A .24B .48C .56D .6410.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()01nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变11.为了考察两个变量x 和y 之间的线性相关性,甲.乙两个同学各自独立地做10次和15次试验,并且利用线性回归方法,求得回归直线分别为l1和l2.已知在两个人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t.那么下列说法正确的是()A.直线l1和l2有交点(s,t)B.直线l1和l2相交,但是交点未必是点(s,t)C.直线l1和l2由于斜率相等,所以必定平行D.直线l1和l2必定重合12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,若将学生按成绩由低到高编为1-45号,再用系统抽样方法从中抽取9人,则其中成绩在区间[120,135]上的学生人数是()A.4 B.5 C.6 D.7二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.如图是某地区2018年12个月的空气质量指数以及相比去年同期变化幅度的数据统计图表,根据图表,下面叙述正确的是______.①2月相比去年同期变化幅度最小,3月的空气质量指数最高;②第一季度的空气质量指数的平均值最大,第三季度的空气质量指数的平均值最小;③第三季度空气质量指数相比去年同期变化幅度的方差最小;④空气质量指数涨幅从高到低居于前三位的月份为6、8、4月.15.福利彩票“双色球”中红色球由编号为01,02,…,33的33个个体组成,某彩民利用下面的随机数表(下表是随机数表的第一行和第二行)选取6个红色球,选取方法是从随机数表中第1行的第6列和第7列数字开始,由左到右依次选取两个数字,则选出来的第3个红色球的编号为______.49 54 43 54 82 17 37 93 23 28 87 35 20 56 43 84 26 34 91 6457 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7616.某学校高一年级男生人数占该年级学生人数的45%,在一次考试中,男、女生平均分数依次为72、74,则这次考试该年级学生的平均分数为__________.17.某高中有高一学生320人,高二学生400人,高三学生360人.现采用分层抽样调查学生的视力情况.已知从高一学生中抽取了8人,则三个年级一共抽取了__________人。
北师大版高中数学必修三第一章《统计》测试卷(包含答案解析)(1)

一、选择题1.某班统计一次数学测验的平均分与方差,计算完毕才发现有位同学的分数还未录入,只好重算一次.已知原平均分和原方差分别为x ,2s ,新平均分和新方差分别为1x ,21s ,若此同学的得分恰好为x ,则( )A .1x x =,221s s = B .1x x =,221s s < C .1x x =,221s s >D .1x x <,221s s =2.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,83.采用系统抽样的方法从400人中抽取20人做问卷调查,为此将他们随机编号为1,2,3…,400.适当分组后在第一组采用随机抽样的方法抽到的号码为5,则抽到的20人中,编号落入区间[201,319]内的人员编号之和为( ) A .600B .1225C .1530D .18554.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是 A .中位数 B .平均数 C .方差D .极差5.根据表中提供的全部数据,用最小二乘法得出y 关于x 的线性回归方程是9944y x =+,则表中m 的值为( )A .26B .27C .28D .296. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日7.下图是某公司2018年1月至12月空调销售任务及完成情况的气泡图,气泡的大小表示完成率的高低,如10月份销售任务是400台,完成率为90%,则下列叙述不正确的是( )A .2018年3月的销售任务是400台B .2018年月销售任务的平均值不超过600台C .2018年第一季度总销售量为830台D .2018年月销售量最大的是6月份 8.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .39.汽车的“燃油效率”是指汽车每消耗1升汽油行驶的里程,下图描述了甲、乙、丙三辆汽车在不同速度下的燃油效率情况. 下列叙述中正确的是( )A.消耗1升汽油,乙车最多可行驶5千米B.以相同速度行驶相同路程,三辆车中,甲车消耗汽油最多C.甲车以80千米/小时的速度行驶1小时,消耗10升汽油D.某城市机动车最高限速80千米/小时. 相同条件下,在该市用丙车比用乙车更省油10.已知x,y的取值如表:x 2678y若x,y之间是线性相关,且线性回归直线方程为,则实数a的值是A.B.C.D.11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为A.12 B.14 C.16 D.1812.从存放号码分别为1,2, ,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是()A.0.53 B.0.5 C.0.47 D.0.37二、填空题13.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____14.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..15.已知数据(1,2,3,4,5)i x i =的平均值为a ,数列2{()}i x a -为等差数列,且3||0.1x a -=________.16.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.17.某公司的广告费支出x 与销售额y (单位:万元)之间有下列对应数据:由资料显示y 对x 呈线性相关关系。
北师大版高中数学必修三单元测评:第一章统计(A卷)(含解析).docx

单元测评统计(A卷)(时间:90分钟满分:120分)第Ⅰ卷(选择题,共50分)一、选择题:本大题共10小题,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的,将答案填在指定答题栏内.1.下列调查方式合适的是()A.要了解一批灯泡的使用寿命,采用普查方式B.要了解收看中央电视台的“法制报道”栏目的情况,采用普查方式C.为了保证“天宫一号”太空舱发射成功,对重要零件采取抽查方式D.要了解外国人对“上海世博会”的关注度,可采用抽查方式答案:D2.某班的78名同学已编号1,2,3,…,78,为了解该班同学的作业情况,老师收取了学号能被5整除的15名同学的作业本,这里运用的抽样方法是()A.简单随机抽样法B.系统抽样法C.分层抽样法D.抽签法答案:B3.容量为100的样本数据按从小到大的顺序分为8组,如下表:组号 1 2 3 4 5 6 7 8 频数1013x141513129第3组的频数与频率分别是( ) A .14和0.14 B .0.14和14 C.114和0.14D.13和114解析:频数为100-(10+13+14+15+13+12+9)=14,频率为14100=0.14.答案:A4.一次选拔运动员,测得7名选手的身高(单位:cm)分布茎叶图如图,记录的平均身高为177 cm ,有一名候选人的身高记录不清楚,其末位数为x ,那么x 的值是( )A .5B .6C .7D .8解析:设这名候选人的身高为m ,则180+181+170+173+178+179+m 7=177. 解得m =178.∴x =8. 答案:D5. 如图是某学校抽取的学生体重的频率分布直方图,已知图中从左到右的前3个小组的频率之比为1∶2∶3,第2小组的频数为10,则抽取的学生人数为( )A .20B .30C .40D .50解析:前3组的频率之和等于1-(0.012 5+0.037 5)×5=0.75,第2小组的频率是0.75×21+2+3=0.25,设样本容量为n ,则10n =0.25,即n =40.答案:C6.已知两个变量x ,y 之间具有线性相关关系,试验测得(x ,y )的四组值分别为(1,2),(2,4),(3,5),(4,7),则y 与x 之间的回归直线方程为( )A .y =0.8x +3B .y =-1.2x +7.5C .y =1.6x +0.5D .y =1.3x +1.2解析:利用排除法.∵x =14(1+2+3+4)=2.5,y =14(2+4+5+7)=4.5, 由于回归直线y =bx +a 必过定点(2.5,4.5),故排除A ,D. 又由四组数值知y 随x 的增大而增大,知b >0,排除B. 答案:C7.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差是( )A .3.5B .-3C .3D .-0.5解析:少输入90,9030=3,平均数少3,求出的平均数减去实际的平均数等于-3.答案:B8.为了稳定市场,确保农民增收,某农产品3月以后的每月市场收购价格与其前三个月的市场收购价格有关,并使其与前三个月的市场收购价格之差的平方和最小,下表列出的是该产品今年前六个月的市场收购价格:( )月份 1 2 3 4 5 6 7 价格(元/担)687867717270则前七个月该产品的市场收购价格的方差为 A.757 B.767 C .11D.787解析:设7月份该产品的市场收购价格为a ,由题意得(a -71)2+(a -72)2+(a -70)2值最小时a =71+72+703=71,前七个月该产品的市场收购价格先各减去71后得:-3,7,-4,0,1,-1,0.所得数据的平均数恰好为0,方差为s 2=17[(-3)2+72+(-4)2+0+1+1+0-7×02]=767.答案:B9.已知数据x 1,x 2,x 3的中位数为k ,众数为m ,平均数为n ,方差为p ,则下列说法中,错误的是( )A .数据2x 1,2x 2,2x 3的中位数为2kB .数据2x 1,2x 2,2x 3的众数为2mC .数据2x 1,2x 2,2x 3的平均数为2nD.数据2x1,2x2,2x3的方差为2p解析:当数据由x1,x2,x3变为2x1,2x2,2x3时,其中位数、众数、平均数也变为原来的2倍,但是其方差应变为原来的4倍.故数据2x1,2x2,2x3的方差为4p.答案:D10.为了调查利群超市的营业情况,下表是利群超市五月份一周的利润情况记录.日期14日15日16日17日18日19日20日当日利润0.200.170.230.210.230.180.25 (万元)根据上表你估计利群超市今年五月份的总利润是()A.6.51万元B.6.4万元C.1.47万元D.5.88万元解析:根据这一周的记录可以求得每天的平均利润为:0.20+0.17+0.23+0.21+0.23+0.18+0.257=0.21(万元),故五月份的总利润为:0.21×31=6.51(万元).答案:A第Ⅱ卷(非选择题,共70分)二、填空题:本大题共4小题,每小题5分,共20分.将答案填在题中横线上.11.某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆,现用分层抽样的方法抽取46辆进行检验.这三种型号的轿车依次抽取__________辆,__________辆,__________辆.解析:各种型号的轿车差别较大,可用分层抽样法抽取,抽取比例为46∶(1 200+2 000+6 000)=1∶200.所以这三种型号的轿车依次应抽取6辆,30辆,10辆.答案:6 30 1012.为了解某校教师使用多媒体进行教学的情况,采用简单随机抽样的方法,从该校200名授课教师中抽取20名教师,调查了他们上学期使用多媒体进行教学的次数,结果用茎叶图表示如图,据此可估计该校上学期200名教师中,使用多媒体进行教学的次数在[15,25)内的人数为__________.解析:由茎叶图知,抽取的20名教师中使用多媒体进行教学的次数在[15,25)内的人数为6,频率为620,故200名教师中使用多媒体进行教学的次数在[15,25)内的人数为620×200=60.答案:6013.某市高三数学抽样考试中,对90分以上(含90分)的成绩进行统计,其频率分布图如图所示,若130~140分数段的人数为90,则90~100分数段的人数为__________.解析:设总人数为n ,则90n =0.05,故n =1 800,故90~100分数段的人数为1 800×0.45=810.答案:81014.调查了某地若干户家庭的年收入x (单位:万元)和年饮食支出y (单位:万元),调查显示年收入x 与年饮食支出y 具有线性相关关系,并由调查数据得到y 对x 的回归直线方程:y =0.254x +0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加__________万元.解析:本题考查了对线性回归知识的理解和应用.回归直线方程中的斜率就是平均增长率.答案:0.254三、解答题:本大题共4小题,满分50分.解答应写出文字说明、证明过程或演算步骤.15.(12分)某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量(单位:kg),分别记录,抽查数据如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110. (1)这种抽样方法是哪一种?(2)估计甲、乙两车间包装的肥料重量的平均值与方差,并说明哪个车间产品较稳定?解:(1)这种抽样方法是系统抽样;(2分)(2)x 甲=102+101+99+98+103+98+997=100(kg), s 2甲=17[(102-100)2+(101-100)2+(99-100)2+(98-100)2+(103-100)2+(98-100)2+(99-100)2]≈3.428 6(kg 2),(6分)x 乙=110+115+90+85+75+115+1107=100(kg), s 2乙≈228.57(kg 2),因为x 甲=x 乙,s 2甲<s 2乙,所以甲车间产品较稳定.(12分)16.(12分)一汽车厂生产A ,B ,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):轿车A 轿车B 轿车C 舒适型 100 150 x 标准型300450600按类用分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆.(1)求z 的值;(2)用分层抽样的方法在C 类轿车中抽取一个容量为5的样本,应如何抽取?解:(1)设该厂本月生产轿车n 辆, 由题意,得50n =10100+300,所以n =2 000,则z =2 000-100-300-150-450-600=400.(6分) (2)设所抽样本中有m 辆舒适型轿车,因为要用分层抽样的方法在C 类轿车中抽取一个容量为5的样本,所以4001 000=m5,解得m =2,即在C 类轿车中抽取2辆舒适型轿车,3辆标准型轿车.(12分) 17.(12分)某零售店近五个月的销售额和利润额资料如下表:商店名称 A B C D E 销售额x /千万 3 5 6 7 9 利润额y /百万元23345(1)画出散点图.观察散点图,说明两个变量有怎样的相关关系; (2)用最小二乘法计算利润额y 关于销售额x 的回归直线方程;(3)当销售额为4(千万元)时,利用(2)的结论估计该零售店的利润额(百万元).⎣⎢⎢⎢⎡⎦⎥⎥⎥⎤参考公式:b =∑i =1n(x i-x )(y i-y )∑i =1n(x i-x )2,a =y -b x 解:(1)散点图如下. 两个变量呈线性相关关系.(4分)(2)设回归直线的方程是y =bx +a . 由题中的数据可知y =3.4,x =6.所以b =∑i =1n(x i -x )(y i -y )∑i =1n(x i -x )2=-3×(-1.4)+(-1)×(-0.4)+1×0.6+3×1.69+1+1+9=1020=12.a =y -b x =3.4-12×6=0.4.所以利润额y 关于销售额x 的回归直线方程为y =0.5x +0.4.(8分) (3)由(2)知,当x =4时,y =0.5×4+0.4=2.4,所以当销售额为4千万元时,可以估计该店的利润额为2.4百万元.(12分)18.(14分)在某中学举行的信息知识竞赛中,将高二年级两个班的参赛学生成绩(得分均为整数)进行整理后分成五组,绘制出如图所示的频率分布直方图.已知图中从左到右的第一、第三、第四、第五小组的频率分别是0.30,0.15,0.10,0.05,第二小组的频数是40.(1)求第二小组的频率,并补全这个频率分布直方图;(2)求这两个班参赛的学生人数是多少?(3)这两个班参赛学生的成绩的中位数应落在第几小组内?(不必说明理由)解:(1)因为各小组的频率之和为1.00,第一、三、四、五小组的频率分别是0.30,0.15,0.10,0.05,所以第二小组的频率为1.00-(0.30+0.15+0.10+0.05)=0.40.(3分)因为第二小组的频率为0.40,所以落在59.5~69.5内的第二小组的小长方形的高=频率组距=0.4010=0.04,由此可补全频率分布直方图(如图阴影部分所示).(6分)(2)设高二年级两个班参赛的学生人数为x 人,因为第二小组的频数为40,频率为0.40,所以40x =0.40.解得x =100(人).所以高二年级两个班参赛的学生人数为100.(12分)(3)高二年级两个班参赛学生的成绩的中位数应落在第二小组内.(14分)。
新北师大版高中数学必修三第一章《统计》测试卷(含答案解析)

一、选择题1.一组数据的平均数为m ,方差为n ,将这组数据的每个数都加上(0)a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均不变 B .这组新数据的平均数为am C .这组新数据的方差为2a nD .这组新数据的方差不变2.一组数据的平均数为x ,方差为2s ,将这组数据的每个数都乘以()0a a >得到一组新数据,则下列说法正确的是( ) A .这组新数据的平均数为x B .这组新数据的平均数为a x + C .这组新数据的方差为2asD .这组新数据的标准差为2a s3.在一个容量为5的样本中,数据均为整数,已测出其平均数为8,但墨水污损了后面两个数据,其中一个数据的十位数字1未污损,即5,7,8, ,那么这组数据的方差2s 可能的最大值是( ) A .185B .18C .36D .64.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .35.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3OP (O 为原点)的斜率的取值范围是3333(,)(,)22-∞-. A .①②③B .①③④C .①②④D .②③④6.为了解某社区居民的家庭年收入所年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x (万元)8.28.610.011.311.9支出y (万元)6.27.58.0 8.59.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中ˆˆˆ0.76,ba y bx ==-,据此估计,该社区一户收入为15万元家庭年支出为( ) A .11.4万元B .11.8万元C .12.0万元D .12.2万元7.某林场有树苗30000棵,其中松树苗4000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为( ) A .30B .25C .20D .158.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用(万元)4235销售额(万元)49263954根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为A .63.6万元B .65.5万元C .67.7万元D .72.0万元9.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是 A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.某校高中三个年级共有学生1050人,其中高一年级300人,高二年级350人,高三年级400人.现要从全体高中学生中通过分层抽样抽取一个容量为42的样本,那么应从高三年级学生中抽取的人数为 A .12B .14C .16D .1812.根据如下样本数据 x 3 4 5 6 7 8 y﹣4.0﹣2.50.5﹣0.52.03.0得到的回归方程为y bx a =+,则( ) A .a >0,b <0B .a >0,b >0C .a <0,b <0D .a <0,b >0二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.如图是甲、乙两人在10天中每天加工零件个数的茎叶图,若这10天甲加工零件个数的中位数为a ,乙加工零件个数的平均数为b ,则a b +=______.15.为调查某高校学生对“一带一路”政策的了解情况,现采用分层抽样的方法抽取一个容量为500的样本.其中大一年级抽取200人,大二年级抽取100人.若其他年级共有学生2000人,则该校学生总人数是_______..16.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.17.已知由样本数据点集合(){},|1,2,3,,i i x y i n =,求得的回归直线方程为1.230.08y x Λ=+ ,且4x =。
人教A版高中数学必修三试卷北师版第一章统计单元检测(附答案).docx

数学北师版必修3第一章统计单元检测(时间:90分钟,满分:100分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.在一次数学测试中,有考生1 000名,现想了解这1 000名考生的数学成绩,从中抽取100名考生的数学成绩进行统计分析,在这个问题中,总体是指( ).A.1 000名考生B.1 000名考生的数学成绩C.100名考生的数学成绩D.100名考生2.下列说法中不正确的是( ).A.系统抽样是先将差异明显的总体分成几小组,再进行抽取B.分层抽样是将差异明显的几部分组成的总体分成几层,然后进行抽取C.简单随机抽样是从个体无差异且个数较少的总体中逐个抽取个体D.系统抽样是从个体无差异且个数较多的总体中,将总体均分,再按事先确定的规则在各部分抽取3.有一个容量为80的样本,数据的最大值是140,最小值是51,组距为10,则可以分为( ).A.10组 B.9组 C.8组 D.7组4.某大学数学系共有本科生5 000人,其中一、二、三、四年级的人数比为4∶3∶2∶1,要用分层抽样的方法从所有本科生中抽取一个容量为200的样本,则应抽取三年级的学生人数为( ).A.80 B.40 C.60 D.20A.42% B.58% C.40% D.16%6.(2011西安一中月考,8)我市对上下班交通情况作抽样调查,在上下班时间各抽取12辆机动车,车辆行驶时速(单位:km/h)的茎叶图如下图:则上下班时间车辆行驶时速的中位数分别为( ).A.28与28.5 B.29与28.5C.28与27.5 D.29与27.57.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.则这种抽样方法是( ).A.简单随机抽样法 B.抽签法C.随机数表法 D.分层抽样法8.(2011山东省实验中学二模,文4)为了了解高三学生的数学成绩,抽取了某班60名学生的数学成绩,将所得数据整理后,画出其频率分布直方图如下图,已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在[80,100)之间的学生人数是( ).A.32 B.27 C.24 D.339.在某项体育比赛中,七位裁判为一选手打出的分数如下:90 89 90 95 93 94 93去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为( ).A.92,2 B.92,2.8C.93,2 D.93,2.810A.y=0.56x+997.4 B.y=0.63x-231.2C.y=50.2x+501.4 D.y=60.4x+400.7二、填空题(本大题共5小题,每小题5分,共25分.把答案填在题中的横线上)11.(2011湖北高考,文11)某市有大型超市200家、中型超市400家、小型超市1 400家.为掌握各类超市的营业情况,现按分层抽样方法抽取一个容量为100的样本,则应抽取中型超市______家.12.若施化肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归直线方程是y=4x+250,则当施化肥量为50 kg 时,可以预测小麦产量为__________ kg.13.(2011山东潍坊模拟训练题,文14)为了解某小区老年人在一天中锻炼身体的时间,随机调查了50人,根据调查数据,画出了锻炼时间在0~2小时的样本频率分布直方图(如图).则50人中锻炼身体的时间在区间[0.5,1.5)小时的人数是________.14.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是______、______.15.从一堆苹果中任取5个,称得它们的质量如下(单位:克):125 124 121 123 127则该样本标准差s=______(克).(用数字作答)三、解答题(本大题共2小题,共25分.解答时应写出文字说明、证明过程或演算步骤)16.(本小题满分10分)对甲、乙两名自行车手在相同条件下进行了6次测试,测得他(1)(2)分别求出甲、乙两名自行车手最大速度数据的平均数、标准差,并判断选谁参加比赛更合适.17.(本小题满分15分)以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)(2)求线性回归方程,并在散点图中画出回归直线;(3)根据(2)的结果估计房屋面积为150 m2时的销售价格.参考答案1.答案:B 总体是1 000名考生的数学成绩,样本是100名考生的数学成绩.2.答案:A 当总体中个体差异明显时,用分层抽样;当总体中个体无差异且个数较多时,用系统抽样;当总体中个体无差异且个数较少时,用简单随机抽样.所以A 不正确.3.答案:B 据题意:最大值与最小值的差为89,898.910=,故应分9组较合适. 4.答案:B 应抽取三年级的学生人数为200×210=40. 5.答案:A 样本中小于29的数据频数为1+1+3+3+18+16=42.所以小于29的数据大约占总体的42100×100%=42%. 6.答案:D 上班时间车辆行驶时速从小到大依次为:18,20,21,26,27,28,30,32,33,35,36,40,所以上班时间车辆行驶时速的中位数为2830292+=,同理可得下班时间车辆行驶时速的中位数为27.5. 7.答案:D 样本容量n =25+20=45,男生和女生的抽样比都是120,即按抽样比为120的分层抽样方法抽取样本.8.答案:D 设第一组至第六组的样本数据的频率分别为2x,3x,5x,6x,3x ,x ,则2x +3x +5x +6x +3x +x =1.∴x =120.成绩在[80,100)之间的频率为5x +6x =1120,人数为1120×60=33. 9. 答案:B 去掉一个最高分95与一个最低分89后,所剩的5个数分别为90,90,93,94,93, 所以90909394934609255x ++++===, 22222(9092)2(9392)(9492)14 2.855s ⨯-+⨯-+-===,故选B. 10.答案:A 利用公式51522150.565i ii i i x y x y b xx ==-==-∑∑,a =y -b x =997.4.∴回归直线方程为y =0.56x +997.4.11.答案:20 本题为分层抽样,所以应抽取中型超市的个数为400×1004002001400++=20.12.答案:450 当x =50时,y =4×50+250=450.13.答案:35 在区间[0.5,1.5)内的频率为(0.8+0.6)×0.5=0.7,人数为0.7×50=35.14.答案:45 46 甲组数据从小到大排序后,最中间的数是45,即甲组数据的中位数为45;乙组数据从小到大排序后,最中间的数是46,即乙组数据的中位数是46.15.答案:2 因为样本平均数x =15(125+124+121+123+127)=124,则样本方差s 2=15(12+02+32+12+32)=4,所以标准差s =2.16.答案:解:(1)画茎叶图如图所示,从这个茎叶图可以看出,乙的得分比较均匀,发挥比较稳定;乙的中位数是33.5,甲的中位数是33,因此乙的总体得分情况比甲好.(2)根据表中数据得x 甲=33,x 乙=33,s 甲≈3.96,s 乙≈3.56,比较可知,选乙参加比赛比较合适.17.答案:分析:(1)以房屋面积作为自变量,测得的销售价格为因变量作散点图;(2)利用定义求出线性回归方程;(3)利用线性回归方程估计.解:(1)数据对应的散点图如图所示:(2)x =109,y =23.2,()52=11570i i x x -=∑, ()()51308i ii x x y y =--=∑, 设所求的回归直线方程为y =bx +a ,则b=3081570≈0.196 2,a=y-b x=23.2-109×0.196 2=1.814 2,故所求回归直线方程为y=0.196 2x+1.814 2,回归直线如图所示.(3)据(2),当x=150时,销售价格的估计值为y=0.196 2×150+1.814 2=31.244 2. 所以房屋面积为150 m2时,销售价格约为31.244 2万元.。
必修3(北师大版)第一章 《统计》测试题

必修三 统计测试题一、选择题(每题只有一个正确答案,每小题5分,共12小题,60分)1.在2008年奥运会开幕之际,某网站想要调查北京市家庭的收入情况,在该问题中,总体是( B )A.北京市B.北京市的所有家庭的收入C.北京市的所有人口D.北京市的工薪阶层 1.解析 :所要研究对象的全体称为统计总体,简称总体,要调查某城市的所有家庭的收入,研究对象就是所有家庭的收入. 答案:B.2.某企业有职工150人,其中高级职称15人,中级职称45人,一般职员90人,现抽取30人进行分层抽样,则各职称人数分别为( B )A .5,10,15B .3,9,18C .3,10,17D .5,9,163. 从N 个编号中抽取n 个号码入样,若采用系统抽样方法进行抽取,则分段间隔应为( C )A .nN B .n C .⎥⎦⎤⎢⎣⎡n N D.1+⎥⎦⎤⎢⎣⎡n N 4. 有50件产品编号从1到50,现在从中抽取5件检验,用系统抽样确定所抽取的编号为( D )A .5,10,15,20,25B .5,15,20,35,40C .5,11,17,23,29D .10,20,30,40,505.用样本频率分布估计总体频率分布的过程中,下列说法正确的是( C )A .总体容量越大,估计越精确B .总体容量越小,估计越精确C .样本容量越大,估计越精确D .样本容量越小,估计越精确6.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则改样本的中位数、众数、极差分别是 ( A )( )A .46,45,56B .46,45,53C .47,45,56D .45,47,537.据报道,2012年7月2日,正阳县一女子在考驾照的路上不小心撞倒行人.对此,某网站对责任的界定进行了一个调查,结果如下:根据此调查结论,则“认为驾校和学员共同负责”者的频率为( )A.18B.14C.12D.137.解析:参与的人数为8000人, “认为驾校和学员共同负责”的频率为4000180002=.答案:C.8 .小波一星期的总开支分布图如图1所示,一星期的食品开支如图2所示,则小波一星期的鸡蛋开支占总开支的百分比为(C)( )A .30%B .10%C .3%D .不能确定9 .在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据都加2后所得数据,则A ,B 两样本的下列数字特征对应相同的是(D )A .众数B .平均数C .中位数D .标准差A.9%B.18%C.27%D.82% 10.解析:优秀的学生共9人,该班总人数为50人,故优秀率为918%50=. 答案:B.11.容量为20的样本数据,分组后的频数如下表则样本数据落在区间[10,40)的频率为( B )A .0.35B .0.45C .0.55D .0.6512.某地区某种病的发病人数呈上升趋势,统计近四年这种病的新发病人数的线性回归分析如下表所示:如果不加控制,仍按这个趋势发展下去,请预测从2000年初到2003年底的四年时间里,该地区这种病的新发病总人数约为( B )A.1167B.11676C.20987D.209812.解析:由上表可得: yˆ=94.7x -186623,当x 分别取2000,2001,2002,2003时,得估计值分别为:2777, 2871.7, 2966.4, 3061.1,则总人数约为2777+2871.7+2966.4+3061.1≈ 11676 答案:B. 二、填空题(每题5分,共4小题,满分20分)13 .一支田径运动队有男运动员56人,女运动员42人.现用分层抽样的方法抽取若干人,若抽取的男运动员有8人,则抽取的女运动员有_6_____人.14.由正整数组成的一组数据1x 、2x 、3x 、4x ,其平均数和中位数都是2,且标准差等于1,则这组数据为_1;1;3;3;________.(从小到大排列)15.采用简单随机抽样从含10个个体的总体中抽取一个容量为4的样本,个体 a 前两次未被抽到,第三次被抽到的概率为_101____________________解析 : 不论先后,被抽取的概率都是11016.则样本在区间[20,50)[60,70)⋃ 上的频率为__________________16.解析:首先可以求出20245423x =-----=,在区间[20,50)[60,70)⋃的样本个数为3+4+5+2=14,故频率为140.720=. 答案:0.7.三、解答题(共6小题,满分70分) 17.(本题满分10分)某学校对甲、乙两班的学习成绩进行抽样分析,各抽5 门功课,得到其平均分数分别如下: 甲:60,80,70,90,70 乙:80,60,70,80,75问:甲、乙两个班哪班平均成绩好?哪班的各门功课发展较平衡?17.解:甲班的各门平均成绩为:11(6080709070)745x =++++=乙班的各门平均成绩为:21(8060708075)735x =++++=甲班成绩的方差为:22222211(1464164)1045s =++++= 乙班成绩的方差为: 22222221(713372)565s =++++=由12x x >,2212S S >可知甲的平均成绩较好,乙的各门功课发展较平衡 18.(本题满分12分)有1个容量为100的样本,数据的分组及各组的频率如下:[12.5,15.5)频数 6; [15.5,18.5)频数16; [18.5,21.5) 频数18; [21.5,24.5)频数 22; [24.5,27.5)频数20; [27.5,30.5) 频数10; [30.5,33.5)频数 8.(1).列出样本的频率分布表(含累积频率); (2).画出频率分布直方图. 18.解:(1).样本的频率分布表如下:(2)频率分布直方图如图10—519.(本题满分12分)某学校选拔学生会主席,在5名参选者中选出1名,规定获胜者的条件如下: (1)在竞选中得票最多;(2)得票总数不低于总票数的一半.如果在计票中周小玉的数据不小心丢失,试根据统计数据回答下列问题:(1)请问:如果周小玉获胜,那么周小玉的得票数x 至少是多少?(2)如果赵琦获胜,求周小玉得票数x 的取值范围.19.解:(1).根据条件,如果周小玉获胜,则周小玉的得票数不低于总票数的一半,且票数最高:则必有:130010030602xx≥++++且300x>,解之得:490x ≥.即周小玉的得票数至少为490票;(2).根据条件,如果赵琦获胜,则赵琦的得票数不低于总票数的一半,且得票数最多,则必有:300130010030602300x x ⎧≥⎪++++⎨⎪>⎩,解之得110x ≤ 即周小玉的得票数取值范围是:0110x ≤≤,x N ∈. 20.(本题满分12分)如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:观察图形,回答下列问题:(1)79.589.5 这一组的频数、频率分别是多少?(2)估计这次环保知识竞赛分数的众数、中位数和平均数; (3)估计这次环保知识竞赛的及格率(60分及以上为及格)解析:(1)频率为:0.025100.25⨯=,频数:600.2515⨯=(2)众数在样本数据的频率分布直方图中就是最高矩形的中点横坐标5.7425.795.69=+;估计众数是75或74;对于中位数,由于样本中的个体有一半小于或等于中位数,因此在排列分布直方图中中位数左边和右边的直方图面积应该相等,由此估计样本中的中位数的大小。
北师大版高中数学必修三第一章《统计》测试题(答案解析)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量3.若一组数据12345,,,,x x x x x 的平均数为5,方差为2,则12323,23,23x x x ---,4523,23x x --的平均数和方差分别为( )A .7,-1B .7,1C .7,2D .7,84.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .675.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .6.一组数据中的每一个数据都乘2,再减去80,得到一组新数据,若求得新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是 A .81.2,4.4 B .40.6,1.1 C .48.8,4.4D .78.8,1.17.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下: 父亲身高x (cm )174176176176178儿子身高y (cm )175175176177177则y 对x 的线性回归方程为 A .y = x-1B .y = x+1C .y =88+12x D .y = 1768.某产品的广告费用x 与销售额y 的统计数据如下表: 广告费用x (万元) 2 3 4 5 销售额y (万元)25374454根据上表可得回归方程ˆˆˆy bx a =+中的ˆb为9.4,据此模型预报广告费用为6万元时销售额为( ) A .61.5万元 B .62.5万元C .63.5万元D .65.0万元9.若某中学高二年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数是( )A .90.5B .91.5C .90D .9110.PM2.5是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与PM2.5的浓度是否相关,现采集到某城市周一至周五某时间段车流量与PM2.5浓度的数据如下表: 时间周一 周二 周三周四 周五 车流量x (万辆) 100 102 108 114 116 浓度y (微克)7880848890根据上表数据,用最小二乘法求出y 与x 的线性回归方程是( )参考公式:121()()()niii ni i x x y y b x x ==--=-∑∑,a y b x =-⋅;参考数据:108x =,84y =;A .0.6274ˆ.2yx =+ B .0.7264ˆ.2y x =+ C .0.7164ˆ.1y x =+ D .0.6264ˆ.2y x =+ 11.设有一个直线回归方程为2 1.5y x =-,则变量x 增加一个单位时( ) A .y 平均增加1.5个单位 B .y 平均增加2个单位 C .y 平均减少1.5个单位 D .y 平均减少2个单位12.从存放号码分别为1,2,⋯,10的卡片的盒子中,有放回地取100次,每次取一张卡片并记下号码,统计结果如下:则取到号码为奇数的频率是( ) A .0.53B .0.5C .0.47D .0.37二、填空题13.为了了解一片经济林的生长情况,随机抽测了其中60株树木的底部周长(单位: cm ),所得数据均在区间[80,130]上,其频率分布直方图如图所示,则在抽测的60株树木中,有_______株树木的底部周长大于110cm .14.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.15.数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,若记数据1a ,2a ,3a ,⋅⋅⋅,2019a 的标准差为1σ,数据11S ,22S ,33S ,⋅⋅⋅,20192019S 的标准差为2σ,则12σσ=________ 16.一个车间为了规定工作原理,需要确定加工零件所花费的时间,为此进行了5次试验,收集数据如下: 零件数x (个) 15 20 30 40 50 加工时间y (分钟)6570758090由表中数据,求得线性回归方程0.66y x a =+,则估计加工70个零件时间为__________分钟(精确到0.1). 17.已知x ,y 的取值如下表: x 2 3 4 5 y2.23.85.56.5从散点图分析,y 与x 线性相关,且回归方程为y =1.46x +a ,则实数a 的值为________.18.数据1x ,2x ,…,n x 的平均数是3,方差是1,则数据15x -,25x -,…,5n x -的平均数和方差之和是__________.19.某超市统计了一个月内每天光顾的顾客人数,得到如图所示的频率分布直方图,根据该图估计该组数据的中位数为__________.20.已知某市A 社区35岁至45岁的居民有450人,46岁至55岁的居民有750人,56岁至65岁的居民有900人.为了解该社区35岁至65岁居民的身体健康状况,社区负责人采用分层抽样技术抽取若干人进行体检调查,若从46岁至55岁的居民中随机抽取了50人,试问这次抽样调查抽取的人数是________人.三、解答题21.某同学在生物研究性学习中,对春季昼夜温差大小与黄豆种子发芽多少之间的关系进行研究,于是他在4月份的30天中随机挑选了5天进行研究,且分别记录了每天昼夜温差与每天每100颗种子浸泡后的发芽数,得到如下资料:(1)从这5天中任选2天,若选取的是4月1日与4月30日的两组数据,请根据这5天中的另三天的数据,求出y 关于x 的线性回归方程y bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠? 附:回归直线的斜率和截距的最小二乘估计公式分别为:()()()1122211nniii i i i nniii i x x y y x y nx yb x x xnx====---==--∑∑∑∑,a y bx =-.22.假设关于某设备的使用年限x 和所支出的维修费用y (万元),有如下的统计资料:若由资料可知y 对x 呈线性相关关系,试求: (1)回归直线方程;(2)估计使用年限为10年时,维修费用约是多少?(参考:1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-)23.经销商小王对其所经营的某一型号二手汽车的使用年数(010)x x <≤与销售价格y (单位:万元/辆)进行整理,得到如下的对应数据:售价 1613 9.5 7 4.5(1)试求y 关于x 的回归直线方程;(2)已知每辆该型号汽车的收购价格为20.05 1.7517.2=-+w x x 万元,根据(1)中所求的回归方程,预测x 为何值时,小王销售一辆该型号汽车所获得的利润z 最大.附:回归方程ˆybx a =+中,1221ˆˆˆˆ,ni ii nii x ynx y b ay bx xnx -=-==--∑∑ 24.学生甲在一次试验中用显微镜观察某种环境下细菌的个数,发现时间x (分钟)时刻的细菌个数为y 个,统计结果如下:x 1 2 3 4 5 y23445(Ⅰ)在给出的坐标系中画出x ,y 的散点图,说明细菌个数和时间是正相关还是负相关.(Ⅱ)根据表格中的5组数据,求y 关于x 的回归直线方程ˆˆˆy bx a =+,并根据回归直线方程估计从实验开始,什么时刻细菌个数为12.参考公式:(1221ˆˆˆ,ni ii ni i x y nx yx n axby bx ====---∑∑) 25.某市举办了一次“诗词大赛”,分预赛和复赛两个环节,已知共有20000名学生参加了预赛,现从参加预赛的全体学生中随机地抽取100人的预赛成绩作为样本,得到如下的统计数据. 得分(百分[0,20)[20,40)[40,60)[60,80)[80,100]地抽取2人,求恰有1人预赛成绩优良的概率;(2)由样本数据分析可知,该市全体参加预赛学生的预赛成绩Z 服从正态分布()2,N μσ,其中μ可近似为样本中的100名学生预赛成绩的平均值(同一组数据用该组数据的中间值代替),且2361σ=.利用该正态分布,估计全市参加预赛的全体学生中预赛成绩不低于72分的人数;(3)预赛成绩不低于91分的学生将参加复赛,复赛规则如下: ①参加复赛的学生的初始分都设置为100分;②参加复赛的学生可在答题前自己决定答题数量n ,每一题都需要“花”掉一定分数来获取答题资格(即用分数来买答题资格),规定答第k 题时“花”掉的分数为()0.21,2,k k n =; ③每答对一题得2分,答错得0分;④答完n 题后参加复赛学生的最终分数即为复赛成绩.已知学生甲答对每道题的概率均为0.75,且每题答对与否都相互独立,则当他的答题数量n 为多少时,他的复赛成绩的期望值最大?参考数据:若()2~,Z N μσ,则() 6.827P Z μσμσ-<<+≈,()220.9545P Z μσμσ-<<+≈,()330.9973P Z μσμσ-<<+≈26.某校的一个社会实践调查小组,在对该校学生的良好“用眼习惯”的调查中,随机发放了120分问卷.对收回的100份有效问卷进行统计,得到如22⨯下列联表:(1)现按女生是否能做到科学用眼进行分层,从45份女生问卷中抽取了6份问卷,从这6份问卷中再随机抽取3份,并记其中能做到科学用眼的问卷的份数X ,试求随机变量X 的分布列和数学期望;(2)若在犯错误的概率不超过P 的前提下认为良好“用眼习惯”与性别有关,那么根据临界值表,最精确的P 的值应为多少?请说明理由.附:独立性检验统计量22()()()()()n ad bc K a b c d a c b d -=++++,其中n a b c d =+++.独立性检验临界值表:【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.3.D解析:D 【分析】根据平均数的性质,方差的性质直接运算可得结果. 【详解】令23(1,2,,5)i i y x i =-=1234555x x x x x x ++++==,1234523232323232310375x x x x x y x -+-+-+-+-∴==-=-=,(也可()(23)2()32537E y E x E x =-=-=⨯-=)()()()2y 232428D D x D x =-==⨯=故选:D 【点睛】本题主要考查方差及平均值的性质的简单应用,属于中档题.4.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.5.D解析:D 【解析】 【分析】 先计算,代入回归直线方程,可得,从而可求得结果.【详解】 因为,所以,代入回归直线方程可求得,所以,故选D. 【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.6.B解析:B 【分析】先设出原来的数据,然后设出现在的数据,找到两组数据的联系,即可. 【详解】设原来的数据为12,,....,n x x x ,每一个数据都乘以2,再减去80,得到新数据为 12280,280,...,280n x x x --- 已知()122...80 1.2n x x x nn+++-=,则81.240.62X == 方差为:224 4.4, 1.1σσ==,故选B . 【点睛】本道题目考查的是平均数和方差之间的关系,列出等式,探寻两组数据的联系,即可.7.C解析:C 【详解】试题分析:由已知可得176,176x y ==∴中心点为()176,176, 代入回归方程验证可知,只有方程y =88+12x 成立,故选C 8.C解析:C 【分析】先求出所给数据的平均数,得到样本中心点,根据回归直线经过样本中心点,求出ˆa,得到线性回归方程,把6x =代入即可求出答案. 【详解】 由题意知4235 3.54x +++==,44253754404y +++==, 则40ˆˆ9.4 3.57.1a y bx=-=-⨯=, 所以回归方程为9.4.1ˆ7yx =+, 则广告费用为6万元时销售额为9.467.163.5⨯+=, 故答案为C. 【点睛】本题考查了线性回归方程的求法与应用,属于基础题.9.A解析:A 【分析】共有8个数据,中位数就是由小到大中间两数的平均数,求解即可. 【详解】根据茎叶图,由小到大排列这8个数为84,85,89,90,91,92,93,95, 所以中位数为90+91=90.52,故选A. 【点睛】本题主要考查了中位数,茎叶图,属于中档题.10.B解析:B 【解析】 【分析】利用最小二乘法做出线性回归直线的方程的系数,写出回归直线的方程,得到结果. 【详解】 由题意,b=22222210078102801088411488116905108841001021081141165108⨯+⨯+⨯+⨯+⨯-⨯⨯++++-⨯=0.72,a=84﹣0.72×108=6.24, ∴y =0.72x+6.24, 故选:B . 【点睛】本题主要考查线性回归方程,属于难题.求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,nnii i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,ab ;④写出回归直线方程为ˆˆˆy bx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.11.C解析:C 【解析】 【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论. 【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.A解析:A【解析】分析:由题意结合统计表确定频数,然后确定频率即可.详解:由题意可知,取到卡片为奇数的频数为:1356181153++++=,取卡片的次数为100次,则取到号码为奇数的频率是530.53 100=.本题选择A选项.点睛:本题主要考查频率的定义及其应用等知识,意在考查学生的转化能力和计算求解能力.二、填空题13.18【分析】根据频率小矩形的面积小矩形的高组距底部求出周长大于110的频率再根据频数样本容量频率求出对应的频数【详解】由频率分布直方图知:底部周长大于110的频率为所以底部周长大于110的频数为(株解析:18【分析】根据频率=小矩形的面积=小矩形的高⨯组距底部,求出周长大于110cm的频率,再根据频数=样本容量⨯频率求出对应的频数.【详解】由频率分布直方图知:底部周长大于110cm的频率为(0.0200.010)100.3+⨯=,所以底部周长大于110cm的频数为600.318⨯=(株),故答案是:18.【点睛】该题考查的是有关频率分布直方图的应用,在解题的过程中,注意小矩形的面积表示的是对应范围内的频率,属于简单题目.14.【分析】先根据平均数计算出的值再根据方差的计算公式计算出这组数的方差【详解】依题意所以方差为故答案为【点睛】本小题主要考查平均数和方差的有关计算考查运算求解能力属于基础题解析:26 5【分析】先根据平均数计算出m的值,再根据方差的计算公式计算出这组数的方差.【详解】依题意12674,45m m ++++==.所以方差为()()()()()22222114244464745⎡⎤-+-+-+-+-⎣⎦[]126944955=+++=. 故答案为265. 【点睛】本小题主要考查平均数和方差的有关计算,考查运算求解能力,属于基础题.15.2【分析】根据等差数列性质分析两组数据之间关系再根据数据变化规律确定对应标准差变化规律即得结果【详解】因为数列是公差不为零的等差数列其前项和为所以因此即故答案为:2【点睛】本题考查等差数列和项性质以解析:2 【分析】根据等差数列性质分析两组数据之间关系,再根据数据变化规律确定对应标准差变化规律,即得结果. 【详解】因为数列{}n a 是公差不为零的等差数列,其前n 项和为n S ,所以111=+222n n n a a a a n S +=, 因此2112σσ=,即122σσ=故答案为:2 【点睛】本题考查等差数列和项性质以及数据变化对标准差的影响规律,考查综合分析求解能力,属中档题.16.7【解析】【分析】结合题意先求出线性回归方程然后再计算出结果【详解】由题意可得则线性回归方程为当时【点睛】本题考查了求线性回归方程然后求出估计结果需要掌握解题方法较为基础解析:7 【解析】 【分析】结合题意先求出线性回归方程,然后再计算出结果 【详解】 由题意可得1520304050315x ++++==6570758090765y ++++==,760.6631a ∴=⨯+,55.54a =,则线性回归方程为0.66 5.4ˆ55y x =+ 当70x =时,ˆ101.7y≈ 【点睛】本题考查了求线性回归方程,然后求出估计结果,需要掌握解题方法,较为基础17.—061【分析】根据所给条件求出把样本中心点代入回归直线方程可以得到关于的方程解出即可得到答案【详解】根据题意可得则这组数据的样本中心点是代入到回归直线方程故答案为【点睛】本题考查了线性回归方程解题解析:—0.61 【分析】根据所给条件求出x ,y ,把样本中心点()x y ,代入回归直线方程 1.4ˆ6ˆyx a +=,可以得到关于ˆa的方程,解出即可得到答案 【详解】 根据题意可得23453.54x +++== 2.2 3.8 5.5 6.54.54y +++==则这组数据的样本中心点是()3.54.5,代入到回归直线方程 1.4ˆ6ˆyx a += 4.5 1.46 3.ˆ5a∴⨯+= ˆ0.61a=- 故答案为0.61- 【点睛】本题考查了线性回归方程,解题的关键是线性回归方程一定过样本中心点,这是求解线性回归方程的步骤之一,是线性回归方程考查的常见题型,体现了回归直线方程与样本中心点的关联.18.3【解析】分析:由题意结合平均数方差的性质整理计算即可求得最终结果详解:由题意结合平均数和方差的性质可知:数据…的平均数为:方差为:则平均数和方差之和是点睛:本题主要考查均值的性质方差的性质等知识意解析:3 【解析】分析:由题意结合平均数、方差的性质整理计算即可求得最终结果. 详解:由题意结合平均数和方差的性质可知:数据15x -,25x -,…,5n x -的平均数为:532-=,方差为:()2111-⨯=, 则平均数和方差之和是213+=.点睛:本题主要考查均值的性质、方差的性质等知识,意在考查学生的转化能力和计算求解能力.19.75【解析】分析:由频率分布直方图算出各频率然后计算中位数详解:由图可知的频率为的频率为的频率为的频率为的频率为前两组频率前三组频率中位数在第三组设中位数为则解得故该组数据的中位数为点睛:本题考查了解析:75. 【解析】分析:由频率分布直方图算出各频率,然后计算中位数 详解:由图可知,10~20的频率为0.1420~30的频率为0.2430~40的频率为0.32 40~50的频率为0.2 50~60的频率为0.1前两组频率0.140.240.380.5=+=< 前三组频率0.140.240.320.70.5=++=>∴中位数在第三组设中位数为x ,则()300.380.320.510x -+⨯=解得33.75x =故该组数据的中位数为33.75点睛:本题考查了在频率分布直方图中求中位数,此类题目需要先确定中位数所在的组,然后根据公式计算求得结果,较为基础.20.【解析】根据题意可得抽样比为则这次抽样调查抽取的人数是即答案为140 解析:140【解析】根据题意可得抽样比为501,75015= 则这次抽样调查抽取的人数是()114507509002100140,1515++=⨯= 即答案为140.三、解答题21.(1)532y x =-;(2)线性回归方程是可靠的. 【分析】(1)根据最小二乘法公式,分别将数据代入计算,即可得答案;(2)选取的是4月1日与4月30日的两组数据,即10x =和8x =代入判断即可; 【详解】解:(1)由数据得12x =,27y =,3972xy =,23432x =; 又31977i i i x y ==∑,321434i i x ==∑;97797254344322b -==-,5271232a =-⨯=-;所以y 关于x 的线性回归方程为:532y x =-. (2)当10x =时,5103222y =⨯-=,22232-<; 当8x =时,583222y =⨯-=,17162-<, 所得到的线性回归方程是可靠的. 【点睛】本题考查最小二乘法求回归直线方程及利用回归方程进行判断拟合效果,考查数据处理能力,求解时注意回归直线必过样本点中心的应用.22.(1) 1.2308ˆ.0yx =+;(2)12.38万元.. 【分析】(1)由已知表格中的数据,易计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.(2)把使用年限10代入回归直线方程,即可估算出维修费用的值. 【详解】 (1)4x =,5y=,52190i i x==∑,51112.3i i i x y ==∑,12215 1.235ni ii nii x yxyb xx ==-==-∑∑,0.08a y bx =-=, 所以回归直线方程为 1.2308ˆ.0yx =+; (2) 1.23100.0812.3ˆ8y=⨯+=, 即估计用10年时维修费约为12.38万元. 【点评】本题考查回归直线的方程求解,关键是要求出回归直线方程的系数,由已知的变量x ,y 的值,我们计算出变量x ,y 的平均数,及2i x ,i i x y 的累加值,代入回归直线系数公式1221ni ii nii x ynxyb xnx ==-=-∑∑,a y bx =-,即可求出回归直线的系数,进而求出回归直线方程.属于中等题.23.(1) 1.4518.7y x =-+;(2)3 【分析】(1)由表中数据计算x 、y ,求出ˆb、ˆa ,即可写出回归直线方程; (2)写出利润函数z y w =-,利用二次函数的图象与性质求出3x =时z 取得最大值. 【详解】解:(1)由表中数据得,1(246810)65x =⨯++++=,1(16139.57 4.5)105y =⨯++++=, 由最小二乘法求得:22222221641369.58710 4.5561058ˆ 1.452468105640b⨯+⨯+⨯+⨯+⨯-⨯⨯-===-++++-⨯, ˆ10( 1.45)618.7a=--⨯=, 所以y 关于x 的回归直线方程为 1.4518.7y x =-+; (2)根据题意,利润函数为:22(1.4518.7)(0.05 1.7517.2)0.050.3 1.5z y w x x x x x =-=-+--+=-++,所以,当0.332(0.05)x =-=⨯-时,二次函数z 取得最大值为1.95;即预测3x =时,小王销售一辆该型号汽车所获得的利润z 最大. 【点睛】本题考查了回归直线方程的求法,以及二次函数的图象与性质的应用,考查计算能力.24.(Ⅰ)图象见解析,正相关;(Ⅱ)ˆ0.7 1.5yx =+,当15x =时细菌个数为12个. 【分析】(Ⅰ)根据数据描点即得散点图,看图即判断结果; (Ⅱ)利用公式代入数据计算即可. 【详解】解:(Ⅰ)图形如下,观察图像可知细菌个数和时间是正相关.(Ⅱ)由数据计算得,()11234535x =⨯++++=,()123445 3.65y =⨯++++=,1122334445561ni ii x y==⨯+⨯+⨯+⨯+⨯=∑,22222211234555n i i x ==++++=∑122216153 3.67ˆ0.7555310ni ii ni i x y nx yxbx n ==-⨯⨯====-⨯--∑∑,ˆˆ 3.60.73 1.5a y bx =-=-⨯=, 所以ˆ0.7 1.5yx =+, 当0.7 1.512x +=时,解得15x =. 所以当15x =时细菌个数为12个. 【点睛】本题考查了散点图、线性回归方程及其应用,属于基础题. 25.(1)2552;(2)3173;(3)当他的答题数量7n =时,他的复赛成绩的期望值最大. 【分析】(1)由表可知,样本中成绩不低于60分的学生共有40人,其中成绩优良的人数为15人,再结合排列组合与古典概型即可得解;(2)先求出样本中的100名学生预赛成绩的平均值,即为μ,从而推出~(53Z N ,219),再根据正态分布的性质即可得解;(3)以随机变量ξ表示甲答对的题数,则~B ξ(,0.75)n ,记甲答完n 题所得的分数为随机变量X ,则2X ξ=,为了获取答n 道题的资格,甲需要“花”掉的分数为20.1()n n +,设甲答完n 题后的复赛成绩的期望值为()f n ,则2()1000.1()()f n n n E X =-++,最后利用配方法即可得解. 【详解】解:(1)由题意得样本中成绩不低于60分的学生共有40分,其中成绩优良的人数为15人,记“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”为事件A ,则()1125152402552C C P A C == 答:“从样本中预赛成绩不低于60分的学生中随机地抽取2人,恰有1人预赛成绩优良”的概率为2552(2)由题意知样本中的100名学生预赛成绩的平均值为:100.1300.2500.3700.25900.1533x =⨯+⨯+⨯+⨯+⨯=,则53μ=,由2361σ=得19σ=, 所以()()()()17210.158652P Z P Z P Z μσμσμσ≥=≥+=--<≤+≈, 所以,估计全市参加参赛的全体学生中,成绩不低于72分的人数为20000×0.15865=3173,即全市参赛学生中预赛成绩不低于72分的人数为3173.(3)以随机变量ξ表示甲答对的题数,则()~,0.75B n ξ,且()0.75E n ξ=, 记甲答完n 题所加的分数为随机变量X ,则2X ξ=,∴()()2 1.5E X E n ξ==, 依题意为了获取答n 道题的资格,甲需要“花”掉的分数为:()()20.2123...0.1n n n ⨯++++=+,设甲答完n 题后的复赛成绩的期望值为()f n ,则()()()221000.1 1.50.17104.9f n n n n n =-++=--+,由于*n N ∈,所以当7n =时,()f n 取最大值104.9. 即当他的答题数量7n =时,他的复赛成绩的期望值最大. 【点睛】本题考查古典概型、正态分布的性质、二项分布的性质及数学期望的实际应用,考查学生对数据的分析与处理能力,属于中档题.26.(1)分布列见解析,1;(2)0.10=P ,理由见解析. 【分析】(1)按照分层抽样计算“科学用眼”和“不科学用眼”的抽取人数,随机变量X 的取值可能为0,1,2,然后计算概率得出分布列及其数学期望; (2)按照公式计算2K 的值,然后由临界值表得出结果即可. 【详解】(1)“科学用眼”抽156245⨯=人,“不科学用眼”抽306445⨯=人,则随机变量X0=,1,2,∴343641 (0)205====CP XC,122436123(1)205C CP XC====,21243641(2)205C CP XC====,分布列为:0120121555EX=⨯+⨯+⨯=;(2)22100(45153010)3.03075255545⨯-⨯=≈⨯⨯⨯K,由表可知2.706 3.030 3.840<<,∴0.10=P.【点睛】本题考查随机变量的分布列和数学期望,考查独立性检验,考查逻辑思维能力和计算能力,考查学生分析解决问题的能力,属于常考题.。
新北师大版高中数学必修三第一章《统计》测试题(答案解析)(1)
一、选择题1.某校举行演讲比赛,9位评委给选手A 打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x )无法看清,若统计员计算无误,则数字x 应该是( )A .5B .4C .3D .22.2020年,一场突如其来的“新型冠状肺炎”使得全国学生无法在春季正常开学,不得不在家“停课不停学”.为了解高三学生居家学习时长,从某校的调查问卷中,随机抽取n 个学生的调查问卷进行分析,得到学生可接受的学习时长频率分布直方图(如下图所示),已知学习时长在[)9,11的学生人数为25,则n 的值为( )A .40B .50C .80D .1003.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生 B .200号学生C .616号学生D .815号学生4.在一段时间内,某种商品的价格x (元)和销售量y (件)之间的一组数据如下表:价格x (元) 4 6 8 10 12 销售量y (件)358910若y 与x 呈线性相关关系,且解得回归直线ˆˆˆybx a =+的斜率0.9b ∧=,则a ∧的值为( ) A .0.2 B .-0.7 C .-0.2 D .0.75.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .636.在一次53.5公里的自行车个人赛中,25名参赛选手的成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为125-号,再用系统抽样方法从中选取5人,已知选手甲的成绩为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A .95B .96C .97D .987.有线性相关关系的变量有观测数据,已知它们之间的线性回归方程是,若,则( ) A .B .C .D .8.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9C .y =1.9x +1.04D .y =1.05x -0.99.预测人口的变化趋势有多种方法,“直接推算法”使用的公式是()0 1nn P P k =+(1k >-),n P 为预测人口数,0P 为初期人口数,k 为预测期内年增长率,n 为预测期间隔年数.如果在某一时期有10k -<<,那么在这期间人口数 A .呈下降趋势B .呈上升趋势C .摆动变化D .不变10.某校为了提高学生身体素质,决定组建学校足球队,学校为了解报名学生的身体素质,对他们的体重进行了测量,将所得的数据整理后,画出了频率分布直方图(如右图),已知图中从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,则该校报名学生总人数( )A.40 B.45 C.48 D.5011.设有一个直线回归方程为2 1.5=-,则变量x增加一个单位时()y xA.y平均增加1.5个单位B.y平均增加2个单位C.y平均减少1.5个单位D.y平均减少2个单位12.根据如下样本数据x345678y﹣4.0﹣2.50.5﹣0.5 2.0 3.0得到的回归方程为y bx a=+,则()A.a>0,b<0 B.a>0,b>0 C.a<0,b<0 D.a<0,b>0二、填空题13.用系统抽样方法从400名学生中抽取容量为20的样本,将400名学生随机地编号为1~400,按编号顺序平均分为20个组.若第1组中用抽签的方法确定抽出的号码为11,则第17组抽取的号码为________.14.水痘是一种传染性很强的病毒性疾病,易在春天爆发.市疾控中心为了调查某校高年级学生注射水症疫苗的人数,在高一年级随机抽取5个班级,每个班抽取的人数互不相同,若把每个班级抽取的人数作为样本数据.已知样本平均数为7,样本方差为4,则样本数据中的最小值是______.15.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示:学校A高中B高中C高中D高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D高中中抽取的学生人数为_______.16.某校有高一学生n 名,其中男生数与女生数之比为6:5,为了解学生的视力情况,现要求按分层抽样的方法抽取一个样本容量为10n的样本,若样本中男生比女生多12人,则n =_______.17.某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.18.一个项目由15个专家评委投票表决,剔除一个最高分96,一个最低分58后所得到的平均分为92,方差为16,那么原始得分的方差为______________.19.为了研究某药品的疗效,选取若干名志愿者进行临床试验,所有志愿者的舒张压数据(单位:kPa )的分组区间为[12,13),[13,14),[14,15),[15,16),[16,17],将其按从左到右的顺序分别编号为第一组,第二组,,第五组,如图是根据试验数据制成的频率分布直方图,已知第一组与第二组共有20人,第三组没有疗效的有6人,则第三组中有疗效的人数为__________.20.一组样本数据按从小到大的顺序排列为:1-,0,4,x ,y ,14,已知这组数据的平均数与中位数均为5,则其方差为__________.三、解答题21.某市政府针对全市10所由市财政投资建设的企业进行了满意度测评,得到数据如下表: 企业abcdefghij满意度x (%) 21 33 24 20 25 21 24 23 25 12 投资额y (万元)79868978767265625944y x (2)约定:投资额y 关于满意度x 的相关系数r 的绝对值在0.7以上(含0.7)是线性相关性较强,否则,线性相关性较弱.如果没有达到较强线性相关,则根据满意度“末位淘汰”规定,关闭满意度最低的那一所企业,求关闭此企业后投资额y 关于满意度x 的线性回归方程(精确到0.1).参考数据:22.8x =,71y =,1022110248i i x x =-≈∑,10102222111010643.7i i i i x x y y ==⎛⎫⎛⎫--≈ ⎪⎪⎝⎭⎝⎭∑∑,10110406i i i x y x y =-=∑,222851984=,2287116188⨯=.附:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线ˆˆˆybx a =+的斜率和截距的最小二乘估计公式分别为:1221ˆni ii nii x ynx y bxnx==-=-∑∑,ˆˆay bx =-.线性相关系数1222211ni ii n ni i i i x y nx yr x nx y ny ===-=⎛⎫⎛⎫-- ⎪⎪⎝⎭⎝⎭∑∑∑.22.某企业投资两个新型项目,投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,投资新型项目B 的投资额x (单位:十万元)与纯利润y (单位:万元)的散点图如图所示.(1)求y 关于x 的线性回归方程;(2)根据(1)中的回归方程,若A ,B 两个项目都投资60万元,试预测哪个项目的收益更好.附:回归直线y bx a =+的斜率和截距的最小二乘估计分别为1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-.23.某地区2007年至2013年农村居民家庭纯收入y (单位:千元)的数据如下表: 年份 2007 2008 2009 2010 2011 2012 2013 年份代号x1234567人均纯收入y2.93.3 3.64.4 4.85.2 5.9x (2)预测该地区2015年农村居民家庭人均纯收入. 附:77211134.4,140i ii i i x yx ====∑∑.回归直线的斜率和截距的最小二乘法估计公式分别为:1221ni ii nii x y nx yb xnx==-=-∑∑,a y bx =-24.峰谷电是目前在城市居民当中开展的一种电价类别.它是将一天24小时划分成两个时间段,把8:00—22:00共14小时称为峰段,执行峰电价,即电价上调;22:00—次日8:00共10个小时称为谷段,执行谷电价,即电价下调.为了进一步了解民众对峰谷电价的使用情况,从某市一小区随机抽取了50 户住户进行夏季用电情况调查,各户月平均用电量以[100,300),[300500),,[500700),,[700900),,[9001100),,[]11001300,(单位:度)分组的频率分布直方图如下图:若将小区月平均用电量不低于700度的住户称为“大用户”,月平均用电量低于700度的住户称为“一般用户”.其中,使用峰谷电价的户数如下表: 月平均用电量(度) [)100,300 [)300,500 [)500,700 [)700,900 [)900,1100 []11001300, 使用峰谷电价的户数3913721值作代表);(2)(i )将“一般用户”和“大用户”的户数填入下面22⨯的列联表:一般用户 大用户“使用峰谷电价”有关?附:()22()()()()n ad bc K a b c d a c b d -=++++,25.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下:(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位.参考数据:61936i i y ==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211ni ii n ii y y R yy==-=--∑∑,残差e y y =-.26.为提高某作物产量,种植基地对单位面积播种数与每棵作物的产量之间的关系进行了研究,收集了10块试验田的数据,得到下表:技术人员选择模型21y a bx =+作为y 与x 的回归方程类型,令2i i u x =,1i iv y =. (1)由最小二乘法得到线性回归方程v u βα=+,求y 关于x 的回归方程; (2)利用(1)得出的结果,计算当单位面积播种数x 为何值时,单位面积的总产量w xy =的预报值最大?(计算结果精确到0.01)附:对于一组数据()11,u v ,()22,u v …(),n n u v 其回归直线v u βα=+的斜率和截距的最小二乘法估计分别为1221ni i i nii u v nu vunuβ==-⋅=-∑∑,v u αβ=-.参考数据:1500nii u==∑,140ni i v ==∑,12321n i i i u v ==∑,2135642ni i u ==∑ 5.48≈.【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】记分员在去掉一个最高分94和一个最低分87后,余下的7个数字的平均数是91,()89889290939291791x +++++++÷=,635=917=6372x x ,∴+⨯∴=,故选D.2.B解析:B 【分析】由频率分布直方图的性质,求得0.25x =,再结合频率分布直方图的频率的计算方法,即可求解. 【详解】由频率分布直方图的性质,可得()20.050.150.051x +++=,解得0.25x =,所以学习时长在[)9,11的频率2520.5x n==,解得50n =. 故选:B . 【点睛】本题主要考查了频率分布直方图性质及其应用,其中解答中熟记频率分布直方图的性质是解答的关键,着重考查了数据分析能力,以及计算能力.3.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.4.C解析:C 【解析】 【分析】由题意利用线性回归方程的性质计算可得a 的值. 【详解】 由于468101285x ++++==,35891075y ++++==,由于线性回归方程过样本中心点(),x y ,故:70.98a =⨯+, 据此可得:0.2a =-. 故选C . 【点睛】本题主要考查线性回归方程的性质及其应用,属于中等题.5.A解析:A 【解析】 【分析】由茎叶图确定所给的所有数据,然后确定中位数即可.【详解】各数据为:122031323445454547474850506163,最中间的数为:45,所以,中位数为45.本题选择A选项.【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.6.C解析:C【分析】结合系统抽样法的方法,得出其他四名选手的成绩,然后计算平均数,即可.【详解】结合系统抽样法,可知间隔5个人抽取一次,甲为85,则其他人分别是88,94,99,107,故平均数为88+94+99+107=974,故选C.【点睛】考查了系统抽样法,关键该抽取方法每间隔相同人数中抽取一人,计算平均数,即可,难度中等. 7.D解析:D【解析】【分析】先计算,代入回归直线方程,可得,从而可求得结果.【详解】因为,所以,代入回归直线方程可求得,所以,故选D.【点睛】该题考查的是有关回归直线的问题,涉及到的知识点有回归直线一定会过样本中心点,利用相关公式求得结果,属于简单题目.8.B解析:B【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程.详解:123+4=2.54x ++=, 3 3.8 5.26 4.5,4y +++== ∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.9.A解析:A【分析】可以通过n P 与0P 之间的大小关系进行判断.【详解】当10k -<<时,()011011nk k <+<<+<,,所以()001n n P P k P =+<,呈下降趋势.【点睛】判断变化率可以通过比较初始值与变化之后的数值之间的大小来判断. 10.C解析:C【分析】根据频数关系,求出前三段每段的频数,由直方图求出四五组的频率,进而求出前三组的频率和,从而可求该校报名学生的总人数.【详解】从左到右3个小组的频率之比为1:2:3,其中第2小组的频数为12,∴从左到右3个小组的频数分别为6,12,18,共有36人,第4,5小组的频率之和为()0.03750.012550.25+⨯=,则前3小组的频率之和为10.250.75-=,则该校报名学生的总人数为360.7548÷=,故选C.【点睛】本题主要考查频率分布直方图的应用,属于中档题. 直方图的主要性质有:(1)直方图中各矩形的面积之和为1;(2)组距与直方图纵坐标的乘积为该组数据的频率;(3)每个矩形的中点横坐标与该矩形的纵坐标相乘后求和可得平均值;(4)直观图左右两边面积相等处横坐标表示中位数.11.C解析:C【解析】【分析】细查题意,根据回归直线方程中x 的系数是 1.5-,得到变量x 增加一个单位时,函数值要平均增加 1.5-个单位,结合回归方程的知识,根据增加和减少的关系,即可得出本题的结论.【详解】因为回归直线方程是2 1.5ˆyx =-, 当变量x 增加一个单位时,函数值平均增加 1.5-个单位,即减少1.5个单位,故选C.【点睛】本题是一道关于回归方程的题目,掌握回归方程的分析时解题的关键,属于简单题目. 12.D解析:D【解析】分析:利用公式求出ˆb,ˆa ,即可得出结论. 详解:样本平均数x =5.5,y =﹣0.25, ∴()()61i i i x x y y =--∑=23,621()i i x x =-∑=17.5,∴ˆb =2317.5=4635>0, ∴ˆa =﹣0.25﹣4635•5.5<0, 故选:D . 点睛:求回归直线方程的步骤:①依据样本数据画出散点图,确定两个变量具有线性相关关系;②计算211,,,n ni i i i i x y x x y ==∑∑的值;③计算回归系数ˆˆ,a b ;④写出回归直线方程为ˆˆˆybx a =+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.二、填空题13.331【分析】分段抽样由抽取时的分段间隔是20利用等差数列知识得解【详解】由抽取时的分段间隔是20即抽取20名同学其编号构成首项为11公差为20的等差数列第17组抽取的号码故答案为:331【点睛】本解析:331【分析】分段抽样由抽取时的分段间隔是20,利用等差数列知识得解.【详解】由抽取时的分段间隔是20.即抽取20名同学,其编号构成首项为11,公差为20的等差数列,第17组抽取的号码11(171)20331+-⨯=故答案为:331【点睛】本题考查系统抽样,属于基础题.14.4【分析】首先设个班抽取的人数由小到大分别为根据题意得到再求数据中的最小值即可【详解】设个班抽取的人数由小到大分别为由题知:即若时则则四个数为:或此时一定有相同的数与已知矛盾若时则则四个数为:此时为解析:4【分析】首先设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,根据题意得到()()()()()22222123457777720x x x x x -+-+-+-+-=,再求数据中的最小值即可.【详解】 设5个班抽取的人数由小到大分别为12345,,,,x x x x x ,由题知:()()()()()222221234517777745x x x x x ⎡⎤-+-+-+-+-=⎣⎦, 即()()()()()22222123457777720x x x x x -+-+-+-+-=.若13x =时,则()()()()2222234577774x x x x -+-+-+-=,则()()()()222223457,7,7,7x x x x ----四个数为:1,1,1,1或4,0,0,0,此时2345,,,x x x x 一定有相同的数,与已知矛盾.若14x =时,则()()()()22222345777711x x x x -+-+-+-=,则()()()()222223457,7,7,7x x x x ----四个数为:1,0,1,9,此时12345,,,,x x x x x 为4,6,7,8,10,符合题意.故答案为:4【点睛】本题主要考查方差的定义,熟记定义为解题的关键,属于中档题. 15.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题解析:24【分析】计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数.【详解】应在D 高中抽取的学生人数为6001442480012001000600⨯=+++. 【点睛】本小题主要考查分层抽样,考查频率的计算,属于基础题.16.【分析】依题意可得解之即得解【详解】依题意可得解得故答案为1320【点睛】本题主要考查分层抽样意在考查学生对这些知识的理解掌握水平和分析推理能力解析:1320【分析】 依题意可得6512111110n ⎛⎫-⨯=⎪⎝⎭,解之即得解. 【详解】 依题意可得6512111110n ⎛⎫-⨯= ⎪⎝⎭,解得1320n =. 故答案为1320【点睛】本题主要考查分层抽样,意在考查学生对这些知识的理解掌握水平和分析推理能力.17.60【分析】采用分层抽样的方法从该校四个年级的本科生中抽取一个容量为300的样本进行调查的【详解】∵该校一年级二年级三年级四年级的本科生人数之比为4:5:5:6∴应从一年级本科生中抽取学生人数为:故解析:60【分析】采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查的.【详解】∵该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,∴应从一年级本科生中抽取学生人数为:4300604556⨯=+++. 故答案为60. 18.【解析】分析:根据方差与均值的关系求解即可详解:剔除最高分和最低分后的则原始平均分 原始原始方差即原始方差为88点睛:本题考查方差与均值的关系属基础题解析:88【解析】分析:根据方差与均值的关系()()()22D x E xE x ⎡⎤=-⎣⎦ 求解即可. 详解:剔除最高分和最低分后的 222()()()92168480,E x E x D x =+=+=22()8480(152)110240,x E x n ∑=⨯=⨯-=则原始平均分()921?3? 96? 58 9015E x ;⨯++==原始 22229658()8188,15x E x ∑++== 原始方差 222()?()?()81889088.D x E X E X =-=-=原始原始即原始方差为 88 .点睛:本题考查方差与均值的关系,属基础题.19.12【解析】分析:由频率=以及直方图可得分布在区间第一组与第二组共有20人的频率即可求出第三组中有疗效的人数得到答案详解:由直方图可得分布在区间第一组和第二组共有20人分布唉区间第一组与第二组的频率解析:12【解析】分析:由频率=频数样本容量,以及直方图可得分布在区间第一组与第二组共有20人的频率,即可求出第三组中有疗效的人数得到答案.详解:由直方图可得分布在区间第一组和第二组共有20人,分布唉区间第一组与第二组的频率分别为0.24,0.16,所以第一组有12人,第二组8人第三组的频率为0.36,所以第三组的人数为18人,第三组中没有疗效的有6人,第三组由疗效的有12人.点睛:1、用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本的频率分布去估计总体分布的两种主要方法,分布表在数量表示上比较准确,直方图比较直观.2、频率分布表中的频数之和等于样本容量,各组中的频率之和等于1;在频率分布直方图中,各小长方形的面积表示相应各组的频率,所以,所有小长方形的面积的和等于1.20.【解析】分析:根据中位数为求出是代入平均数公式可求出从而可得出平均数代入方差公式得到方差详解中位数为这组数据的平均数是可得这组数据的方差是故答案为点睛:本题主要考查平均数与方差属于中档题样本数据的算 解析:743【解析】分析:根据1,0,4,,,14x y -中位数为5,,求出x 是6 ,代入平均数公式,可求出7y =,从而可得出平均数,代入方差公式,得到方差.详解1,0,4,,7,14x -中位数为45,52x +∴=,6x ∴=,∴这组数据的平均数是10461456y -+++++=,7y =可得这组数据的方差是()17436251148163+++++=,故答案为743. 点睛:本题主要考查平均数与方差,属于中档题.样本数据的算术平均数公式为12n 1(x +x +...+x )x n=.样本方差2222121[()()...()]n s x x x x x x n =-+-++-,标准差s = 三、解答题21.(1)0.63;(2)ˆ0.757.4yx =+. 【分析】(1)代入公式即可得出结果.(2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业.重新计算,代入公式即可求出结果.【详解】(1)由题意,根据相关系数的公式,可得10104060.63643.7ii x y x y r -=≈≈∑ (2)由(1)可知,因为0.630.7<,所以投资额y 关于满意度x 没有达到较强线性相关,所以要关闭j 企业. 重新计算得22.810122162499x ⨯-'===,7110446667499y ⨯-'===, 922222192481022.812924118.4i i xx ='-≈+⨯--⨯=∑, 9194061022.87112449247482i ii x y x y =''-≈+⨯⨯-⨯-⨯⨯=∑. 所以919221982ˆ0.690.7118.49ii i i i x y x y b xx ==''-=≈≈≈'-∑∑, ˆˆ740.692457.4457.4ay bx ''=-≈-⨯=≈. 所以所求线性回归方程为ˆ0.757.4yx =+. 22.(1) 1.60.2y x =+;(2)B 项目的收益更好.【分析】(1)先利用平均数公式求出样本中心点的坐标, 再利用所给公式求出b 的值,最后将样本中心点的坐标代入回归方程求得a 的值即可;(2)分别利用所给关系式以及所求回归方程,求出A ,B 两个项目投资60万元,该企业所得纯利润的估计值,便可预测哪个项目的收益更好.【详解】(1)由散点图可知,x 取1,2,3,4,5时,y 的值分别为2,3,5,7,8, 所以1234535x ++++==,2357855y ++++==, 2222221223354758535 1.61234553b ⨯+⨯+⨯+⨯+⨯-⨯⨯==++++-⨯, 则5 1.630.2a =-⨯=,故y 关于x 的线性回归方程为 1.60.2y x =+.(2)因为投资新型项目A 的投资额m (单位:十万元)与纯利润n (单位:万元)的关系式为 1.70.5n m =-,所以若A 项目投资60万元,则该企业所得纯利润的估计值为1.760.59.7⨯-=万元; 因为y 关于x 的线性回归方程为 1.60.2y x =+,所以若B 项目投资60万元,则该企业所得纯利润的估计值为1.660.29.8⨯+=万元.因为9.89.7>,所以可预测B 项目的收益更好.【点睛】方法点睛:求回归直线方程的步骤:①依据样本数据确定两个变量具有线性相关关系;②计算211,,,n n i ii i i x y x x y ==∑∑的值;③计算回归系数,a b ;④写出回归直线方程为ˆy bx a=+; 回归直线过样本点中心(),x y 是一条重要性质,利用线性回归方程可以估计总体,帮助我们分析两个变量的变化趋势.23.(1)0.5 2.3y x =+;(2)6800元.【分析】(1)根据表中数据计算出4x =, 4.3y =,再结合参考数据利用公式即可计算出,b a ,进而得出线性回归方程;(2)将9x =代入即可预测.【详解】解:(1)由表可得:123456747++++++==x , 2.9 3.3 3.6 4.4 4.8 5.2 5.9 4.37y ++++++==, 又77211134.4,140ii i i i x y x ====∑∑, 71722217134.474 4.30.5140747i ii i i x y x y b x x==--⨯⨯∴===-⨯-∑∑ 4.30.54 2.3a y bx ∴=-=-⨯=y ∴关于x 的线性回归方程为0.5 2.3y x =+;(2)由(1)可得:0.5 2.3y x =+,∴当9x =时,0.59 2.3 6.8y =⨯+=,即该地区2015年农村居民家庭人均纯收入约为6800元.【点睛】本题考查线性回归方程的求法,考查由线性回归方程进行预测,属于基础题.24.(1)众数600度,平均数640度(2)(i )见解析;(ii )不能有99%的把握认为 “用电量的高低”与“使用峰谷电价”有关.【分析】(1)由频率分布直方图计算出众数与平均数(2)完善列表联并计算出是否有关【详解】(1)根据频率分布直方图的得到100度到300度的频率为:10.0012000.00152000.00122000.00062000.00022000.1-⨯-⨯-⨯-⨯-⨯=,估计所抽取的50户的月均用电量的众数为:500+700=6002(度); 估计所抽取的50户的月均用电量的平均数为:(2000.00054000.0016000.00158000.001210000.000612000.0002)200640=⨯+⨯+⨯+⨯+⨯+⨯⨯=x (度)(2)依题意,22⨯列联表如下2K 的观测值50(2510510)400 6.349 6.6353515302063k ⨯⨯-⨯==≈<⨯⨯⨯ 所以不能有99%的把握认为 “用电量的高低”与“使用峰谷电价”有关.【点睛】本题考查了频率分布直方图,并完善列表联计算线性相关性,较为基础,需要掌握解题方法25.(1)ˆ465yx =-;拟合效果较好;(2)至少需要规划409个停车位 【分析】(1)由已知数据求得ˆb与ˆa 的值,则线性回归方程可求,再求出残差平方和,代入相关指数公式求得2R ,根据与1的接近程度分析拟合效果;(2)在(1)中求得的线性回归方程中,取9x =求得y 值即可.【详解】解:(1)1(123456) 3.56x =+++++=,19361566y =⨯=. 6162221640816 3.5156ˆ46916356i i i ii x y xyb xx ==--⨯⨯===-⨯-∑∑, ˆˆ15646 3.55ay bx =-=-⨯=-. y ∴关于x 的线性回归方程为ˆ465y x =-.1x =时,ˆ41y=,2x =时,ˆ87y =,3x =时,ˆ133y =, 4x =时,ˆ179y=,5x =时,ˆ225y =,6x =时,ˆ271y =. 621()556i i i yy =-=∑.6221621()556110.9737586()i i i ii y y R y y ==-=-=-≈-∑∑, 相关指数2R 近似为0.97,接近1,说明拟合效果较好;(2)在(1)中求得的线性回归方程中,取9x =,可得ˆ4695409y=⨯-=. 故若要求在2022年小区停车位数量仍可满足需要,则至少需要规划409个停车位.【点睛】本题考查线性回归方程与相关指数的求法,考查运算求解能力,属于中档题. 26.(1)212.50.03y x=+;(1)9.13x =棵2/m . 【分析】(1)先利用公式和数据计算,αβ,即得v 关于u 的线性回归方程,再代入得到y 关于x 的回归方程即可;(2)先利用(1)的结果计算w xy =,再利用基本不等式求其最大值即可. 【详解】 解:(1)由题意得115010n i i u u ===∑,11410ni i v v ===∑, ∴1011022212321105040.0335*******1010i ii i i u v u v u uβ==-⨯⨯=⨯⋅--≈=-∑∑, 2.5v u αβ=-=. 所以v 关于u 的线性回归方程为0.03 2.5v u =+.则y 关于x 的回归方程为212.503ˆ0.y x=+. (2)根据(1)的结果并结合条件,单位面积的总产量的预报值21252.50.030.03x w x x x==++ 1.833≤=≈. 当且仅当2.50.03x x =时,等号成立,此时9.13x =≈. 即当9.13x =棵2/m 时,单位面积的总产量w 的预报值最大,最大值是1.83. 【点睛】本题考查了非线性回归方程的求法以及方程的应用,属于中档题.。
北师大版高中数学必修三第一章《统计》测试题(含答案解析)
一、选择题1.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是()A.成绩B.视力C.智商D.阅读量2.某农业科学研究所分别抽取了试验田中的海水稻以及对照田中的普通水稻各10株,测量了它们的根系深度(单位:cm),得到了如图所示的茎叶图,其中两竖线之间表示根系深度的十位数,两边分别是海水稻和普通水稻根系深度的个位数,则下列结论中不正确的是()A.海水稻根系深度的中位数是45.5B.普通水稻根系深度的众数是32C.海水稻根系深度的平均数大于普通水稻根系深度的平均数D.普通水稻根系深度的方差小于海水稻根系深度的方差3.将某选手的7个得分去掉1个最高分,去掉1个最低分,5个剩余分数的平均分为21,现场作的7个分数的茎叶图后来有1个数据模糊,无法辨认,在图中以x 表示,则5个剩余分数的方差为( )A .1167B .365C .36D .674.某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验,若46号学生被抽到,则下面4名学生中被抽到的是 A .8号学生B .200号学生C .616号学生D .815号学生5. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日6.如果在一次试验中,测得(x ,y )的四组数值分别是A (1,3),B (2,3.8),C (3,5.2),D (4,6),则y 与x 之间的回归直线方程是 ( ) A .y =x +1.9 B .y =1.04x +1.9 C .y =1.9x +1.04 D .y =1.05x -0.97.①45化为二进制数为(2)101101;②一个总体含有1000个个体(编号为0000,0001,…,0999),采用系统抽样从中抽取一个容量为50的样本,若第一个抽取的编号为0008,则第六个编号为0128; ③已知a ,b ,c 为ABC ∆三个内角A ,B ,C 的对边,其中3a =,4c =,6A π=,则这样的三角形有两个解.以上说法正确的个数是( ) A .0B .1C .2D .38.已知某8个数的平均数为3,方差为2,现加入一个新数据3,此时这9个数的平均数为x ,方差为2s ,则( ) A .3x =,22s < B .3x =,22s > C .3x >,22s <D .3x >,22s >9.下列说法正确的是( )①设某大学的女生体重(kg)y 与身高(cm)x 具有线性相关关系,根据一组样本数据(,)(1,2,3,,)i i x y i n =,用最小二乘法建立的线性回归方程为0.8585.71y x =- ,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ;②关于x 的方程210(2)x mx m -+=>的两根可分别作为椭圆和双曲线的离心率; ③过定圆C 上一定点A 作圆的动弦AB ,O 为原点,若1()2OP OA OB =+,则动点P 的轨迹为椭圆;④已知F 是椭圆22143x y +=的左焦点,设动点P 在椭圆上,若直线FP 的斜率大于3,则直线OP (O 为原点)的斜率的取值范围是3333(,)(,)282-∞-. A .①②③B .①③④C .①②④D .②③④10.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,...,960,分组后某组抽到的号码为41.抽到的32人中,编号落入区间[]401,755 的人数为( ) A .10B .11C .12D .1311.已知x ,y 的取值如表: x 2 6 7 8y若x ,y 之间是线性相关,且线性回归直线方程为,则实数a 的值是A .B .C .D .12.在学校组织的考试中,45名学生的数学成绩的茎叶图如图所示,则该45名学生的数学成绩的中位数为( )A .127B .128C .128.5D .129二、填空题13.某社会爱心组织面向全市征召义务宣传志愿者.现从符合条件的志愿者中随机抽取100名按年龄分组:第1组[20,25),第2组[25,30),第3组[30,35),第4组[35,40),第5组[40,45),得到的频率分布直方图如图所示.若从第3,4,5组中用分层抽样的方法抽取6名志愿者参与广场的宣传活动,应从第3组抽取__________名志愿者.14.通过市场调查,得到某种产品的资金投入x (单位:万元)与获得的利润y (单位:万元)的数据,如表所示: 资金投入x 2 3 4 5 6 利润y0.40.611.21.8根据表格提供的数据,用最小二乘法求线性回归直线方程为0.36ˆˆybx =-,现投入资金15万元,求获得利润的估计值(单位:万元)为_____________.15.某地区共有4所普通高中,这4所普通高中参加2018年高考的考生人数如下表所示: 学校 A 高中B 高中C 高中D 高中参考人数80012001000600现用分层抽样的方法在这4所普通高中抽取144人,则应在D 高中中抽取的学生人数为_______.16.已知一组数据126,,,x x x ⋅⋅⋅的方差是2,并且()()()22212611118x x x -+-+⋅⋅⋅+-=,0x ≠,则x =______.17.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.18.某种产品的广告费支出x 与销售额y 之间有如下对应数据(单位:百万元),根据下表求出y 关于x 的线性回归方程为 6.517.5y x =+,x2 4 5 6 8 y30 40 57a69则表中a 的值为__________.19.已知某产品连续4个月的广告费i x (千元)与销售额i y (万元)(1,2,3,4i =),经过对这些数据的处理,得到如下数据信息:①441118,14ii i i xy ====∑∑;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y bx a =+中的0.8b =. 那么广告费用为6千元时,则可预测销售额约为__________万元.20.能够说明“若甲班人数为m ,平均分为a ;乙班人数为n n m ≠(),平均分为b ,则甲乙两班的数学平均分为2a b+”是假命题的一组正整数a ,b 的值依次为_____. 三、解答题21.某大学生利用寒假参加社会实践,对机械销售公司7月份至12月份销售某种机械配件的销售量及销售单价进行了调查,销售单价x 和销售量y 之间的一组数据如表所示:(2)若由回归直线方程得到的估计数据与剩下的检验数据的误差不超过2件,则认为所得到的回归直线方程是理想的,试问(1)中所得到的回归直线方程是否理想?(3)预计在今后的销售中,销售量与销售单价仍然服从(1)中的关系,若该种机器配件的成本是2.5元/件,那么该配件的销售单价应定为多元才能获得最大利润?(注:利润=销售收入-成本). 参考数据:51392i ii x y==∑,521502.5i i x ==∑.参考公式:回归直线方程ˆˆˆy bx a =+,其中1221ˆni ii nii x y nx ybxnx ==-=-∑∑,ˆˆa y bx=-. 22.我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.(1)在给定坐标系中作出煤改气、煤改电用户数量y 随月份t 变化的散点图,并用散点图和相关系数说明y 与t 之间具有线性相关性;(2)建立y 关于t 的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量. 参考数据:7772111y9.24,t 7 2.646iiii i i i y=====⋅≈≈∑∑∑(y -y ).参考公式:相关系数()()()()()()11112211niinn ni i i i i i nni i i i i i i t t y y r t ty y t y t y t ty y ======⋅--=⋅--=-⋅-⋅-∑∑∑∑∑∑.回归方程ˆy a bt=+中斜率和截距的最小二乘估计公式分别为:()()()121ˆˆˆ,niii ni i t t y y bay bt t t==⋅--==-⋅-∑∑. 23.随着人民生活水平的日益提高,某小区拥有私家车的数量与日俱增,物业公司统计了近六年小区私家车的数量,数据如下:(1)若该小区私家车的数量y 与年份编号x 的关系可用线性回归模型来拟合,请求出y 关于x 的线性回归方程,并用相关指数2R 分析其拟合效果(2R 精确到0.01);(2)由于该小区没有配套停车位,车辆无序停放易造成交通拥堵,因此物业公司预在小区内划定一定数量的停车位,若要求在2022年小区停车位数量仍可满足需要,则至少需要规划多少个停车位.参考数据:61936i i y ==∑,614081i i i x y ==∑,62191ii x ==∑,()62137586i i y y=-=∑.附:回归方程中斜率和截距的最小二乘估计公式分别为:1221ni ii nii x y nx yb xnx==-⋅=-∑∑,a y bx =-,相关指数()()221211nii i n ii yy R yy==-=--∑∑,残差e y y=-.24.为研究冬季昼夜温差大小对某反季节大豆新品种发芽率的影响,某校课外兴趣小组记录了5组昼夜温差与100颗种子发芽数,得到如下资料:经分析,这组数据具有较强的线性相关关系,因此该小组确定的研究方案是:先从这五组数据中选取3组数据求出线性回归方程,再用没选取的2组数据进行检验.(1)若选取的是第2,3,4组的数据,求出y 关于x 的线性回归方程ˆˆˆy bx a =+;(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(1)中所得的线性回归方程是否可靠?(参考公式:()()()1122211ˆnni i i i i i nn i ii i x x y y x y nxy bx x x nx====---==--∑∑∑∑,ˆˆa y bx=-) 25.某玻璃工艺品加工厂有2条生产线用于生产其款产品,每条生产线一天能生产200件该产品,该产品市场评级规定:评分在10分及以上的为A 等品,低于10分的为B 等品.厂家将A 等品售价定为2000元/件,B 等品售价定为1200元/件. 下面是检验员在现有生产线上随机抽取的16件产品的评分:经计算得16119.9716i i x x ===∑,()1616222211110.0451616i i i i s x x x x ===-=-=∑∑,其中i x 为抽取的第i 件产品的评分,1,2,,16i =⋅⋅⋅.该厂计划通过增加生产工序来改进生产工艺,已知对一条生产线增加生产工序每年需花费1500万元,改进后该条生产线产能不变,但生产出的每件产品评分均提高0.05.已知该厂现有一笔1500万元的资金.(1)若厂家用这1500万元改进一条生产线,根据随机抽取的16件产品的评分. (i )估计改进后该生产线生产的产品中A 等品所占的比例; (ii )估计改进后该厂生产的所有产品评分的平均数和方差.(2)某金融机构向该厂推销一款年收益率为8.2%的理财产品,请你利用所学知识分析,将这1500万元用于购买该款理财产品所获得的收益,与通过改进一条生产线使产品评分提高所增加的收益相对比,一年后哪种方案的收益更大? (一年按365天计算) 26.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下:(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).【参考答案】***试卷处理标记,请不要删除一、选择题 1.D 解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.2.D解析:D 【分析】选项A 求出海水稻根系深度的中位数是444745.52+=,判断选项A 正确;选项B 写出普通水稻根系深度的众数是32,判断选项B 正确;选项C 先求出海水稻根系深度的平均数,再求出普通水稻根系深度的平均数,判断选项C 正确;选项D 先求出普通水稻根系深度的方差,再求出海水稻根系深度的方差,判断选项D 错误. 【详解】解:选项A :海水稻根系深度的中位数是444745.52+=,故选项A 正确; 选项B :普通水稻根系深度的众数是32,故选项B 正确; 选项C :海水稻根系深度的平均数393938434447495050514510+++++++++=,普通水稻根系深度的平均数252732323436384041453510+++++++++=,故选项C 正确;选项D :普通水稻根系深度的方差2222222211[(3845)(3945)(3945)(4345)(4445)(4745)(4945)(5045)10S =-+-+-+-+-+-+-+-+, 海水稻根系深度的方差2222222221[(2535)(2735)(3235)(3235)(3435)(3635)(3835)(4035)(10S =-+-+-+-+-+-+-+-+,故选项D 错误故选:D. 【点睛】本题考查根据茎叶图求中位数、众数、平均数、方差,是基础题.3.B解析:B 【分析】由剩余5个分数的平均数为21,据茎叶图列方程求出x =4,由此能求出5个剩余分数的方差. 【详解】∵将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个分数的平均数为21, ∴由茎叶图得:1724202020215x+++++=得x =4,∴5个分数的方差为: S 2=()()()()()222221361721242120212021242155⎡⎤-+-+-+-+-=⎣⎦ 故选B 【点睛】本题考查方差的求法,考查平均数、方差、茎叶图基础知识,考查运算求解能力,考查数形结合思想,是基础题.4.C解析:C 【分析】等差数列的性质.渗透了数据分析素养.使用统计思想,逐个选项判断得出答案. 【详解】详解:由已知将1000名学生分成100个组,每组10名学生,用系统抽样,46号学生被抽到,所以第一组抽到6号,且每组抽到的学生号构成等差数列{}n a ,公差10d =,所以610n a n =+()n *∈N ,若8610n =+,则15n =,不合题意;若200610n =+,则19.4n =,不合题意; 若616610n =+,则61n =,符合题意;若815610n =+,则80.9n =,不合题意.故选C . 【点睛】本题主要考查系统抽样.5.C解析:C 【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果. 【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确; 从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确; 从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确; 由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C. 【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键.6.B解析:B 【解析】分析:根据所给的这组数据,取出这组数据的样本中心点,把样本中心点代入所给的四个选项中验证,若能够成立的只有一个,这一个就是回归直线方程. 详解:123+4=2.54x ++=, 3 3.8 5.264.5,4y +++==∴这组数据的样本中心点是(2.5,4.5)把样本中心点代入四个选项中,只有y =1.04x +1.9成立,故选B.点睛:这是一道关于考查回归直线方程的题目,关键掌握回归直线必过样本中心点的特点,首先分析题目,由四组数据可得,x y ,进而得到样本中心点的坐标,接下来根据回归直线必过样本中心点,即可解答此题.7.C解析:C 【解析】分析:①根据进位制的互化可得结果;②根据系统抽样的性质可得结论;③由正弦定理可得结论.详解:①45222...1÷=,22211...0÷=,112 5...1÷=,52 2...1÷=,22 1...0÷=,120...1÷=,故()()10245101101=,①正确;②因为1000个个题抽取50个样本,∴每个样本编号间隔为20,第六个编号为8205108+⨯=,即编号为0108,故②错误;③由正弦定理可得342,1sin 32sinC C ==,,c a C >∴∠可能是锐角,也可能是钝角,三角形有两个解,③正确,故选C.点睛:本题主要考查进位制、正弦定理的应用,分层抽样的应用,意在考查综合运用所学知识解决问题的能力,属于中档题.8.A解析:A 【分析】由题意计算出加入新数据后的平均数,然后比较方差 【详解】()18138x x +⋯+=, ()181339x x +⋯++=, 3x ∴=,由方差的定义可知加入新数据3,样本数据会变得更加稳定 故22s < 故选A 【点睛】本题主要考查了加入数据后平均数和方差的变化,代入公式计算出结果,较为基础9.C解析:C 【分析】利用线性回归方程系数的几何意义,圆锥曲线离心率的范围,椭圆的性质,逐一判断即可. 【详解】①设某大学的女生体重y (kg )与身高x (cm )具有线性相关关系,根据一组样本数据(x i ,y i )(i =1,2,…,n ),用最小二乘法建立的线性回归方程为y ∧=0.85x ﹣85.71,则若该大学某女生身高增加1cm ,则其体重约增加0.85kg ,正确;②关于x 的方程x 2﹣mx +1=0(m >2)的两根之和大于2,两根之积等于1,故两根中,一根大于1,一根大于0小于1,故可分别作为椭圆和双曲线的离心率.正确; ③设定圆C 的方程为(x ﹣a )2+(x ﹣b )2=r 2,其上定点A (x 0,y 0),设B (a +r cosθ,b +r sinθ),P (x ,y ),由12OP =(OA OB +)得0022x a rcos x y b rsin y θθ++⎧=⎪⎪⎨++⎪=⎪⎩,消掉参数θ,得:(2x ﹣x 0﹣a )2+(2y﹣y 0﹣b )2=r 2,即动点P 的轨迹为圆, ∴故③不正确;④由22143x y +=,得a 2=4,b 2=3,∴1c ==.则F (﹣1,0),如图:过F 作垂直于x 轴的直线,交椭圆于A (x 轴上方),则x A =﹣1,代入椭圆方程可得32A y =.当P 为椭圆上顶点时,P (0FP k =32OA k =-, ∴当直线FPOP 的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,.当P 为椭圆下顶点时,P (0,∴当直线FPOP ,32),综上,直线OP (O 为原点)的斜率的取值范围是32⎛⎫-∞- ⎪⎝⎭,∪,32). 故选C 【点睛】本题以命题真假的判断为载体,着重考查了相关系数、离心率、椭圆简单的几何性质等知识点,属于中档题.10.C解析:C 【分析】由题意可得抽到的号码构成以11为首项、以30为公差的等差数列,求得此等差数列的通项公式为a n =30n ﹣19,由401≤30n ﹣21≤755,求得正整数n 的个数,即可得出结论. 【详解】∵960÷32=30,∴每组30人,∴由题意可得抽到的号码构成以30为公差的等差数列, 又某组抽到的号码为41,可知第一组抽到的号码为11,∴由题意可得抽到的号码构成以11为首项、以30为公差的等差数列, ∴等差数列的通项公式为a n =11+(n ﹣1)30=30n ﹣19, 由401≤30n ﹣19≤755,n 为正整数可得14≤n ≤25, ∴做问卷C 的人数为25﹣14+1=12, 故选C . 【点睛】本题主要考查等差数列的通项公式,系统抽样的定义和方法,根据系统抽样的定义转化为等差数列是解决本题的关键,比较基础.11.B解析:B 【解析】 【分析】根据所给的两组数据,做出横标和纵标的平均数,写出这组数据的样本中心点,根据线性回归方程一定过样本中心点,得到线性回归直线一定过的点的坐标. 【详解】根据题意可得,,由线性回归方程一定过样本中心点,.故选:B.【点睛】本题考查线性回归方程的意义,线性回归方程一定过样本中心点,本题解题的关键是正确求出样本中心点,题目的运算量比较小,是一个基础题.12.D解析:D【解析】分析:由茎叶图得出45名学生的数学成绩,从而求出中位数.详解:根据茎叶图得出45名学生的数学成绩,可知中位数为129.故选D.点睛:本题考查了茎叶图的应用问题,解题时应根据茎叶图中的数据,进行解答,属基础题..二、填空题13.【分析】先分别求出这3组的人数再利用分层抽样的方法即可得出答案【详解】第3组的人数为第4组的人数为第5组的人数为所以这三组共有60名志愿者所以利用分层抽样的方法在60名志愿者中抽取6名志愿者第三组应解析:3【分析】先分别求出这3组的人数,再利用分层抽样的方法即可得出答案.【详解】第3组的人数为10050.0630⨯⨯=,第4组的人数为10050.0420⨯⨯=,第5组的人数为1000.02510⨯⨯=,所以这三组共有60名志愿者,所以利用分层抽样的方法在60名志愿者中抽取6名志愿者,第三组应抽取306360⨯=名,故答案为:3.【点睛】关键点点睛:该题考查的是有关频率分布直方图的识别以及分层抽样某层抽取个数的问题,正确解题的关键是掌握在抽取过程中每个个题被抽到的机会均等.14.【分析】根据线性回归方程过样本数据中心点可求出b代入即可求解【详解】由表中数据可得所以过点代入可得所以当时即获得利润大约为万元故答案为:【点睛】本题主要考查了线性回归方程样本数据中心点线性回归方程的 解析:4.74【分析】根据线性回归方程过样本数据中心点,可求出b ,代入15x =即可求解. 【详解】由表中数据可得4,1x y ==,所以0.36ˆˆybx =-过点(4,1), 代入可得0.34b =,所以ˆˆ0.340.36yx =-, 当15x =时,0.34150.34ˆ6 4.7y=⨯-=, 即获得利润大约为4.74万元. 故答案为:4.74 【点睛】本题主要考查了线性回归方程,样本数据中心点,线性回归方程的应用,属于中档题.15.24【分析】计算出高中人数占总人数的比例乘以得到在高中抽取的学生人数【详解】应在高中抽取的学生人数为【点睛】本小题主要考查分层抽样考查频率的计算属于基础题解析:24 【分析】计算出D 高中人数占总人数的比例,乘以144得到在D 高中抽取的学生人数. 【详解】应在D 高中抽取的学生人数为6001442480012001000600⨯=+++.【点睛】本小题主要考查分层抽样,考查频率的计算,属于基础题.16.2【解析】【分析】由题意结合方差的定义整理计算即可求得最终结果【详解】由题意结合方差的定义有:①而②①-②有:③注意到将其代入③式整理可得:又故故答案为2【点睛】本题主要考查方差的计算公式整体的数学解析:2 【解析】 【分析】由题意结合方差的定义整理计算即可求得最终结果. 【详解】由题意结合方差的定义有:()()()22212612x x x x x x -+-++-= ①,而()()()22212611118x x x -+-+⋅⋅⋅+-=, ②, ①-②有:()()212612666226x x x x x x x x --+++++++=-, ③,注意到1266x x x x +++=,将其代入③式整理可得:26120x x -+=,又0x ≠,故2x =.故答案为2. 【点睛】本题主要考查方差的计算公式,整体的数学思想等知识,意在考查学生的转化能力和计算求解能力.17.【解析】【分析】先求出这个数据的平均数为此时这个数据的方差为由此求出结果【详解】某个数据的平均数为方差为现又加入一个新数据则这个数据的平均数为此时这个数据的方差为故答案为【点睛】本题主要考查了平均数解析:83【解析】 【分析】先求出这9个数据的平均数为5,此时这9个数据的方差为()22183559S ⎡⎤=⨯+-⎣⎦,由此求出结果 【详解】某8个数据的平均数为5,方差为3,现又加入一个新数据5, 则这9个数据的平均数为85559⨯+= ∴此时这9个数据的方差为()2218835593S ⎡⎤=⨯+-=⎣⎦故答案为83【点睛】本题主要考查了平均数和方差的计算公式,属于基础题。
北师大版高中数学必修三第一章《统计》测试(含答案解析)
一、选择题1.为了解某社区居民的家庭年收入和年支出的关系,随机调查了该社区5户家庭,得到如下统计数据表: 收入x 万 8.3 8.6 9.9 11.1 12.1 支出y 万5.97.88.18.49.8根据上表可得回归直线方程ˆˆˆy bx a =+,其中0.78b ∧=,a y b x ∧∧=-元,据此估计,该社区一户收入为16万元家庭年支出为( ) A .12.68万元B .13.88万元C .12.78万元D .14.28万元2.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图(如下图),已知从左到右各长方形高的比为2:3:5:6:3:1,则该班学生数学成绩在(80,100)之间的学生人数是( )A .32B .27C .24D .333.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量之间的关系,随机抽查52名中学生,得到统计数据如表1至表4,这与性别有关联的可能性最大的变量是( )A .成绩B .视力C .智商D .阅读量4.下表是某两个相关变量x ,y 的几组对应数据,根据表中提供的数据,求出y 关于x 的线性回归方程ˆ0.70.35yx =+,那么表中t 的值为( ) x 3 4 5 6 y2.5t44.5A .3B .3.15C .3.5D .4.55.如图是某手机商城2018年华为、苹果、三星三种品牌的手机各季度销量的百分比堆积图(如:第三季度华为销量约占50%,苹果销量约占20%,三星销量约占30%).根据该图,以下结论中一定正确的是( )A .华为的全年销量最大B .苹果第二季度的销量大于第三季度的销量C .华为销量最大的是第四季度D .三星销量最小的是第四季度6.统计某校n 名学生的某次数学同步练习成绩,根据成绩分数依次分成六组:[)[)[)[)[)[]90,100,100,110,110,120,120,130,130,140,140,150,得到频率分布直方图如图所示,若不低于140分的人数为110.①0.031m =;②800n =;③100分以下的人数为60;④分数在区间[)120,140的人数占大半.则说法正确的是( )A .①②B .①③C .②③D .②④7. 2.5PM 是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即 2.5PM 日均值在335/g m μ以下空气质量为一级,在335~75/g m μ空气量为二级,超过375/g m μ为超标.如图是某地12月1日至10日的 2.5PM (单位:3/g m μ)的日均值,则下列说法不正确...的是( )A .这10天中有3天空气质量为一级B .从6日到9日 2.5PM 日均值逐渐降低C .这10天中 2.5PM 日均值的中位数是55D .这10天中 2.5PM 日均值最高的是12月6日8.2018年12月12日,某地食品公司对某副食品店某半月内每天的顾客人数进行统计得到样本数据的茎叶图如图所示,则该样本的中位数是( )A .45B .47C .48D .639.已知x ,y 取值如下表:x0 1 4 5 6 8 y1.31.85.66.17.49.3从所得的散点图分析可知:y 与x 线性相关,且 1.03y x a =+,则a =( ) A .1.53B .1.33C .1.23D .1.1310.甲、乙两名选手参加歌手大赛时,5名评委打的分数用如图所示的茎叶图表示,s 1,s 2分别表示甲、乙选手分数的标准差,则s 1与s 2的关系是( ).A .s 1>s 2B .s 1=s 2C .s 1<s 2D .不确定11.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据:11(,)x y ,22(,)x y ,33(,)x y ,44(,)x y ,55(,)x y .根据收集到的数据可知12345150x x x x x ++++=,由最小二乘法求得回归直线方程为0.6754.9y x =+,则12345y y y y y ++++的值为( )A .75B .155.4C .375D .466.212.已知某企业上半年前5个月产品广告投入与利润额统计如下: 月份1 2 3 4 5 广告投入(x 万元) 9.5 9.3 9.1 8.9 9.7 利润(y 万元)9289898793由此所得回归方程为7.5ˆyx a =+,若6月份广告投入10(万元)估计所获利润为( ) A .97万元B .96.5万元C .95.25万元D .97.25万元二、填空题13.已知一组数1,2,m ,6,7的平均数为4,则这组数的方差为______.14.如图,这是某校高一年级一名学生七次数学测试成绩(满分100分)的茎叶图. 去掉一个最高分和一个最低分后,所剩数据的方差是 _____15.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示: 宽带 租户业主已安装 6042未安装36 62则该小区已安装宽带的居民估计有______户.16.玉林市有一学校为了从254名学生选取部分学生参加某次南宁研学活动,决定采用系统抽样的方法抽取一个容量为42的样本,那么从总体中应随机剔除的个体数目为__________.17.已知某8个数据的平均数为5,方差为3,现又加入一个新数据5,此时这9个数据的方差为______.18.某天有10名工人生产同一零部件,生产的件数分别是:15、17、14、10、15、17、17、16、14、12,设其平均数为a ,中位数为b ,众数为c ,则a 、b 、c 从小到大的关系依次是________19.如图是某工厂对一批新产品长度(单位:)mm 检测结果的频率分布直方图.估计这批产品的中位数为______.20.某班运动队由足球运动员18人、篮球运动员12人、乒乓球运动员6人组成(每人只参加一项),现从这些运动员中抽取一个容量为n 的样本,若分别采用系统抽样法和分层抽样法,则都不用剔除个体;当样本容量为n +1时,若采用系统抽样法,则需要剔除1个个体,那么样本容量n 为________.三、解答题21.“湖广熟,天下足”,鱼米之乡的湖北是全国重要的农产品生产地.而受疫情影响,像莲藕、小龙虾等湖北很多优质农副产品近期都面临销售难题.为了让淜北尽快恢复正常,央视主持人朱广权化身直播带货官,和网红们一起为湖北产品做公益直播.在为湖北某地区的小龙虾进行带货时,需大致了解该地区小龙虾的产量,通过调查发现湖北某地区近几年的小龙虾产量统计如下表:(1)根据表中数据,建立关于t 的线性回归方程y bt a =+; (2)请你根据线性回归方程预测今年(2020年)该地区小龙虾的年产量.附:对于一组数据()11,t y ,()22,t y ,…,(),n n t y ,其回归直线y bt a =+的斜率和截距的最小二乘估计分别为:()()()121ˆniii ni i t t y y bt t==--=-∑∑,a y bt =-.(参考数据:()()616.3iii t t y y =--=∑)22.画糖人是一种以糖为材料在石板上进行造型的民间艺术.某糖人师傅在公园内画糖人,每天卖出某种糖人的个数与价格相关,其相关数据统计如下表: (1)根据表中数据求y 关于x 的回归直线方程;(2)若该种造型的糖人的成本为2元/个,为使糖人师傅每天获得最大利润,则该种糖人应定价多少元?(精确到1元)参考公式:回归直线方程^^^y b x a =+,其中^121()()()niii nii x x y y b x x ==--=-∑∑,^^^a y b x =-.23.某“双一流”大学专业奖学金是以所学专业各科考试成绩作为评选依据,分为专业一等奖学金(奖金额3000元)、专业二等奖学金(奖金额1500元)及专业三等奖学金(奖金额600元),且专业奖学金每个学生一年最多只能获得一次.图(1)是统计了该校2018年500名学生周课外平均学习时间频率分布直方图,图(2)是这500名学生在2018年周课外平均学习时间段获得专业奖学金的频率柱状图.(Ⅰ)求这500名学生中获得专业三等奖学金的人数;(Ⅱ)若周课外平均学习时间超过35小时称为“努力型”学生,否则称为“非努力型”学生,列22⨯联表并判断是否有99.9%的把握认为该校学生获得专业一、二等奖学金与是否是“努力型”学生有关?(Ⅲ)若以频率作为概率,从该校任选一名学生,记该学生2018年获得的专业奖学金额为随机变量X ,求随机变量X 的分布列和期望.22()()()()()n ad bc K a b c d a c b d -=++++24. 2.5PM 是指空气中直径小于或等于2.5微米的颗粒物(也称可入肺颗粒物),为了探究车流量与 2.5PM 的浓度是否相关,现采集到某城市周一至周五某时间段车流量与2.5PM 浓度的数据如下表:时间周一 周二 周三 周四 周五 车流量x (万辆)50 51 54 57 58 2.5PM 的浓度y (微克/立方米)3940424445(1)根据上表数据,求出这五组数据组成的散点图的样本中心坐标; (2)用最小二乘法求出y 关于x 的线性回归方程y bx a =+;(3)若周六同一时间段车流量是100万辆,试根据(2)求出的线性回归方程预测,此时2.5PM 的浓度是多少?(参考公式:()()()121nii i nii xx y yb xx==--=-∑∑,a y bx =-)25.某市为了解疫情过后制造业企业的复工复产情况,随机调查了100家企业,得到这些企业4月份较3月份产值增长率x 的频率分布表如下: x 的分组 [0.20,0)-[0,0.20)[0.20,0.40)[0.40,0.60)[0.60,0.80)企业数13403584(1)估计制造业企业中产值增长率不低于60%的企业比例及产值负增长的企业比例; (2)求制造业企业产值增长率的平均数与方差的估计值(同一组中的数据用该组区间的中点值为代表).26.某快递公司招聘快递骑手,该公司提供了两种日工资方案:方案(1)规定每日底薪50元,快递骑手每完成一单业务提成3元;方案(2)规定每日底薪150元,快递业务的前44单没有提成,从第45单开始,每完成一单提成5元.该快递公司记录了每天骑手的人均业务量.现随机抽取100天的数据,将样本数据分为[)25,35、[)35,45、[)45,55、[)55,65、[)65,75、[)75,85、[]85,95七组,整理得到如图所示的频率分布直方图.(1)求直方图中a 的值;(2)若仅从人均日收入的角度考虑,请你利用所学的统计学知识为新聘骑手做出日工资方案的选择,并说明理由(同组中的每个数据用该组区间的中点值代替);(3)假设公司中所有骑手都选择了你在(2)中所选的方案,已知公司现有骑手400人,某骑手希望自己的收入在公司众骑手中处于前100名内,求他每天的平均业务量至少应达多少单?【参考答案】***试卷处理标记,请不要删除一、选择题 1.A 解析:A 【分析】由已知求得 x , y ,进一步求得 a ,得到线性回归方程,取16x =求得y 值即可. 【详解】8.38.69.911.1512.1 10x +++=+=, 5.97.88.18.49.858y ++++==.又 0.78b =,∴ 80.78100.2a y bx --⨯===. ∴ 0.780.2y x =+.取16x =,得 0.78160.212.68y ⨯+==万元,故选A . 【点睛】本题主要考查线性回归方程的求法,考查了学生的计算能力,属于中档题.2.D解析:D 【详解】高的比就是频率的比,所以各区间上的频率可依次设为2x,3x,5x,6x,3x,x,,同它们的和为1235631,20x x x x x x x +++++=∴=,所以该班学生数学成绩在[80,100)之间的学生人数是1(56)6011603320x +⨯⨯=⨯⨯=,故选D 3.D解析:D 【解析】试题分析:由表中数据可得 表1:()25262210140.00916362032K ⨯⨯-⨯=≈⨯⨯⨯;表2: ()2524201216 1.76916362032K ⨯⨯-⨯=≈⨯⨯⨯;表3: ()252824128 1.316362032K ⨯⨯-⨯=≈⨯⨯⨯;表4: ()25214302623.4816362032K ⨯⨯-⨯=≈⨯⨯⨯.其中23.48最大,所以阅读量与性别有关联的可能性最大.故D 正确. 考点:独立性检验.4.A解析:A 【分析】计算得到 4.5x =,114t y +=,代入回归方程计算得到答案. 【详解】3456 4.54x +++==, 2.54 4.51144t t y ++++==,中心点(),x y 过ˆ0.70.35yx =+, 即114.50.70.354t +=⨯+,解得3t =. 故选:A . 【点睛】本题考查了回归方程的相关问题,意在考查学生的计算能力.5.A解析:A 【分析】根据图象即可看出,华为在每个季度的销量都最大,从而得出华为的全年销量最大,从而得出A 正确;由于不知每个季度的销量多少,从而苹果、华为和三星在哪个季度的销量大或小是没法判断的,从而得出选项B ,C ,D 都错误. 【详解】根据图象可看出,华为在每个季度的销量都最大,所以华为的全年销量最大;每个季度的销量不知道,根据每个季度的百分比是不能比较苹果在第二季度和第三季度销量多少的,同样不能判断华为在哪个季度销量最大,三星在哪个季度销量最小;B ∴,C ,D 都错误,故选A .【点睛】本题主要考查对销量百分比堆积图的理解.6.B解析:B 【分析】根据频率分布直方图的性质和频率分布直方图中样本估计总体,准确运算,即可求解. 【详解】由题意,根据频率分布直方图的性质得10(0.0200.0160.0160.0110.006)1m +++++=,解得0.031m =.故①正确;因为不低于140分的频率为0.011100.11⨯=,所以11010000.11n ==,故②错误; 由100分以下的频率为0.00610=0.06⨯,所以100分以下的人数为10000.06=60⨯,故③正确;分数在区间[120,140)的人数占0.031100.016100.47⨯+⨯=,占小半.故④错误.所以说法正确的是①③.故选B.【点睛】本题主要考查了频率分布直方图的应用,其中解答熟记频率分布直方图的性质,以及在频率分布直方图中,各小长方形的面积表示相应各组的频率,所有小长方形的面积的和等于1,着重考查了分析问题和解答问题的能力,属于基础题.7.C解析:C【分析】认真观察题中所给的折线图,对照选项逐一分析,求得结果.【详解】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确;从图可知从6日到9日 2.5PM 日均值逐渐降低,所以B 正确;从图可知,这10天中 2.5PM 日均值最高的是12月6日,所以D 正确;由图可知,这10天中 2.5PM 日均值的中位数是4145432+=,所以C 不正确; 故选C.【点睛】该题考查的是有关利用题中所给的折线图,描述对应变量所满足的特征,在解题的过程中,需要逐一对选项进行分析,正确理解题意是解题的关键. 8.A解析:A【解析】【分析】由茎叶图确定所给的所有数据,然后确定中位数即可.【详解】各数据为:12 20 31 32 34 45 45 45 47 47 48 50 50 61 63,最中间的数为:45,所以,中位数为45.本题选择A 选项.【点睛】本题主要考查茎叶图的阅读,中位数的定义与计算等知识,意在考查学生的转化能力和计算求解能力.9.D解析:D【解析】分析:首先根据题中所给的表中的数据,计算得出样本中心点的坐标,利用回归直线必过样本中心点,代入求得结果.详解:依题意得,1(014568)46x =⨯+++++=,1(1.3 1.8 5.6 6.17.49.3) 5.256y =+++++=, 因为回归直线必过样本中心点(,)x y ,即点(4,5.25),所以有5.25 1.034ˆa=⨯+,解得ˆ 1.13a =,故选D. 点睛:该题考查的是有关回归直线的有关问题,涉及到的知识点有回归直线一定过样本中心点,计算得出相应坐标的平均值,求得样本中心点的坐标,代入求得结果.10.C解析:C【分析】先求均值,再根据标准差公式求标准差,最后比较大小.【详解】 乙选手分数的平均数分别为7885848192767780949384,84,55++++++++==== 因此s 1<s 2,选C.【点睛】本题考查标准差,考查基本求解能力.11.C解析:C【分析】 首先求得x 的值,然后利用线性回归方程过样本中心点的性质求解12345y y y y y ++++的值即可.【详解】 由题意可得:12345305x x x x x x ++++==, 线性回归方程过样本中心点,则:0.6754.975y x =⨯+=,据此可知:12345y y y y y ++++5375y ==.本题选择C 选项.【点睛】本题主要考查线性回归方程的性质及其应用等知识,意在考查学生的转化能力和计算求解能力.12.C解析:C【解析】【分析】首先求出x y ,的平均数,将样本中心点代入回归方程中求出a 的值,然后写出回归方程,然后将10x =代入求解即可【详解】()19.59.39.18.99.79.35x =⨯++++= ()19289898793905y =⨯++++= 代入到回归方程为7.5ˆyx a =+,解得20.25a = 7.25ˆ50.2yx ∴=+ 将10x =代入7.50.5ˆ22yx =+,解得ˆ95.25y = 故选C【点睛】本题是一道关于线性回归方程的题目,解答本题的关键是求出线性回归方程,属于基础题。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
第一章 统计测评(A 卷)【说明】 本试卷分为第Ⅰ、Ⅱ卷两部分,请将第Ⅰ卷选择题的答案填入答题栏内,第Ⅱ卷可在各题后直接作答.共120分,考试时间90分钟.第Ⅰ卷(选择题 共50分)一、选择题(本大题共10小题,每小题5分,共50分)1.下列哪种工作不能使用抽样方法进行A .测定一批炮弹的射程B .测定海洋一水域的某种微生物的含量C .高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D .检测某学校全体高三学生的身高和体重的情况答案:D 抽样是为了用总体中的部分个体(样本)来估计总体的情况,选项A 、B 、C 都是从总体中抽取部分个体进行检验.选项D 是检测高三全体学生的身体状况,应进行普查,即要对该校高三全体学生的身体都进行检查,所以不能采取抽样的方法2.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长情况,采用分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为A .30B .25C .20D .15答案:C ∵抽样比=15030 000=1200,∴样本中松树苗的数量为4 000×1200=20.∴选C.A .0.13B .0.39C .0.52D .0.64答案:C 样本数据落在(10,40]上的频数为13+24+15=52,故其频率为52100=0.52.∴选C.4.一个年级有12个班,每班同学以1~50排学号,为了交流学习经验,要求每班学号为14的同学留下进行交流,这里运用的是A .分层抽样法B .抽签法C .随机数表法D .系统抽样法答案:D 由系统抽样的特点知,D 正确.5.设有一个线性回归方程为y =2-3x ,则变量x 增加一个单位时A .y 平均增加3个单位B .y 平均增加2个单位C .y 平均减少3个单位D .y 平均减少2个单位答案:C 由y =2-3x 的意义可得,变量x 增加一个单位,则y 平均减少3个单位,故选C 项.6.某商场买来一车苹果,从中随机抽取了10个苹果,其重量(单位:克)分别为:150,152,153,149,148,146,151,150,152,147,由此估计这车苹果单个重量的期望值(即平均值或均值)是A .150.2克B .149.8克C .149.4克D .147.8克答案:B 可直接用公式求得或x =150+110(0+2+3-1-2-4+1+0+2-3)=150-0.2=149.8(克).7.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为A .9B .18C .27D .36答案:B 设该单位老年职工有x 人,则160+3x =430⇒x =90,即老年职工有90人,则样本中老年职工人数为90×32160=18(人).故选B. 8A .答案:C 众数出现的频率最大,由表知0分频率最大是37%,故选C.9.对一组数据x i (i =1,2,3,…,n),如果将它们改变为x i -c(i =1,2,3,…,n),其中c≠0,则下列结论正确的是A .平均数与方差均不变B .平均数改变,方差不变C .平均数不变,方差改变D .平均数与方差都改变答案:B 设x =x 1+x 2+…+x n n ,则x i -c 的平均数x ′=1n[(x 1-c)+(x 2-c)+…+(x n -c)]=1n[(x 1+x 2+…+x n )-nc] =x 1+x 2+…+x n n-c =x -c , ∴平均数改变了;设s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],则x i -c 的方差为s 2=1n[(x 1-c -x ′)2+(x 2-c -x ′)2+…+(x n -c -x ′)2]=1n[(x 1-c -x +c)2+(x 2-c -x +c)2+…+(x n -c -x +c)2] =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2]=s 2, ∴方差没变.故选B.10.为了了解某学校学生的身体发育情况,抽查了该校100名高中男生的体重情况,根据所得数据画出样本的频率分布直方图如下图所示.根据此图,估计该校2 000名高中男生中体重大于70.5千克的人数为A .380B .420C .450D .480答案:A 设体重大于70.5千克的人数为x ,则x 2 000×2=0.04+0.035+0.02=0.095, ∴x=4 000×0.095=380(人),所以选A.第Ⅱ卷(非选择题 共70分)二、填空题(本大题共4小题,每小题4分,共16分.把答案填在题中横线上)11.假设要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验.利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第8行第7列的数开始向右读,请你依次写出最先检测的5袋牛奶的编号______________.(下面摘取了随机数表第7行至第9行)84 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 55 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54答案:785,567,199,507,175 第8行第7列为7,向右读第一个数为785,超过799的跳过,与前面重复的不取,一直取5个即可.12.某学院的A,B,C三个专业共有1 200名学生,为了调查这些学生勤工俭学的情况,拟采用分层抽样的方法抽取一个容量为120的样本.已知该学院的A专业有380名学生,B 专业有420名学生,则在该学院的C专业应抽取________名学生.答案:40 由题意知C专业有学生1 200-380-420=400(人),那么C专业应抽取的学生数为120×4001 200=40(名).13.从一堆苹果中任取5只,称得它们的质量如下(单位:克):125 124 121 123 127则该样本标准差s=______(克).(用数字作答)答案:2 ∵x=15(125+124+121+123+127)=124,∴s2=15[(125-124)2+(124-124)2+(121-124)2+(123-124)2+(127-124)2]=4.∴s=2.14.如下图是某企业近几年来关于生产销售的一张统计图表,则针对该企业近几年的销售情况,有以下几种说法:①这几年的利润逐年提高(注:利润=销售额-总成本);②2005年至2006年是销售额增长最快的一年;③2006年至2007年是销售额增长最慢的一年;④2007年至2008年销售额增长最慢,但是由于总成本有所下降,因而2008年的利润比上一年仍有所增长.其中说法正确的是________(注:把你认为正确的说法的代号都填上).答案:②④由题图知,2007年利润是100单位,比2006年的利润140单位小,∴①错误.2006年到2007年的销售额增长60单位,2007年到2008年的销售额增长50单位,∴③错误.三、解答题(本大题共5小题,共54分.解答应写出文字说明、证明过程或解题步骤)15.(10分)某单位共有在岗职工624人,为了调查工人上班时,从离开家到单位的路上平均所用时间,决定抽取62人作样本,如何采用系统抽样方法完成这一抽样?解:第一步 将这624名在岗职工随机编号,分别为000,001, (623)第二步 利用随机抽样方法从总体中剔除4人,将剩下的620名职工重新编号(分别为000,001,002,…,619),并分成62段;第三步 在第一段000,001,…,009这十个编号中用简单随机抽样确定起始号码i 0; 第四步 将编号为i 0,i 0+10,i 0+20,…,i 0+610的个体抽出,组成样本.16.(10分)下图是总体的一样本频率分布直方图,且在[15,18)内频数为8,(1)求样本容量;(2)若在[12,15)内小矩形面积为0.06,求在[12,15)内的频数;(3)求样本在[18,33)内的频率.解:(1)由题图可知[15,18)对应y 轴数字为475,且组距为3, ∴[15,18)对应频率为475×3=425.又已知[15,18)内频数为8, ∴样本容量n =8425=50. (2)[12,15)内的小矩形面积为0.06,即[12,15)内频率为0.06,且样本容量为50. ∴[12,15)内的频数为50×0.06=3.(3)由(1)(2)知,[12,15)内的频数为3,[15,18)内频数为8,样本容量为50.∴[18,33)内频数为50-3-8=39.∴[18,33)内频率为3950=0.78.17.(11分)某市有210名初中生参加数学竞赛预赛,随机调阅了60名学生的答卷,成(2)若规定预赛成绩在7分或7分以上的学生参加复赛,试估计有多少名学生可以进入复赛.解:(1)x =160(4×6+5×15+6×21+7×12+8×3+9×3)=6. s 2=160[6(4-6)2+15(5-6)2+21(6-6)2+12(7-6)2+3(8-6)2+3(9-6)2]=1.5. ∴s≈1.22.样本的数学平均成绩为6分,标准差为1.22.(2)根据60名学生中预赛成绩在7分或7分以上的学生数有:12+3+3=18(名),所以210名学生可以进入复赛的有1860×210=63(名).因此,估计有63名学生可以进入复赛.18.(11分)某良种培育基地正在培育一种小麦新品种A ,将其与原有的一个优良品种B 进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A :357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B :363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)画出茎叶图.(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A 与B 的亩产量及其稳定性进行比较,写出统计结论.解:(1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A 的亩产平均数(或均值)比品种B 高;②品种A 的亩产标准差(或方差)比品种B 大,故品种A 的亩产稳定性较差.19.(12(1)(2)如果散点图中各点大致分布在一条直线的附近,求y 与x 之间的线性回归方程;(3)试预测居民年收入50亿元时这种商品的销售额.解:(1)散点图如下图所示.(2)观察散点图可知各点大致分布在一条直线的附近.列出表,利用计算器进行计算.b =∑i =110x i y i -10x·y∑i =110x 2i -10x 2=15 202.9-379.7×39.114 663.67-(379.710)2×10≈1.447, a =y -b x =39.1-1.447×37.97≈-15.84,∴所求线性回归方程为y =1.447x -15.84.(3)根据上面求得的线性回归方程,当居民年收入50亿元时,y =1.447×50-15.84=56.51(万元),即这种商品销售额大约为56.51万元.。