2018卓越学案高考文科数学新课标一轮复习练习:第11章 统计、统计案例及算法初步 第3讲回归教材题源探究 含
北师大版版高考数学一轮复习第十一章统计与统计案例用样本估计总体教学案理

一、知识梳理1.统计图表(1)频率分布直方图的画法步骤1求极差(即一组数据中最大值与最小值的差);2决定组距与组数;3将数据分组;4列频率分布表;5画频率分布直方图.(2)频率分布折线图1频率分布折线图:连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.(3)茎叶图的画法步骤第一步:将每个数据分为茎(高位)和叶(低位)两部分;第二步:将最小茎与最大茎之间的数按大小次序排成一列;第三步:将各个数据的叶依次写在其茎的两侧.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把错误!称为a1,a2,…,a n这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,x n的平均数为错误!,则这组数据的标准差和方差分别是s=错误!s2=错误![(x1—错误!)2+(x2—错误!)2+…+(x n—错误!)2]常用结论1.频率分布直方图的特点(1)频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示错误!,频率=组距×错误!.(2)在频率分布直方图中,各小长方形的面积总和等于1,因为在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.2.平均数、方差的公式推广(1)若数据x1,x2,…,x n的平均数为错误!,那么mx1+a,mx2+a,mx3+a,…,mx n+a 的平均数是m错误!+a.(2)数据x1,x2,…,x n的方差为s2.1数据x1+a,x2+a,…,x n+a的方差也为s2;2数据ax1,ax2,…,ax n的方差为a2s2.二、教材衍化1.一个容量为32的样本,已知某组样本的频率为0.25,则该组样本的频数为()A.4B.8C.12D.16解析:选B.设频数为n,则错误!=0.25,所以n=32×错误!=8.2.若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是()A.91.5和91.5B.91.5和92C.91和91.5D.92和92解析:选A.因为这组数据由小到大排列为87,89,90,91,92,93,94,96,所以中位数是错误!=91.5,平均数错误!=错误!=91.5.3.如图是100位居民月均用水量的频率分布直方图,则月均用水量为[2,2.5)范围内的居民数有________人.解析:由频率分布直方图可知,月均用水量为[2,2.5)范围内的居民所占频率为0.5×0.5=0.25,所以月均用水量为[2,2.5)范围内的居民数为100×0.25=25.答案:254.甲、乙两台机床同时生产一种零件,10天中,两台机床每天出的次品数分别是:甲0 10 220 3124乙23110 2110 1则机床性能较好的为________.解析:因为错误!甲=1.5,错误!乙=1.2,s错误!=1.65,s错误!=0.76,所以s错误!<s 错误!,所以乙机床性能较好.答案:乙一、思考辨析判断正误(正确的打“√”,错误的打“×”)(1)一组数据的方差越大,说明这组数据的波动越大.()(2)在频率分布直方图中,小矩形的面积越大,表示样本数据落在该区间内的频率越大.()(3)茎叶图中的数据要按从小到大的顺序写,相同的数据可以只记一次.()(4)频率分布表和频率分布直方图是一组数据频率分布的两种形式,前者准确,后者直观.()(5)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数的估计值.()答案:(1)√(2)√(3)×(4)√(5)√二、易错纠偏错误!错误!(1)平均数与方差的性质理解出错;(2)中位数、众数、平均数的求法不清导致出错.1.若数据x1,x2,x3,…,x n的平均数错误!=5,方差s2=2,则数据3x1+1,3x2+1,3x3+1,…,3x n+1的平均数和方差分别为()A.5,2B.16,2C.16,18 D.16,9解析:选C.因为x1,x2,x3,…,x n的平均数为5,所以错误!=5,所以错误!+1=3×5+1=16,因为x1,x2,x3,…,x n的方差为2,所以3x1+1,3x2+1,3x3+1,…,3x n+1的方差是32×2=18.故选C.2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m,众数为n,平均数为错误!,则m,n,错误!的大小关系为________.(用“<”连接)解析:由题图可知,30名学生得分的中位数为第15个数和第16个数(分别为5,6)的平均数,即m=5.5;又5出现次数最多,故n=5;错误!=错误!(2×3+3×4+10×5+6×6+3×7+2×8+2×9+2×10)≈5.97.故n<m<错误!.答案:n<m<错误!茎叶图(自主练透)1.如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为()A.3,5B.5,5C.3,7 D.5,7解析:选A.根据两组数据的中位数相等可得65=60+y,解得y=5,又它们的平均值相等,所以错误!=错误!,解得x=3.故选A.2.(2020·陕西渭南模拟)已知甲,乙两名篮球运动员进行罚球训练,每人练习10组,每组罚球40个,每组投中个数的茎叶图如图所示,则下列结论错误的是()A.甲投中个数的极差是29B.乙投中个数的众数是21C.甲的投中率比乙高D.甲投中个数的中位数是25解析:选D.由茎叶图可知甲投中个数的极差为37—8=29,故A正确;易知乙投中个数的众数是21,故B正确;甲的投中率为错误!=0.535,乙的投中率为错误!=0.4225,所以甲的投中率比乙高,C正确;甲投中个数的中位数为错误!=23,D不正确,故选D.3.某学生在一门功课的22次考试中,所得分数的茎叶图如图所示,则此学生该门功课考试分数的极差与中位数之和为()A.117 B.118C.118.5D.119.5解析:选B.22次考试中,所得分数最高的为98,最低的为56,所以极差为98—56=42,将分数从小到大排列,中间两数为76,76,所以中位数为76,所以此学生该门功课考试分数的极差与中位数之和为42+76=118.错误!茎叶图中的三个关注点(1)“叶”的位置只有一个数字,而“茎”的位置的数字位数一般不需要统一.(2)重复出现的数据要重复记录,不能遗漏.(3)给定两组数据的茎叶图,估计数字特征,茎上的数字由小到大排列,一般“重心”下移者平均数较大,数据集中者方差较小.频率分布直方图(多维探究)角度一求样本的频率、频数(2020·湖南五市十校联考)在某次赛车中,50名参赛选手的成绩(单位:min)全部介于13到18之间(包括13和18),将比赛成绩分为五组:第一组[13,14),第二组[14,15),…,第五组[17,18].其频率分布直方图如图所示,若成绩在[13,15)内的选手可获奖,则这50名选手中获奖的人数为()A.39 B.35C.15D.11【解析】由频率分布直方图知成绩在[15,18]内的频率为(0.38+0.32+0.08)×1=0.78.所以成绩在[13,15)内的频率为1—0.78=0.22.则成绩在[13,15)内的选手有50×0.22=11(人),即这50名选手中获奖的人数为11,故选D.【答案】D角度二求样本的数字特征(2019·高考全国卷Ⅲ改编)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).【解】(1)由已知得0.70=a+0.20+0.15,故a=0.35.b=1—0.05—0.15—0.70=0.10.(2)甲离子残留百分比的平均值的估计值为2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05.乙离子残留百分比的平均值的估计值为3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.角度三与概率结合的问题(2020·安徽芜湖一模)某社区为了解该社区退休老人每天的平均户外活动时间,从该社区退休老人中随机抽取了100位老人进行调查,获得了每人每天的平均户外活动时间(单位:时),活动时间按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成样本的频率分布直方图如图所示.(1)求图中a的值;(2)估计该社区退休老人每人每天的平均户外活动时间的中位数;(3)在[1,1.5),[1.5,2)这两组中采用分层抽样的方法抽取7人,再从这7人中随机抽取2人,求抽取的2人恰好在同一个组的概率.【解】(1)由频率分布直方图,可知平均户外活动时间在[0,0.5)内的频率为0.08×0.5=0.04.同理,平均户外活动时间在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5)内的频率分别为0.08,0.20,0.25,0.07,0.04,0.02,由1—(0.04+0.08+0.20+0.25+0.07+0.04+0.02)=0.5a+0.5a,解得a=0.30.(2)设中位数为m时.因为前5组的频率之和为0.04+0.08+0.15+0.20+0.25=0.72>0.5,而前4组的频率之和为0.04+0.08+0.15+0.20=0.47<0.5,所以2≤m<2.5.所以0.50×(m—2)=0.5—0.47,解得m=2.06.故可估计该社区退休老人每人每天的平均户外活动时间的中位数为2.06时.(3)由题意得平均户外活动时间在[1,1.5),[1.5,2)内的人数分别为15,20.按分层抽样的方法在[1,1.5),[1.5,2)内分别抽取3人,4人,从7人中随机抽取2人,共有C错误!=21种方法,抽取的两人恰好都在同一个组有C错误!+C错误!=9种方法,故抽取的2人恰好在同一个组的概率P=错误!=错误!.错误!频率、频数、样本容量的计算方法错误!=频率,错误!=样本容量,样本容量×频率=频数.[提醒] 制作好频率分布表后,可以利用各组的频率之和是否为1来检验该表是否正确.1.在某中学举行的环保知识竞赛中,将三个年级参赛学生的成绩进行整理后分为5组,绘制如图所示的频率分布直方图,图中从左到右依次为第一、第二、第三、第四、第五小组,已知第二小组的频数是40,则成绩在80~100分的学生人数是()A.15B.18C.20 D.25解析:选A.根据频率分布直方图,得第二小组的频率是0.04×10=0.4,因为频数是40,所以样本容量是错误!=100,又成绩在80~100分的频率是(0.01+0.005)×10=0.15,所以成绩在80~100分的学生人数是100×0.15=15.故选A.2.(2020·安徽淮南二模)某乡镇为了打赢脱贫攻坚战,决定盘活贫困村的各项经济发展要素,实施了产业、创业、就业“三业并举”工程.在实施过程中,引导某贫困村农户因地制宜开展种植某经济作物.该类经济作物的质量以其质量指标值来衡量,质量指标值越大表明质量越好,记其质量指标值为k,其质量指标的等级划分如表:质量指标值k产品等级k≥90优秀80≤k<90良好75≤k<80合格k<75不合格品种的各10 000件产品,测量了每件产品的质量指标值,得到下面产品质量指标值频率分布直方图(图甲和图乙).(1)若将频率视为概率,从乙品种产品中有放回地随机抽取3件,记“抽出乙品种产品中至少有1件优等品(质量指标值k≥80为优等品)”为事件A,求事件A发生的概率P(A);(结果保留小数点后3位)(2)若甲、乙两个品种的销售利润率y与质量指标值k满足下表:质量指标值k k≥9080≤k<9075≤k<80k<75销售利润率y3t5t2t2—t其中错误!<t<解:(1)设“从乙品种产品中抽取1件为优等品”的概率为P,则根据频率分布直方图可得P=(0.03+0.08+0.04+0.02)×5=0.85,则P(A)=1—C错误!(1—P)3=1—0.153≈0.997.(2)由频率分布直方图可得,甲品种产品的利润率的分布列为y3t5t2t2P0.20.70.1Ey甲=0.2×3t+0.7×5t2+22;乙品种产品的利润率的分布列为y3t5t2t2—tP0.30.550.10.05Ey乙=0.3×3t+0.55×5t2+0.1×t2+0.05×(—t)=2.85t2+0.85t.Ey甲—E(y)乙=3.6t2+0.6t—(2.85t2+0.85t)=0.75t2—0.25t=0.25t(3t—1),由于错误!<t<错误!,所以Ey甲—Ey乙<0,即Ey甲<Ey乙.故种植乙品种的平均利润率较大.样本数字特征的求解与应用(师生共研)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:运动员第1次第2次第3次第4次第5次甲8791908993乙8990918892(2)甲、乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图:1分别求出两人得分的平均数与方差;2根据图和上面算得的结果,对两人的训练成绩作出评价.【解】(1)错误!甲=错误!(87+91+90+89+93)=90,错误!乙=错误!(89+90+91+88+92)=90,s错误!=错误![(87—90)2+(91—90)2+(90—90)2+(89—90)2+(93—90)2]=4,s错误!=错误![(89—90)2+(90—90)2+(91—90)2+(88—90)2+(92—90)2]=2.故填2.(2)1由题图可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.错误!甲=错误!=13;错误!乙=错误!=13,s错误!=错误![(10—13)2+(13—13)2+()2+(14—13)2+(16—13)2]=4;s错误!=错误![(13—13)2+(14—13)2+()2+()2+(14—13)2]=0.8.2由s错误!>s错误!,可知乙的成绩较稳定.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.错误!(1)众数、中位数、平均数及方差的意义1平均数与方差都是重要的数字特征,是对总体的一种简明地描述;2平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)在计算平均数、方差时可利用平均数、方差的有关结论.1.甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A.甲的成绩的平均数小于乙的成绩的平均数B.甲的成绩的中位数等于乙的成绩的中位数C.甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差解析:选C.错误!甲=错误!(4+5+6+7+8)=6,错误!乙=错误!(5×3+6+9)=6,甲的成绩的方差为错误!(22×2+12×2)=2,乙的成绩的方差为错误!(12×3+32×1)=2.4.甲的成绩的中位数为6,乙的成绩的中位数为5,甲的成绩的极差为4,乙的成绩的极差为4,故选C.2.(2020·贵阳市监测考试)在某校科普知识竞赛前的模拟测试中,得到甲、乙两名学生的6次模拟测试成绩(百分制)的茎叶图(如图).若从甲、乙两名学生中选择一人参加该知识竞赛,你会选哪位?请运用统计学的知识说明理由.解:学生甲的平均成绩错误!甲=错误!=82,学生乙的平均成绩错误!乙=错误!=82,又s错误!=错误!×[(68—82)2+(76—82)2+(79—82)2+(86—82)2+(88—82)2+(95—82)2]=77,s错误!=错误!×[(71—82)2+(75—82)2+(82—82)2+(84—82)2+(86—82)2+(94—82)2]=错误!,则错误!甲=错误!乙,s错误!>s错误!,说明甲、乙的平均水平一样,但乙的方差小,即乙发挥更稳定,故可选择学生乙参加知识竞赛.[基础题组练]1.(2019·高考全国卷Ⅱ)演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分、1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,不变的数字特征是()A.中位数B.平均数C.方差D.极差解析:选A.记9个原始评分分别为a,b,c,d,e,f,g,h,i(按从小到大的顺序排列),易知e 为7个有效评分与9个原始评分的中位数,故不变的数字特征是中位数,故选A.2.(2020·陕西商洛质检)在一次53.5千米的自行车个人赛中,25名参赛选手成绩(单位:分钟)的茎叶图如图所示,现将参赛选手按成绩由好到差编为1~25号,再用系统抽样的方法从中选取5人,已知选手甲的成绩性为85分钟,若甲被选取,则被选取的其余4名选手的成绩的平均数为()A.95B.96C.97 D.98解析:选C.由系统抽样法及已知条件可知被选中的其他4人的成绩分别是88,94,99,107,故平均数为错误!=97,故选C.3.(2020·广东珠海摸底)某班级在一次数学竞赛中设置了一等奖、二等奖、三等奖以及参与奖,各个奖品的单价分别为一等奖20元,二等奖10元,三等奖5元,参与奖2元,获奖人数的分配情况如图所示,则以下说法不正确的是()A.获得参与奖的人数最多B.各个奖项中三等奖的总费用最高C.购买奖品的平均费用为9.25元D.购买奖品的费用的中位数为2元解析:选C.设全班人数为a.由扇形统计图可知.一等奖占5%,二等奖占10%,三等奖占30%,参与奖占55%,获得参与奖的人数最多,故A正确;一等奖的总费用为5%a×20=a.二等奖的总费用为10%a×10=a,三等奖的总费用为30%a×5=错误!a,参与奖的总费用为55%a×2=错误!a,所以各个奖项中三等奖的总费用最高,故B正确;购买奖品的平均费用为5%×20+10%×10+30%×5+55%×2=4.6(元),故C错误;参与奖占55%,所以购买奖品的费用的中位数为2元,故D 正确.故选C.4.(2020·安徽六安毛坦厂中学月考)某位教师的家庭总收入为80 000元,各种用途占比统计如下面的折线图.收入的各种用途占比统计如下面的条形图,已知的就医费用比增加了4750元,则该教师的家庭总收入为()A.100 000元B.95000元C.90 000元D.85000元解析:选D.由已知得,2017年的就医费用为80 000×10%=8 000(元).故的就医费用为8 000+4750=12750(元),所以该教师的家庭总收入为错误!=85000(元).故选D.5.甲、乙两名同学6次考试的成绩统计如图所示,甲、乙两组数据的平均数分别为错误!甲,错误!乙,标准差分别为σ甲,σ乙,则()A.错误!甲<错误!乙,σ甲<σ乙B.错误!甲<错误!乙,σ甲>σ乙C.错误!甲>错误!乙,σ甲<σ乙D.错误!甲>错误!乙,σ甲>σ乙解析:选C.由题图可知,甲同学除第二次考试成绩略低于乙同学外,其他考试成绩都远高于乙同学,可知错误!甲>错误!乙,题图中数据显示甲同学的成绩比乙同学稳定,故σ甲<σ乙.6.某中学奥数培训班共有14人,分为两个小组,在一次阶段测试中两个小组成绩的茎叶图如图所示,其中甲组学生成绩的平均数是88,乙组学生成绩的中位数是89,则n—m的值是________.解析:由甲组学生成绩的平均数是88,可得错误!=88,解得m=3.由乙组学生成绩的中位数是89,可得n=9,所以n—m=6.答案:67.已知某地区中小学生人数和近视情况分别如图甲和图乙所示.为了了解该地区中小学生的近视形成原因,用分层抽样的方法抽取2%的学生进行调查,则样本容量和抽取的高中生近视人数分别为________、________.解析:由题图甲可知学生总人数是10 000,样本容量为10 000×2%=200,抽取的高中生人数是2000×2%=40,由题图乙可知高中生的近视率为50%,所以抽取的高中生的近视人数为40×50%=20.答案:200 208.为了了解某校高三美术生的身体状况,抽查了部分美术生的体重,将所得数据整理后,作出了如图所示的频率分布直方图.已知图中从左到右的前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,则被抽查的美术生的人数是________.解析:设被抽查的美术生的人数为n,因为后2个小组的频率之和为(0.037 5+0.0125)×5=0.25,所以前3个小组的频率之和为0.75.又前3个小组的频率之比为1∶3∶5,第2个小组的频数为15,所以前3个小组的频数分别为5,15,25,所以n=错误!=60.答案:609.我国是世界上严重缺水的国家,城市缺水问题较为突出.某市政府为了鼓励居民节约用水,计划在本市试行居民生活用水定额管理,即确定一个合理的居民月用水量标准x(吨),月用水量不超过x的部分按平价收费,超出x的部分按议价收费.为了了解全市居民用水量的分布情况,通过抽样,获得了100位居民某年的月均用水量(单位:吨),将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求频率分布直方图中a的值;(2)已知该市有80万居民,估计全市居民中月均用水量不低于3吨的人数,并说明理由;(3)若该市政府希望使85%的居民每月的用水量不超过标准x(吨),估计x的值,并说明理由.解:(1)由频率分布直方图,可得(0.08+0.16+a+0.40+0.52+a+0.12+0.08+0.04)×0.5=1,解得a=0.30.(2)由频率分布直方图知,100位居民每人月均用水量不低于3吨的频率为(0.12+0.08+0.04)×0.5=0.12.由以上样本频率分布,可以估计全市80万居民中月均用水量不低于3吨的人数为800 000×0.12=96 000.(3)因为前6组的频率之和为(0.08+0.16+0.30+0.40+0.52+0.30)×0.5=0.88>0.85,前5组的频率之和为(0.08+0.16+0.30+0.40+0.52)×0.5=0.73<0.85,所以2.5≤x<3.由0.3×(x—2.5)=0.85—0.73,解得x=2.9.因此,估计月用水量标准为2.9吨时,85%的居民每月的用水量不超过标准.10.有A,B,C,D,E五位工人参加技能竞赛培训.现分别从A,B二人在培训期间参加的若干次预赛成绩中随机抽取8次.用茎叶图表示这两组数据:(1)A,B二人预赛成绩的中位数分别是多少?(2)现要从A,B中选派一人参加技能竞赛,从平均状况和方差的角度考虑,你认为派哪位工人参加合适?请说明理由;(3)若从参加培训的5位工人中选2人参加技能竞赛,求A,B二人中至少有一人参加技能竞赛的概率.解:(1)A的中位数是错误!=84,B的中位数是错误!=83.(2)派B参加比较合适.理由如下:错误!B=错误!(78+79+81+82+84+88+93+95)=85,错误!A=错误!(75+80+80+83+85+90+92+95)=85,s错误!=错误![(78—85)2+(79—85)2+(81—85)2+(82—85)2+(84—85)2+(88—85)2+(93—85)2+(95—85)2]=35.5,s错误!=错误![(75—85)2+(80—85)2+(80—85)2+(83—85)2+(85—85)2+(90—85)2+(92—85)2+(95—85)2]=41,因为错误!A=错误!B,但s错误!<s错误!,说明B稳定,派B参加比较合适.(3)5位工人中选2人有10种:(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E);A,B都不参加的有3种:(C,D),(C,E),(D,E),A,B二人中至少有一人参加技能竞赛的概率P=1—错误!=错误!.[综合题组练]1.PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物.如图是根据环保部门某日早6点至晚9点在A县、B县两个地区附近的PM2.5监测点统计的数据(单位:毫克/立方米)列出的茎叶图,A县、B县两个地区浓度的方差较小的是()A.A县B.B县C.A县、B县两个地区相等D.无法确定解析:选A.根据茎叶图中的数据可知,A县的数据都集中在0.05和0.08之间,数据分布比较稳定,而B县的数据分布比较分散,不如A县数据集中,所以A县的方差较小.2.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x—y|的值为()A.1B.2C.3D.4解析:选D.由题意知这组数据的平均数为10,方差为2,可得:x+y=20,(x—10)2+(y—10)2=8,设x=10+t,y=10—t,由(x—10)2+(y—10)2=8,得t2=4,所以|x—y|=2|t|=4.3.设样本数据x1,x2,…,x2017的方差是4,若y i=2x i—1(i=1,2,…,2017),则y,y2,…,y2017的方差为________.1解析:设样本数据的平均数为错误!,则y i=2x i—1的平均数为2错误!—1,则y1,y2,…,y20的方差为错误![(2x1—1—2错误!+1)2+(2x2—1—2错误!+1)2+…+(2x2017—117—2错误!+1)2]=4×错误![(x1—错误!)2+(x2—错误!)2+…+(x2017—错误!)2]=4×4=16.答案:164.我市某高中从高三年级甲、乙两个班中各选出7名学生参加全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86,若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则错误!+错误!的最小值为________.解析:由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x=1.由乙班学生成绩的平均数为86,可得(—10)+(—6)+(—4)+(y—6)+5+7+10=0,解得y=4.由x,G,y成等比数列,可得G2=xy=4,由正实数a,b满足a,G,b 成等差数列,可得G=2,a+b=2G=4,所以错误!+错误!=(错误!+错误!)×(错误!+错误!)=错误!(1+错误!+错误!+4)≥错误!×(5+4)=错误!(当且仅当b=2a时取等号).故错误!+错误!的最小值为错误!.答案:错误!5.(2020·东北三省三校二模)一个经销鲜花产品的微店,为保障售出的百合花品质,每天从某省鲜花基地空运固定数量的百合花,如有剩余则免费分赠给第二天购花顾客,如果不足,则从本地鲜花供应商处进货.今年四月前10天,微店百合花的售价为每支2元,某省空运来的百合花每支进价1.6元,本地供应商处的百合花每支进价1.8元,微店这10天的订单中百合花的日需求量(单位:支)依次为:251,255,231,243,263,241,265,255,244,252.(1)求今年四月前10天订单中百合花日需求量的平均数和众数,并完成频率分布直方图;(2)预计四月的后20天,订单中百合花日需求量的频率分布与四月前10天相同,百合花进货价格与售价均不变,请根据(1)中频率分布直方图判断(同一组中的需求量数据用该组区间的中点值作代表,位于各区间的频率代替位于该区间的概率),微店每天从某省固定空运250支,还是255支百合花,四月后20天百合花销售总利润会更大?解:(1)四月前10天订单中百合需求量众数为255,平均数错误!=错误!×(231+241+243+244+251+252+255+255+263+265)=250.频率分布直方图如图:(2)设订单中百合花的日需求量为a(支),由(1)中频率分布直方图知,a可能取值为235,245,255,265,相应频率分别为0.1,0.3,0.4,0.2.所以20天中a=235,245,255,265相应的天数为2天,6天,8天,4天.1若空运250支,a=235,当日利润为235×2—250×1.6=70(元),a=245,当日利润为245×2—250×1.6=90(元),a=255,当日利润为255×2—250×1.6—5×1.8=101(元),a=265,当日利润为265×2—250×1.6—15×1.8=103(元),20天总利润为70×2+90×6+101×8+103×4=1900(元).2若空运255支,a=235,当日利润为235×2—255×1.6=62(元),a=245,当日利润为245×2—255×1.6=82(元),a=255,当日利润为255×2—255×1.6=102(元),a=265,当日利润为265×2—255×1.6—10×1.8=104(元),20天总利润为62×2+82×6+102×8+104×4=1848(元).因为1900>1848,所以每天空运250支百合花,四月后20天总利润更大.6.某高三毕业班甲、乙两名同学在连续的8次数学周练中,统计解答题失分的茎叶图如图:(1)比较这两名同学8次周练解答题失分的平均数和方差的大小,并判断哪位同学做解答题相对稳定些;(2)以上述数据统计甲、乙两名同学失分超过15分的频率作为概率,假设甲、乙两名同学在同一次周练中失分多少互不影响,预测在接下来的2次周练中,甲、乙两名同学失分均超过15分的次数X的分布列和均值.解:(1)错误!甲=错误!(7+9+11+13+13+16+23+28)=15,错误!乙=错误!(7+8+10+15+17+19+21+23)=15,s错误!=错误![(—8)2+(—6)2+(—4)2+(—2)2+(—2)2+12+82+132]=44.75,s错误!=错误![(—8)2+(—7)2+(—5)2+02+22+42+62+82]=32.25.甲、乙两名同学解答题失分的平均数相等;甲同学解答题失分的方差比乙同学解答题失分的方差大.所以乙同学做解答题相对稳定些.(2)根据统计结果,在一次周练中,甲和乙失分超过15分的概率分别为P1=错误!,P2=错误!,两人失分均超过15分的概率为P1P2=错误!,X的所有可能取值为0,1,2.依题意,X~B错误!,P(X=k)=C错误!错误!错误!错误!错误!,k=0,1,2,则X的分布列为X012P错误!错误!错误!X的均值EX=2×错误!。
2018年高三最新 高考第一轮复习数学:统计(文)(附答案) 精品

素质能力检测(十二)一、选择题(每小题5分,共60分)1.从50件产品中,采用逐一抽取的方法抽取5件产品,若其中只有一件次品,在送质检部门进行检验时次品被抽到的概率是A.0.1B.0.18C.0或1D.以上都不对解析:次品被抽到的概率,即入样的概率p =N n =505=0.1. 答案:A2.某校有40个班级,每班50人,每班选派3人参加“学代会”,在这个问题中样本容量是A.40B.50C.120D.150 解析:3×40=120. 答案:C3.从N 个编号中要抽n 个号码入样,考虑采用系统抽样方法,抽样距(间距)为A.nN B.n C.[n N]D.[nN]+1 解析:抽样间距应为n N 的整数部分即[nN ]. 答案:C4.某养鸡场养有蛋鸡、肉鸡和草鸡三种鸡,其中有蛋鸡1500只,肉鸡3000只,草鸡900只,估计产量时,应采用的抽样方法是A.分层抽样B.随机抽样C.系统抽样D.以上三种方法都可以 解析:由于个体之间差异较大,故采用分层抽样. 答案:A5.某校高三年级的195名学生已编号为1,2,3,…,195,为了解高三学生的饮食情况,要按1∶5的比例抽取一个样本,若采用系统抽样法进行抽取,其中抽取的3名编号可能是A.3,24,33B.31,47,147C.133,153,193D.118,132,159解析:由系统抽样方法,分成39个部分,每部分5个个体,分段间隔k =5,抽取编号相差5的整数倍.答案:C6.一个容量为20的样本数据,分组后,组距与频数如下:(10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2.则样本在(-∞,50]上的频率为A.5%B.25%C.50%D.70%解析:205432+++=10070.答案:D 7.若数据x 1,x 2,…,x n 的平均数为x ,方差为s 2,则3x 1+5,3x 2+5,…,3x n +5的平均数和方差分别是A.x ,s 2B.3x +5,9s 2C.3x +5,s 2D.3x +5,9s 2+30s +25解析:代入公式易得为B. 答案:B8.在抽查某产品的尺寸的过程中,将其尺寸分成若干组,[a ,b ]是其中一组,抽查出的个数在该组上的频率为m ,该组上的直方图的高为h ,则|a -b |等于A.h ·mB.mh C.hm D.与m 、h 无关 解析:|a -b |即为组距,m =hx . 答案:C9.从118名学生中,采用系统抽样法抽取10名学生作为样本,则每名学生被抽到的概率为A.1001B.1071C.10010 D.10710解析:p =107100×101=10710. 答案:D10.已知样本容量为30,在样本频率分布直方图中,各小长方形的高之比为AE ∶BF ∶CG ∶DH =2∶4∶3∶1,则第2组的频率和频数分别为频率A B C D E FG H 数据 A.0.4,12 B.0.6,16C.0.4,16D.0.6,12解析:频数n 2=30×13424+++=12,频率f 2=3012=0.4.答案:A第三组的频率和累积频率分别为 A.0.14和0.37B.141和371C.0.18和0.18D.143和376 解析:10014=0.14,100141310++=10037=0.37. 答案:A12.在100个零件中,有一级品20个、二级品30个、三级品50个,从中抽取20个作为样本.①采用随机抽样法将零件编号为00,01,…,99,抽签取出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个; ③采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.对于上述问题,下面说法正确的是A.不论采用哪一种抽样方法,这100个零件中每一个被抽到的概率都是51 B.①②两种抽样方法,这100个零件中每一个被抽到的概率为51,③并非如此 C.①③两种抽样方法,这100个零件中每一个被抽到的概率为51,②并非如此 D.采用不同的抽样方法,这100个零件中每一个零件被抽到的概率是各不相同的 解析:依据抽样方法的基本原理知选A. 答案:A二、填空题(每小题4分,共16分)13.利用简单随机抽样法,从n 个个体(n >13)中抽取13个个体,若第二次抽取时,余下的每个个体被抽取到的概率为31,则在整个抽样过程中,各个个体被抽取到的概率为___________.解析:第二次抽取时,余下的每个个体被抽到的概率为31,所以余下的人数为36人.所以n =37.则在整个抽样过程中,各个个体被抽取到的概率为3713. 答案:3713 14.某公司生产三种型号的轿车,产量分别为1200辆,6000辆和2000辆,为检验该公司的产品质量,现用分层抽样法抽取46辆进行检验,这三种型号的轿车依次应抽取_______辆、_______辆、_______辆.答案:6 30 1015.容量为100的某个样本数据拆分为10组,并填写频率分布表,若前七组频率之和为0.79,而剩下的三组的频率成公差为0.18的等差数列,则剩下的三组中频率最大的一组的频率为___________.解析:依题意,剩下三组的频率之和为1-0.79=0.21,∴0.21=a 1+a 1+d +a 1+2d =3a 1+0.15.得a 1=0.18.∴频率最大的一组的频率为0.18+2×0.18=0.12.答案:0.1216.从甲、乙两个总体中各抽取了一个样本: 甲:900,920,900,850,910,920;乙:890,960,950,850,860,890. 总体波动较小的是___________. 解析:x 甲=61(0+20+0-50+10+20)+900=900, x 乙=61(-10+60+50-50-40-10)+900=900, s 甲2=61[(900-900)2+(920-900)2+…+(920-900)2]=63400≈567, s 乙2=61[(890-900)2+(950-900)2+…+(890-900)2]=610400≈1733. ∴波动较小的是甲. 答案:甲三、解答题(本大题共6小题,共74分)17.(12分)一个城市有210家商店,其中大型商店有20家,中型商店有40家,小型商店有150家,为掌握各商店的营业情况,要从中抽取一个容量为21的样本,按照分层抽样法抽取样本时,各类商店要抽多少家?写出抽样过程.解:抽样比为21021=101,20×101=2,40×101=4,150×101=15, ∴大、中、小型商店各抽2家、4家、15家.抽样过程:从20家大型商店中随机抽2家,从40家中型商店中随机抽4家,从150家小型商店中随机抽15家,将此21家商店综合在一起即为样本.18.(12分)某文艺团体演职人员共100人,其中乐队15人,歌队20人,曲艺队30人,舞队25人,职员10人.(1)列出各队的频率分布表; (2)画出频率分布条形图. 解:(1)频率分布表如下.频率0.30.20.11 2 3 4 5队号19.(12分)某班有50名学生(男生30名,女生20名)准备抽取101,解:(1)运用简单随机抽样方法从50名学生中抽取5名学生作为样本. (2)若男、女生身高有显著差异,则运用分层抽样法抽样,分别运用简单随机抽样法从30名男生中抽取3名,从20名女生中抽取2名,将这5名学生组成样本即为所求.20.(12分)已知一个样本:25,21,23,25,27,29,25,28,30,29,26,24,25,27,26,22,24,25,26,28.以2为组距,列出频率分布表,并绘出频率分布直方图,并估计样本值出现在22~28之间的概率.解:可知最大值为30,最小值为21,组距为2,所以可分5组.(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图估计小于30的数据约占多大百分比. 解:(1)频率分布表如下:(2)频率分布直方图如下:533.5样本数据累积频率分布图如下:100000000012.5 15.5 18.5 21.5 24.5 27.5 30.5 33.5样本数据(322.(145月1日至30布直方图(如下图).为12,请解答下列各题.率距日期(1)本次活动共有多少件作品参加评比? (2)哪组上交的作品数量最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪一组获奖率较高?解:(1)依题意可算出第三组的频率为1464324+++++=51.设共有n 件作品,则n 12=51,∴n =60(件). (2)由直方图,可看出第四组上交作品数量最多,共有60×206=18(件). (3)第四组获奖率为1810=95, 第六组获奖率为201602⨯=32=96, 所以第六组获奖率较高.●意犹未尽自己救自己某人在屋檐下躲雨,看见观音正撑伞走过.这人说:“观音菩萨,普度一下众生吧,带我一段如何?”观音说:“我在雨里,你在檐下,而檐下无雨,你不需要我度.”这人立刻跳出檐下,站在雨中:“现在我也在雨中了,该度我了吧?”观音说:“你在雨中,我也在雨中,我不被淋,因为有伞;你被雨淋,因为无伞,所以不是我度自己,而是伞度我.你要想度,不必找我,请自找伞去!”说完便走了.第二天,这人遇到了难事,便去寺庙里求观音.走进庙里,才发现观音的像前也有一个人在拜,那个人长得和观音一模一样,丝毫不差.这人问:“你是观音吗?”那人答道:“我正是观音.”这人又问:“那你为何还拜自己?”观音笑道:“我也遇到了难事,但我知道,求人不如求己.”一语中的:成功者自救.。
2018年高考数学一轮复习单元滚动检测十一统计与统计案例理新人教B版

单元滚动检测十一 统计与统计案例考生注意:1.本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,共4页.2.答卷前,考生务必用蓝、黑色字迹的钢笔或圆珠笔将自己的姓名、班级、学号填写在相应位置上.3.本次考试时间120分钟,满分150分. 4.请在密封线内作答,保持试卷清洁完整.第Ⅰ卷(选择题 共60分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.某检测机构对一地区农场选送的有机蔬菜进行农药残留量安全检测,其中提供黄瓜、花菜、小白菜、芹菜这4种蔬菜的分别有40家、10家、30家、20家,现从中抽取一个容量为20的样本进行农药残留量安全检测.若采用分层抽样的方法抽取样本,则抽取的提供花菜与芹菜这2种蔬菜的共有( )A .4家B .5家C .6家D .7家2.(2016·武汉4月调研)已知某赛季甲、乙两名篮球运动员每场比赛的得分茎叶图如图所示,则甲、乙两人得分的中位数之和为( )A .62B .63C .64D .653.(2016·大连双基测试)已知x 、y 的取值如表所示:如果y 与x 线性相关,且回归直线方程为y =b x +2,则b ^的值为( )A .-12 B.12 C .-110 D.1104.(2016·石家庄正定中学第一次月考)某健康协会从某地区睡前看手机的居民中随机选取了n 人进行调查,得到如图所示的频率分布直方图.已知睡前看手机时间不低于20分钟的有243人,则n的值为( )A.180 B.270C.360 D.450 5.(2016·沈阳质检)某班级有男生20人,女生30人,从中抽取10人作为样本,恰好抽到4个男生,6个女生.给出下列命题:(1)该抽样可能是简单随机抽样;(2)该抽样一定不是系统抽样;(3)该抽样中每个女生被抽到的概率大于每个男生被抽到的概率.其中真命题的个数为( )A.0 B.1 C.2 D.3 6.(2016·大连模拟)某工科院校对A、B两个专业的男、女生人数进行调查统计,得到以下表格:( )A.0.005 B.0.01 C.0.025 D.0.05注:5户家庭,得到如下统计数据表:根据上表可得回归直线方程y=b x+a,其中b=0.76,a=y-b x.据此估计,该社区一户年收入为15万元家庭的年支出为( )A.11.4万元 B.11.8万元C.12.0万元 D.12.2万元8.如图是某青年歌手大奖赛上七位评委为甲、乙两名选手打出的分数的茎叶图(其中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1、。
2018卓越学案高考文科数学新课标一轮复习练习:第11章 统计、统计案例及算法初步 第1讲知能训练轻松闯关 含

一、选择题1.为检查某公司生产的袋装牛奶的蛋白质含量是否达标,现从800袋牛奶中抽取60袋进行检验,利用随机数表抽取样本时,先将800袋牛奶按000,001,…,799进行编号,如果从随机数表第7行第8列的数开始向右读,则得到的第4个样本个体的编号是(下面摘取了随机数表第7行至第9行)()87 42 17 53 31 57 24 55 06 88 77 04 74 47 67 21 76 33 50 25 83 92 12 06 7663 01 63 78 59 16 95 56 67 19 98 10 50 71 75 12 86 73 58 07 44 39 52 38 7933 21 12 34 29 78 64 56 07 82 52 42 07 44 38 15 51 00 13 42 99 66 02 79 54A.068B.572C.455D.331[导学号35950803]解析:选 A.由随机数表可得前4个样本个体的编号是331,572,455,068.于是,第4个样本个体的编号是068,故选A.2.某校老年、中年和青年教师的人数见下表,采用分层抽样的方法调查教师的身体状况,在抽取的样本中,青年教师有320人,则该样本中的老年教师人数为()A.90C.180 D.300[导学号35950804]解析:选C.设该样本中的老年教师人数为x,由题意及分层抽样的特点得x900=3201 600,故x=180.3.在某大学数学专业的160名学生中开展一项社会调查,先将学生随机编号为01,02,03,…,160,采用系统抽样的方法抽取样本,已知抽取的学生中最小的两个编号为07,23,那么抽取的学生中最大编号应该是()A.150 B.151C.142 D.143[导学号35950805]解析:选B.由最小的两个编号为07,23可知,抽样间距为16,因此抽取人数的比例为116,即抽取10名学生,其编号构成首项为7,公差为16的等差数列,故抽取的学生中最大编号为7+9×16=151.4.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A .93B .123C .137D .167[导学号35950806] 解析:选C.初中部的女教师人数为110×70%=77,高中部的女教师人数为150×(1-60%)=60,该校女教师的人数为77+60=137,故选C.5.某工厂在12月份共生产了3 600双皮靴,在出厂前要检查这批产品的质量,决定采用分层抽样的方法进行抽取,若从一、二、三车间抽取的产品数分别为a ,b ,c ,且a ,b ,c 构成等差数列,则第二车间生产的产品数为( )A .800B .1 000C .1 200D .1 500[导学号35950807] 解析:选C.因为a ,b ,c 成等差数列,所以2b =a +c ,即第二车间抽取的产品数占抽样产品总数的三分之一,根据分层抽样的性质可知,第二车间生产的产品数占12月份生产总数的三分之一,即为1 200双皮靴.6.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样的方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在A 营区,从301到495在B 营区,从496到600在C 营区,则三个营区被抽中的人数依次为( )A .26,16,8B .25,17,8C .25,16,9D .24,17,9[导学号35950808] 解析:选B.依题意及系统抽样的意义可知,将这600名学生按编号依次分成50组,每一组各有12名学生,第k (k ∈N *)组抽中的号码是3+12(k -1).令3+12(k -1)≤300,得k ≤1034,因此A 营区被抽中的人数是25;令300<3+12(k -1)≤495,得1034<k ≤42,因此B 营区被抽中的人数是42-25=17.结合各选项知B 正确. 7.对一个容量为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为p 1,p 2,p 3,则( )A .p 1=p 2<p 3B .p 2=p 3<p 1C .p 1=p 3<p 2D .p 1=p 2=p 3[导学号35950809] 解析:选D.由于三种抽样过程中,每个个体被抽到的概率都是相等的,因此p 1=p 2=p 3.二、填空题8.某校高一年级有900名学生,其中女生400名,按男女比例用分层抽样的方法,从该年级学生中抽取一个容量为45的样本,则应抽取的男生人数为________.[导学号35950810] 解析:设男生抽取x 人,则有45900=x 900-400,解得x =25. 答案:259.为了了解1 200名学生对学校某项教改实验的意见,打算从中抽取一个容量为30的样本,考虑采取系统抽样,则分段的间隔k 为________.[导学号35950811] 解析:在系统抽样中,确定分段间隔k ,对编号进行分段,k =N n(N 为总体的容量,n 为样本的容量),所以k =N n =1 20030=40. 答案:4010.某报社做了一次关于“什么是新时代的雷锋精神”的问卷调查,在A ,B ,C ,D 四个单位回收的问卷数依次成等差数列,且共回收1 000份,因报道需要,再从回收的问卷中按单位分层抽取容量为150的样本,若在B 单位抽取30份,则在D 单位抽取的问卷是________份.[导学号35950812] 解析:由题意依次设在A ,B ,C ,D 四个单位回收的问卷数分别为a 1,a 2,a 3,a 4,在D 单位抽取的问卷数为n ,则有30a 2=1501 000,解得a 2=200,又a 1+a 2+a 3+a 4=1 000,即3a 2+a 4=1 000,所以a 4=400,所以n 400=1501 000,解得n =60. 答案:60三、解答题11.某政府机关有在编人员100人,其中副处级以上干部10人,一般干部70人,工人20人.上级机关为了了解政府机构改革意见,要从中抽取一个容量为20的样本,试确定用何种方法抽取,请具体实施抽取.[导学号35950813] 解:用分层抽样方法抽取.具体实施抽取如下:(1)因为20∶100=1∶5,所以105=2,705=14,205=4, 所以,从副处级以上干部中抽取2人,从一般干部中抽取14人,从工人中抽取4人.(2)因副处级以上干部与工人的人数较少,他们分别按1~10编号与1~20编号,然后采用抽签法分别抽取2人和4人;对一般干部70人采用00,01,02,…,69编号,然后用随机数表法抽取14人.(3)将2人,4人,14人的编号汇合在一起就取得了容量为20的样本.12.某公路设计院有工程师6人,技术员12人,技工18人,要从这些人中抽取n 个人参加市里召开的科学技术大会,如果采用系统抽样和分层抽样的方法抽取,不用剔除个体,如果参会人数增加1个,则在采用系统抽样时,需要在总体中先剔除1个个体,求n .[导学号35950814] 解:总体容量为6+12+18=36.当样本容量是n 时,由题意知,系统抽样的间隔为36n, 分层抽样的比例是n 36,抽取的工程师人数为n 36×6=n 6,技术员人数为n 36×12=n 3,技工人数为n 36×18=n 2, 所以n 应是6的倍数,36的约数,即n =6,12,18.当样本容量为n +1时,总体容量为35,系统抽样的间隔为35n +1,因为35n +1必须是整数,所以n 只能取6,即样本容量n =6.13.已知某中学高三学生共有800人参加了数学与地理的水平测试,学校决定利用随机数表法从中抽取100人进行成绩抽样调查,先将800人按001,002,…,800进行编号.(1)如果从第8行第7列的数开始向右读,请你依次写出最先检查的3个人的编号;(下面摘取了第7行到第9行)84 42 17 53 31 57 24 55 06 88 77 04 7447 67 21 76 33 50 25 83 92 12 06 76(第7行)63 01 63 78 59 16 95 56 67 19 98 10 5071 75 12 86 73 58 07 44 39 52 38 79(第8行)33 21 12 34 29 78 64 56 07 82 52 42 0744 38 15 51 00 13 42 99 66 02 79 54(第9行)(2)抽取的100人的数学与地理的水平测试成绩如下表.成绩分为优秀、人数,例如:表中数学成绩为良好的共有20+18+4=42人.①若在该样本中,数学成绩优秀率是30%,求a ,b 的值;②在地理成绩及格的学生中,已知a ≥10,b ≥8,求数学成绩优秀的人数比及格的人数少的概率.[导学号35950815] 解:(1)从第8行第7列的数开始向右读,依次检查的编号分别为785,916(舍),955(舍),667,199,….故最先检查的3个人的编号为785,667,199.(2)①7+9+a 100=30%, ∴a =14,b =100-30-(20+18+4)-(5+6)=17.②a +b =100-(7+20+5)-(9+18+6)-4=31.∵a ≥10,b ≥8,∴a ,b 的搭配为(10,21),(11,20),(12,19),(13,18),(14,17),(15,16),(16,15),(17,14),(18,13),(19,12),(20,11),(21,10),(22,9),(23,8),共14种.记a ≥10,b ≥8,数学成绩优秀的人数比及格的人数少为事件A .则事件A 包括(10,21),(11,20),(12,19),(13,18),(14,17),(15,16),共6个基本事件.∴P (A )=614=37, ∴数学成绩优秀的人数比及格的人数少的概率为37. 14.据报道,全国很多省市将英语考试作为高考改革的重点,一时间“英语考试该如何改”引起广泛关注.为了解某地区学生和包括老师、家长在内的社会人士对高考英语改革的看法,某媒体在该地区选择了3 600人进行调查,就“是否取消英语听力”问题进行了问卷调查统计,结果如下表:0.05.(1)现用分层抽样的方法在所有参与调查的人中抽取360人进行问卷访谈,问应在持“无所谓”态度的人中抽取多少人?(2)已知y ≥657,z ≥55,若所选择的在校学生的人数低于被调查人群总数的80%,则认为本次调查“失效”,求本次调查“失效”的概率.[导学号35950816] 解:(1)∵抽到持“应该保留”态度的人的概率为0.05,∴120+x 3 600=0.05,解得x =60. ∴持“无所谓”态度的人数共有3 600-2 100-120-600-60=720,∴应在持“无所谓”态度的人中抽取720×3603 600=72(人). (2)∵y +z =720,y ≥657,z ≥55,∴满足条件的(y ,z )有:(657,63),(658,62),(659,61),(660,60),(661,59),(662,58),(663,57),(664,56),(665,55),共9种.记本次调查“失效”为事件A ,若调查“失效”,则2 100+120+y <3 600×0.8,解得y <660.∴事件A 包含:(657,63),(658,62),(659,61),共3种.∴P (A )=39=13.。
2018高考数学一轮复习文科训练天天练统计案例有答案和解释

(1)
求
(xi
i)(
1,2
…
16)
的
相
关
系
数
r
并
回
答
是
否
可
以
认
为
这
一一一
天
生
产
的
零
件
尺
寸
不
随
生
产
过
程
的
进
行
而
系
统
地
变
大
或
变
小
(
若
|r|<
025
则
可
以
认
为
零
件
的
尺
寸
不
随
生
产
过
程
的
进
行
而
系
统
地
变
大
或
变
小
)
-
(2
■)
一一一
天
内
抽
检
零
件
中
如
果
出
现
了
尺
寸
在
(x
一
3s
x
+
3s)
之
外
的
零
件
就
认
为
这
条
生
产
线
在
意
限
疋
区
域
停
车
与
家
长
的
性
别
有
关
•
二二二
、
填
空
题
9
-
(20
18?
江
2018届高考新课标数学理大一轮复习检测:第十一章 统

A 组 专项基础训练(时间:40分钟)1.(2017·豫东、豫北十所名校联考)根据如下样本数据:得到的回归直线方程为y =bx +a .若样本点的中心为(5,0.9),则当x 每增加1个单位时,y 就( )A .增加1.4个单位B .减少1.4个单位C .增加7.9个单位D .减少7.9个单位 【解析】 依题意得,a +b -25=0.9,故a +b =6.5①,又样本点的中心为(5,0.9),故0.9=5b +a ②,联立①②,解得b =-1.4,a =7.9,则y ^=-1.4x +7.9,可知当x 每增加1个单位时,y 就减少1.4个单位.【答案】 B2.春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:附表及公式K 2=(a +b )(c +d )(a +c )(b +d )A .有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”B .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C .在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”D .有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”【解析】 由2×2列联表得到a =45,b =10,c =30,d =15,则a +b =55,c +d =45,a +c =75,b +d =25,ad =675,bc =300,n =100,计算得K 2的观测值k =100×(675-300)255×45×75×25≈3.030.因为2.706<3.030<3.841,所以有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”.【答案】 A3.为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:则y 对x A .y =x -1 B .y =x +1 C .y =88+12x D .y =176【解析】 由题意知D 项明显不符合实际,排除; 且x =174+176+176+176+1785=176,y =175+175+176+177+1775=176,又y 对x 的线性回归方程表示的直线恒过点(x ,y ), 所以将(176,176)代入A ,B ,C 中检验,只有C 成立. 【答案】 C4.已知某产品连续4个月的广告费用为x i (i =1,2,3,4)千元,销售额为y i (i =1,2,3,4)万元,经过对这些数据的处理,得到如下数据信息:①x 1+x 2+x 3+x 4=18,y 1+y 2+y 3+y 4=14;②广告费用x 和销售额y 之间具有较强的线性相关关系;③回归直线方程y ^=bx+a 中的b =0.8(用最小二乘法求得),那么,当广告费用为6千元时,可预测销售额约为( )A .3.5万元B .4.7万元C .4.9万元D .6.5万元【解析】 依题意得x =4.5,y =3.5,由回归直线必过样本中心点得a =3.5-0.8×4.5=-0.1.当x =6时,y ^=0.8×6-0.1=4.7.【答案】 B5.(2017·郑州预测)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:由表中数据,求得线性回归方程为y =-4x +a .若在这些样本点中任取一点,则它在回归直线左下方的概率为( )A.16B.13C.12D.23【解析】 依题意得x =16×(4+5+6+7+8+9)=132,y =16×(90+84+83+80+75+68)=80,又回归直线必经过样本中心点(x ,y ),于是有a =80+4×132=106,不等式4x +y-106<0表示的是回归直线的左下方区域.注意到在6个样本数据中,共有2个样本数据位于回归直线的左下方区域,因此所求的概率等于13.【答案】 B6.(2017·济宁二模)已知下表所示数据的回归直线方程为y ^=4x +242,则实数a =________.【解析】 回归直线y ^=4x +242必过样本点的中心(x ,y ),而x =2+3+4+5+65=4,y=251+254+257+a +2665=1 028+a 5,∴1 028+a 5=4×4+242,解得a =262.【答案】 2627.某单位为了了解用电量y 千瓦·时与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.5 ℃时,用电量的千瓦·时数约为________.【解析】 因为回归直线经过样本中心点,故由已知数表可得x =10,y =30,即(10,30)在回归直线上,代入方程可得a =50,即回归直线方程为y =50-2x ,故可预测当气温为5 ℃时,用电量的度数约为50-2×5=40.【答案】 408.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:已知P (K 2≥3.841)≈K 2的观测值k =50×(13×20-10×7)223×27×20×30≈4.844,则有________的把握认为选修文科与性别有关.【解析】 由题意知,K 2=50×(13×20-10×7)223×27×20×30≈4.844,因为5.024>4.844>3.841,所以有95%的把握认为选修文科与性别有关.【答案】 95%9.(2017·宁夏银川一中期末)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)y =bx +a . (2)已知该厂技改前,100吨甲产品的生产能耗为90吨标准煤.试根据(1)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考数值:3×2.5+4×3+5×4+6×4.5=66.5)10.(2017·邯郸摸底)为了解少年儿童的肥胖是否与常喝碳酸饮料有关,现对30名六年级学生进行了问卷调查得到如下列联表.平均每天喝500 mL 以上为常喝,体重超过50 kg 为肥胖.已知在全部30人中随机抽取1人,抽到肥胖的学生的概率为415.(1)请将上面的列联表补充完整.(2)是否有99.5%的把握认为肥胖与常喝碳酸饮料有关?说明你的理由.(3)设常喝碳酸饮料且肥胖的学生中有2名女生,现从常喝碳酸饮料且肥胖的学生中抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:K 2=n (ad -bc )2(a +b )(c +d )(a +c )(b +d ),其中n =a +b +c +d .【解析】 (1)设常喝碳酸饮料肥胖的学生有x 人,x +230=415,解得x =6.(2)有.由已知数据可求得K 2=10×20×8×22≈8.523>7.879.因此有99.5%的把握认为肥胖与常喝碳酸饮料有关.(3)设4名常喝碳酸饮料的肥胖男生为A ,B ,C ,D ,女生为E ,F ,则任取两人的取法有AB ,AC ,AD ,AE ,AF ,BC ,BD ,BE ,BF ,CD ,CE ,CF ,DE ,DF ,EF ,共15种.其中一男一女的取法有AE ,AF ,BE ,BF ,CE ,CF ,DE ,DF ,共8种.故抽到一男一女的概率是P =815.B 组 专项能力提升 (时间:30分钟)11.下列说法:①将一组数据中的每一个数据都加上或减去同一个常数后,方差不变;②设有一个线性回归方程y ^=3-5x ,变量x 增加1个单位时,y 平均增加5个单位; ③设具有相关关系的两个变量x ,y 的相关系数为r ,则|r |越接近于0,x 和y 之间的线性相关程度越强;④在一个2×2列联表中,由计算得K 2的值,则K 2的值越大,判断两个变量间有关联的把握就越大.以上,错误结论的个数为( ) A .0 B .1 C .2 D .3【解析】 方差反应一组数据的波动大小,将一组数据中的每个数据都加上或减去同一个常数后,方差不变,故①正确;在线性回归方程y ^=3-5x 中,变量x 增加1个单位时,y 平均减小5个单位,故②不正确;根据线性回归分析中相关系数的定义:在线性回归分析中,相关系数为r ,|r |越接近于1,相关程度越强,故③不正确;对分类变量x 与y 的随机变量的观测值K 2来说,K 2越大,“x 与y 有关系”的可信程度越大,故④正确.综上所述,错误结论的个数为2,故选C.【答案】 C12.(2017·兰州、张掖联考)对具有线性相关关系的变量x ,y 有一组观测数据(x i ,y i )(i =1,2,…,8),其线性回归方程是y ^=13x +a ^,且x 1+x 2+x 3+…+x 8=2(y 1+y 2+y 3+…+y 8)=6,则实数a ^的值是( )A.116 B.18C.14D.12【解析】 依题意可知样本点的中心为⎝ ⎛⎭⎪⎫34,38,则38=13×34+a ^,解得a ^=18. 【答案】 B13.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:已知在全部105人中随机抽取1人,成绩优秀的概率为7,则下列说法正确的是( )A .列联表中c 的值为30,b 的值为35B .列联表中c 的值为15,b 的值为50C .根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”D .根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”【解析】 由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c =20,b =45,选项A 、B 错误.根据列联表中的数据,得到K 2=105×(10×30-20×45)255×50×30×75≈6.109>5.024,因此有97.5%的把握认为“成绩与班级有关系”. 【答案】 C14.某中学对“学生性别和是否喜欢看NBA 比赛”作了一次调查,其中男生人数是女生人数的2倍,男生喜欢看NBA 的人数占男生人数的56,女生喜欢看NBA 的人数占女生人数的13.(1)若被调查的男生人数为n ,根据题意建立一个2×2列联表;(2)若有95%的把握认为是否喜欢看NBA 和性别有关,求男生至少有多少人? 附:K 2=(a +b +c +d )(ad -bc )2(a +b )(c +d )(a +c )(b +d ),【解析】 (1)(2)K 2=3n 2⎝ ⎛⎭⎪⎫5n 6·n 3-n 6·n 6n ·n 2·n 2·n =38n .若有95%的把握认为是否喜欢看NBA 和性别有关, 则K 2>3.841,即38n >3.841,n >10.24.∵n 2,n6为整数,∴n 最小值为12. 即:男生至少12人.15.(2016·课标全国Ⅲ)下图是我国2008年至2014年生活垃圾无害化处理量(单位:亿吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y与t的关系,请用相关系数加以说明;(2)建立y关于t的回归方程(系数精确到0.01),预测2016年我国生活垃圾无害化处理量.。
2018卓越学案高考理科数学新课标一轮复习课件:第11章 统计、统计案例及算法初步 第3讲 精品
2.已知变量 x 和 y 满足关系 y=-0.1x+1,变量 y 与 z 正相关.下 列结论中正确的是( C ) A.x 与 y 正相关,x 与 z 负相关 B.x 与 y 正相关,x 与 z 正相关 C.x 与 y 负相关,x 与 z 负相关 D.x 与 y 负相关,x 与 z 正相关 解析:因为 y=-0.1x+1 的斜率小于 0,故 x 与 y 负相关.因为 y 与 z 正相关,可设 z=^by+^a,^b>0,则 z=^by+^a=-0.1^bx+^b +^a,故 x 与 z 负相关,故选 C.
(2)由(1)知,^b=0.5>0,故 2009 年至 2015 年该地区农村居民家庭 人均纯收入逐年增加,平均每年增加 0.5 千元. 将 2020 年的年份代号 t=12 代入(1)中的回归方程,得 ^y=0.5×12+2.3=8.3,即预测该地区 2020 年农村居民家庭人均纯 收入 8.3 千元.
yi-^y i2 yi- y 2)
解析:样本点都在直线上时,其数据的估计值与真实值是相等的,
即 yi=^yi,代入相关系数公式 r=
1-∑ i∑ i==nn11 yyii--^yyi22=1.
求回归方程与线性回归分析
某地区 2009 年至 2015 年农村居民家庭人均纯收入 y(单位:
千元)的数据如下表:
即有 y =^b x +^a,可确定^a. 3.在独立性检验中,查表比较 K2 与临界值进行判断.
1.(必修 3 P101A 组 T8 改编)改革开放以来,我国教育事业发展迅速, 某省把近 10 年来农村、县城、地级市和省城每年考入大学的百分比
作为因变量,把年份 x 作为自变量得到四条回归直线.
省城^y=2.84x+9.50,地级市^y=2.52x+8.35,
高三数学复习 第十一章 统计、统计案例 第二节 用样本估计总体夯基提能作业本 理(2021年整理)
2018届高三数学一轮复习第十一章统计、统计案例第二节用样本估计总体夯基提能作业本理2018届高三数学一轮复习第十一章统计、统计案例第二节用样本估计总体夯基提能作业本理编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018届高三数学一轮复习第十一章统计、统计案例第二节用样本估计总体夯基提能作业本理)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018届高三数学一轮复习第十一章统计、统计案例第二节用样本估计总体夯基提能作业本理的全部内容。
2018届高三数学一轮复习第十一章统计、统计案例第二节用样本估计总体夯基提能作业本理第二节用样本估计总体A组基础题组1.某厂10名工人在一小时内生产零件的个数分别是15,17,14,10,15,17,17,16,14,12,设该组数据的平均数为a,中位数为b,众数为c,则有()A.a〉b>cB.b>c〉aC.c>a〉bD.c〉b〉a2。
如图是某大学自主招生面试环节中,七位评委为某考生打出的分数的茎叶统计图,去掉一个最高分和一个最低分后,所剩数据的平均数和众数依次为( )794 4 6 48793A。
85,84 B.84,85 C。
86,84 D.84,863.某班的全体学生参加英语测试,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100]。
若低于60分的人数是15,则该班的学生人数是()A。
45 B。
50 C。
55 D.604。
为了了解某校高三学生的视力情况,随机地抽查了该校100名高三学生的视力情况,得到频率分布直方图如图,但不慎将部分数据丢失,只知道后五组频数和为62,设视力在4。
高考数学一轮复习 第十一章 计数原理、概率、随机变量及其分布 11.3 二项式定理真题演练集训 理
11.3 二项式定理真题演练集训理新人教A版编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(2018版高考数学一轮复习第十一章计数原理、概率、随机变量及其分布11.3 二项式定理真题演练集训理新人教A版)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为2018版高考数学一轮复习第十一章计数原理、概率、随机变量及其分布11.3 二项式定理真题演练集训理新人教A版的全部内容。
11.3 二项式定理真题演练集训理新人教A版1.[2016·新课标全国卷Ⅰ](2x+x)5的展开式中,x3的系数是________.(用数字填写答案)答案:10解析:由(2x+x)5,得T r+1=C错误!(2x)5-r(错误!)r=25-r C错误!x,令5-错误!=3,得r=4,此时系数为10.2.[2016·北京卷]在(1-2x)6的展开式中,x2的系数为________.(用数字作答)答案:60解析:(1 -2x)6的展开式的通项T r+1=C错误!(-2)r x r,当r=2时,T3=C错误!(-2)2x2=60x2,所以x2的系数为60。
3.[2016·天津卷]错误!8的展开式中x7的系数为________.(用数字作答)答案:-56解析:二项展开式的通项T r+1=C r,8(x2)8-r错误!r=(-1)r C错误!x16-3r,令16-3r=7,得r=3,故x7的系数为-C错误!=-56.4.[2016·山东卷]若错误!5的展开式中x5的系数是-80,则实数a=________。
答案:-2解析:错误!5的展开式的通项T r+1=C错误!(ax2)5-r·x错误!=C错误!a5-r·x,令10-错误!r=5,得r=2,所以C错误!a3=-80,解得a=-2。
2018届高考数学一轮复习精选试题统计(解答题) Word版含答案
统计解答题(本大题共个小题,共分,解答应写出文字说明,证明过程或演算步骤).对某校高三年级学生参加社区服务次数进行统计,随机抽取名学生作为样本,得到这名学生参加社区服务的次数.根据此数据作出了频数与频率的统计表和频率分布直方图如下:(Ⅰ)求出表中及图中的值;(Ⅱ)若该校高三学生有人,试估计该校高三学生参加社区服务的次数在区间内的人数;(Ⅲ)在所取样本中,从参加社区服务的次数不少于次的学生中任选人,求至多一人参加社区服务次数在区间内的概率.【答案】(Ⅰ)由分组内的频数是,频率是知,,所以.因为频数之和为,所以,,因为是对应分组的频率与组距的商,所以(Ⅱ)因为该校高三学生有人,分组内的频率是,所以估计该校高三学生参加社区服务的次数在此区间内的人数为人(Ⅲ)这个样本参加社区服务的次数不少于次的学生共有人,设在区间内的人为,在区间内的人为.则任选人共有,种情况,而两人都在内只能是一种,所以所求概率为.为了解某班学生喜爱打篮球是否与性别有关,对本班人进行了问卷调查得到了如下的列联表:已知在全部人中随机抽取人抽到喜爱打篮球的学生的概率为.()请将上面的列联表补充完整;()是否有.%的把握认为喜爱打篮球与性别有关?说明你的理由;()已知喜爱打篮球的位女生中,还喜欢打羽毛球,还喜欢打乒乓球,还喜欢踢足球,现再从喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的女生中各选出名进行其他方面的调查,求和不全被选中的概率.【答案】()列联表补充如下:()∵∴有.%的把握认为喜爱打篮球与性别有关.()从位女生中选出喜欢打羽毛球、喜欢打乒乓球、喜欢踢足球的各名,其一切可能的结果组成的基本事件如下:,,,,,,,,,,,,基本事件的总数为,用表示“不全被选中”这一事件,则其对立事件表示“全被选中”这一事件,由于由,。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
一、选择题
1.(选修1-2 P 6例2改编)一只红铃虫的产卵y 和温度x 有关,根据收集的数据散点分布在曲线y =c 1e c 2x 的周围,若用线性回归模型建立回归关系,则应作下列哪个变换( )
A .t =ln x
B .t =x 2
C .t =ln y
D .t =e y
解析:选C.由y =c 1e c 2x 得c 2x =ln y
c 1=ln y -ln c 1,
令t =ln y ,得t =c 2x +ln c 1,故选C.
2.(必修3 P 95B 组T 1改编)某科研所对新研发的一种产品进行合理定价,该产品按事先拟定的价格试销得统计数据.
回归方程为y =b x +a ,(其中已算出b =-20);
该产品的成本为4.5元/件,为使科研所获利最大,该产品定价应为( ) A .6.5元/件 B .7.5元/件 C .8.5元/件
D .9.5元/件
解析:选C.依题意:x =1
6(8+8.2+8.4+8.8+8. 6+9)=8.5,
y =1
6(90+84+83+80+75+68)=80.
又b ^
=-20,
∴a ^=y -b ^
x =80+20×8.5=250, ∴回归直线的方程为y ^
=-20x +250. 设科研所所得利润为W ,设定价为x ,
∴W =(x -4.5)(-20x +250)=-20x 2+340x -1 125, ∴当x =340
40
=8.5时,W max =320.
故当定价为8.5元时,W 取得最大值.故选C. 二、填空题
3.(必修3 P 92练习T 2改编)已知x ,y 之间的一组数据如下表:
对于表中数据,现给出如下拟合直线:①y =x +1;②y =2x -1;③y =85x -25;④y =3
2
x .
则根据最小二乘法的思想求得拟合程度最好的直线是________(填序号).
解析:由题意知x =4,y =6, ∴b ^=∑5
i =1x i y i -5x y ∑5i =
1x 2i -5x 2
=85,
∴a ^=y -b ^x =-25,∴y ^=85x -2
5.
答案:③
4.(选修1-2 P 16习题T 2改编)某校某次数学考试规定80分以上(含80分)为优分,在1 000名考生中随机抽取的100名学生中,“男生组”中的优分有15人,“女生组”中的优分有15人,据此可得2×2列联表如下:
则正确的结论是________.
附表及公式
K 2
=n (ad -bc )(a +b )(c +d )(a +c )(b +d )
.
解析:K 2
=100×(15×25-15×45)2
60×40×30×70
≈1.79,
因为1.79<2.706,
所以没有90%以上的把握认为“数学成绩与性别有关”. 答案:没有90%以上的把握认为“数学成绩与性别有关” 三、解答题
5.(必修3 P 90例改编)某位同学进行寒假社会实践活动,为了对白天平均气温与某奶茶店的某种饮料销量之间的关系进行分析研究,他分别记录了1月11日至1月15日的白天平均气温x (℃)与该奶茶店的这种饮料销量y (杯),得到如下数据:
(1)若先从这5组数据中抽出2组,求抽出的2组数据恰好不是相邻2天数据的概率; (2)请根据所给5组数据,求出y 关于x 的线性回归方程y ^=b ^x +a ^
;并根据线性回归方程预测当气象台预报1月16日的白天平均气温为7℃时奶茶店这种饮料的销量.
附:线性回归方程y ^=b ^x +a ^
中,
⎩⎪⎨⎪⎧
b ^=∑i =1
n
(x i
-x )(y i
-y )∑i =1
n (x i
-x )2
=
∑i =1n
x i y i
-nx - y -
∑i =1
n x 2i
-n x 2
a ^=y -
b ^x
,其中x ,y 为样本平均值.
解:(1)设“选取的2组数据恰好不是相邻2天的数据”为事件A .所有基本事件(m ,n )(m ,n 为日期)为(11,12),(11,13),(11,14),(11,15),(12,13),(12,14),(12,15),(13,14),(13,15),(14,15),共10个,事件A 包括的基本事件有(11,13),(11,14),(11,15),(12,14),(12,15),(13,15)共6个.
∴P (A )=610=35
.
(2)∵x =9+10+12+11+8
5=10,
y =
23+25+30+26+21
5
=25.
∴由公式,求得b ^=2.1,a ^=y -b ^
x =4 ∴y 关于x 的线性回归方程为y ^
=2.1x +4, ∵当x =7时,y ^
=2.1×7+4=18.7,
∴该奶茶店这种饮料的销量大约为19杯(或18杯).
6.(选修1-2 P 15练习改编)甲、乙两所学校高三年级分别有1 200人,1 000人,为了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:
甲校:
(2)若规定考试成绩在[120,150]内为优秀,由以上统计数据填写下面2×2列联表,并判断是否有90%的把握认为两所学校的数学成绩有差异.
参考数据与公式:
K 2
=n (ad -bc )2
(a +b )(c +d )(a +c )(b +d )
,n =a +b +c +d
临界值表
解:(1)甲校抽取学生的人数为110×1 200
2 200=60,
乙校抽取学生的人数为110×1 000
2 200=50,故x =10,y =7.
(2)表格填写如下:
K 2
=110×(15×30-20×45)60×50×35×75
≈2.83>2.706.
又因为1-0.10=0.9,故有90%的把握认为两个学校的数学成绩有差异.。