高中数学必修三第二章统计复习 优质
人教版高中数学必修三第二章《统计》单元检测精选(含答案解析)

人教版高中数学必修三第二章《统计》单元检测精选(含答案解析)一、选择题(本大题共12小题,每小题5分,共60分)1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( ) A .1 000名学生是总体B .每个被抽查的学生是个体C .抽查的125名学生的体重是一个样本D .抽取的125名学生的体重是样本容量2.由小到大排列的一组数据x 1,x 2,x 3,x 4,x 5,其中每个数据都小于-1,那么对于样本1,x 1,-x 2,x 3,-x 4,x 5的中位数可以表示为( ) A.12(1+x 2) B.12(x 2-x 1) C.12(1+x 5) D.12(x 3-x 4) 3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是( )A .7,11,19B .6,12,18C .6,13,17D .7,12,174.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关5.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13,那么另一组数3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数,方差分别是( )A .2,13 B .2,1C .4,23D .4,36.某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法是( ) A .在每个饲养房各抽取6只B .把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只C .从4个饲养房分别抽取3,9,4,8只D .先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定7.下列有关线性回归的说法,不正确的是( )A .相关关系的两个变量不一定是因果关系B .散点图能直观地反映数据的相关程度C .回归直线最能代表线性相关的两个变量之间的关系D .任一组数据都有回归直线方程8.已知施肥量与水稻产量之间的回归直线方程为y ^=4.75x +257,则施肥量x =30时,对产量y 的估计值为( )A .398.5B .399.5C .400D .400.59.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ) A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取( ) A .36人 B .60人 C .24人 D .30人11.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( )A .19,13B .13,19C .20,18D .18,2012A .30%B .70%C .60%D .50%二、填空题(本大题共4小题,每小题5分,共20分)13.已知一个回归直线方程为y ^=1.5x +45(x i ∈{1,5,7,13,19}),则y =________. 14.若a 1,a 2,…,a 20这20个数据的平均数为x ,方差为0.21,则a 1,a 2,…,a 20,x 这21个数据的方差为________.15.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.16.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样方法抽一个容量为7的样本,其中30岁以上的员工应抽取________人.三、解答题(本大题共6小题,共70分)17.(10分)某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:(1)(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?18.(12分)炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:(1)(2)求回归直线方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?19.(12分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.20.(12分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)(2)若二者线性相关,求回归直线方程.21.(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)A类工人中和B类工人中各抽查多少工人?(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.表1表2异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1A类工人生产能力的频率分布直方图图2B类工人生产能力的频率分布直方图②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).22.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?参考答案与解析1.C [在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A 、B 错误,样本容量应为125,故D 错误.]2.C [由题意把样本从小到大排序为x 1,x 3,x 5,1,-x 4,-x 2,因此得中位数为12(1+x 5).]3.B [因27∶54∶81=1∶2∶3,16×36=6,26×36=12,36×36=18.]4.C [由点的分布知x 与y 负相关,u 与v 正相关.]5.D [因为数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13,所以x =2,15∑5i =1 (x i -2)2=13, 因此数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为: 15∑5i =1 (3x i -2)=3×15∑5i =1x i-2=4, 方差为:15∑5i =1 (3x i -2-x )2=15∑5i =1 (3x i -6)2=9×15∑5i =1 (x i -2)2=9×13=3.] 6.D [因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C 虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.]7.D [根据两个变量具有相关关系的概念,可知A 正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B 、C 正确.只有线性相关的数据才有回归直线方程,所以D 不正确.] 8.B [成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x =30时,y ^=4.75×30+257=399.5.]9.D [由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合.乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合.故丁地符合.]10.A [由题意知高一、高二、高三的人数分别为667,667,666. 设a =2k ,b =3k ,c =5k ,则a +b +c =35×2 000,即k =120.∴b =3×120=360.又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.]11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.] 12.B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的1420×100%=70%.]13.58.5解析 回归直线方程为y ^=1.5x +45经过点(x , y ),由x =9,知y =58.5. 14.0.215.0.030 3解析 因5个矩形面积之和为1,即(0.005+0.010+0.020+a +0.035)×10=1, ∴0.070×10+10a =1,∴a =0.030.由于三组内学生数的频率分别为:0.3,0.2,0.1,所以三组内学生的人数分别为30,20,10.因此从[140,150]内选取的人数为1060×18=3.16.217.解 (1)作出的散点图如图所示(2)易得x =52,y =692,所以b ^ =∑4i =1x i y i -4x y ∑4i =1x 2i -4x 2=418-4×52×69230-4×⎝⎛⎭⎫522=735,a ^ =y -b ^ x =692-735×52=-2.故y 对x 的回归直线方程为y ^ =735x -2.(3)当x =9时,y ^ =735×9-2=129.4.故当广告费为9万元时,销售收入约为129.4万元.18.解 (1)以x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图所示:从图中可以看出,各点散布在一条直线附近,即它们线性相关.设所求的回归直线方程为y =b x +a ,b ^ =∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2≈1.267,a ^ =y -b ^ x ≈-30.47.所求回归直线方程为 y ^=1.267x -30.47.(3)当x =160时,y ^=1.267×160+(-30.47)=172.25.即当钢水含碳量为160时,应冶炼约172.25分钟.19.解 (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高. 20.解 (1)作出散点图:观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.(2)x =110(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y =110(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,∑10i =1x i y i =27.51,∑10i =1x 2i =33.72, b ^=∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2≈0.813 6,a ^ =1.42-1.74×0.813 6≈0.004 3,∴回归方程为y ^=0.813 6x +0.004 3.21.解 (1)A 类工人中和B 类工人中分别抽查25名和75名.(2)①由4+8+x +5+3=25,得x =5,6+y +36+18=75,得y =15. 频率分布直方图如下:图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.②x A =425×105+825×115+525×125+525×135+325×145=123,x B =675×115+1575×125+3675×135+1875×145=133.8,x =25100×123+75100×133.8=131.1.A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1. 22.解 (1)作出如下散点图:由图可知,y 与x 具有线性相关关系.x =55,y =91.7,∑10i =1x 2i =38 500,∑10i =1y 2i =87 777,∑10i =1x i y i =55 950, 设所求的回归直线方程为y ^ =b ^ x +a ^,则有b ^ =∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668,a ^ =y -b ^ x =91.7-0.668×55=54.96,因此,所求的回归直线方程为y ^ =0.668x +54.96.(3)这个回归直线方程的意义是当x 每增加1时,y 的值约增加0.668,而54.96是y 不随x 变化而变化的部分,因此,当x =200时,y 的估计值为y ^ =0.668×200+54.96=188.56≈189,因此,加工200个零件所用的时间约为189分.。
数学必修3第二章 统计复习

.
所以这组数据的方差为5.5,标准差为2.3 .
例4. 从甲、乙两名学生中选拔一人乘积射 击比赛,对他们的射击水平进行测试,两 人在相同的条件下各射击10次,命中环数 如下﹕ 甲﹕7,8,6,8,6,5,8,10,7,4; 乙﹕9,5,7,8,7,6,8,6,7,7. (1)计算甲、乙两人射击命中环数的平 均数和标准差; (2)比较两人的成绩,然后决定选择哪 一人参赛.
变量间的相关关系
最小二乘法
回归直线方程 y bx + a
n
n
(xi - x)( yi - y) xi yi - nx y
b i1 n
i1 n
, a y - bx
(xi - x)2
xi2 - nx 2
i1
i1
7.小王记录了产量x(吨)和能耗y(吨标准煤)对应
的四组数据,用最小二乘法求出了 yˆ 0.7x +,0不.3慎5 将
6. 2009年义乌小商品博览会共设国际标准展位5000个。 为了解展览期间成交状况,现从中抽取100展位的成交 额(万元),制成如下频率分布表和频率分布直方图:
频率/组距
分组 频 频率 频率/ 0.026
0.50
数
组距 0.022
[150,170) 4 0.04 0.002 0.018
0.36
[170,190)
5
0.05 0.0025 0.014
[190,210) 36 0.36 0.018
0.010
[210,230) 50 0.50 0.025
0.006
[230,250] 5 0.05 0.0025
0.04 0.05
0.05
0.002
国家课程校本化:高中数学必修三第二章 统计 课时训练

2.1.1简单随机抽样一、基础过关1.为了了解某种花的发芽天数,种植某种花的球根200个,进行调查发芽天数的试验,样本是() A.200个表示发芽天数的数值B.200个球根C.无数个球根发芽天数的数值集合D.无法确定2.某校有40个班,每班50人,要求每班随机选派3人参加“学生代表大会”.在这个问题中样本容量是() A.40 B.50 C.120 D.1503.用简单随机抽样方法从含有10个个体的总体中,抽取一个容量为3的样本,其中某一个体a“第一次被抽到”的可能性,“第二次被抽到”的可能性分别是()A.110,110 B.310,15C.15,310 D.310,3104.下列抽样实验中,用抽签法方便的是() A.从某厂生产的3 000件产品中抽取600件进行质量检验B.从某厂生产的两箱(每箱15件)产品中抽取6件进行质量检验C.从甲乙两厂生产的两箱(每箱15件)产品中抽取6件进行质量检验D.从某厂生产的3 000件产品中抽取10件进行质量检验5.某总体共有60个个体,并且编号为00,01,…,59.现需从中抽取一个容量为8的样本,请从随机数表的倒数第5行(下表为随机数表的最后5行)第11、12列的18开始.依次向下读数,到最后一行后向右,直到取足样本为止(大于59及与前面重复的数字跳过),则抽取样本的号码是________.95 33 95 22 00 18 74 72 00 18 38 79 58 69 32 81 76 80 269282 80 84 25 3990 84 60 79 80 24 36 59 87 38 82 07 53 89 35 56 35 23 79 1805 98 90 07 3546 40 62 98 80 54 97 20 56 95 15 74 80 08 32 16 46 70 50 8067 72 16 42 7920 31 89 03 43 38 46 82 68 72 32 14 82 99 70 80 60 47 18 9763 49 30 21 3071 59 73 05 50 28 22 23 71 77 91 01 93 20 49 82 96 59 26 9466 39 67 98 606.为了了解参加运动会的2 000名运动员的年龄情况,从中抽取20名运动员的年龄进行统计分析.就这个问题,下列说法中正确的有________.①2 000名运动员是总体;②每个运动员是个体;③所抽取的20名运动员是一个样本;④样本容量为20;⑤这个抽样方法可采用随机数法抽样;⑥每个运动员被抽到的机会相等.7.要从某汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程.二、能力提升8.总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第5列和第6列数字开始由左到右依次选取两个数字,则选出来的第5个个体的编号为()9.从10个篮球中任取一个,检查其质量,用随机数法抽取样本,则应编号为() A.1,2,3,4,5,6,7,8,9,10;B.-5,-4,-3,-2,-1,0,1,2,3,4C.10,20,30,40,50,60,70,80,90,100;D.0,1,2,3,4,5,6,7,8,910.从一群游戏的小孩中随机抽出k人,一人分一个苹果,让他们返回继续游戏.过了一会儿,再从中任取m人,发现其中有n个小孩曾分过苹果,估计参加游戏的小孩的人数为________.11.现有一批编号为10,11,…,99,100,…,600的元件,打算从中抽取一个容量为6的样本进行质量检验.如何用随机数法设计抽样方案?12.学校举办元旦晚会,需要从每班选10名男生,8名女生参加合唱节目,某班有男生32名,女生28名,试用抽签法确定该班参加合唱的同学.三、探究与拓展13.某电视台举行颁奖典礼,邀请20名港台、内地艺人演出,其中从30名内地艺人中随机选出10人,从18名香港艺人中随机挑选6人,从10名台湾艺人中随机挑选4人.试用抽签法确定选中的艺人,并确定他们的表演顺序.2.1.2系统抽样一、基础过关1.为了了解某地参加计算机水平测试的5 008名学生的成绩,从中抽取了200名学生的成绩进行统计分析,运用系统抽样方法抽取样本时,每组的容量为()A.24 B.25 C.26 D.282.要从160名学生中抽取容量为20的样本,用系统抽样法将160名学生从1~160编号.按编号顺序平均分成20组(1~8号,9~16号,…,153~160号),若第16组应抽出的号码为125,则第一组中按此抽签方法确定的号码是()A.7 B.5 C.4 D.33.下列问题中,最适合用系统抽样法抽样的是() A.从某厂生产的20个电子元件中随机抽取5个入样B.一个城市有210家超市,其中大型超市20家,中型超市40家,小型超市150家,为了掌握各超市的营业情况,要从中抽取一个容量为21的样本C.从参加竞赛的1 500名初中生中随机抽取100人分析试题作答情况D.从参加期末考试的2 400名高中生中随机抽取10人了解某些情况4.一个总体中有100个个体,随机编号为0,1,2,…,99,依编号顺序平均分成10个小组,组号依次为1,2,3,…,10.现用系统抽样方法抽取一个容量为10的样本,规定如果在第1组随机抽取的号码为m,那么在第k小组中抽取的号码个位数字与m+k的个位数字相同.若m=6,则在第7组中抽取的号码是()A.63 B.70 C.50 D.805.将参加夏令营的600名学生编号为001,002,…,600.采用系统抽样方法抽取一个容量为50的样本,且随机抽得的号码为003.这600名学生分住在三个营区,从001到300在第Ⅰ营区,从301到495在第Ⅱ营区,从496到600在第Ⅲ营区,三个营区被抽中的人数依次为()A.26,16,8;B.25,17,8;C.25,16,9 D.24,17,96.采用系统抽样的方法,从个体数为1 003的总体中抽取一个容量为50的样本,则在抽样过程中,被剔除的个体数为________,抽样间隔为________.7.某学校有30个班级,每班50名学生,上级要到学校进行体育达标验收.需要抽取10%的学生进行体育项目的测验.请你制定一个简便易行的抽样方案(写出实施步骤).二、能力提升8.某单位有840名职工,现采用系统抽样方法抽取42人做问卷调查,将840人按1,2,…,840随机编号,则抽取的42人中,编号落入区间[481,720]的人数为()A.11 B.12 C.13 D.149.采用系统抽样方法从960人中抽取32人做问卷调查,为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A ,编号落入区间[451,750]的人做问卷B ,其余的人做问卷C .则抽到的人中,做问卷B 的人数为( )A .7B .9C .10D .1510.采用系统抽样从含有8 000个个体的总体(编号为0000,0001,…,7999)中抽取一个容量为50的样本,则最后一段的编号为____________,已知最后一个入样编号是7894,则开头5个入样编号是__________________.11.某装订厂平均每小时大约装订图书362册,要求检验员每小时抽取40册图书,检验其质量状况,请你设计一个抽样方案.12.某工厂有工人1 021人,其中高级工程师20人,现抽取普通工人40人,高级工程师4人组成代表队去参加某项活动,应怎样抽样?三、探究与拓展13.下面给出某村委调查本村各户收入情况所作的抽样,阅读并回答问题:本村人口:1 200人,户数300,每户平均人口数4人; 应抽户数:30户; 抽样间隔:1 20030=40;确定随机数字:取一张人民币,编码的后两位数为12; 确定第一样本户:编码的后两位数为12的户为第一样本户; 确定第二样本户:12+40=52,52号为第二样本户; ……(1)该村委采用了何种抽样方法? (2)抽样过程中存在哪些问题,并修改. (3)何处是用简单随机抽样.2.1.3 分层抽样课时达标训练一、基础过关1.某学校有男、女学生各500名,为了解男、女学生在学习兴趣与业余爱好方面是否存在显著差异,拟从全体学生中抽取100名学生进行调查,则宜采用的抽样方法是() A.抽签法B.随机数法C.系统抽样法D.分层抽样法2.下列问题中,最适合用分层抽样抽取样本的是() A.从10名同学中抽取3人参加座谈会B.某社区有500个家庭,其中高收入的家庭125户,中等收入的家庭280户,低收入的家庭95户,为了了解生活购买力的某项指标,要从中抽取一个容量为100户的样本C.从1 000名工人中,抽取100人调查上班途中所用时间D.从生产流水线上,抽取样本检查产品质量3.具有A、B、C三种性质的总体,其容量为63,将A、B、C三种性质的个体按1∶2∶4的比例进行分层抽样调查,如果抽取的样本容量为21,则A、B、C三种元素分别抽取() A.12、6、3 B.12、3、6C.3、6、12 D.3、12、64.某校高三一班有学生54人,二班有学生42人,现在要用分层抽样的方法从两个班抽出16人参加军训表演,则一班和二班分别被抽取的人数是()A.8,8 B.10,6 C.9,7 D.12,45.某城区有农民、工人、知识分子家庭共计2 000家,其中农民家庭1 800户,工人家庭100户.现要从中抽取容量为40的样本,调查家庭收入情况,则在整个抽样过程中,可以用到下列抽样方法()①简单随机抽样;②系统抽样;③分层抽样.A.②③B.①③C.③D.①②③6.某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.7.某工厂有3条生产同一产品的流水线,每天生产的产品件数分别是3 000件,4 000件,8 000件.若要用分层抽样的方法抽取一个容量为150件产品的样本,应该如何抽样?二、能力提升8.某学校高一、高二、高三三个年级共有学生3 500人,其中高三学生数是高一学生数的两倍,高二学生数比高一学生数多300人,现在按1100的抽样比用分层抽样的方法抽取样本,则应抽取高一学生数为()A.8 B.11 C.16 D.109.某单位有老年人28人,中年人54人,青年人81人,为了调查他们的身体状况,从他们中抽取容量为36的样本,最适合抽样本的方法是() A.简单随机抽样B.系统抽样C.先从中年人中剔除1人,再用分层抽样D.先从老年人中剔除1人,再用分层抽样10.某工厂生产A、B、C、D四种不同型号的产品,产品数量之比依次为2∶3∶5∶1.现用分层抽样方法抽出一个容量为n的样本,样本中A种型号有16件,那么此样本的容量n为________.11.一批产品有一级品100个,二级品60个,三级品40个,分别采用系统抽样和分层抽样,从这批产品中抽取一个容量为20的样本.12.某单位有技师18人,技术员12人,工程师6人,需要从这些人中抽取一个容量为n 的样本,如果采用系统抽样和分层抽样方法抽取,都不用剔除个体;如果样本容量增加1,则在采用系统抽样时,需要在总体中剔除1个个体,求样本容量n.三、探究与拓展13.某中学举行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名初中生、4 000名高中生中作问卷调查,如果要在所有答卷中抽出120份用于评估.(1)采用哪种抽样方法才能得到比较客观的评价结论?教职员工、初中生、高中生中抽取的个体数各是什么?(2)要从3 000份初中生的答卷中抽取一个容量为48的样本,如果采用简单随机抽样,应如何操作?(3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取到所需的样本?2.2.1用样本的频率分布估计总体分布(一)一、基础过关1.如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20)内的频数为()A.20B.30C.40D.502.容量为20的样本数据,分组后的频数如下表:A.0.35 B.0.45 C.0.55 D.0.653.某校为了了解高三学生的身体情况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45 kg的人数是() A.10B.2C.5D.154.学校为了调查学生在课外读物方面的支出情况,抽取了一个容量为n的样本,其频率分布直方图如图所示,其中支出在[50,60)的同学有30人,若想在这n个人中抽取50个人,则在[50,60)之间应抽取的人数为()A.10B.15C.25D.305.将容量为n的样本中的数据分成6组,绘制频率分布直方图.若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n=________. 6.从某小区抽取100户居民进行月用电量调查,发现其用电量都在50至350度之间,频率分布直方图如图所示.(1)直方图中x 的值为 __________;(2)在这些用户中,用电量落在区间[100,250)内的户数为________.7.某制造商在今年3月份生产了一批乒乓球,随机抽取100个进行检查,测得每个球的直径(单位:mm),将数据分组如下表:补充完成频率分布表(结果保留两位小数),并在上图中画出频率分布直方图.二、能力提升8.容量为100的样本数据按从小到大的顺序分为8组,如下表:第3( )A .14和0.14B .0.14和14 C.114和0.14D.13和1149.某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100]加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生600名,据此估计,该模块测试成绩不少于60分的学生人数为()A.588B.480C.450D.12010.如图是根据部分城市某年6月份的平均气温(单位:℃)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5].已知样本中平均气温低于22.5 ℃的城市个数为11,则样本中平均气温不低于25.5 ℃的城市个数为________.11.某市共有5 000名高三学生参加联考,为了了解这些学生对数学知识的掌握情况,现从中随机抽出若干名学生在这次测试中的数学成绩,制成如下频率分布表:(1)根据上面的频率分布表,求①,②,③,④处的数值;(2)在所给的坐标系中画出区间[80,150]上的频率分布直方图.三、探究与拓展12.某校100名学生期中考试语文成绩的频率分布直方图如图所示,其中成绩分组区间是:[50,60),[60,70),[70,80),[80,90),[90,100].(1)求图中a的值;(2)根据频率分布直方图,估计这100名学生语文成绩的平均分;(3)若这100名学生语文成绩某些分数段的人数(x)与数学成绩相应分数段的人数(y)之比如下表所示,求数学成绩在[50,90)之外的人数.2.2.1用样本的频率分布估计总体分布(二)一、基础过关1.在用样本频率分布估计总体分布的过程中,下列说法正确的是()A.总体容量越大,估计越精确;B.总体容量越小,估计越精确C.样本容量越大,估计越精确;D.样本容量越小,估计越精确2.从甲、乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图).设甲、乙两组数据的平均数分别为x甲、x乙,中位数分别为m甲、m乙,则()A.x甲<x乙,m甲>m乙B.x甲<x乙,m甲<m乙C.x甲>x乙,m甲>m乙D.x甲>x乙,m甲<m乙3.如图是根据《山东统计年鉴2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字.从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为()A.304.6B.303.6C.302.6D.301.64.对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是() A.46,45,56B.46,45,53C.47,45,56D.45,47,535.对一个未知总体,我们常用样本的频率分布估计总体的分布,其中表示样本数据的频率分布的基本方法有________、________、________、________.6.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.7.某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30 mm抽取一包产品,称其重量,分别记录抽查数据如下:甲:102,101,99,98,103,98,99乙:110,115,90,85,75,115,110将这两组数据用茎叶图表示,并根据茎叶图对两个车间的产品进行比较.二、能力提升8.某学校随机抽取20个班,调查各班中有网上购物经历的人数,所得数据的茎叶图如图所示,以组距为5将数据分组成[0,5),[5,10),…,[30,35),[35,40]时,所作的频率分布直方图是()9.如图是某赛季甲、乙两名篮球运动员参加的每场比赛得分的茎叶图,则甲、乙两人这几场比赛得分的中位数之和是()A.65 B.64 C.63 D.6210.在某电脑杂志的一篇文章中,每个句子的字数如下:10,28,31,17,23,27,18,15,26,24,20,19,36,27,14,25,15,22,11,24,27,17在某报纸的一篇文章中,每个句子的字数如下:27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22试画出这两组数据的茎叶图.11.参加CBA2013~2014赛季的甲、乙两支球队,统计两队队员的身高如下(单位:cm):甲队队员:194,187,199,207,203,205,209,199,183,215,219,206,201,208;乙队队员:179,192,218,223,187,194,205,207,185,197,199,209,214,189.(1)用茎叶图表示两队队员的身高;(2)根据茎叶图判断哪个队队员的身高更整齐一些.12.美国历届总统中,就任时年纪最小的是罗斯福,他于1901年就任,当时年仅42岁;就任时年纪最大的是里根,他于1981年就任,当时69岁.下面按时间顺序(从1789年的华盛顿到2009年的奥巴马,共44任)给出了历届美国总统就任时的年龄:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,5256,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.(2)用自己的语言描述一下历届美国总统就任时年龄的分布情况.三、探究与拓展13.某市2010年4月1日-4月30日对空气污染指数的监测数据如下(主要污染物为可吸入颗粒物):61,76,70,56,81,91,92,91,75,81,88,67,101,103,95,91,77,86,81,83,82,82,64,79,86,85,75,71,49,45.(1)完成频率分布表.(2)作出频率分布直方图.(3)根据国家标准,污染指数在0~50之间时,空气质量为优;在51~100之间时,为良;在101~150之间时,为轻微污染;在151~200之间时,为轻度污染.请你依据所给数据和上述标准,对该市的空气质量给出一个简短评价.2.2.2用样本的数字特征估计总体的数字特征(一)一、基础过关1.已知10名工人生产同一零件,生产的件数分别是16,18,15,11,16,18,18,17,15,13,设其平均数为a,中位数为b,众数为c,则有()A.a>b>c B.a>c>b C.c>a>b D.c>b>a2.某台机床加工的1 000只产品中次品数的频率分布如下表:) A.0,1.1 B.0,1C.4,1 D.0.5,23.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输入为15,那么由此求出的平均数与实际平均数的差等于() A.3.5 B.-3 C.3 D.-0.54.电池厂从某日生产的电池中抽取10个进行寿命测试,得数据如下(单位:小时):30,35,25,25,30,34,26,25,29,21,则该电池的平均寿命估计为______小时.5.某商店大米的价格是3.00元/千克,面粉的价格是3.60元/千克,大米与面粉的销量分别是1 000千克,500千克,则该商店出售的粮食的平均价格是______元/千克.6.已知一组数据的频率分布直方图如下.求众数、中位数、平均数.7.某中学举行电脑知识竞赛,现将高一参赛学生的成绩进行整理后分成五组绘制成如图所示的频率分布直方图,已知图中从左到右的第一、二、三、四、五小组的频率分别是0.30、0.40、0.15、0.10、0.05.求:(1)高一参赛学生的成绩的众数、中位数. (2)高一参赛学生的平均成绩.二、能力提升8.期中考试以后,班长算出了全班40个人数学成绩的平均分为M ,如果把M 当成一个同学的分数,与原来的40个分数一起,算出这41个分数的平均值为N ,那么M ∶N 为( ) A.4041B .1C.4140D .29.若有一个企业,70%的员工收入1万,25%的员工年收入3万,5%的员工年收入11万,则该企业员工的年收入的平均数是______万,中位数是____万,众数是____万. 10.有容量为100的样本,数据分组及各组的频数、频率如下:[12.5,14.5),6,0.06;[14.5,16.5),16,0.16;[16.5,18.5),18,0.18;[18.5,20.5),22,0.22;[20.5,22.5),20,0.20;[22.5,24.5),10,0.10;[24.5,26.5),8,0.08.估计总体的平均数为________. 11.高一(3)班有男同学27名,女同学21名,在一次语文测验中,男同学的平均分是82分,中位数是75分,女同学的平均分是80分,中位数是80分. (1)求这次测验全班平均分(精确到0.01);(2)估计全班成绩在80分以下(含80分)的同学至少有多少人?(3)分析男同学的平均分与中位数相差较大的主要原因是什么?12.为了了解小学生的体能情况,抽取了某小学同年级部分学生进行跳绳测试,将所得数据整理后,画出频率分布直方图,已知图中从左到右前三个小组的频率分别是0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)问参加这次测试的学生人数是多少?(3)问在这次测试中学生跳绳次数的中位数落在第几小组内?三、探究与拓展13.为了比较两种治疗失眠症的药(分别称为A药,B药)的疗效,随机地选取20位患者服用A药,20位患者服用B药,这40位患者在服用一段时间后,记录他们日平均增加的睡眠时间(单位:h),试验的观测结果如下:服用A药的20位患者日平均增加的睡眠时间:0.6 1.2 2.7 1.5 2.8 1.8 2.2 2.3 3.23.5 2.5 2.6 1.2 2.7 1.5 2.9 3.0 3.12.3 2.4服用B药的20位患者日平均增加的睡眠时间:3.2 1.7 1.90.80.9 2.4 1.2 2.6 1.31.4 1.60.5 1.80.6 2.1 1.1 2.5 1.22.70.5(1)分别计算两组数据的平均数,从计算结果看,哪种药的疗效更好?(2)根据两组数据完成下面茎叶图,从茎叶图看,哪种药的疗效更好?2.2.2用样本的数字特征估计总体的数字特征(2)一、基础过关1.已知一个样本中的数据为1,2,3,4,5,则该样本的标准差为() A.1 B. 2 C. 3 D.22.在某次测量中得到的A样本数据如下:82,84,84,86,86,86,88,88,88,88.若B样本数据恰好是A样本数据每个都加2后所得数据,则A,B两样本的下列数字特征对应相同的是() A.众数B.平均数C.中位数D.标准差3.若样本1+x1,1+x2,1+x3,…,1+x n的平均数是10,方差为2,则对于样本2+x1,2+x2,…,2+x n,下列结论正确的是()A.平均数是10,方差为2;B.平均数是11,方差为3C.平均数是11,方差为2;D.平均数是10,方差为34.下表是某班50名学生综合能力测试的成绩分布表,则该班成绩的方差为()A.345B.1.36 C.2 D.45.抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:6.已知样本9,10,11,x,y的平均数是10,方差是4,则xy=________.7.(1)已知一组数据x1,x2,…,x n的方差是a,求另一组数据x1-2,x2-2,…,x n-2的方差;(2)设一组数据x1,x2,…,x n的标准差为s x,另一组数据3x1+a,3x2+a,…,3x n+a的标准差为s y,求s x与s y的关系.二、能力提升8.如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为x A和x B,样本方差分别为s2A和s2B,则()A.x A>x B,s2A>s2BB.x A<x B,s2A>s2BC.x A>x B,s2A<s2BD.x A<x B,s2A<s2B9.如图是2012年某校举行的元旦诗歌朗诵比赛中,七位评委为某位选手打出的分数的茎叶图,去掉一个最高分和一个最低分,所剩数据的平均数和方差分别为() A.84,4.84 B.84,1.6C.85,1.6 D.85,0.410.为了考察某校各班参加课外书法小组的人数,从全校随机抽取5个班级,把每个班级参加该小组的人数作为样本数据,已知样本平均数为7,样本方差为4,且样本数据互不相同,则样本数据中的最大值为________.11.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(单位:m/s)的数据如下:(1)(2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、极差、方差,并判断选谁参加比赛比较合适?12.为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下表:(2)若定期更换,可选择多长时间统一更换合适?三、探究与拓展13.师大附中三年级一班40人随机平均分成两组,两组学生一次考试的成绩情况如下表:2.3 变量间的相关关系一、基础过关1.下列两个变量之间的关系,哪个不是函数关系( )A .匀速行驶车辆的行驶距离与时间;B .角度和它的正弦值C .等腰直角三角形的腰长与面积;D .在一定年龄段内,人的年龄与身高 2.下列有关线性回归的说法,不正确的是( )A .变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系B .在平面直角坐标系中用描点的方法得到表示具有相关关系的两个变量的一组数据的图形叫做散点图C .回归方程最能代表观测值x 、y 之间的线性关系D .任何一组观测值都能得到具有代表意义的回归方程3.工人月工资(元)依劳动生产率(千元)变化的回归方程为y ^=60+90x ,下列判断正确的( )A .生产率为1千元时,工资为50元;B .生产率提高1千元时,工资提高150元C .生产率提高1千元时,工资约提高90元;D .生产率为1千元时,工资为90元 4.已知x 与y 之间的几组数据如下表:假设根据上表数据所得线性回归直线方程y =b x +a ,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y =b ′x +a ′,则以下结论正确的是( )A.b ^>b ′,a ^>a ′B.b ^>b ′,a ^<a ′C.b ^<b ′,a ^>a ′D.b ^<b ′,a ^<a ′5.若对某个地区人均工资x 与该地区人均消费y 进行调查统计得y 与x 具有相关关系,且回归方程为y ^=0.7x +2.1(单位:千元),若该地区人均消费水平为10.5,则估计该地区人均消费 额占人均工资收入的百分比约为________.6.期中考试后,某校高三(9)班对全班65名学生的成绩进行分析,得到数学成绩y 对总成绩x 的回归方程为y ^=6+0.4x .由此可以估计:若两个同学的总成绩相差50分,则他们的数学 成绩大约相差________分.7.从某居民区随机抽取10个家庭,获得第i 个家庭的月收入x i (单位:千元)与月储蓄y i (单位:千元)的数据资料,算得∑i =110x i =80,∑i =110y i =20,∑i =110x i y i =184,∑i =110x 2i =720.(1)求家庭的月储蓄y 对月收入x 的线性回归方程y ^=b ^x +a ^; (2)判断变量x 与y 之间是正相关还是负相关;(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.附:线性回归方程y ^ =b ^ x +a ^ 中,b ^=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,a ^=y -b ^x ,其中x ,y 为样本平均值.二、能力提升8.设(x1,y1),(x2,y2),…,(x n,y n)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的回归直线(如图),以下结论中正确的是() A.x和y的相关系数为直线l的斜率B.x和y的相关系数在0到1之间C.当n为偶数时,分布在l两侧的样本点的个数一定相同D.直线l过点(x,y)9.若变量y与x之间的相关系数r=-0.936 2,则变量y与x之间() A.不具有线性相关关系;B.具有线性相关关系C.它们的线性相关关系还要进一步确定;D.不确定10.某工厂生产某种产品的产量x(吨)与相应的生产能耗y(吨标准煤)有如下几组样本数据:线的斜率为0.7,则这组样本数据的回归直线方程是________.11.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm. 因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为___________cm.12.以下是某地搜集到的新房屋的销售价格y和房屋的面积x的数据:(1)(2)求回归方程,并在散点图中加上回归直线.(3)据(2)的结果估计当房屋面积为150 m2时的销售价格.。
高中数学第二章统计23变量间的相关关系课件新人教A版必修3(2)

总费用y/万元 2.2 3.8 5.5 6.5 7.0
(1)根据表格数据,画出散点图;
(2)求线性回归方程y^=b^x+a^的系数a^,b^; (3)估计使用年限为 10 年时,车的使用总费用是多少?
【解题探究】(1)利用描点法作出散点图; (2)把数据代入公式,可得回归方程的系数; (3)把x=10代入回归方程得y值,即为总费用的估计 值.
【答案】A 【解析】在A中,若b确定,则a,b,c都是常数,Δ= b2-4ac也就唯一确定了,因此,这两者之间是确定性的函数 关系;一般来说,光照时间越长,果树亩产量越高;降雪量越 大,交通事故发生率越高;施肥量越多,粮食亩产量越高,所 以B,C,D是相关关系.故选A.
两个变量x与y相关关系的判断方法 1.散点图法:通过散点图,观察它们的分布是否存在 一定规律,直观地判断.如果发现点的分布从整体上看大致在 一条直线附近,那么这两个变量就是线性相关的,注意不要受 个别点的位置的影响. 2.表格、关系式法:结合表格或关系式进行判断. 3.经验法:借助积累的经验进行分析判断.
变量之间的相关关系的判断
【 例 1】 下 列 变 量 之 间 的 关 系 不 是 相 关 关 系 的 是 ()
A.二次函数y=ax2+bx+c中,a,c是已知常数,取b 为自变量,因变量是判别式Δ=b2-4ac
B.光照时间和果树亩产量 C.降雪量和交通事故发生率 D.每亩田施肥量和粮食亩产量
【解题探究】判断两个变量之间具有相关关系的关键是 什么?
①反映^y与 x 之间的函数关系;
②反映 y 与 x 之间的函数关系;
③表示^y与 x 之间的不确定关系;
④表示最接近 y 与 x 之间真实关系的一条直线.
A.①②
高中数学必修3第二章:统计2.3变量间的相关关系

Y 研考点·知规律
探究悟道 点拨技法
题型一 相关关系的判断 【例 1】 河北国欣农研会的科研人员在 7 块并排、形状大小 相同的试验田上对某棉花新品种进行施化肥量 x 对产量 y 影响的 试验,得到如下表所示的一组数据(单位:kg): 施化肥量 x 15 20 25 30 35 40 45 棉花产量 y 330 345 365 405 445 450 455
D 读教材·抓基础
回扣教材 扫除盲点
课本导读
1.两个变量的线性相关 (1)在散点图中,点散布在从 左下角 到 右上角的区域,对于 两个变量的这种相关关系,我们将它称为正相关. (2)在散点图中,点散布在从 左上角 到 右下角的区域,两个 变量的这种相关关系称为负相关. (3)如果散点图中点的分布在整体上看大致在一条直线附近 , 就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.
() (A)她儿子10岁时的身高一定是145.83 cm (B)她儿子10岁时的身高在145.83 cm以上 (C)她儿子10岁时的身高在145.83 cm左右 (D)她儿子10岁时的身高在145.83 cm以下
2.经调查知,某品牌汽车的销售量y(辆)与广告费用x(万元)之 间的回归直线方程为 yˆ =250+4x,当广告费用为50万元时,预计 汽车销售量约为 ______辆.
2.回归方程 (1)最小二乘法:使得样本数据的点到回归直线的 距离的平方
和最小的方法叫最小二乘法.
(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1,
^^ ^
y1)、(x2,y2),…,(xn,yn).其回归方程为y=bx+a,则
n
n
xi- x yi- y xiyi-n x y
高中数学 第二章 统计本章整合 新人教A版必修3(2021年最新整理)

高中数学第二章统计本章整合新人教A版必修3编辑整理:尊敬的读者朋友们:这里是精品文档编辑中心,本文档内容是由我和我的同事精心编辑整理后发布的,发布之前我们对文中内容进行仔细校对,但是难免会有疏漏的地方,但是任然希望(高中数学第二章统计本章整合新人教A版必修3)的内容能够给您的工作和学习带来便利。
同时也真诚的希望收到您的建议和反馈,这将是我们进步的源泉,前进的动力。
本文可编辑可修改,如果觉得对您有帮助请收藏以便随时查阅,最后祝您生活愉快业绩进步,以下为高中数学第二章统计本章整合新人教A版必修3的全部内容。
高中数学第二章统计本章整合新人教A版必修3 知识网络专题探究专题一三种抽样方法的比较简单随机抽样、系统抽样、分层抽样的比较如下表:类别共同点各自特点联系适用范围简单随机抽样抽样过程中每个个体被抽到的可能性相等;每次抽出个体后不再将它放回,即不从总体中逐个抽取总体中个体无差异且个数较少系统抽样将总体均分成几部分,按预先制定的规则在各部分中抽在第一组抽取样本时采用简单随机抽样总体中个体无差异且个数很多抽样方法抽取具有代表性的样本对整个统计问题起着至关重要的作用.高考中主要考查三种抽样方法的比较和辨析以及应用.错误!某高级中学有学生270人,其中一年级108人,二、三年级各81人.现要利用抽样方法抽取10人参加某项调查,考虑选用简单随机抽样、分层抽样和系统抽样三种方案,使用简单随机抽样和分层抽样时,将学生按一、二、三年级依次统一编号为1,2,…,270;使用系统抽样时,将学生统一随机编号为1,2,…,270,并将整个编号依次分为10段.如果抽得号码有下列四种情况:①7,34,61,88,115,142,169,196,223,250;②5,9,100,107,111,121,180,195,200,265;③11,38,65,92,119,146,173,200,227,254;④30,57,84,111,138,165,192,219,246,270。
高中数学 第二章 统计模块复习课检测 新人教B版必修3-新人教B版高一必修3数学试题

第2课时统计课后篇巩固探究A组1.下列不具有相关关系的是()A.单产不为常数时,土地面积和总产量B.人的身高与体重C.季节与学生的学习成绩D.学生的学习态度与学习成绩.2.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽取50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是()A.5B.7C.11D.13k==16,即每16人抽取一个人.因为39=2×16+7,所以第1小组中抽取的数为7.3.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.9.4,0.484B.9.4,0.016C.9.5,0.04D.9.5,0.016=9.5.方差s2=[(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.4-9.5)2+(9.7-9.5)2]=0.016.4.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店为() A.2家B.3家C.5家D.13家1:在整个抽样过程中,每个个体被抽到的可能性为,则抽取的中型商店为75×=5(家).方法2:因为大、中、小型商店数的比为30∶75∶195=2∶5∶13,所以抽取的中型商店为20×=5(家).答案:C5.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A.6万元B.8万元C.10万元D.12万元解析:由频率分布直方图可知,11时至12时的销售额占全部销售额的,即销售额为25×=10(万元).答案:C6.从一堆苹果中任取了20个,并得到它们的质量(单位:g)数据分布表如下:分组[90,100) [100,110) [110,120) [120,130) [130,140) [140,150)频数 1 2 3 10 1则这堆苹果中,质量不小于120 g的苹果数约占苹果总数的.解析:由表中可知这堆苹果中,质量不小于120 g的苹果数为20-1-2-3=14.故约占苹果总数的=0.70=70%.答案:70%7.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元 4 2 3 5销售额y/万元49 26 39 54根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额约为元.解析:=3.5,=42,∴=42-9.4×3.5=9.1,∴回归方程为=9.4x+9.1,∴当x=6时,=9.4×6+9.1=65.5..58.现有同一型号的电脑96台,为了了解这种电脑每开机一次所产生的辐射情况,从中抽取10台在同一条件下做开机实验,测量开机一次所产生的辐射,得到如下数据:13.712.914.413.813.312.713.513.613.113.4(1)写出采用简单随机抽样抽取上述样本的过程;(2)根据样本,请估计总体平均数与总体标准差的情况.解:(1)利用随机数表法或抽签法.具体过程如下:方法一(抽签法):①将96台电脑随机编号为1~96;②将以上96个分别写在96X相同的小纸条上,揉成小球,制成号签;③把号签放入一个不透明的容器中,充分搅拌均匀;④从容器中逐个抽取10个号签,每次取完后再次搅拌均匀,并记录上面的;⑤找出和所得对应的10台电脑,组成样本.方法二(随机数表法):①将96台电脑随机编号,编号为00,01,02, (95)②在随机数表中任选一数作为开始,然后依次向右读,每次读两位,凡不在00~95中的数和前面已读过的数跳过不读,直到读出10个符合条件的数;③这10个数所对应的10台电脑即是我们所要抽取的样本.(2)=13.44;s2=≈0.461.故总体平均数为13.44,总体标准差约为0.461.9.对某班50人进行智力测验,其得分如下:48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,5 5,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.(1)这次测试成绩的最大值和最小值各是多少?(2)将[30,100)平分成7个小区间,试画出该班学生智力测验成绩的频数分布图.(3)分析这个频数分布图,你能得出什么结论?解:(1)最小值是32,最大值是97.(2)7个区间分别是[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),每个小区间的长度是10,统计出各小区间内的数据频数,列表如下:区间[30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)频数 1 6 12 14 9 6 2频数分布图如下图所示.(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.10.导学号17504078已知学生的总成绩与数学成绩之间有线性相关关系,下表给出了5名同学在一次考试中的总成绩和数学成绩(单位:分).学生编号1 2 3 4 5成绩总成绩/x482 383 421 364 362数学成绩/y78 65 71 64 61(1)求数学成绩与总成绩的回归直线方程.(2)根据以上信息,如果一个学生的总成绩为450分,试估计这个学生的数学成绩;(3)如果另一位学生的数学成绩为92分,试估计其总成绩是多少?解:(1)列出下表,并进行有关计算.编号x y x2xy1 482 78 232 324 37 5962 383 65 146 689 24 8953 421 71 177 241 29 8914 364 64 132 496 23 2965 362 61 131 044 22 082合计 2 012 339 819 794 137 760由上表可得,可得≈0.132,-0.132×≈14.683.故数学成绩y对总成绩x的回归直线方程为=14.683+0.132x.(2)由(1)得当总成绩x为450分时,=14.683+0.132×450≈74(分),即数学成绩大约为74分.(3)若数学成绩为92分,将=92代入回归直线方程=14.683+0.132x中,得x≈586(分).故估计该生的总成绩在586分左右.B组1.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为()A.1+a,4B.1+a,4+aC.1,4D.1,4+a解析:=+a=1+a.s2===4.答案:A2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则()A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e==5.5,又众数m o=5,平均值(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,故m o<m e<.答案:D3.某市为加强教师基础素质建设,开展了“每月多读一本书,提高自身修养”的读书活动.设该市参加读书活动的教师平均每人每年读书的本数为x(单位:本),按读书本数分下列四种情况统计:①0~10本;②11~20本;③21~30本;④30本以上.现有10 000名教师参加了此项活动,如图是此次调查中某一项的程序框图,其输出的结果为6 200,则该市参加活动的教师中平均每年读书本数在0~20之间的频率是()A.3 800B.6 200C.0.38D.0.62解析:由程序框图知,当x>20时,S=S+1,故输出的S值应是10 000名教师中读书本数大于20的人数,故S=6 200,∴在0~20之间的频率为=0.38.答案:C4.(2017某某某某二中高三一模)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得为12的学生,则在第八组中抽得为的学生.解析:由题意得,在第八组中抽得为12+(8-3)×5=37.答案:375.某公司为改善职工的出行条件,随机抽取50名职工,调查他们的居住地与公司的距离d(单位:千米).若样本数据分组为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],由数据绘制的频率分布直方图如图所示,则样本中职工居住地与公司的距离不超过4千米的人数为.解析:样本中职工居住地与公司的距离不超过4千米的频率为(0.1+0.14)×2=0.48,所以样本中职工居住地与公司的距离不超过4千米的人数为50×0.48=24.答案:246.导学号17504079从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125)频数 6 26 38 22 8(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.7.导学号17504080某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元8 8.2 8.4 8.6 8.8 9销量y/件90 84 83 80 75 68(1)求回归直线方程x+,其中=-20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)=8.5,=80.∵=-20,,∴=80+20×8.5=250.∴回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-20(x-8.25)2+361.25,∴该产品的单价定为8.25元时,工厂获得的利润最大.。
人教A版高中数学必修3《二章 统计 小结》优质课教案_14

第二章统计复习教案一、教学目标:1、整合本章知识点,完善知识结构,体会知识之间的相关关系,能应用所学知识解决一些简单的统计问题。
2、在归纳总结知识的过程中完善知识结构。
3、让学生在学习中自觉应用类比,数形结合等数学思想方法帮助学习。
二、教学重难点重点:构建本章(统计)的知识结构,能应用所学知识解决简单的统计问题。
难点:应用所学知识解决简单的统计问题。
三、教学方法:归纳总结法,讲练结合法四、教学用时:1课时五、教学过程设计2、用样本估计总体(1)用样本估计总体的两种情况 ①用样本的频率分布估计总体的分布.②用样本的数字特征估计总体的数字特征. (2)绘制频率分布直方图的步骤 (3)频率分布折线图和总体密度曲线频率分布直方图――――――――→连接各小长方形上端的中点频率分布折线图 ――――――――――――→样本容量不断增大,频率折线图接近于一条光滑曲线总体密度曲线 (4)茎叶图的制作步骤 ①将数据分为茎和叶两部分;②将最大茎和最小茎之间数据按大小次序排成一列; ③将各个数据的“叶”按大小次序写在茎右(左)侧.(5)数字特征①众数:一组数据中重复出现次数最多的数.②中位数:把一组数据按从小到大的顺序排列,处在中间位置(或中间两个数的平均数)的数叫做这组数据的中位数.③平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )叫做这n 个数的平均数.④标准差的计算公式: s =1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2 ⑤方差的计算公式:s 2=1n[(x 1-x )2+(x 2-x )2+…+(x n -x )2],想一想:众数、中位数、平均数与频率分布直方图的关系。
3、两个变量的线性相关(1)散点图:将样本中n 个数据点(x i ,y i )(i =1,2,…,n )描在平面直角坐标系中得到的图形. (2)正相关与负相关:① 正相关:散点图中的点散布在从左下角到右上角的区域. ② 负相关:散点图中的点散布在从左上角到右下角的区域. (3)回归直线的方程① 回归直线:如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.② 回归方程:回归直线对应的方程叫做回归直线的方程,简称回归方程.二、巩固练习1、要从已编号(1—60)的60枚最新研制的某型导弹中随机抽取6枚来进行发射试验,用每部分选取的号码间隔一样的系统抽样方法确定所选取的枚导弹的编号可能是( ) A 、5,10,15,20,25,30 B 、3,13,23,33,43,53 C 、1,2,3,4,5,6 D 、2,4,8,16,32,482、某公司现有普通职员160人,中级管理人员30人,高级管理人员10人,要从其中抽取20个人进行身体健康检查,如果采用分层抽样的方法,则普通职员,中级管理人员和高级管理人员各应该抽取多少人( )A 、8,15,7B 、16,2,2C 、16,3,1D 、12,3,5 3、右图是根据某校10位高一同学的身高(单位:cm)画出的茎叶图,其中左边的数字从左到右分别表示学生身高的百位数字和十位数字,右边的数字表示学生身高的个位数字,从图中可以得到这10位同学身高的中位数是( ) A 、161cm B 、162cmC 、163cm D 、164cm4、为了了解某地区高中学生的身体发育情况,抽查了该地区100名年龄在17.5~18岁的男生体重(单位:kg ),得到频率分布直方图如下: 求这100名学生中体重在56.5~64.5范围内的人数.5、某商场为了调查旅游鞋的销售情况,抽取了部分顾客购鞋的尺寸,将所得数据整理后,画出频率分布直方图如下,已知图中从左到右前3个小矩形的面积之比为1︰2︰3,第二小组的频数为10. (1)求样本容量;(2)估计购鞋尺寸在37.5~43.556.5 60.5 64.5 68.5 72.56、已知某人5次上班途中所花时间的平均数为10分钟,方差为2分钟,其中有三次上班途中所花时间分别为9分钟,10分钟和11分钟,求另两次上班途中所花的时间.7、随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)判断家庭平均收入与月平均生活支出是否相关? (2)若二者线性相关,求回归直线方程.8、某工厂经过技术改造后,生产某种产品的产量x 吨与相应的生产能耗y 吨标准煤有如下几组样本数据:(1)样本数据是否具有线性相关关系?若是,求出其回归方程; (2)预测生产100吨产品的生产能耗约需多少吨标准煤?三、课堂小结1、本章中统计的相关知识。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
当总体容量大或检测具有一定的破坏性时,可以从总体 中抽取适当的样本,通过对样本的分析、研究,得到对总体 的估计,这就是统计分析的基本过程.而用样本估计总体就 是统计思想的本质. 要准确估计总体,必须合理地选择样本,我们学习的是 最常用的三种抽样方法.获取样本数据后,将其用频率分布 表、频率直方图、频率折线图或茎叶图表示后,蕴含于数据 之中的规律得到直观的揭示.运用样本的平均数可以对总体 水平作出估计,用样本的极差、方差(标准差)可以估计总 体的稳定程度. 对两个变量的样本数据进行相关性分析,可发现存在于 现实世界中的回归现象.用最小二乘法研究回归现象,得到 的线性回归方程可用于预测和估计,为决策提供依据. 总之,统计的基本思想是从样本数据中发现统计规律, 实现对总体的估计.
到大依次分成
50 段,每段 10 人;
定首号 S3:在第一段1~10号中用的 简单随机抽样 的方法
抽取一个号码,比如3;
取余号 S4:依次抽取 3,13,23,33,
……这50个号码。
这样就得到了一个容量为50的样本。
2.1 抽样方法
(2).随机数表法:
将总体中的N个个体编号时可以从0开始,例如当N=100时, 编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表. 当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
2.1 抽样方法 1.简单随机抽样
(1)抽签法 1.将总体中的所有个体编号(号码可以从1到 N); 2.将1到N 这N 个号码写在形状、大小相同的号签上 (号签可以用小球、卡片、纸条等制作); 3.将号签放在同一箱中,并搅拌均匀; 4.从箱中每次抽出1个号签,并记录其编号,连续抽 取k次; 5.从总体中将与抽到的签的编号相一致的个体取出.
人教A版必修③
第二章 统计复习
本章回顾 本章介绍了从总体中抽取样本的常用方法,并通过 实例,研究了如何利用样本对总体的分布规律、整体 水平、稳定程度及相关关系等特性进行估计和预测. 总体 抽样 简 单 随 机 抽 样 系 统 抽 样 分 层 抽 样 分析 样 本 分 布
估计 样 本 特 征 数
总 体 分 布 总 体 特 征 数
第8行
16 22 77 94 39 84 42 17 53 31 63 01 63 78 59 33 21 12 34 29 57 60 86 32 44 49 54 43 54 82 57 24 55 06 88 16 95 55 67 19 78 64 56 07 82 09 47 27 96 54 17 37 93 23 78 77 04 74 47 67 98 10 50 71 75 52 42 07 44 38 49 17 46 09 62 87 35 20 96 43 21 76 33 50 25 12 86 73 58 07 15 51 00 13 42 90 52 84 77 27 84 26 34 91 64 83 92 12 06 76 44 39 52 38 79 99 66 02 79 54 08 02 73 43 28
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
例子:
下面我们用随机数表法求解本节开头的问题. (1)对50个同学进行编号,编号分别为01,02,03,…,50; (2)在随机数表中随机地确定一个数作为开始,如第8行第29列的 数7开始.为便于说明,我们将附表中的第6行至第10行摘录如下: 第29列
2.系统抽样:
系统抽样的步骤为: (1)采用随机的方式将总体中的个体编号; (2)将整个的编号按一定的间隔(设为k)分段, N 当 n (N为总体中的个体数,n为样本容量)是整数 N N 时,k= n ;当 n 不是整数时,从总体中剔除一些个 体,使剩下的总体中个体的个数N′能被n 整除,这 N 时k= n ,并将剩下的总体重新编号; (3)在第一段中用简单随机抽样确定起始的个体编 号l ; (4)将编号为l , l +k,l +2k,…, l +(n-1)k的个 体抽出.
(1)对总体中的个体进行编号(每个号码位数一致); (2)在随机数表中任选一个数作为开始; (3)从选定的数开始按一定的方向读下去,得到的数码 若不在编号中,则跳过;若在编号中,则取出;如果得到 的号码前面已经取出,也跳过;如此继续下去,直到取满 为止; (4)根据选定的号码抽取样本.
将总体中的N个个体编号时可以从0开始,例如当N=100时, 编号可以是00,01,02, …,99.这样,总体中的所有个体均可用两位 数字号码表示,便于使用随机数表. 当随机地选定开始的数后,读数的方向可以向右,也可以向 左、向上、向下等.由此可见,用随机数表法抽取样本的步骤是:
(3)从数7开始向右读下去,每次读两位,凡不在01到50中的数跳过 去不读,遇到已经读过的数也跳过去,便可依次得到
12,07,44,39,38,33,21,34,29,42
这10个号码,就是所要抽取的10个样本个体的号码.
小结:
1.抽样无放回; 2.抽样公平性; 3.抽签法,随机数表法—简单的随机抽样.
1
例; 某单位在岗职工共624人,为了调查工人用于上班途 中的时间,决定抽取10%的工人进行调查.如何采用系统 抽样方法完成这一抽样?
说明: 1.抽样公平性原则—等概率—随机性;
2.抽签法适用与总体中个数N不大的情形.
例题 1 系统抽样(等距抽样) 例子—— . 为了解高一年级 500名同学的视力情况,试用系 统抽样从中抽取50名同学进行检查。 编号 分段
S1:把50Leabharlann 人从1到500编号;500 S2:计算分段间隔为 k= 50 =10 人。把编号从小