人教版高中数学必修三第二章《统计》质量检测
人教版高中数学必修三第二章《统计》单元检测精选(含答案解析)

人教版高中数学必修三第二章《统计》单元检测精选(含答案解析)一、选择题(本大题共12小题,每小题5分,共60分)1.从某年级1 000名学生中抽取125名学生进行体重的统计分析,就这个问题来说,下列说法正确的是( ) A .1 000名学生是总体B .每个被抽查的学生是个体C .抽查的125名学生的体重是一个样本D .抽取的125名学生的体重是样本容量2.由小到大排列的一组数据x 1,x 2,x 3,x 4,x 5,其中每个数据都小于-1,那么对于样本1,x 1,-x 2,x 3,-x 4,x 5的中位数可以表示为( ) A.12(1+x 2) B.12(x 2-x 1) C.12(1+x 5) D.12(x 3-x 4) 3.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别应抽取的人数是( )A .7,11,19B .6,12,18C .6,13,17D .7,12,174.对变量x ,y 有观测数据(x i ,y i )(i =1,2,…,10),得散点图1;对变量u ,v 有观测数据(u i ,v i )(i =1,2,…,10),得散点图2.由这两个散点图可以判断( )A .变量x 与y 正相关,u 与v 正相关B .变量x 与y 正相关,u 与v 负相关C .变量x 与y 负相关,u 与v 正相关D .变量x 与y 负相关,u 与v 负相关5.已知一组数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13,那么另一组数3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数,方差分别是( )A .2,13 B .2,1C .4,23D .4,36.某学院有4个饲养房,分别养有18,54,24,48只白鼠供实验用.某项实验需抽取24只白鼠,你认为最合适的抽样方法是( ) A .在每个饲养房各抽取6只B .把所有白鼠都加上编有不同号码的颈圈,用随机抽样法确定24只C .从4个饲养房分别抽取3,9,4,8只D .先确定这4个饲养房应分别抽取3,9,4,8只,再由各饲养房自己加号码颈圈,用简单随机抽样的方法确定7.下列有关线性回归的说法,不正确的是( )A .相关关系的两个变量不一定是因果关系B .散点图能直观地反映数据的相关程度C .回归直线最能代表线性相关的两个变量之间的关系D .任一组数据都有回归直线方程8.已知施肥量与水稻产量之间的回归直线方程为y ^=4.75x +257,则施肥量x =30时,对产量y 的估计值为( )A .398.5B .399.5C .400D .400.59.在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( ) A .甲地:总体均值为3,中位数为4 B .乙地:总体均值为1,总体方差大于0 C .丙地:中位数为2,众数为3D .丁地:总体均值为2,总体方差为310.某高中在校学生2 000人,高一与高二人数相同并都比高三多1人.为了响应“阳光体育运动”号召,学校举行了“元旦”跑步和登山比赛活动.每人都参加而且只参与了其中一项比赛,其中a ∶b ∶c =2∶3∶5,全校参与登山的人数占总人数的25.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则高二参与跑步的学生中应抽取( ) A .36人 B .60人 C .24人 D .30人11.某赛季,甲、乙两名篮球运动员都参加了11场比赛,他们所有比赛得分的情况用如右图所示的茎叶图表示,则甲、乙两名运动员得分的中位数分别为( )A .19,13B .13,19C .20,18D .18,2012A .30%B .70%C .60%D .50%二、填空题(本大题共4小题,每小题5分,共20分)13.已知一个回归直线方程为y ^=1.5x +45(x i ∈{1,5,7,13,19}),则y =________. 14.若a 1,a 2,…,a 20这20个数据的平均数为x ,方差为0.21,则a 1,a 2,…,a 20,x 这21个数据的方差为________.15.从某小学随机抽取100名学生,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.16.某公司有员工49人,其中30岁以上的员工有14人,没超过30岁的员工有35人,为了解员工的健康情况,用分层抽样方法抽一个容量为7的样本,其中30岁以上的员工应抽取________人.三、解答题(本大题共6小题,共70分)17.(10分)某产品的广告支出x(单位:万元)与销售收入y(单位:万元)之间有下表所对应的数据:(1)(2)求出y对x的回归直线方程;(3)若广告费为9万元,则销售收入约为多少万元?18.(12分)炼钢是一个氧化降碳的过程,钢水含碳量的多少直接影响冶炼时间的长短,必须掌握钢水含碳量和冶炼时间的关系.如果已测得炉料熔化完毕时,钢水的含碳量x与冶炼时间y(从炉料熔化完毕到出钢的时间)的一列数据如下表所示:(1)(2)求回归直线方程;(3)预测当钢水含碳量为160时,应冶炼多少分钟?19.(12分)甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.20.(12分)随着我国经济的快速发展,城乡居民的生活水平不断提高,为研究某市家庭平均收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下:(1)(2)若二者线性相关,求回归直线方程.21.(12分)某工厂有工人1 000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人).现用分层抽样方法(按A类,B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(生产能力指一天加工的零件数).(1)A类工人中和B类工人中各抽查多少工人?(2)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.表1表2异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1A类工人生产能力的频率分布直方图图2B类工人生产能力的频率分布直方图②分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).22.(12分)一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了10(1)y与x是否具有线性相关关系?(2)如果y与x具有线性相关关系,求回归直线方程;(3)根据求出的回归直线方程,预测加工200个零件所用的时间为多少?参考答案与解析1.C [在初中学过:“在统计中,所有考察对象的全体叫做总体,其中每一个所要考察的对象叫做个体,从总体中抽取的一部分个体叫做总体的一个样本,样本中个体的数目叫做样本容量.”因此题中所指的对象应是体重,故A 、B 错误,样本容量应为125,故D 错误.]2.C [由题意把样本从小到大排序为x 1,x 3,x 5,1,-x 4,-x 2,因此得中位数为12(1+x 5).]3.B [因27∶54∶81=1∶2∶3,16×36=6,26×36=12,36×36=18.]4.C [由点的分布知x 与y 负相关,u 与v 正相关.]5.D [因为数据x 1,x 2,x 3,x 4,x 5的平均数是2,方差是13,所以x =2,15∑5i =1 (x i -2)2=13, 因此数据3x 1-2,3x 2-2,3x 3-2,3x 4-2,3x 5-2的平均数为: 15∑5i =1 (3x i -2)=3×15∑5i =1x i-2=4, 方差为:15∑5i =1 (3x i -2-x )2=15∑5i =1 (3x i -6)2=9×15∑5i =1 (x i -2)2=9×13=3.] 6.D [因为这24只白鼠要从4个饲养房中抽取,因此要用分层抽样决定各个饲养房应抽取的只数,再用简单随机抽样法从各个饲养房选出所需白鼠.C 虽然用了分层抽样,但在每个层中没有考虑到个体的差异,也就是说在各个饲养房中抽取样本时,没有表明是否具有随机性,故选D.]7.D [根据两个变量具有相关关系的概念,可知A 正确,散点图能直观地描述呈相关关系的两个变量的相关程度,且回归直线最能代表它们之间的相关关系,所以B 、C 正确.只有线性相关的数据才有回归直线方程,所以D 不正确.] 8.B [成线性相关关系的两个变量可以通过回归直线方程进行预测,本题中当x =30时,y ^=4.75×30+257=399.5.]9.D [由于甲地总体均值为3,中位数为4,即中间两个数(第5、6天)人数的平均数为4,因此后面的人数可以大于7,故甲地不符合.乙地中总体均值为1,因此这10天的感染人数总和为10,又由于方差大于0,故这10天中不可能每天都是1,可以有一天大于7,故乙地不符合.丙地中中位数为2,众数为3,3出现的最多,并且可以出现8,故丙地不符合.故丁地符合.]10.A [由题意知高一、高二、高三的人数分别为667,667,666. 设a =2k ,b =3k ,c =5k ,则a +b +c =35×2 000,即k =120.∴b =3×120=360.又2 000人中抽取200人的样本,即每10人中抽取一人,则360人中应抽取36人,故选A.]11.A [分别将甲、乙两名运动员的得分从小到大排列,中间位置的分数则为中位数.] 12.B [由数据分布表可知,质量不小于120克的苹果有10+3+1=14(个),占苹果总数的1420×100%=70%.]13.58.5解析 回归直线方程为y ^=1.5x +45经过点(x , y ),由x =9,知y =58.5. 14.0.215.0.030 3解析 因5个矩形面积之和为1,即(0.005+0.010+0.020+a +0.035)×10=1, ∴0.070×10+10a =1,∴a =0.030.由于三组内学生数的频率分别为:0.3,0.2,0.1,所以三组内学生的人数分别为30,20,10.因此从[140,150]内选取的人数为1060×18=3.16.217.解 (1)作出的散点图如图所示(2)易得x =52,y =692,所以b ^ =∑4i =1x i y i -4x y ∑4i =1x 2i -4x 2=418-4×52×69230-4×⎝⎛⎭⎫522=735,a ^ =y -b ^ x =692-735×52=-2.故y 对x 的回归直线方程为y ^ =735x -2.(3)当x =9时,y ^ =735×9-2=129.4.故当广告费为9万元时,销售收入约为129.4万元.18.解 (1)以x 轴表示含碳量,y 轴表示冶炼时间,可作散点图如图所示:从图中可以看出,各点散布在一条直线附近,即它们线性相关.设所求的回归直线方程为y =b x +a ,b ^ =∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2≈1.267,a ^ =y -b ^ x ≈-30.47.所求回归直线方程为 y ^=1.267x -30.47.(3)当x =160时,y ^=1.267×160+(-30.47)=172.25.即当钢水含碳量为160时,应冶炼约172.25分钟.19.解 (1)由图象可得甲、乙两人五次测试的成绩分别为 甲:10分,13分,12分,14分,16分; 乙:13分,14分,12分,12分,14分.x 甲=10+13+12+14+165=13,x 乙=13+14+12+12+145=13,s 2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4, s 2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8. (2)由s 2甲>s 2乙可知乙的成绩较稳定. 从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高. 20.解 (1)作出散点图:观察发现各个数据对应的点都在一条直线附近,所以二者呈线性相关关系.(2)x =110(0.8+1.1+1.3+1.5+1.5+1.8+2.0+2.2+2.4+2.8)=1.74,y =110(0.7+1.0+1.2+1.0+1.3+1.5+1.3+1.7+2.0+2.5)=1.42,∑10i =1x i y i =27.51,∑10i =1x 2i =33.72, b ^=∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2≈0.813 6,a ^ =1.42-1.74×0.813 6≈0.004 3,∴回归方程为y ^=0.813 6x +0.004 3.21.解 (1)A 类工人中和B 类工人中分别抽查25名和75名.(2)①由4+8+x +5+3=25,得x =5,6+y +36+18=75,得y =15. 频率分布直方图如下:图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.②x A =425×105+825×115+525×125+525×135+325×145=123,x B =675×115+1575×125+3675×135+1875×145=133.8,x =25100×123+75100×133.8=131.1.A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1. 22.解 (1)作出如下散点图:由图可知,y 与x 具有线性相关关系.x =55,y =91.7,∑10i =1x 2i =38 500,∑10i =1y 2i =87 777,∑10i =1x i y i =55 950, 设所求的回归直线方程为y ^ =b ^ x +a ^,则有b ^ =∑10i =1x i y i -10x y ∑10i =1x 2i -10x 2=55 950-10×55×91.738 500-10×552≈0.668,a ^ =y -b ^ x =91.7-0.668×55=54.96,因此,所求的回归直线方程为y ^ =0.668x +54.96.(3)这个回归直线方程的意义是当x 每增加1时,y 的值约增加0.668,而54.96是y 不随x 变化而变化的部分,因此,当x =200时,y 的估计值为y ^ =0.668×200+54.96=188.56≈189,因此,加工200个零件所用的时间约为189分.。
新人教A版必修3 高中数学2.3.4第二章统计复习小结测试 文

高中数学 2.3.4第二章统计复习小结测试文新人教A版必修3一、选择题1.下列说法错误的是()A.在统计里,把所需考察的对象的全体叫做总体B.一组数据的平均数一定大于这组数据中的每个数据C.平均数、众数与中位数从不同的角度描述了一组数据的集中趋势D.一组数据的方差越大,说明这组数据的波动越大2.为了了解参加一次知识竞赛的1252名学生的成绩,决定采用系统抽样的方法抽取一个样本容量为10的样本,那么从总体中应随机剔除个体的数目是()A.2 B.3 C.4 D.53.从某年级2000名学生中抽取200名学生进行体重的统计分析,就这个问题来说,下列说法正确的是()A.应采用分层抽样抽取样本B.每个被抽查的学生是个体C.抽取的200名学生的体重是一个样本D.抽取的200名学生的体重是样本容量4.某单位有老年人27人,中年人54人,青年人81人,为了调查他们的身体状况的某项指标,需从他们中间抽取一个容量为36的样本,则老年人、中年人、青年人分别各抽取的人数是()A.7,11,9 B.6,12,18 C.6,13,17 D.7,12,175.下列抽样问题中最适合用系统抽样发抽样的是()A.从全班48名学生中随机抽取8人参加一项活动B.一个城市有210家百货商店,其中大型商店20家,中型商店40家,小型商店150家.为了掌握各商店的营业情况,要从中抽取一个容量为21的样本C.从参加模拟考试的1200名高中生中随机抽取100人分析试题作答情况D.从参加模拟考试的1200名高中生中随机抽取10人了解某些情况6.已知某赛季甲、乙两名篮球运动员每场比赛得分的茎叶图(如图所示),则()3 6 8 2 54 3 8 9 3 1 6 1 6 7 9 2 4 4 9 15 0A.甲篮球运动员比赛得分更稳定,中位数为26B.甲篮球运动员比赛得分更稳定,中位数为27C.乙篮球运动员比赛得分更稳定,中位数为31D.乙篮球运动员比赛得分更稳定,中位数为367. 某人5次上班途中所花的时间(单位:分钟)分别为x ,y ,10,11,9.已知这组数据的平均数为10,方差为2,则|x -y |的值为( ) A .1 B .2 C .3 D .4A.0.001B.0.1C.0.2D.0.38. 给出两组数据x 、y 的对应值如下表,若已知x 、y 是线性相关的,且线性回归方程:x b a yˆˆˆ+=,经计算知:4.1ˆ-=b ,则=a ˆ( )A.17.4B.-1.74C.0.6D.-0.69. 某中学有学生270人,其中一年级108人,二、三年级各81人,现在用抽样方法抽取10人形成样本,将学生按一、二、三年级依次统一编号为1,2,…,270,如果抽得号码有下列四种情况:①5,9,100,107,111,121,180,195,200,265; ②7,34,61,88,115,142,169,196,223,250; ③30,57,84,111,138,165,192,219,246,270;④11,38,65,92,119,146,173,200,227,254;其中可能是由分层抽样得到,而不可能是由系统抽样得到的一组号码为( ) A. ①② B.②③ C.①③ D.①④ 二、填空题11.一组数据:23,27,20,18,x ,12,它们的平均数为21,那么x 是 .12.一组数据的平均数是2.8,方差是3.6,若将这组数据中的每一个数据都加上60,得到一组新数据,则所得新数据的平均数和方差分别是 13.某单位为了了解用电量y 度与气温x ℃之间的关系,随机统计了某4天的用电量与当天气温.由表中数据得线性方程x b a yˆˆˆ+=中2ˆ-=b ,据此预测当气温为5℃时,用电量的度数约为 .14.某单位有技工18人,技术员12人,工程师6人,需要从这些人中抽取一个容量为n 的样本;如果采用系统抽样和分层抽样方法,都不用剔除个体;如果样本容量增加一个,则在采用系统抽样时,需要在总体中剔除一个个体,则样本容量n 为 . 15.某班12位学生父母年龄的茎叶图如图所示,则12位同学母亲的年龄的中位数是 ,三、解答题16.一批产品中,有一级品100个,二级品60个,三级品40个,分别用系统抽样和分层抽样的方法,从这批产品中抽取一个容量为20的样本.17.要从甲、乙两名运动员中选拔一人参加射击比赛,为此对他们的射击水平进行了测试,两人在相同条件下各射击10次,命中的环数如下: 甲:7 8 6 8 6 5 9 10 7 4 乙:9 5 7 8 7 6 8 6 7 7(1)计算甲、乙两人射击命中环数的平均数和标准差; (2)比较两人的成绩,然后决定选择哪一人参加比赛.18.为了研究三月下旬的平均气温(x )与四月棉花害虫化蛹高峰(y )的关系,某地区观察了2003年至2008年的情况,得到下面数据:已知与之间具有线性相关关系,据气象预测该地区在2010年三月下旬平均气温为27℃,试估计2010年四月化蛹高峰日为哪天?19.为参加连队组织的射击比赛,班长在本班安排射击选拔赛,每人每轮10发,共安排10(1)根据表中数据画出茎叶图(以个数为叶,并且排序);(2)请你替班长选出1名战士参加连队的射击比赛,并说明理由.20.一般来说,一个人的身高越高,他的手就越大.为调查这一问题,对10名高三男生的身高与右手一拃长测量得如下数据(单位:cm):(2)如果近似成线性关系,求回归方程.(3)如果一个学生身高185cm,估计他的右手一拃长.21.某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:[107,109〕3株;[109,111〕9株;[111,113〕13株;[113,115〕16株;[115,117〕26株;[117,119〕20株;[119,121〕7株;[121,123〕4株;[123,125〕2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据[109,121〕范围内的可能性是百分之几?必修3 第二章《统计》单元测试题[供教师备课参考]参考答案: BACBC DDDAC11.26 12.62.8 3.6 13.40 14.6 15.42 3 16.解:(1)系统抽样的方法:先将200个产品随机编号,001,0020,…,200,再将200个产品按001~010,011~020,…,191~200,分成20组,每组10个产品,在第一组内用简单随机抽样确定起始的个体编号,按事先确定的规则,从每组中分别抽取样本,这样就得到一个容量为20的样本.(2)分层抽样的方法:先将总体按其级别分为三层,一级品有100个,产品按00,01,…,99编号,二级品有60个,产品按00,01,…,59编号,三级品有40个,产品按00,01,…,39编号.因总体个数:样本容量为10:1,故用简单随机抽样的方法,在一级品中抽10个,二级品中抽6个,三级品中抽4个.这样就得到一个容量为20的样本.17.解:(1).10.1,73.1,7ˆ,7ˆ≈≈==乙甲乙甲s s x x(2)由(1)知,甲、乙两人的平均成绩相等,但甲乙s s <,这表明乙的成绩比甲的成绩稳定一些,从成绩的稳定性考虑,可以选择乙参赛.18.解: 由题意知:,6.71ˆˆ,2.266ˆ,6.1222,92.5130,5,7,13.2926126161612≈-=-≈--=∴===≈∑∑∑∑====x b y ax xy x yx by x x y x i iii i i i i i i∴回归方程为6.712.2ˆ+-=x y. 当27=x 时,2.126.71272.2ˆ=+⨯-=y,据此,可估计该地区2010年4月12日或13日为化蛹高峰期日.19.解: (1)(2)应当安排战士乙参加比赛,因为这两个战士的平均成绩都是95环,叶的分布是“单峰”的,从叶在茎上的分布情况看,乙战士的得分更集于峰值附近,这说明乙战士的发挥更稳定,所以若只要派去的选手发挥水平,应选战士乙.20.解:(1)散点图如图:由上图可见,身高与右手一扎长之间的总体趋势成一条直线,即它们线性相关.(2).264.31303.0ˆ-=x y(3)当x=185时,.791.24264.31185303.0ˆ=-⨯=y即学生身高185cm 时,他的右手一拃长约为24.791cm. 21.解:(1)画出频率分布表如下:18 19 20 21 22 23 24 25 26167 168 169 170 171 172 173 174 175 176 177 178 179 180 181 182一拃长 身高0.14 0.12 0.1 0.08 0.06 0.04 0.02 0树苗高度/cm(2)频率分布直方图如下:(3)由上述图表可知数据落在[109,121〕范围内的频率为:0.94-0.03=0.91,即数据落在[109,121〕范围内的可能性是91%.频率/组距。
2020学年高中数学第二章统计单元质量测评(含解析)新人教A版必修3(最新整理)

第二章单元质量测评本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分,满分150分,考试时间120分钟.第Ⅰ卷(选择题,共60分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.某学校为调查高三年级的240名学生完成课后作业所需的时间,采取了两种抽样调查的方式:第一种由学生会的同学随机抽取24名同学进行调查;第二种由教务处对高三年级的学生进行编号,从001到240,抽取学号最后一位为3的同学进行调查.上述两种抽样方法依次为()A.分层抽样,简单随机抽样B.简单随机抽样,分层抽样C.分层抽样,系统抽样D.简单随机抽样,系统抽样答案D解析结合简单随机抽样、系统抽样、分层抽样的定义可知第一种抽样方法是简单随机抽样,第二种抽样方法是系统抽样.2.下列变量之间的关系是相关关系的是( )A.正方体的表面积与体积B.光照时间与果树产量C.匀速行驶车辆的行驶距离与时间D.中国足球队的比赛成绩与中国乒乓球队的比赛成绩答案B解析其中A、C的两个变量是函数关系,D中两个变量无相关关系.3.在下列各图中,每个图的两个变量具有相关关系的图是()A.(1)(2) B.(1)(3) C.(2)(4) D.(2)(3)答案D解析根据题目所提供的信息,题图(1)表示函数的图象;题图(2)上的点分布在某一条直线附近,所以它们是相关关系;题图(3)上的点分布在某一个二次函数的图象附近,所以这两个变量之间也是相关关系;题图(4)表示的点不具有相关关系.故选D.4.为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验,得到5组数据(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5).根据收集到的数据可知错误!=20,由最小二乘法求得回归直线方程为错误!=0.6x+48,则y1+y2+y3+y4+y5=( )A.60 B.120 C.150 D.300答案D解析将x-=20代入回归方程得错误!=0.6×20+48=60.∴y1+y2+y3+y4+y5=5错误!=300.故选D.5.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数为3.2,全年比赛进球个数的标准差为3;乙队平均每场进球数是1.8,全年进球数的标准差为0.3.下列说法中,正确的个数为( )①甲队的技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏.A.1 B.2 C.3 D.4答案D解析因为甲队的平均进球数比乙队多,所以甲队技术较好,①正确;乙队的标准差比甲队小,标准差越小越稳定,所以乙队发挥稳定,②也正确;乙队标准差为0.3,说明每次进球数接近平均值,乙队几乎每场都进球,③正确;由于s甲=3,s乙=0.3,所以甲队与乙队相比,不稳定,所以甲队的表现时好时坏,④正确,故选D.6.对于线性回归方程错误!=错误!x+错误!,下列说法中不正确的是()A.直线必经过点(x,错误!)B.x增加一个单位时,y平均增加错误!个单位C.样本数据中x=0时,可能有y=错误!D.样本数据中x=0时,一定有y=错误!答案D解析线性回归方程错误!=错误!x+错误!,一定过点(错误!,错误!),故A正确;线性回归方程错误!=错误!x+错误!中,x增加一个单位时,y平均增加错误!个单位,故B正确;线性回归方程错误!=错误!x+错误!中,样本数据中x=0时,可能有y=错误!,也可能有y≠错误!,故C正确,D不正确.7.已知一组正数x1,x2,x3,x4的方差为s2=错误!(x错误!+x错误!+x错误!+x错误!-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为( )A.2 B.3 C.4 D.6答案C解析设x1,x2,x3,x4的平均值为错误!,∵s2=错误![(x1-错误!)2+(x2-错误!)2+(x3-错误!)2+(x4-错误!)2]=错误!(x 错误!+x错误!+x错误!+x错误!-4错误!2).∴4错误!2=16,∴错误!=2,∴x1+2,x2+2,x3+2,x4+2的平均数为4.故选C.8.某校高一、高二年级各有7个班参加歌咏比赛,他们得分的茎叶图如图所示,对这组数据分析正确的是( )A.高一的中位数大,高二的平均数大B.高一的平均数大,高二的中位数大C.高一的平均数、中位数都大D.高二的平均数、中位数都大答案A解析由茎叶图可以看出,高一的中位数为93,高二的中位数为89,所以高一的中位数大.由计算得,高一的平均数为91,高二的平均数为92错误!,所以高二的平均数大.故选A.9.为了了解高三学生的数学成绩,抽取了某班60名学生,将所得数据整理后,画出其频率分布直方图,如图.已知从左到右各长方形高的比为2∶3∶5∶6∶3∶1,则该班学生数学成绩在[80,100)之间的学生人数是( )A.32 B.27 C.24 D.33答案D解析由于所有矩形的面积之和等于1,所以该班学生数学成绩在[80,100)之间的频率是错误!=错误!.所以该班学生数学成绩在[80,100)之间的学生人数是错误!×60=33.10.从某中学高一年级中随机抽取100名学生的成绩(单位:分),绘制成频率分布直方图(如图),则这100名学生成绩的平均数、中位数分别为( )A.125,125 B.125.1,125C.124.5,124 D.125,124答案D解析由题图可知(a+a-0.005)×10=1-(0.010+0.015+0.030)×10,解得a =0.025,则错误!=105×0.1+115×0.3+125×0.25+135×0.2+145×0.15=125.中位数在120~130之间,设为x,则0.01×10+0.03×10+0.025×(x-120)=0.5,解得x=124,故选D.11.某人5次上班途中所花的时间(单位:分钟)分别为x,y,10,11,9.已知这组数据的平均数为10,方差为2,则|x-y|的值为()A.1 B.2 C.3 D.4答案D解析由题意得错误!所以错误!解得错误!或错误!故|x-y|=4,故选D.12.已知样本数据由小到大依次为2,3,3,7,a,b,12,13.7,18.3,20,且样本的中位数为10.5,若使该样本的方差最小,则a,b的值分别为( )A.10,11 B.10.5,9.5C.10.4,10.6 D.10.5,10.5答案D解析由于样本共有10个值,且中间两个数为a,b,依题意,得错误!=10.5,即b=21-a.因为平均数为(2+3+3+7+a+b+12+13.7+18.3+20)÷10=10,所以要使该样本的方差最小,只需(a-10)2+(b-10)2最小.又(a-10)2+(b-10)2=(a-10)2+(21-a-10)2=2a2-42a+221,所以当a=-错误!=10.5时,(a-10)2+(b-10)2最小,此时b=10.5.第Ⅱ卷(非选择题,共90分)二、填空题(本大题共4小题,每小题5分,共20分)13.现有甲、乙两种产品共120件,现按一定的比例用分层抽样的方法共抽取10件进行产品质量调查,如果所抽取的甲产品的数量是乙产品的2倍还多1件,那么甲、乙产品的总件数分别为________、________.答案84 36解析设抽取乙产品x件,则抽取甲产品2x+1件,由x+(2x+1)=10,得x=3.∴2x+1=7.∴共有甲产品120×错误!=84(件),乙产品120×错误!=36(件).14.某年级120名学生在一次百米测试中,成绩全部介于13秒与18秒之间.将测试结果分成5组:[13,14),[14,15),[15,16),[16,17),[17,18],得到如图所示的频率分布直方图.如果从左到右的5个小矩形的面积之比为1∶3∶7∶6∶3,那么成绩在[16,18]的学生人数是________.答案54解析成绩在[16,18]的学生的人数所占比例为错误!=错误!,所以成绩在[16,18]的学生人数为120×错误!=54.15.某地区为了解70~80岁的老人的日平均睡眠时间(单位:h),随机选择了50位老人进行调查,下表是这50位老人日睡眠时间的频率分布表:序号(i)分组(睡眠时间)组中值(G i)频数(人数)频率(F i)1[4,5)4.560.122[5,6)5.5100.203[6,7)6.5200.404[7,8)7.5100.205[8,9]8.540.08在上述统计数据的分析中,一部分计算见程序框图,则输出的S的值为________.答案6.42解析由程序框图可得:S=G1F1+G2F2+G3F3+G4F4+G5F5=4.5×0.12+5.5×0.20+6.5×0.40+7.5×0.20+8.5×0.08=6.42.16.据统计表明,某城市每月的雾霾天数与该城市每月的汽车出行量呈线性相关关系,已知该城市10~12月份的数据统计如下表:月份101112月汽车出行量x537(万辆)雾霾天数y(天)15822要使下一年元月份的雾霾天数不超过11.5天,那么该月汽车的出行量应控制在________万辆以内.线性回归方程有关公式:错误!=错误!x+错误!,错误!=错误!,错误!=错误!-错误!错误!答案4解析由题意可知,错误!=5,错误!=15,错误!=错误!=3.5,所以错误!=-2.5,所以线性回归方程为错误!=3.5x-2.5,又雾霾天数不超过11.5天,所以3.5x-2.5≤11.5,可得x≤4.所以该月汽车的出行量应控制在4万辆以内.三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)17.(本小题满分10分)已知某单位有50名职工,现要从中抽取10名职工,将全体职工随机按1~50编号,并按编号顺序平均分成10组,按各组内抽取的编号依次增加5进行系统抽样.(1)若第5组抽出的号码为22,写出所有被抽出职工的号码;(2)分别统计这10名职工的体重(单位:公斤),获得体重数据的茎叶图如图所示,求该样本的方差.解(1)由题意,第5组抽出的号码为22.因为k+5×(5-1)=22,所以第1组抽出的号码应该为2,抽出的10名职工的号码分别为2,7,12,17,22,27,32,37,42,47.(2)因为10名职工的平均体重为错误!=错误!×(81+70+73+76+78+79+62+65+67+59)=71,所以样本方差为s2=110×(102+12+22+52+72+82+92+62+42+122)=52.18.(本小题满分12分)某公司对新研发的一种产品进行合理定价,且销量与单价具有相关关系,将该产品按事先拟定的价格进行试销,得到如下数据:(1)现有三个y对x的回归直线方程:错误!=-10x+170;错误!=-20x+250;错误!=-15x+210.根据所学的统计学知识,选择一条合理的回归直线,并说明理由.(2)预计在今后的销售中,销量与单价服从(1)中选出的回归直线方程,且该产品的成本是每件5元,为使公司获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解(1)错误!=错误!×(8+8.2+8.4+8.6+8.8+9)=8.5,错误!=错误!×(90+84+83+80+75+68)=80.∵点(错误!,错误!)在回归直线上,∴选择错误!=-20x+250.(2)利润w=(x-5)(-20x+250)=-20x2+350x-1250=-20(x-8.75)2+281.25,∴当x=8.75元时,利润w最大,为281.25万元.∴当该产品的单价定为8.75元时,利润最大,为281.25万元.19.(本小题满分12分)某车站在春运期间为了了解旅客购票情况,随机抽样调查了100名旅客从开始在售票窗口排队到购到车票所用的时间t(以下简称为购票用时,单位为min),下面是这次调查统计分析得到的频率分布表和频率分布直方图(如图所示).〈15四组15≤t〈20①0.5五组20≤t≤25300.3合计1001.0 0解答下列问题:(1)这次抽样的样本容量是多少?(2)在表中填写出缺失的数据并补全频率分布直方图;(3)旅客购票用时的平均数可能落在哪一组?解(1)样本容量是100.(2)①50 ②0.10所补频率分布直方图如图中的阴影部分.(3)设旅客平均购票用时为t min,则有0×0+5×10+10×10+15×50+20×30100≤t〈错误!,即15≤t〈20.所以旅客购票用时的平均数可能落在第四组.20.(本小题满分12分)假设某种设备使用的年限x(年)与所支出的维修费用y(元)有以下统计资料:参考数据:错误!错误!=90,错误!i y i=112.3,如果由资料知y对x呈线性相关关系.试求:(1)x,y;(2)线性回归方程错误!=错误!x+错误!;(3)估计使用10年时,维修费用是多少?解(1)错误!=4,错误!=5.(2)由已知可得:错误!=错误!=错误!=1.23.于是错误!=错误!-错误!错误!=5-1.23×4=0.08.所求线性回归方程为:错误!=1.23x+0.08.(3)由(2)可得,当x=10时,错误!=1.23x+0.08=1.23×10+0.08=12.38(万元).即估计使用10年时,维修费用是12.38万元.21.(本小题满分12分)某品牌手机厂商推出新款的旗舰机型,并在某地区跟踪调查得到这款手机上市时间(x个月)和市场占有率(y%)的几组相关对应数据:(1)根据上表中的数据,用最小二乘法求出y关于x的线性回归方程;(2)根据上述回归方程,分析该款旗舰机型市场占有率的变化趋势,并预测自上市起经过多少个月,该款旗舰机型市场占有率能超过0.5%(精确到月).附:错误!=错误!,错误!=错误!-错误!错误!.解(1)经计算错误!=0.042,错误!=-0.026,所以线性回归方程为错误!=0.042x -0.026.(2)由上面的回归方程可知,上市时间与市场占有率正相关,即上市时间每增加1个月,市场占有率都增加0.042个百分点.由y,^=0.042x-0.026>0.5,解得x≥12.5,故预计上市13个月时,该款旗舰机型市场占有率能超过0.5%.22.(本小题满分12分)酒后驾车与醉酒驾车认定的标准是:车辆驾驶员血液酒精含量在20~80 mg/100 mL(不含80)之间,属于酒后驾车;在80 mg/100 mL(含80)以上时,属于醉酒驾车.某市公安局交通管理局在某路段的一次拦查行动中,依法检查了300辆机动车,查处酒后驾车和醉酒驾车的驾驶员共20人,检测结果如表:(1)绘制出检测数据的频率分布直方图(在图中用实线画出矩形框即可);(2)求检测数据中醉酒驾车的频率,并估计检测数据中酒精含量的众数和平均数.解(1)酒精含量(mg/100 mL)在[20,30)的错误!为错误!=0.015,在[30,40)的频率组距为错误!=0.020,在[40,50)的错误!为错误!=0.005,在[50,60)的频率组距为420×10=0.020,在[60,70)的错误!为错误!=0.010,在[70,80)的错误!为错误!=0.015,在[80,90)的错误!为错误!=0.010,在[90,100]的错误!为错误!=0.005.绘制出的酒精含量检测数据的频率分布直方图如图所示.(2)检测数据中醉酒驾驶(酒精含量在80 mg/100 mL(含80)以上时)的频率是错误!=0.15.根据频率分布直方图,小矩形最高的是[30,40)和[50,60),估计检测数据中酒精含量的众数是35与55;估计检测数据中酒精含量的平均数是0.015×10×25+0.020×10×35+0.005×10×45+0.020×10×55+0.010×10×65+0.015×10×75+0.010×10×85+0.005×10×95=55.尊敬的读者:本文由我和我的同事在百忙中收集整编出来,本文档在发布之前我们对内容进行仔细校对,但是难免会有不尽如人意之处,如有疏漏之处请指正,希望本文能为您解开疑惑,引发思考。
2020学年高中数学第二章统计单元质量测评新人教A版必修3(2021-2022学年)

第二章统计单元质量测评本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分,考试时间120分钟.第Ⅰ卷(选择题,共60分)一、选择题(本大题共12小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.已知总体的个数为111,若用随机数表法抽取一个容量为12的样本,则下列对总体的编号正确的是()A.1,2,…,111ﻩB.0,1,…,111C.000,002,…,111ﻩD.001,002,…,111答案D解析在使用随机数表法抽取样本时,必须保证编号的位数一致,同时要规范编号,不能多也不能少,结合所给选项,选D.2.如图所示的4个散点图中,两个变量具有相关关系的是()A.①② B.①③ C.②④D.③④答案C解析由图可知①是一次函数关系,不是相关关系;②的所有点在一条直线附近波动,是线性相关关系;③不具有相关关系;④在某曲线附近波动,是非线性相关关系.所以两个变量具有相关关系的是②④。
3.我国古代数学名著《数书九章》有“米谷粒分”题:粮仓开仓收粮,有人送来米1534石,验得米内夹谷,抽样取米一把,数得254粒内夹谷28粒,则这批米内夹谷约为( ) A.134石 B.169石 C.338石 D.1365石答案Bﻬ解析根据样本估计总体,可得这批米内夹谷约为错误!未定义书签。
×1534≈169(石),故选B.4.对一个样本容量为100的数据分组,各组的频数如下:估计小于29的数据大约占总体的()A.42% B.58% C.40% D.16%答案A解析小于29的数据频数为1+1+3+3+18+16=42,所以小于29的数据大约占总体的42×100%=42%。
1005.如图是某赛季甲、乙两名篮球运动员5场比赛得分的茎叶图,已知甲的成绩的极差为31,乙的成绩的平均值为24,则下列结论错误的是()A.x=9B.y=9C.乙的成绩的中位数为26D.乙的成绩的方差小于甲的成绩的方差答案B解析因为甲的成绩的极差为31,所以其最高成绩为39,所以x=9;因为乙的成绩的平均值为24,所以y=24×5-(12+25+26+31)-20=6;由茎叶图知乙的成绩的中位数为26;对比甲、乙的成绩分布发现,乙的成绩比较集中,故其方差较小.6.某出租汽车公司为了了解本公司司机的交通违章情况,随机调查了50名司机,得到了他们某月交通违章次数的数据,结果制成了如图所示的统计图,根据此统计图可得这50名出租车司机该月平均违章的次数为( )A.1B.1.8 C.2.4 D.3答案B解析错误!=1。
(完整版)人教版高一数学必修三第二章统计全部教案和测试题

人教版高一数学必修三第二章统计目录简单随机抽样(新讲课)系统抽样(新讲课)分层抽样(新讲课)2用样本的频次散布预计整体散布(2 课时 ) (新讲课)用样本的数字特色预计整体的数字特色(2 课时 ) (新讲课)变量之间的有关关系(新讲课)两个变量的线性有关(第一课时)(新讲课)两个变量的线性有关(第二课时)(新讲课)生活中线性有关实例(第三课时)(新讲课)第二章统计单元检测题(一)第二章统计单元检测题(一)参照答案第二章统计单元检测题(二)第二章统计单元检测题(二)参照答案第二章统计单元检测题(三)第二章统计单元检测题(三)参照答案第二章统计一、课程目标:本章主要介绍最基本的获得样本数据的方法,以及集中从样本数据中提守信息的统计方法,此中包含用样本预计整体散布、数字特色和线性回归等内容。
本章经过实质问题,进一步介绍随机抽样、样本预计整体、线性回归的基本方法。
二、学习目标:1、随机抽样(1)能从现实生活或其余学科中提出拥有一订价值的统计问题。
(2)联合详细的实质问题情境,理解随机抽样的必需性和重要性。
(3)在参加解决统计问题的过程中,学会用简单随机抽样从整体中抽取样本;经过对实例的剖析,认识分层抽样和系统抽样方法。
(4)经过试验、查阅资料、设计检盘问卷等方法采集数据。
2、用样本预计整体(1)经过实例领会散布的意义和作用,在表示样本数据的过程中,学会列频次散布彪、花频次散布直方图、频次折线图、茎叶土,领会它们各自的特色。
(2)经过实例理解样本数据标准差的意义和作用,学会计算数据样本差。
(3)能依据实质问题的需求合理地选用样本,从样本数据中提取基本的数字特色,并做出合理的解说。
(4)进一步领会用样本预计整体的思想。
(5)会用随机抽样的基本方法和样本预计整体的思想,解决一些简单的实质问题。
(6)形成对数据办理过程进行初步评论的意识。
3、变量的有关性(1)经过采集现实问题中两个有关系变量的数据作出散点图,并利用散点图直观认识变量间的有关关系。
高中数学 第二章 统计模块复习课检测 新人教B版必修3-新人教B版高一必修3数学试题

第2课时统计课后篇巩固探究A组1.下列不具有相关关系的是()A.单产不为常数时,土地面积和总产量B.人的身高与体重C.季节与学生的学习成绩D.学生的学习态度与学习成绩.2.某中学采用系统抽样方法,从该校高一年级全体800名学生中抽取50名学生做牙齿健康检查.现将800名学生从1到800进行编号.已知从33~48这16个数中抽到的数是39,则在第1小组1~16中随机抽到的数是()A.5B.7C.11D.13k==16,即每16人抽取一个人.因为39=2×16+7,所以第1小组中抽取的数为7.3.在一次歌手大奖赛上,七位评委为某歌手打出的分数如下:9.48.49.49.99.69.49.7去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为()A.9.4,0.484B.9.4,0.016C.9.5,0.04D.9.5,0.016=9.5.方差s2=[(9.4-9.5)2+(9.4-9.5)2+(9.6-9.5)2+(9.4-9.5)2+(9.7-9.5)2]=0.016.4.某地区有300家商店,其中大型商店有30家,中型商店有75家,小型商店有195家,为了掌握各商店的营业情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的中型商店为() A.2家B.3家C.5家D.13家1:在整个抽样过程中,每个个体被抽到的可能性为,则抽取的中型商店为75×=5(家).方法2:因为大、中、小型商店数的比为30∶75∶195=2∶5∶13,所以抽取的中型商店为20×=5(家).答案:C5.某商场在五一促销活动中,对5月1日9时至14时的销售额进行统计,其频率分布直方图如图,已知9时至10时的销售额为2.5万元,则11时至12时的销售额为()A.6万元B.8万元C.10万元D.12万元解析:由频率分布直方图可知,11时至12时的销售额占全部销售额的,即销售额为25×=10(万元).答案:C6.从一堆苹果中任取了20个,并得到它们的质量(单位:g)数据分布表如下:分组[90,100) [100,110) [110,120) [120,130) [130,140) [140,150)频数 1 2 3 10 1则这堆苹果中,质量不小于120 g的苹果数约占苹果总数的.解析:由表中可知这堆苹果中,质量不小于120 g的苹果数为20-1-2-3=14.故约占苹果总数的=0.70=70%.答案:70%7.某产品的广告费用x与销售额y的统计数据如下表:广告费用x/万元 4 2 3 5销售额y/万元49 26 39 54根据上表可得回归方程x+中的为9.4,据此模型预报广告费用为6万元时销售额约为元.解析:=3.5,=42,∴=42-9.4×3.5=9.1,∴回归方程为=9.4x+9.1,∴当x=6时,=9.4×6+9.1=65.5..58.现有同一型号的电脑96台,为了了解这种电脑每开机一次所产生的辐射情况,从中抽取10台在同一条件下做开机实验,测量开机一次所产生的辐射,得到如下数据:13.712.914.413.813.312.713.513.613.113.4(1)写出采用简单随机抽样抽取上述样本的过程;(2)根据样本,请估计总体平均数与总体标准差的情况.解:(1)利用随机数表法或抽签法.具体过程如下:方法一(抽签法):①将96台电脑随机编号为1~96;②将以上96个分别写在96X相同的小纸条上,揉成小球,制成号签;③把号签放入一个不透明的容器中,充分搅拌均匀;④从容器中逐个抽取10个号签,每次取完后再次搅拌均匀,并记录上面的;⑤找出和所得对应的10台电脑,组成样本.方法二(随机数表法):①将96台电脑随机编号,编号为00,01,02, (95)②在随机数表中任选一数作为开始,然后依次向右读,每次读两位,凡不在00~95中的数和前面已读过的数跳过不读,直到读出10个符合条件的数;③这10个数所对应的10台电脑即是我们所要抽取的样本.(2)=13.44;s2=≈0.461.故总体平均数为13.44,总体标准差约为0.461.9.对某班50人进行智力测验,其得分如下:48,64,52,86,71,48,64,41,86,79,71,68,82,84,68,64,62,68,81,57,90,52,74,73,56,78,47,66,5 5,64,56,88,69,40,73,97,68,56,67,59,70,52,79,44,55,69,62,58,32,58.(1)这次测试成绩的最大值和最小值各是多少?(2)将[30,100)平分成7个小区间,试画出该班学生智力测验成绩的频数分布图.(3)分析这个频数分布图,你能得出什么结论?解:(1)最小值是32,最大值是97.(2)7个区间分别是[30,40),[40,50),[50,60),[60,70),[70,80),[80,90),[90,100),每个小区间的长度是10,统计出各小区间内的数据频数,列表如下:区间[30,40) [40,50) [50,60) [60,70) [70,80) [80,90) [90,100)频数 1 6 12 14 9 6 2频数分布图如下图所示.(3)可以看出,该班智力测验成绩大体上呈两头小、中间大、左右对称的钟形状态,说明该班学生智力特别好或特别差的是极少数,而智力一般的是多数,这是一种最常见的分布.10.导学号17504078已知学生的总成绩与数学成绩之间有线性相关关系,下表给出了5名同学在一次考试中的总成绩和数学成绩(单位:分).学生编号1 2 3 4 5成绩总成绩/x482 383 421 364 362数学成绩/y78 65 71 64 61(1)求数学成绩与总成绩的回归直线方程.(2)根据以上信息,如果一个学生的总成绩为450分,试估计这个学生的数学成绩;(3)如果另一位学生的数学成绩为92分,试估计其总成绩是多少?解:(1)列出下表,并进行有关计算.编号x y x2xy1 482 78 232 324 37 5962 383 65 146 689 24 8953 421 71 177 241 29 8914 364 64 132 496 23 2965 362 61 131 044 22 082合计 2 012 339 819 794 137 760由上表可得,可得≈0.132,-0.132×≈14.683.故数学成绩y对总成绩x的回归直线方程为=14.683+0.132x.(2)由(1)得当总成绩x为450分时,=14.683+0.132×450≈74(分),即数学成绩大约为74分.(3)若数学成绩为92分,将=92代入回归直线方程=14.683+0.132x中,得x≈586(分).故估计该生的总成绩在586分左右.B组1.设样本数据x1,x2,…,x10的均值和方差分别为1和4,若y i=x i+a(a为非零常数,i=1,2,…,10),则y1,y2,…,y10的均值和方差分别为()A.1+a,4B.1+a,4+aC.1,4D.1,4+a解析:=+a=1+a.s2===4.答案:A2.为了普及环保知识,增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如图所示,假设得分的中位数为m e,众数为m o,平均值为,则()A.m e=m o=B.m e=m o<C.m e<m o<D.m o<m e<解析:由题目所给的统计图示可知,30个得分中,按大小顺序排好后,中间的两个得分为5,6,故中位数m e==5.5,又众数m o=5,平均值(3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×2)=,故m o<m e<.答案:D3.某市为加强教师基础素质建设,开展了“每月多读一本书,提高自身修养”的读书活动.设该市参加读书活动的教师平均每人每年读书的本数为x(单位:本),按读书本数分下列四种情况统计:①0~10本;②11~20本;③21~30本;④30本以上.现有10 000名教师参加了此项活动,如图是此次调查中某一项的程序框图,其输出的结果为6 200,则该市参加活动的教师中平均每年读书本数在0~20之间的频率是()A.3 800B.6 200C.0.38D.0.62解析:由程序框图知,当x>20时,S=S+1,故输出的S值应是10 000名教师中读书本数大于20的人数,故S=6 200,∴在0~20之间的频率为=0.38.答案:C4.(2017某某某某二中高三一模)某班级有50名学生,现要采取系统抽样的方法在这50名学生中抽出10名学生,将这50名学生随机编号1~50号,并分组,第一组1~5号,第二组6~10号,…,第十组46~50号,若在第三组中抽得为12的学生,则在第八组中抽得为的学生.解析:由题意得,在第八组中抽得为12+(8-3)×5=37.答案:375.某公司为改善职工的出行条件,随机抽取50名职工,调查他们的居住地与公司的距离d(单位:千米).若样本数据分组为[0,2],(2,4],(4,6],(6,8],(8,10],(10,12],由数据绘制的频率分布直方图如图所示,则样本中职工居住地与公司的距离不超过4千米的人数为.解析:样本中职工居住地与公司的距离不超过4千米的频率为(0.1+0.14)×2=0.48,所以样本中职工居住地与公司的距离不超过4千米的人数为50×0.48=24.答案:246.导学号17504079从某企业生产的某种产品中抽取100件,测量这些产品的一项质量指标值,由测量结果得如下频数分布表:质量指标值分组[75,85) [85,95) [95,105) [105,115) [115,125)频数 6 26 38 22 8(1)作出这些数据的频率分布直方图;(2)估计这种产品质量指标值的平均数及方差(同一组中的数据用该组区间的中点值作代表);(3)根据以上抽样调查数据,能否认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定?解:(1)(2)质量指标值的样本平均数为=80×0.06+90×0.26+100×0.38+110×0.22+120×0.08=100.质量指标值的样本方差为s2=(-20)2×0.06+(-10)2×0.26+0×0.38+102×0.22+202×0.08=104.所以这种产品质量指标值的平均数的估计值为100,方差的估计值为104.(3)质量指标值不低于95的产品所占比例的估计值为0.38+0.22+0.08=0.68.由于该估计值小于0.8,故不能认为该企业生产的这种产品符合“质量指标值不低于95的产品至少要占全部产品80%”的规定.7.导学号17504080某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x/元8 8.2 8.4 8.6 8.8 9销量y/件90 84 83 80 75 68(1)求回归直线方程x+,其中=-20,;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)=8.5,=80.∵=-20,,∴=80+20×8.5=250.∴回归直线方程为=-20x+250.(2)设工厂获得的利润为L元,则L=x(-20x+250)-4(-20x+250)=-20(x-8.25)2+361.25,∴该产品的单价定为8.25元时,工厂获得的利润最大.。
人教版高中数学必修三 2.1《随机抽样》知识梳理+跟踪检测

人教版高中数学必修三 第二章 统计2.1《随机抽样》知识梳理知识点一:简单随机抽样1.简单随机抽样的定义设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n ≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.2.简单随机抽样的分类简单随机抽样⎩⎨⎧随机数法抽签法 3.简单随机抽样的优点及适用类型简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的.知识点二:系统抽样1.系统抽样的概念先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本.2.系统抽样的步骤假设要从容量为N 的总体中抽取容量为n 的样本,步骤为:(1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.(2)确定分段间隔k ,对编号进行分段.当N n(n 是样本容量)是整数时,取k =N n; (3)在第1段用简单随机抽样确定第一个个体编号l(l ≤k);(4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本.知识点三:简单随机抽样1.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.人教版高中数学必修三第二章统计2.1《随机抽样》跟踪检测一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是1 5B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .126.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,87.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( )A. 22,100x s +B. 22100,100x s ++C. 2,x sD. 2100,x s +9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A.①②③B.①②④C.①③④D.①②③④10.下列抽样实验中,最适宜用系统抽样的是()A.某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B.某厂生产的2 000个电子元件中随机抽取5个入样C.从某厂生产的2 000个电子元件中随机抽取200个入样D.从某厂生产的20个电子元件中随机抽取5个入样11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为()A.93B.123C.137D.16712.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为()A.2个B.3个C.5个D.13个13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,614.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,5315.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,916.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. 18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.人.三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:60人进行更为详细的调查,应当怎样进行抽样?23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?2.1《随机抽样》跟踪检测解答一、选择题1.下列哪种工作不能使用抽样方法进行()A.测定一批炮弹的射程B.测定海洋水域的某种微生物的含量C.高考结束后,国家高考命题中心计算数学试卷中每个题目的难度D.检测某学校全体高三学生的身高和体重的情况[答案] D2.为了了解所加工的一批零件的长度,抽取其中200个零件并测量了其长度,在这个问题中,200个零件的长度是()A.总体B.个体C.总体的一个样本D.样本容量[答案] C3.某工厂质检员每隔10分钟从传送带某一位置取一件产品进行检测,这种抽样方法是()A.分层抽样B.简单随机抽样C.系统抽样D.以上都不对[答案] C[解析]按照一定的规律进行抽取为系统抽样.4.在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本:①采用随机抽样法,将零件编号为00,01,02,,99,抽出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组中随机抽取1个;③采用分层抽样法,随机从一级品中抽取4个,二级品中抽取6个,三级品中抽取10个.则()A.不论采取哪种抽样方法,这100个零件中每个被抽到的概率都是15B.①②两种抽样方法,这100个零件中每个被抽到的概率都是15,③并非如此 C.①③两种抽样方法,这100个零件中每个被抽到的概率都是15,②并非如此 D.采用不同的抽样方法,这100个零件中每个被抽到的概率各不相同[答案] A[解析] 无论采用哪种抽样,每个个体被抽到的概率相等.5.一个田径队,有男运动员56人,女运动员42人,比赛后,立即用分层抽样的方法,从全体队员中抽出一个容量为28的样本进行尿样兴奋剂检查,其中男运动员应抽的人数为( )A .16B .14C .28D .12[答案] A[解析] 运动员共计98人,抽取比例为2898=27,因此男运动员56人中抽取16人.6.以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则,x y 的值分别为( )A. 2,5B. 5,5C. 5,8D. 8,8[答案] C[解析] 由题意得x =15,16.8=51(9+15+10+y +18+24) y =8,选C. 7.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查,这种抽样方法是( )A .简单随机抽样法B .抽签法C .随机数法D .分层抽样法[答案] D[解析] 由分层抽样的定义可知,该抽样为按比例的抽样.8.某公司10位员工的月工资(单位:元)为1210,,,x x x ,其均值和方差分别为x 和2s ,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的均值和方差分别为( ) A. 22,100x s + B. 22100,100x s ++ C. 2,x s D. 2100,x s +[答案] D[解析] 设增加工资后10位员工下月工资均值为'x ,方差为2's , 则平均数()()()12101'10010010010x x x x =++++⋅⋅⋅++⎡⎤⎣⎦ ()1210110010010x x x x =++++=+; ()()()222212101'100'100'100'10s x x x x x x ⎡⎤=+-++-+⋅⋅⋅++-⎣⎦ ()()()22221210110x x x x x x s ⎡⎤=-+-+⋅⋅⋅+-=⎣⎦.故选D . 9.对于简单随机抽样,下列说法中正确的命题为( )①它要求被抽取样本的总体的个数有限,以便对其中各个个体被抽取的概念进行分析;②它是从总体中逐个进行抽取,以便在抽样实践中进行操作;③它是一种不放回抽样;④它是一种等可能抽样,不仅每次从总体中抽取一个个体时,各个个体被抽取的可能性相等,而且在整个抽样过程中,各个个体被抽取的可能性也相等,从而保证了这种抽样方法的公平性.A .①②③B .①②④C .①③④D .①②③④[答案] D10.下列抽样实验中,最适宜用系统抽样的是( )A .某市的4个区共有2 000名学生,且4个区的学生人数之比为3∶2∶8∶2,从中抽取200人入样B .某厂生产的2 000个电子元件中随机抽取5个入样C .从某厂生产的2 000个电子元件中随机抽取200个入样D .从某厂生产的20个电子元件中随机抽取5个入样[答案] C[解析] A 中总体有明显层次,不适用系统抽样法;B 中样本容量很小,适宜用简单随机抽样法中的随机数法;D 中总体数很小,故适宜用抽签法,只有C 比较适用系统抽样法.11.某中学初中部共有110名教师,高中部共有150名教师,其性别比例如图所示,则该校女教师的人数为( )A.93B.123C.137D.167[答案] C[解析] 由图可知该校女教师的人数为()11070%150160%7760137⨯+⨯-=+= 故选C12.一段高速公路有300个太阳能标志灯,其中进口的有30个,联合研制的有75个,国产的有195个,为了掌握每个标志灯的使用情况,要从中抽取一个容量为20的样本,若采用分层抽样的方法,抽取的进口的标志灯的数量为( )A .2个B .3个C .5个D .13个[答案] A[考点]分层抽样方法[分析]由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x ,即可得出结论.解:由题意,设抽取的进口的标志灯的数量为x 个,则30030=20x , ∴x=2,故选A .[点评]本题考查分层抽样,抽样过程中每个个体被抽到的可能性相同,这是解决抽样问题的依据,样本容量、总体个数、每个个体被抽到的概率,这三者可以做到知二求一.13.一个单位有职工800人,其中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是()A.12,24,15,9 B.9,12,12,7C.8,15,12,5 D.8,16,10,6[答案] D[解析]由题意,各种职称的人数比为160∶320∶200∶120=4∶8∶5∶3,所以抽取的具有高、中、初级职称的人数和其他人员的人数分别为40×4 20=8,40×820=16,40×520=10,40×320=6.14.对某商店一个月(30天)内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数、众数、极差分别是( )A.46,45,56B.46,45,53C.47,45,56D.45,47,53[答案] A[解析]样本中共有30个数据,中位数为4547462+=;显然样本中数据出现次数最多的为45,故众数为45;极差为68-12=56,故选A.15.某单位有职工100人,不到35岁的有45人,35岁到49岁的25人,剩下的为50岁以上的人,现在用分层抽样法抽取20人,则各年龄段人数分别是()A.7,4,6 B.9,5,6 C.6,4,9 D.4,5,9[答案] B[解析]各年龄段所选分别为20100×45=9,20100×25=5,20100×30=6.16.某单位共有老、中、青职工430人,其中有青年职工160人,中年职工人数是老年职工人数的2倍.为了解职工身体状况,现采用分层抽样方法进行调查,在抽取的样本中有青年职工32人,则该样本中的老年职工人数为()A.9 B.18 C.27 D.36[答案] B[解析]设该单位老年职工有x人,从中抽取y人.则160+3x=430⇒x=90,即老年职工有90人,则90160=y32⇒y=18.故选B.二、填空题17.在学生人数比例为2∶3∶5的A,B,C三所学校中,用分层抽样的方法招募n名志愿者,若在A学校恰好选出了6名志愿者,那么n=________. [答案]30[解析]由题意,知22+3+5×n=6,∴n=30.18.博才实验中学共有学生1 600名,为了调查学生的身体健康状况,采用分层抽样法抽取一个容量为200的样本.已知样本容量中女生比男生少10人,则该校的女生人数是________人.[答案]760[解析]设该校女生人数为x,则男生人数为(1 600-x).由已知,2001 600×(1 600-x)-2001 600·x=10,解得x=760.故该校的女生人数是760人.19.某地有居民100 000户,其中普通家庭99 000户,高收入家庭1 000户,从普通家庭中以简单随机抽样方法抽取990户,从高收入家庭中以简单随机抽样方法抽取100户进行调查,发现共有120户家庭拥有3套或3套以上住房,其中普通家庭50户,高收入家庭70户.依据这些数据并结合所掌握的统计知识,你认为该地拥有3套或3套以上住房的家庭所占比例的合理估计是________.[答案] 5.7%[解析]∵990∶99 000=1∶100,∴普通家庭中拥有3套或3套以上住房的大约为50×100=5 000(户).又∵100∶1 000=1∶10,∴高收入家庭中拥有3套或3套以上住房的大约为70×10=700(户).∴3套或3套以上住房的家庭约有5 000+700=5 700(户).故5 700100 000=5.7%.20.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本、用系统抽样法,将全体职工随机按1~200编号,并按编号顺序平均分为40组(1~5号,6~10号,…,196~200号).若第5组抽出的号码为22,则第8组抽出的号码应是__________.若用分层抽样方法,则40岁以下年龄段应抽取________人.[答案]3720[解析]由分组可知,抽号的间隔为5,又因为第5组抽出的号码为22,所以第6组抽出的号码为27,第7组抽出的号码为32,第8组抽出的号码为37.40岁以下的年龄段的职工数为200×0.5=100,则应抽取的人数为40200×100=20(人).21.从某地区15 000位老人中随机抽取500人,其生活能否自理的情况如下表所示.生活能否自理人数性别男女能178 278不能23 21人.[答案]60[解析]由表知500人中生活不能自理的男性比女性多2人,所以该地区15 000位老人生活不能自理的男性比女性多2×15 000500=60(人).三、解答题22.某电台在因特网上就观众对某一节目的喜爱程度进行调查,参加调查的总人数为12 000人,其中持各种态度的人数如下表:很喜爱喜爱一般不喜爱2 435 4 5673 926 1 07260人进行更为详细的调查,应当怎样进行抽样?解:可用分层抽样方法,其总体容量为12 000.“很喜爱”占2 43512 000,应取60×2 43512 000≈12(人);“喜爱”占4 56712 000,应取60×4 56712 000≈23(人);“一般”占3 92612 000,应取60×3 92612 000≈20(人);“不喜爱”占1 07212 000,应取60×1 07212 000≈5(人).因此采用分层抽样在“很喜爱”、“喜爱”、“一般”和“不喜爱”的2 435人、4 567人、3 926人和1 072人中分别抽取12人、23人、20人和5人.23.某单位在岗职工共624人,为了调查工人用于上班途中的时间,该单位工会决定抽取10%的工人进行调查,请问如何采用系统抽样法完成这一抽样?解:(1)将624名职工用随机方式编号由000至623.(2)利用随机数法从总体中剔除4人.(3)将剩下的620名职工重新编号由000至619.(4)分段,取间隔k=62062=10,将总体分成62组,每组含10人.(5)从第一段,即为000到009号随机抽取一个号l.(6)按编号将l,10+l,20+l,…,610+l,共62个号码选出,这62个号码所对应的职工组成样本.24.为调查小区平均每户居民的月用水量,下面是3名学生设计的调查方案:学生A:我把这个用水量调查表放在互联网上,只要登录网址的人就可以看到这张表,他们填表的信息可以很快地反馈到我的电脑中.这样,我就可以很快估计出小区平均每户居民的月用水量.学生B:我给我们居民小区的每一个住户发一个用水量调查表,只要一两天就可以统计出小区平均每户居民的月用水量.学生C:我在小区的电话号码本上随机地选出一定数量的电话号码,然后逐个给他们打电话,问一下他们的月用水量,然后就可以估计出小区平均每户居民的月用水量.请问:对上述3种学生设计的调查方案能够获得平均每户居民的月用水量吗?为什么?你有什么建议?解:学生A的方法得到的样本不能够反映不上网的居民情况,是一种方便样本,所得的结果代表性差,不能很准确地获得平均每户居民的月用水量;学生B 的方法实际上是普查,花费的人力物力要多一些,但是如果统计过程不出错,可以准确地得到平均每户居民的月用水量;在小区的每户居民都装有电话的情况下,学生C的方法是一种随机抽样方法,所得的样本具有代表性,可以比较准确地获得平均每户居民的月用水量.在小区的每户居民都装有电话的情况下,建议用随机抽样的方法获取数据,即用学生C的方法,以节省人力物力,并且可以得到比较精确的结果.5、已知变量x 与y 正相关,且由观测数据算得样本平均数3x =, 3.5y =,则由该观测数据算得的线性回归方程可能为( )A. 0.4.3ˆ2yx =+ B. 2 2.4ˆy x =- C. 9ˆ2.5yx =-+ D. 0.3 4.4ˆy x =-+ [答案] A[解析] 变量x 与y 正相关,可以排除C,D;样本平均数代入可求这组样本数据的回归直线方程.∵变量x 与y 正相关,∴可以排除C,D;样本平均数3x =, 3.5y =,代入A 符合,B 不符合,故选A.。
2022版优化方案高一数学人教版必修三学案 第二章 统计 2.1.3分层抽样

2.1.3分层抽样问题导航(1)什么叫分层抽样?(2)分层抽样适用于什么状况?(3)分层抽样时,每个个体被抽到的机会是相等的吗?1.分层抽样的概念一般地,在抽样时,将总体分成互不交叉的层,然后依据肯定的比例,从各层独立地抽取肯定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.2.分层抽样的适用条件分层抽样尽量利用事先所把握的各种信息,并充分考虑保持样本结构与总体结构的全都性,这对提高样本的代表性格外重要.当总体是由差异明显的几个部分组成时,往往选用分层抽样的方法.1.推断下列各题.(对的打“√”,错的打“×”)(1)系统抽样时,将总体分成均等的几部分,每部分抽取一个,符合分层抽样,故系统抽样就是一种特殊的分层抽样;()(2)在分层抽样时,每层可以不等可能抽样;()(3)在分层抽样的过程中,每个个体被抽到的可能性是相同的,与层数及分层有关.()解析:(1)由于分层抽样是从各层独立地抽取个体,而系统抽样各段上抽取时是按事先定好的规章进行的,各层编号有联系,不是独立的,故系统抽样不同于分层抽样.(2)分层抽样时,每层仍旧要等可能抽样.(3)与层数及分层无关.答案:(1)×(2)×(3)×2.某地区为了解居民家庭生活状况,先把居民按所在行业分为几类,然后每个行业抽取1100的居民家庭进行调查,这种抽样是()A.简洁随机抽样B.系统抽样C.分层抽样D.分类抽样解析:选C.符合分层抽样的特点.3.一个班共有54人,其中男、女比为5∶4,若抽取9人参与教改调查会,则每个男同学被抽取的可能性为________,每个女同学被抽取的可能性为________.解析:男、女每人被抽取的可能是相同的,由于男同学共有54×59=30(人),女同学共有54×49=24(人),所以每个男同学被抽取的可能性为530=16,每个女同学被抽取的可能性为424=16.答案:16164.分层抽样的操作步骤是什么?解:总体分层;依据比例独立抽取.1.分层抽样的特点(1)适用于总体由有明显差别的几部分组成的状况.(2)抽取的样本更好地反映了总体的状况.(3)是等可能性抽样,每个个体被抽到的可能性都是nN.2.分层抽样的公正性假如总体中个体的总数是N,样本容量为n,第i层中个数为N i,则第i层中要抽取的个体数为n i=n·N iN.每一个个体被抽取的可能性是n iN i=1N i·n·N iN=nN,与层数无关.所以对全部个体来说,被抽取的可能性是一样的,与层数及分层无关,所以分层抽样是公正的.3.分层抽样需留意的问题(1)分层抽样中分多少层、如何分层要视具体状况而定,总的原则是每层内样本的差异要小,不同层之间的样本差异要大,且互不重叠.(2)抽取比例由每层个体占总体的比例确定.(3)各层抽样按简洁随机抽样或系统抽样进行.分层抽样的概念某中学有老年老师20人,中年老师65人,青年老师95人.为了调查他们的健康状况,需从他们中抽取一个容量为36的样本,则合适的抽样方法是()A.抽签法B.系统抽样C.分层抽样D.随机数法[解析]各部分之间有明显的差异是分层抽样的依据.[答案] C方法归纳各部分之间有明显的差异是分层抽样的依据,至于各层内用什么方法抽样是机敏的,可用简洁随机抽样,也可接受系统抽样.分层抽样中,无论哪一层的个体,被抽中的机会均等,体现了抽样的公正性.1.(1)某市有四所重点高校,为了解该市高校生的课外书籍阅读状况,则接受下列哪种方法抽取样本最合适(四所高校图书馆的藏书有肯定的差距)( )A .抽签法B .随机数表法C .系统抽样法D .分层抽样法解析:选D. 由于学校图书馆的藏书对同学课外书籍阅读影响比较大,因此实行分层抽样.(2)某校高三班级有男生800人,女生600人,为了解该班级同学的身体健康状况,从男生中任意抽取40人,从女生中任意抽取30人进行调查.这种抽样方法是( )A .简洁随机抽样法B .抽签法C .随机数表法D .分层抽样法解析:选D.总体中个体差异比较明显,且抽取的比例也符合分层抽样.分层抽样的应用(2022·高考湖北卷)甲、乙两套设备生产的同类型产品共4 800件,接受分层抽样的方法从中抽取一个容量为80的样本进行质量检测.若样本中有50件产品由甲设备生产,则乙设备生产的产品总数为________件.[解析] 设乙设备生产的产品总数为x 件,则甲设备生产的产品总数为(4 800-x )件.由分层抽样特点,结合题意可得5080=4 800-x4 800,解得x =1 800.[答案] 1 800[互动探究] 将本例条件“若样本中有50件产品由甲设备生产”换为“已知甲、乙两套设备生产的同类型产品数量之比为5∶3”,求样本中抽取的由甲、乙设备生产的数量分别是多少件?解:设样本中抽取的由甲、乙设备生产的数量分别是x ,y 件,则x =80×55+3=50,y =80×35+3=30.故样本中抽取的由甲、乙设备生产的数量分别是50,30件. 方法归纳在分层抽样的过程中,为了保证每个个体被抽到的可能性是相同的,这就要求各层所抽取的个体数与该层所包含的个体数之比等于样本容量与总体的个体数之比,即n i ∶N i =n ∶N .2.(1)为了调查城市PM 2.5的状况,按地域把48个城市分成大型、中型、小型三组,相应的城市数分别为8,16,24.若用分层抽样的方法抽取12个城市,则应抽取的中型城市数为( )A .3B .4C .5D .6解析:选B.依据分层抽样的特点可知,抽样比例为1248=14,则应抽取的中型城市数为16×14=4.(2)一个单位共有职工200人,其中不超过45岁的有120人,超过45岁的有80人.为了调查职工的健康状况,用分层抽样的方法从全体职工中抽取一个容量为25的样本,则应抽取超过45岁的职工________人.解析:抽样比为25∶200=1∶8,而超过45岁的职工有80人,则从中应抽取的个体数为80×18=10.答案:10三种抽样方法的考查选择合适的抽样方法抽样,并写出抽样过程.(1)有甲厂生产的30个篮球,其中一箱21个,另一箱9个,抽取10个入样; (2)有30个篮球,其中甲厂生产的有21个,乙厂生产的有9个,抽取10个入样; (3)有甲厂生产的300个篮球,抽取10个入样; (4)有甲厂生产的300个篮球,抽取30个入样. [解] (1)总体容量较小,用抽签法.①将30个篮球编号,编号为00,01, (29)②将以上30个编号分别写在完全一样的一张小纸条上,揉成小球,制成号签. ③把号签放入一个不透亮 的袋子中,充分搅拌均匀. ④从袋子中逐个抽取10个号签,并记录上面的号码. ⑤找出和所得号码对应的篮球即可得到样本.(2)总体由差异明显的两个层次组成,需选用分层抽样.①确定抽取个数.由于1030=13,所以甲厂生产的应抽取213=7(个),乙厂生产的应抽取93=3(个).②用抽签法分别抽取甲厂生产的篮球7个,乙厂生产的篮球3个.这些篮球便组成了我们要抽取的样本. (3)总体容量较大,样本容量较小,宜用随机数表法. ①将300个篮球用随机方式编号,编号为001,002, (300)②在随机数表中随机地确定一个数作为开头,如(教材P 103附表)第8行第29列的数“7”开头.任选一个方向作为读数方向,比如向右读.③从数“7”开头向右读,每次读三位,凡不在001~300中的数跳过去不读,遇到已经读过的数也跳过去不读,便可依次得到10个号码,这就是所要抽取的10个样本个体的号码.(4)总体容量较大,样本容量也较大,宜用系统抽样.①将300个篮球用随机方式编号,编号为000,001,002,…,299,并分成30段,其中每一段包含30030=10个个体.②在第一段000,001,002,…,009这十个编号中用简洁随机抽样抽出一个(如002)作为起始号码.③将编号为002,012,022,…,292的个体抽出,即可组成所要求的样本.方法归纳(1)简洁随机抽样、系统抽样和分层抽样是三种常用的抽样方法,在实际生活中有着广泛的应用.(2)三种抽样的适用范围不同,各自的特点也不同,但各种方法间又有亲密联系.在应用时要依据实际状况选取合适的方法.(3)三种抽样中每个个体被抽到的可能性都是相同的.扫一扫进入91导学网()三种抽样方法的比较3.(1)某饮料公司在华东、华南、华西、华北四个地区分别有200个、180个、180个、140个销售点.公司为了调查产品销售的状况,需从这700个销售点中抽取一个容量为100的样本,记这项调查为①;在华南地区中有20个特大型销售点,要从中抽取7个调查其销售收入和售后服务状况,记这项调查为②.则完成①、②这两项调查宜接受的抽样方法依次是()A.分层抽样法、系统抽样法B.分层抽样法、简洁随机抽样法C.系统抽样法、分层抽样法D.简洁随机抽样法、分层抽样法解析:选B. 当总体中个体较多时宜接受系统抽样;当总体中的个体差异较大时,宜接受分层抽样;当总体中个体较少时,宜接受简洁随机抽样.依题意,第①项调查应接受分层抽样法、第②项调查应接受简洁随机抽样法.故选B.(2)调查某班同学的平均身高,从50名同学中抽取5名,抽样方法是________,假如男女身高有显著不同(男生30人,女生20人),抽样方法是________.解析:从50名同学中抽取5名,总体中个体数不多,接受简洁随机抽样;总体中个体差异比较明显,接受分层抽样.答案:简洁随机抽样分层抽样(3)下列问题中,接受怎样的抽样方法较为合理?①从10台电冰箱中抽取3台进行质量检查;②某学校有160名教职工,其中老师120名,行政人员16名,后勤人员24名,为了了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.解:①抽签法,由于总体容量较小,宜用抽签法.②分层抽样,由于学校各类人员对这一问题的看法可能差异较大,用分层抽样.易错警示分层抽样的应用某单位有工程师6人,技术员12人,技工18人,要从这些人中抽取一个容量为n的样本,假如接受系统抽样和分层抽样方法抽取,不用剔除个体;假如样本容量增加1个,则在接受系统抽样时,需要在总体中先剔除1个个体,则样本容量为________.[解析]总体容量N=36.当样本容量为n时,系统抽样间隔为36n∈N+,所以n是36的约数;分层抽样的抽样比为n36,求得工程师、技术员、技工的抽样人数分别为n6,n3,n2,所以n应是6的倍数,所以n=6或12或18或36.当样本容量为n+1时,总体中先剔除1人时还有35人,系统抽样间隔为35n+1∈N+,所以n只能是6.[答案] 6[错因与防范]由36n,n6,n3,n2∈N+求n时,n的值有遗漏;35n+1∈N+易错写成36n+1∈N+.为猎取各层入样数目,需先正确计算出抽样比k=样本容量总体容量,若k与某层个体数的积不是整数时,可先将该层等可能性剔除多余个体.4.某林场有树苗30 000棵,其中松树苗4 000棵.为调查树苗的生长状况,接受分层抽样的方法抽取一个容量为150的样本,则样本中松树苗的数量为()A.30 B.25C.20 D.15解析:选C.抽样比为150∶30 000=1∶200,则样本中松树苗的数量为4 000×1200=20.故选C.1.某高校共有同学5 600人,其中有专科生1 300人、本科生3 000人、争辩生1 300人,现接受分层抽样的方法调查同学利用因特网查找学习资料的状况,抽取的样本为280人,则应在专科生、本科生与争辩生这三类同学中分别抽取( )A .65人、150人、65人B .30人、150人、100人C .93人、94人、93人D .80人、120人、80人解析:选A.依据分层抽样按比例抽取的特点,有5 600280=1 300x =3 000y =1 300z ,解得x =z =65,y =150,即专科生、本科生与争辩生应分别抽取65、150、65,故选A.2.某地共有10万户居民,从中随机调查了1 000户拥有彩电的调查结果如下表:彩电 城市 农村 有 432 400 无48120若该地区城市与农村住户之比为4∶6,估量该地区无彩电的农村总户数约为( )A .0.923万户B .1.385万户C .1.8万户D .1.2万户 解析:选B.无彩电的农村总户数约为10×610×120520≈1.385万户.3.某工厂生产A 、B 、C 三种不同型号的产品,产品数量之比依次为2∶3∶5,现用分层抽样方法抽出一个容量为n 的样本,样本中A 种型号产品有16件,那么此样本的容量n =________.解析:由分层抽样的特点,得n ×22+3+5=16,所以n =80.答案:804.某校对全校男、女同学共1 200名进行健康调查,选用分层抽样抽取一个容量为200的样本,已知男生比女生多抽了10人,则该校男生人数为________.解析:入样比例=2001 200=16,则男生应抽105人,设男生为x 人,所以105x =16⇒x =630.答案:630[A.基础达标]1.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户.为了调查社会购买力的某项指标,要从中抽取1个容量为100的样本,记作①;某学校高一班级有12名女排运动员,要从中选出3名调查学习负担状况,记作②.那么完成上述两项调查应接受的抽样方法是( )A .①用简洁随机抽样法;②用系统抽样法B .①用分层抽样法;②用简洁随机抽样法C .①用系统抽样法;②用分层抽样法D .①用分层抽样法;②用系统抽样法解析:选B.对于①,总体由高收入家庭、中等收入家庭和低收入家庭差异明显的3部分组成,而所调查的指标与收入状况亲密相关,所以应接受分层抽样法.对于②,总体中的个体数较少,而且所调查内容对12名调查对象是“公平”的,所以应接受简洁随机抽样法.2.已知某单位有职工120人,其中男职工90人,现接受分层抽样的方法(按男、女分层)抽取一个样本,若已知样本中有27名男职工,则样本容量为( )A .30B .36C .40D .无法确定解析:选B.分层抽样中抽样比肯定相同,设样本容量为n ,由题意得,n 120=2790,解得n =36.3.(2022·高考重庆卷)某中学有高中生3 500人,学校生1 500人,为了解同学的学习状况,用分层抽样的方法从该校同学中抽取一个容量为n 的样本,已知从高中生中抽取70人,则n 为( )A .100B .150C .200D .250解析:选A.法一:由题意可得70n -70=3 5001 500,解得n =100,故选A.法二:由题意,抽样比为703 500=150,总体容量为3 500+1 500=5 000,故n =5 000×150=100.4.(2021·中山高一检测)某校选修乒乓球课程的同学中,高一班级有30名,高二班级有40名,现用分层抽样的方法在这70名同学中抽取一个样本,已知在高一班级的同学中抽取了6名,则在高二班级的同学中应抽取的人数为( )A .6B .8C .10D .12解析:选B.设高二班级抽取x 人,则有630=x40,解得x =8,故选B.5.(2021·潍坊高一检测)某学校在校同学2 000人,为了同学的“德、智、体”全面进展,学校进行了跑步和登山竞赛活动,每人都参与而且只参与其中一项竞赛,各班级参与竞赛的人数状况如下表:高一班级高二班级高三班级跑步人数 a b c 登山人数xyz其中a ∶b ∶c =2∶5∶3,全校参与登山的人数占总人数的14.为了了解同学对本次活动的满足程度,从中抽取一个200人的样本进行调查,则高三班级参与跑步的同学中应抽取( )A .15人B .30人C .40人D .45人解析:选D.全校参与登山的人数是2 000×14=500,所以参与跑步的人数是1 500,应抽取1 5002 000×200=150,c =150×310=45(人).6.某学校高一、高二、高三班级的同学人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个班级的同学中抽取一个容量为50的样本,则应从高二班级抽取________名同学.解析:抽取比例与同学比例全都.设应从高二班级抽取x 名同学,则x ∶50=3∶10.解得x =15.答案:157.某公司生产三种型号的轿车,产量分别为1 200辆,6 000辆和2 000辆,为检验该公司的产品质量,现用分层抽样的方法抽取46辆进行检验,这三种型号的轿车依次应当抽取________辆,________辆,________辆.解析:由于461 200+6 000+2 000=1200,所以这三种型号的轿车依次应当抽取1 200×1200=6辆,6 000×1200=30辆,2 000×1200=10辆.即这三种型号的轿车依次应当抽取6辆、30辆、10辆进行检验.答案:6 30 108.某地区有农夫、工人、学问分子家庭共计2 015家,其中农夫家庭1 600户,工人家庭303户.现要从中抽出容量为40的样本,则在整个抽样过程中,可以用到下列抽样方法中的________.(将你认为正确的选项的序号都填上)①简洁随机抽样;②系统抽样;③分层抽样.解析:为了保证抽样的合理性,应对农夫、工人、学问分子分层抽样,在各层中接受系统抽样和简洁随机抽样,抽样时还要先用简洁随机抽样剔除多余的个体.答案:①②③ 9.(2021·莱州高一检测)某校高一班级500名同学中,血型为O 的有200人,血型为A 的有125人,B 型的有125人,AB 型的有50人.为了争辩血型与色弱的关系,要从中抽取一个容量为40的样本,应如何抽样?写出血型为AB 型的抽样过程.解:由于40÷500=225,所以应用分层抽样法抽取血型为O 型的225×200=16(人),A 型的225×125=10(人),B 型的225×125=10(人),AB 型的225×50=4(人).AB 型的4人可以这样抽取:第一步,将50人随机编号,编号为1,2, (50)其次步,把以上50人的编号分别写在大小相同的小纸片上,揉成小球,制成号签. 第三步,把得到的号签放入一个不透亮 的袋子中,充分搅拌均匀. 第四步,从袋子中逐个抽取4个号签,并记录上面的编号. 第五步,依据所得编号找出对应的4人即可得到样本.10.某单位最近组织了一次健身活动,活动分为登山组和游泳组,且每个职工至多参与其中一组.在参与活动的职工中,青年人占42.5%,中年人占47.5%,老年人占10%.登山组的职工占参与活动总人数的14,且该组中青年人占50%,中年人占40%,老年人占10%.为了了解各组不同年龄层次的职工对本次活动的满足程度,现用分层抽样的方法从参与活动的全体职工中抽取一个容量为200的样本.试确定:(1)游泳组中,青年人、中年人、老年人分别所占的比例; (2)游泳组中,青年人、中年人、老年人分别应抽取的人数.解:(1)设登山组人数为x ,游泳组中,青年人、中年人、老年人所占比例分别为a 、b 、c , 则有x ×40%+3xb 4x =47.5%,x ×10%+3xc 4x =10%,解得b =50%,c =10%, 故a =100%-50%-10%=40%,即游泳组中,青年人、中年人、老年人所占比例分别为40%、50%、10%. (2)游泳组中,抽取的青年人人数为200×34×40%=60(人);抽取的中年人人数为200×34×50%=75(人);抽取的老年人人数为200×34×10%=15(人).即游泳组中,青年人、中年人、老年人分别应抽取的人数为60人,75人,15人.[B.力量提升]1.某鱼贩一次贩运草鱼、青鱼、鲢鱼、鲤鱼及鲫鱼各有80条、20条、40条、40条、20条,现从中抽取一个容量为20的样本进行质量检测,若接受分层抽样的方法抽取样本,则抽取的青鱼与鲤鱼共有( )A .6条B .8条C .10条D .12条解析:选A.设抽取的青鱼与鲤鱼共有x 条,依据分层抽样的比例特点有20+4080+20+40+40+20=x 20,所以x=6.2.某校做了一次关于“感恩父母”的问卷调查,从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷依次为:120份,180份,240份,x 份.因调查需要,从回收的问卷中按年龄段分层抽取容量为300的样本,其中在11~12岁同学问卷中抽取60份,则在15~16岁同学中抽取的问卷份数为( )A .60B .80C .120D .180解析:选C.11~12岁回收180份,其中在11~12岁同学问卷中抽取60份,则抽样比为13.∵从回收的问卷中按年龄段分层抽取容量为300的样本,∴从8~10岁,11~12岁,13~14岁,15~16岁四个年龄段回收的问卷总数为30013=900(份),则15~16岁回收问卷份数为:x =900-120-180-240=360(份).∴在15~16岁同学中抽取的问卷份数为360×13=120(份),故选C.3.某校高一班级有x 名同学,高二班级有y 名同学,高三班级有z 名同学,接受分层抽样抽取一个容量为45的样本,高一班级被抽取20人,高二班级被抽取10人,高三班级共有同学300人,则此学校共有同学________人.解析:高三班级被抽取了45-20-10=15(人),设此学校共有同学N 人,则45N =15300,解得N =900.答案:900 4.(2021·泰安质检)某企业三月中旬生产A ,B ,C 三种产品共3 000件,依据分层抽样的结果,企业统计员制作了如下的统计表格:由于不当心,表格中A 、C A 产品的样本容量比C 产品的样本容量多10,依据以上信息,可得C 产品的数量是________件.解析:抽样比为130∶1 300=1∶10,又A 产品的样本容量比C 产品的样本容量多10,故C 产品的数量是[(3 000-1 300)-100]×12=800(件).答案:8005.某校有在校高中生共1 600人,其中高一班级同学520人,高二班级同学500人,高三班级同学580人.假如想通过抽查其中的80人来调查同学的消费状况,考虑到不同班级同学的消费状况有明显差别,而同一班级内消费状况差异较小,问应接受怎样的抽样方法?高三班级同学中应抽查多少人?解:因不同班级的同学消费状况有明显差别,所以应接受分层抽样.由于520∶500∶580=26∶25∶29,于是将80分成比例为26∶25∶29的三部分.设三部分各抽个体数分别为26x ,25x ,29x ,由26x +25x +29x =80,解得x =1.所以高三班级同学中应抽查29人.6.(选做题)某中学进行了为期3天的新世纪体育运动会,同时进行全校精神文明擂台赛.为了解这次活动在全校师生中产生的影响,分别在全校500名教职员工、3 000名学校生、4 000名高中生中进行问卷调查,假如要在全部答卷中抽出120份用于评估.(1)应如何抽取才能得到比较客观的评价结论?(2)要从3 000份学校生的答卷中抽取一个容量为48的样本,假如接受简洁随机抽样,应如何操作? (3)为了从4 000份高中生的答卷中抽取一个容量为64的样本,如何使用系统抽样抽取得到所需的样本?解:(1)由于这次活动对教职员工、学校生和高中生产生的影响不相同,所以应当实行分层抽样的方法进行抽样.∵样本容量为120,总体个数为500+3 000+4 000=7 500(名),则抽样比为1207 500=2125.∴500×2125=8(人),3 000×2125=48(人),4 000×2125=64(人),∴在教职员工、学校生、高中生中抽取的个体数分别是8、48、64.分层抽样的步骤是:第一步,分为教职员工、学校生、高中生共三层.其次步,确定每层抽取个体的个数:在教职员工、学校生、高中生中抽取的个体数分别是8、48、64. 第三步,各层分别按简洁随机抽样的方法抽取样本. 第四步,综合每层抽样,组成样本.这样便完成了整个抽样过程,就能得到比较客观的评价结论.(2)由于简洁随机抽样有两种方法:抽签法或随机数表法.若用抽签法,则要做3 000个号签,费时费劲,因此接受随机数表法抽取样本,步骤是:第一步,编号:将3 000份答卷都编上号码:0 001,0 002,…,3 000. 其次步,在随机数表上随机选取一个起始位置.第三步,规定读数方向:向右连续取数字,以4个数为一组,遇到右边线时接下一行左边线连续向右连续取数,若读取的4位数大于3 000,则去掉,假如遇到相同号码则只取一个,这样始终到取满48个号码为止.(3)由于4 000÷64=62.5不是整数,故应先使用简洁随机抽样法从4 000名同学中随机剔除32个个体,再将剩余的3 968个个体进行编号:1,2,…,3 968,然后将整体分为64个部分,其中每个部分中含有62个个体,如第一部分个体的编号为1,2,…,62.从中随机抽取一个号码,若抽取的是23,则从第23号开头,每隔62个号码抽取一个,这样得到一个容量为64的样本:23,85,147,209,271,333,395,457,…,3 929.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
(时间90分钟,满分120分)一、选择题(本大题共10小题,每小题5分,共50分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.我校在检查学生作业时,抽出每班学号尾数为5的学生作业进行检查,这里运用的是()A.分层抽样B.抽签抽样C.随机抽样D.系统抽样答案:D2.下列各选项中的两个变量具有相关关系的是()A.长方体的体积与边长B.大气压强与水的沸点C.人们着装越鲜艳,经济越景气D.球的半径与表面积解析:A、B、D均为函数关系,C是相关关系.答案:C3.为了调查全国人口的寿命,抽查了十一个省(市)的2 500名城镇居民.这2 500名城镇居民的寿命的全体是()A.总体B.个体C.样本D.样本容量答案:C4.已知总体容量为106,若用随机数表法抽取一个容量为10的样本.下面对总体的编号最方便的是()A.1,2,…,106 B.0,1,2,…,105C.00,01,…,105 D.000,001,…,105解析:由随机数抽取原则可知选D.答案:D5.(2011·湖北高考)有一个容量为200的样本,其频率分布直方图如图所示.根据样本的频率分布直方图估计,样本数据落在区间[10,12)内的频数为()A.18 B.36C.54 D.72解析:易得样本数据在区间[10,12)内的频率为0.18,则样本数据在区间[10,12)内的频数为36. 答案:B6.对一组数据x i (i =1,2,3,…,n ),如果将它们改变为x i +c (i =1,2,3,…,n ),其中c ≠0,则下面结论中正确的是( ) A .平均数与方差均不变 B .平均数变了,而方差保持不变 C .平均数不变,而方差变了 D .平均数与方差均发生了变化解析:设原来数据的平均数为x -,将它们改变为x i +c 后平均数为x ′,则x ′=x -+c ,而方差s ′2=1n [(x 1+c -x --c )2+…+(x n +c -x --c )2]=s 2.答案:B7.如果是甲、乙两名运动员某赛季一些场次得分的茎叶图,据图可知( )A .甲运动员的成绩好于乙运动员B .乙运动员的成绩好于甲运动员C .甲、乙两名运动员的成绩没有明显的差异D .甲运动员的最低得分为0分解析:从这个茎叶图可以看出运动员得分大致对称,平均得分及中位数都是30多分;乙运动员的得分除一个52外,也大致对称,平均得分及中位数都是20多分,因此,甲运动员发挥比较稳定,总体得分情况比乙好. 答案:A8.(2011·江西高考)为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x (cm) 174 176 176 176 178 儿子身高y (cm)175175176177177则y 对x 的线性回归方程为( ) A.y ^=x -1 B.y ^=x +1 C.y ^=88+12xD.y ^=176 解析:设y 对x 的线性回归方程为y ^=bx +a ,因为b=-2×(-1)+0×(-1)+0×0+0×1+2×1(-2)2+22=12,a=176-12×176=88,所以y对x的线性回归方程为y^=12x+88.答案:C9.甲、乙两支女子曲棍球队在去年的国际联赛中,甲队平均每场进球数是3.2,全年进球数的标准差为3;乙队平均每场进球数是1.8,全年进球数的标准差为0.3.下列说法中,正确的个数为()①甲队的技术比乙队好;②乙队发挥比甲队稳定;③乙队几乎每场都进球;④甲队的表现时好时坏.A.1个B.2个C.3个D.4个解析:因为甲队的平均进球数比乙队多,所以甲队技术较好,①正确;乙队的标准差比甲队小,标准差越小越稳定,所以乙队发挥稳定,②也正确;乙队平均每场进球数为1.8,所以乙队几乎每场都进球,③正确;由于s甲=3,s乙=0.3,所以甲队与乙队相比,不稳定,所以甲队的表现时好时坏,④正确.答案:D10.已知数据:①18,32,-6,14,8,12;②21,4,7,14,-3,11;③5,4,6,5,7,3;④-1,3,1,0,0,-3.各组数据中平均数和中位数相等的是()A.①B.②C.③D.①②③④解析:运用计算公式x=1n(x1+x2+…+x n),可知四组数据的平均数分别为13,9,5,0.根据中位数的定义:把每组数据从小到大排列,取中间一位数(或两位的平均数)即为该组数据的中位数,可知四组数据的中位数分别为13,9,5,0.故每组数据的平均数和中位数均对应相等.答案:D二、填空题(本大题共4小题,每小题5分,共20分.把答案填在题中横线上.) 11.(2012·银川模拟)将一个总体分为A、B、C三层,其个体数之比为5∶3∶2.若用分层抽样方法抽取容量为100的样本,则应从C中抽取________个个体.解析:由题意,应从C中抽取100×25+3+2=20个个体.答案:2012.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图如图所示,由图中数据可知a=________.若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为________.解析:因为直方图中的各个矩形的面积之和为1,所以有10×(0.005+0.035+a +0.020+0.010)=1,解得a =0.03.由直方图可知三个区域的学生总数为100×10×(0.030+0.020+0.010)=60,其中身高在[140,150]内的学生人数为10,所以从身高在[140,150]内抽取的学生人数为1860×10=3.答案:0.03 313.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投蓝练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679则以上两组数据的方差中较小的一个为s 2=________.解析:甲班的平均数为7,方差s ?=15[(6-7) 2+02+02+(8-7) 2+02]=25;乙班的平均数为7,方差 s 2=2(6-7)2+2(7-7)2+(9-7)25=65.答案:2514.某班12位学生父母年龄的茎叶图如图所示,则12位同学母亲的年龄的中位数是________,父亲的平均年龄比母亲的平均年龄多________岁.解析:由41+432=42,得中位数是42.母亲平均年龄=42.5,父亲平均年龄为45.5,因而父亲平均年龄比母亲平均年龄多3岁.答案:42 3三、解答题(本大题共4小题,共50分.解答时应写出必要的文字说明、证明过程或演算步骤)15.(12分)某花木公司为了调查某种树苗的生长情况,抽取了一个容量为100的样本,测得树苗的高度(cm)数据的分组及相应频数如下:[107,109)3株;[109,111)9株;[111,113)13株;[113,115)16株;[115,117)26株;[117,119)20株;[119,121)7株;[121,123)4株;[123,125]2株.(1)列出频率分布表;(2)画出频率分布直方图;(3)据上述图表,估计数据在[109,121)范围内的可能性是百分之几?解:分组频数频率累积频率[107,109)30.030.03[109,111)90.090.12[111,113)130.130.25[113,115)160.160.41[115,117)260.260.67[117,119)200.200.87[119,121)70.070.94[121,123)40.040.98[123,125]20.02 1.00合计100 1.00(2)频率分布直方图如下:(3)由上述图表可知数据落在[109,121)范围内的频率为:0.94-0.03=0.91,即数据落在[109,121)范围内的可能性是91%.16.(12分)(2012·福建六校联考)甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:甲8281797895889384乙9295807583809085(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由?解:(1)作出茎叶图如下:(2)x甲=18(78+79+81+82+84+88+93+95)=85,x乙=18(75+80+80+83+85+90+92+95)=85.2s甲=18[(78-85)2+(79-85)2+(81-85)2+(82-85)2+(84-85)2+(88-85)2+(93-85) 2+(95-85) 2]=35.5,2s乙=18[(75-85)2+(80-85)2+(80-85)2+(83-85)2+(85-85)2+(90-85)2+(92-85) 2+(95-85) 2]=41,∵x甲=x乙,2s甲<2s乙,∴甲的成绩较稳定,派甲参赛比较合适.17.(12分)某个服装店经营某种服装,在某周内获纯利y(元)与该周每天销售这些服装件数x之间有如下一组数据:x 3456789y 66697381899091已知∑i=17x2i=280,∑i=17x i y i=3 487,(1)求x,y;(2)求纯利y与每天销售件数x之间的回归直线方程;(3)每天多销售1件,纯利y增加多少元?解:(1)x=17(3+4+5+…+9)=6,y=17(66+69+…+91)≈79.86.(2)设回归直线方程为y ^=a ^+b ^x ,则b ^=∑i =17x i y i -7x - y-∑i =17x 2i -7x2=3 487-7×6×79.86280-7×6?≈4.75.a ^=y -b x -≈79.86-4.75×6=51.36. ∴所求的回归直线方程为y ^=51.36+4.75x .(3)由回归直线方程知,每天多销售1件,纯利增加4.75元.18.(14分)某地统计局就该地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(每个分组包括左端点,不包括右端点,如第一组表示收入在[1 000,1 500)).(1)求居民月收入在[3 000,3 500)的频率; (2)根据频率分布直方图算出样本数据的中位数;(3)为了分析居民的收入与年龄、职业等方面的关系,必须按月收入再从这10 000人中用]分层抽样方法抽出100人作进一步分析,则月收入在[2 500,3 000)的这段应抽多少人?解:(1)月收入在[3 000,3 500)的频率为0.000 3×(3 500-3 000)=0.15. (2)∵0.000 2×(1 500-1 000)=0.1, 0.000 4×(2 000-1 500)=0.2, 0.000 5×(2 500-2 000)=0.25, 0.1+0.2+0.25=0.55>0.5. ∴样本数据的中位数为2 000+0.5-(0.1+0.2)0.000 5=2 000+400=2 400(元).(3)居民月收入在[2 500,3 000)的频率为0.000 5×(3 000-2 500)=0.25, 所以10 000人中月收入在[2 500,3 000)的人数为0.25×10 000=2 500(人).再从10 000人中分层抽样方法抽出100人,则月收入在[2 500,3 000)的这段应抽取100×2 50010 000=25人.。