高一数学统计试题

合集下载

(精选试题附答案)高中数学第九章统计经典大题例题

(精选试题附答案)高中数学第九章统计经典大题例题

(名师选题)(精选试题附答案)高中数学第九章统计经典大题例题单选题1、某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数表法在该中学抽取容量为n的样本,则n等于()A.80B.160C.200D.280答案:C分析:每个个体被抽的可能性等于样本容量除以总体数,由此列出关于n的方程并求解出结果.=0.2,解得n=200,由题意可知:n400+320+280故选:C.2、某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:则该校学生一周进行课外锻炼的时间的第40百分位数是()A.8.5B.8C.7D.9答案:A分析:根据百分位数的求法计算即可.抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,=8.5.即8+92故选: A.3、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.4、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错.误.的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,B 由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.5、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A6、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A .1组B .2组C .3组D .4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s =4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B .8、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( )A .4a mB .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1, 对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有a m =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.9、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19 C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为310. 故选:C10、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是( )A .1200名学生是总体B .每个学生是个体C .样本容量是100D .抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.填空题11、某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取__________________.答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A区的人数,得到A区要抽取的人数.解:由题意知A区在样本中的比例为700020000∴A区应抽取的人数是700020000×600=210.所以答案是:210.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)答案:a=b##b=a分析:由百分位数求法得50为第60百分位数,并确定数据的众数,即可比较它们的大小关系.因为8×60%=4.8,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是a=b.所以答案是:a=b14、某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152 ,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170 ,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.答案:172分析:根据百分位数的意义求解.百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,=173,x=172本题第90百分位数是173,所以x+1742故答案为:172小提示:本题考查样本数据的第多少百分位数的概念.15、气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_____.答案:①③分析:根据数据的特点进行估计甲、乙、丙三地连续5天的日平均气温的记录数据,分析数据的可能性进行解答即可得出答案.①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22、22、24、25、26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19、20、27、27、27,可知其连续5天的日平均温度有低于22,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22,如22、25、25、26、32,这组数据的平均值为26,方差为10.8,但是进一步扩大方差就会超过10.8,故③对.则肯定进入夏季的地区有甲、丙两地,故答案为①③.小提示:本题考查中位数、众数、平均数、方差的数据特征,简单的合情推理,解答此题应结合题意,根据平均数的计算方法进行解答、取特殊值即可.解答题16、为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a的值;(2)估计这种植物果实重量的平均数x̅(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于37.5克的即为优质果实,现对该种植物果实的某批10000个果实进行检测.据此估算这批果实中的优质果实的个数.答案:(1)a=0.050(2)40(3)7000分析:(1)由各组频率之和为1(面积之和为1)可求得;(2)频率分布直方图用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和估计平均数;(3)用样本频率估计总体概率进行求解.(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050;(2)这种植物果实重量的平均数约为:30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40,∴这种植物果实重量的平均数x̅的估计值约为40.(3)样本中,这种植物果实重量不低于37.5克,即优质果实的频率为0 .075×5+0.050×5+0.015×5=0.7,由此估计某批10000个果实中,重量不低于37.5克,即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10000×0.7=7000个.17、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可. (1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.18、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.19、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.。

高一数学统计试题

高一数学统计试题

高一数学统计试题1.为了调查甲、乙两种品牌商品的市场认可度,在某购物网点随机选取了14天,统计在某确定时间段的销量,得如下所示的统计图,根据统计图求:(1)甲、乙两种品牌商品销量的中位数分别是多少?(2)甲品牌商品销量在[20,50]间的频率是多少?(3)甲、乙两个品牌商品哪个更受欢迎?并说明理由.【答案】(1) 甲、乙两种品牌商品销量的中位数分别是;(2)甲品牌商品销量在间的频率;(3)甲品牌商品更受欢迎.【解析】(1)利用茎叶图能求出甲、乙两种品牌商品销量的中位数;(2)甲品牌商品销量在间的数据有共5个,由此能求出甲品牌商品销量在间的频率.(3)求出甲品牌商品的日平均销售量和乙品牌商品的日平均销售量,由此能求出结果.试题解析:(1)甲的数据由小到大为:乙的数据由小到大为:所以甲、乙两种品牌商品销量的中位数分别是.(2) 甲品牌商品销量在间的数据有共5个,所以甲品牌商品销量在间的频率.(3) 解一:甲品牌商品的日平均销售量为:,乙品牌商品的日平均销售量为:,由知甲品牌商品更受欢迎.【考点】中位数、频率的求法;平均数的应用.2.青年歌手电视大赛共有10名选手参加,并请了7名评委,如图所示的茎叶图是7名评委给参加最后决赛的两位选手甲、乙评定的成绩,流程图用来编写程序统计每位选手的成绩(各评委所给有效分数的平均值),试根据所给条件回答下列问题:(1) 根据茎叶图,选手乙的成绩中,众数是多少?选手甲的成绩中,中位数是多少?(2) 在流程图(如图所示)中,用k表示评委人数,用a表示选手的成绩(各评委所给有效分数的平均值).横线①、②处应填什么?(3) 根据流程图,甲、乙的成绩分别是多少?【答案】(1) 84,85;(2) ①,②;(3) 84.2,85.【解析】(1)由众数与中位数概念易得,但要注意茎叶图所含的数据是什么,对于中位数的求法要先把这组数据从大到小或从小到大排列,当数据个数为奇数时,中位数为最中间一个数,当数据个数为偶数个时,中位数为最中间两个数的平均值,(2)由于满足条件要跳出循环结构,k的值是用来控制数据个数,所以①中要填,去掉一个最大数据与一个最小数据再求平均值,所以②中填,(3)由流程图可知a的值即去掉一个最大数据与一个最小数据再求平均值,因此易得甲与乙的成绩.试题解析:(1) 选手乙的成绩为79,84,84,84,86,87,93,众数为84,选手甲的成绩为75,78,84,85,86,88,92,中位数为85;(2) ①;②;(3) ,.【考点】1,众数,中位数的概念;2,茎叶图及程序框图的理解,数据处理能力.3.如图,从参加环保知识竞赛的学生中抽出60名,将其成绩(均为整数)整理后画出的频率分布直方图如下:请观察图形,求解下列问题:(1)79.5~89.5这一组的频率、频数分别是多少?(2)估计这次环保知识竞赛的及格率(60分及以上为及格)和平均分.【答案】(1)0.25,15; (2)0.75, 70.5【解析】(1)利用频率分布直方图中,纵坐标与组距的乘积是相应的频率,频数=频率×组距,可得结论;(2)纵坐标与组距的乘积是相应的频率,再求和,即可得到结论.试题解析:(1)由频率的意义可知,成绩在79.5~89.5这一组的频率为:0.025×10=0.25,频数:60×0.25=15;(2)利用纵坐标与组距的乘积是相应的频率可得及格率为0.015×10+0.025×10+0.03×10+0.005×10=0.75平均分为: 70.5【考点】用样本的频率分布估计总体分布;频率分布直方图.4.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】由题意知,解得a=-1,∴样本方差为S2=,故选D.【考点】方差与标准差.5.某单位N名员工参加“社区低碳你我他”活动,他们的年龄在25岁至50岁之间。

高中数学-统计-测试练习题

高中数学-统计-测试练习题

高中数学-统计-测试练习题1. 2018年央视大型文化节目《经典咏流传》的热播,在全民中掀起了诵读诗词的热潮,节目组为热心观众给以奖励,要从2018名观众中抽取50名幸运观众,先用简单随机抽样从2018人中剔除18人,剩下的2000人再按系统抽样的方法抽取50人,则在2018人中,每个人被抽到的可能性()A.均不相等B.不全相等C.都相等,且为251009D.都相等,且为1402. 下列属于相关现象的是()A.利息与利率B.居民收入与储蓄存款C.电视机产量与苹果产量D.某种商品的销售额与销售价格3. 将某选手的7个得分去掉1个最高分,去掉1个最低分,剩余5个得分的平均分为91,现场做的7个得分的茎叶图(如图)后来有一个数据模糊,无法辨认,在图中用x表示,则x的值为()A.0B.4C.5D.74. 在100个零件中,有一级品20个,二级品30个,三级品50个,从中抽取20个作为样本,有以下三种抽样方法:①采用随机抽样法,将零件编号为00,01,…,99,抽签取出20个;②采用系统抽样法,将所有零件分成20组,每组5个,然后每组随机抽取1个;③采用分层抽样法,从一级品中随机抽取4个,从二级品中随机抽取6个,从三级品中随机抽取10个.则下述判断中正确的是()A.不论采用何种抽样方法,这100个零件中每个被抽到的可能性均为15B.①、②两种抽样方法,这100个零件中每个被抽到的可能性均为15;③并非如此C.①、③两种抽样方法,这100个零件中每个被抽到的可能性均为15;②并非如此D.采用不同的抽样方法,这100个零件中每个被抽到的可能性是各不相同的5. 某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:∘C)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2,⋯,20)得到下面的散点图:由此散点图,在10∘C至40∘C之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bxB.y=a+bx2C.y=a+be xD.y=a+b ln x6. 某公司10位员工的月工资(单位:元)为x1,x2,…,x10,其平均数和方差分别为x和s2,若从下月起每位员工的月工资增加100元,则这10位员工下月工资的平均数和方差分别为()A.x¯,s2+1002B.x¯+100,s2+1002C.x¯,s2D.x¯+100,s27. 某校有高中生1470人,现采用系统抽样法抽取49人做问卷调查,将高一、高二、高三学生(高一、高二、高三分别有学生495人、493人、482人)按1,2,3, (1470)号,若第一组用简单随机抽样的方法抽取的号码为23,则所抽样本中高二学生的人数为( )A.15B.16C.17D.188. 某学校有教职员工150人,其中高级职称15人,中级职称45人,一般职员90人,现在用分层抽样抽取30人,则样本中各职称人数分别为()A.5,10,15B.3,9,18C.3,10,17D.5,9,169. 在下列各图中,每个图的两个变量具有相关关系的图是()A.(1)(2)B.(1)(3)C.(2)(4)D.(2)(3)10. 一组数据中的每一个数据都乘以2,再减去80,得到一组新数据,若求得的新数据的平均数是1.2,方差是4.4,则原来数据的平均数和方差分别是()A.40.6,1.1B.48.8,4.2C.81.2,44.4D.78.8,75.611. 我国于2015年10月宣布实施普遍二孩政策,为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取了容量为140的调查样本,其中城镇户籍与农村户籍各70人;男性60人,女性80人,绘制的不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图如图所示,其中阴影部分表示倾向选择生育二胎的对应比例,则下列叙述正确的是( )A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别有关C.调查样本中倾向选择生育二胎的人群中,男性人数与女性人数相同D.倾向选择不生育二胎的人群中,农村户籍人数多于城镇户籍人数12. 给出下列命题,其中正确的命题有()A.若a∈R,则(a+1)i是纯虚数B.随机变量X∼N(3,22),若X=2η+3,则D(η)=1C.公共汽车上有10位乘客,沿途5个车站,乘客下车的可能方式有105种D.回归方程为ŷ=0.85x−85.71中,变量y与x具有正的线性相关关系E.P(A)=0.5,P(B)=0.3,P(AB)=0.2,则P(A|B)=0.413. “微信运动”是腾讯开发的一个记录跑步或行走情况(步数里程)的公众号用户通过该公众号可查看自己某时间段的运动情况.某人根据2018年1月至2018年11月期间每月跑步的里程(单位:十公里)的数据绘制了下面的折线图.根据该折线图,下列结论正确的是( )A.月跑步里程逐月增加B.月跑步里程最大值出现在10月C.月跑步里程的中位数为5月份对应的里程数D.1月至5月的月跑步里程相对于6月至11月,波动性更小,变化比较平稳14. 下列抽样方法是简单随机抽样的是()A.从50个零件中随机抽取5个做质量检验B.从50个零件中有放回地抽取5个做质量检验C.从整数集中随机抽取10个分析奇偶性D.运动员从8个跑道中随机选取一个跑道15. 对于表中x,y之间的一组数据:甲、乙两位同学给出的拟合直线方程分别为①y=13x+1和②y=12x+12.若通过分析得出②的拟合效果好,则下列分析理由正确的是()参考公式:R2=1−∑ni=1(y i−y i)2∑n i=1(y i−y¯)2.A.①的残差和大于②的残差和,所以②拟合效果更好B.①的残差平方和大于②的残差平方和,所以②拟合效果更好C.①的R2小于②的R2,所以②拟合效果更好D.残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好16. 某工厂生产甲、乙、丙三种不同型号的产品,产量分别为360、240、120,为检验产品的质量,现需从以上所有产品中抽取一个容量为60的样本进行检验,则下列说法正确的是()A.如果采用系统抽样的方法抽取,不需要先剔除个体B.如果采用分层抽样的方法抽取,需要先剔除个体C.如果采用系统抽样的方法抽取,抽取过程不需要运用简单随机抽样的方法D.如果采用分层抽样的方法抽取时,所有产品被抽中的概率相等17. 某公司生产三种型号的轿车,产量分别为1500辆,6000辆和2000辆.为检验该公司的产品质量,公司质监部门要抽取76辆进行检验,则下列说法正确的是( )A.应采用抽签法抽取B.应采用分层随机抽样抽取C.三种型号的轿车依次应抽取12辆,48辆,16辆D.这三种型号的轿车,每一辆被抽到的概率都是相等的18. 频率分布直方图中各小长方体的面积和为________.19. 从某500件产品中随机抽取50件进行质检,利用随机数表法抽取样本时,先将这500件产品按001,002,003,…,500进行编号.如果从随机数表第第7行第4列的数2开始,从左往右读数,则依次抽取的第4个个体的编号是________.(下面摘录了随机数表第6行至第8行各数)16 22 77 94 3949 54 43 54 8217 37 93 23 7887 35 20 96 4384 26 34 91 6484 42 17 53 3157 24 55 06 8877 04 74 47 6721 72 06 50 2583 42 16 33 7663 01 63 78 5916 95 55 67 1998 10 50 71 7512 86 73 58 0744 39 52 38 79.20. 2008年5月12日,四川汶川地区发生里氏8.0级特大地震.在随后的几天中,地震专家对汶川地区发生的余震进行了监测,记录的部分数据如下表:注:地震强度是指地震时释放的能量地震强度(x)和震级(y)的模拟函数关系可以选用y=a lg x+b(其中a,b为常数).利用散点图可知a的值等于________.(取lg2=0.3)21. 如图为两种商品2019年前三季度销售量的折线统计图,结合统计图,下列说法中正确的有________.①1∼6月,商品B的月销售量都超过商品A.②7月份商品A与商品B的销售量相等.③对于商品B,7∼8月的月销售量增长率与8∼9月的月销售量增长率相同.④2019年前三季度商品A的销量逐月增长.22. 将参加夏令营的100名学生编号为001,002,…,100.先采用系统抽样方法抽取一个容量为20的样本,若随机抽得的号码为003,那么从048号到081号被抽中的人数是________.23. 某工厂的某种型号的机器的使用年限x和所支出的维修费用y(万元)有下表的统计资料:根据该表可得回归方程ŷ=1.23x+â,据此模型估计,该型号机器使用年限为9年的维修费用大约为________万元.24. 世卫组织规定,PM2.5日均值在35微克/立方米以下空气质量为一级;在35微克/立方米∼75微克/立方米之间空气质量为二级;在75微克/立方米以上空气质量为超标.清远市环保局从市区2013年全年每天的PM2.5监测数据中随机抽取15天的数据作为样本,监测值如茎叶图所示(十位为茎,个位为叶),从这15天的数据中任取3天的数据,则恰有一天空气质量达到一级的概率为________(用分数作答).25. 随着智能手机的发展,微信越来越成为人们交流的一种方式,某机构对使用微信交流的态度进行调查,随机调查了50人,他们年龄的频数分布及对使用微信交流赞成人数如下表:分界点对使用微信交流的态度有差异;(Ⅱ)若对年龄在[55, 65)的被调查人中随机抽取两人进行追踪调查,求至少有1人赞成使用微信交流的概率.,其中n=a+b+c+d参考公式:K2=n(ad−bc)2(a+b)(c+d)(a+c)(b+d)参考数据:26. 设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(x i, y i)(i=1, 2,…,n),用最小二乘法建立的回归方程为y=0.85x−85.71,给定下列结论:①y与x具有正的线性相关关系;②回归直线过样本点的中心(x¯, y¯);③若该大学某女生身高增加1cm,则其体重约增加0.85kg;④若该大学某女生身高为170cm,则可断定其体重必为58.79kg.其中正确的结论是________.27. 为了解M离子在小鼠体内的残留程度,进行如下试验:给100只小鼠服M离子溶液,每只小鼠给服的溶液体积相同、摩尔浓度相同,经过一段时间后检测出残留在小鼠体内离子的百分比.根据试验数据得到如图频率分布直方图,则图中a=________;估计M离子残留百分比的平均数为________.(同组中的每个数据用该组区间的中点值代替)28. 成年人收缩压的正常范围是(90,140)(单位:mmHg),未在此范围的献血志愿者不适合献血.某血站对志愿者的收缩压进行统计,随机抽取男志愿者100名、女志愿者100名,根据统计数据分别得到如下直方图:(1)根据直方图计算这200名志愿者中不适合献血的总人数;(2)估计男志愿者收缩压的中位数;(3)估计女志愿者收缩压的平均值(同一组中的数据用该组区间的中点值为代表).29. 甲、乙两位学生参加数学竞赛培训,现分别从他们在培训期间参加的若干次预赛成绩中随机抽取8次,记录如下:(1)用茎叶图表示这两组数据;(2)现要从中选派一人参加数学竞赛,从统计学的角度(在平均数、方差或标准差中选两个)考虑,你认为选派哪位学生参加合适?请说明理由.30. 某商场为了调查旅游鞋的销售情况,随机抽取了40位顾客的购鞋尺寸,将所得数据整理后,画出频率分布直方图如下,其中直方图从左到右前3个小矩形的面积之比为1:2:3,试估计(1)购鞋尺寸在39.5∼43.5内的顾客所占的百分比是多少?(2)样本数据的中位数是多少?(精确到0.01)31. 为了让学生了解环保知识,增强环保意识,某中学举行了一次“环保知识竞赛”,共有900名学生参加了这一次竞赛,为了解本次竞赛成绩情况,从中抽取了部分学生的成绩进行统计,请你根据尚未完成并有局部污损的频率分布表和频率分布直方图,解答下列问题:(1)填充频率分布表的空格(将答案直接填在表格内);7分(2)补全频率分布直方图;11分(3)若成绩在60.5∼80.5分的学生为三等奖,问全校获得三等奖的学生约为多少人?32. 目前,我国老年人口比例不断上升,造成日趋严峻的人口老龄化问题.2019年10月12日,北京市老龄办、市老龄协会联合北京师范大学中国公益研究院发布《北京市老龄事业发展报告(2018)》,相关数据有如下图表.规定年龄在15岁至59岁为“劳动年龄”,具备劳动力,60岁及以上年龄为“老年人”,据统计,2018年底北京市每2.4名劳动力抚养1名老年人.(1)请根据上述图表计算北京市2018年户籍总人口数和北京市2018年的劳动力数;(保留两位小数)(2)从2014年起,北京市老龄人口与年份呈线性关系,比照2018年户籍老年人人口年龄构成,预计到2020年年底,北京市90以上老人达到多少人?(精确到1人)(附:对于一组数据(u 1,v 1),(u 2,v 2),⋯⋯,(u n ,v n ),其回归直线v =α+βu 的斜率和截距的最小二乘法估计分别为:β̂=∑u i n i=1v i −nu ¯⋅v¯∑u i 2n i=1−nu¯2,α̂=v ¯−β̂u ¯,2×27.62+1×11.02+1×8.98+2×24.78=124.8)参考答案与试题解析高中数学-统计-测试练习题一、选择题(本题共计 10 小题,每题 3 分,共计30分)1.【答案】C【考点】简单随机抽样【解析】此题暂无解析【解答】解:因为在系统抽样中,若所给的总体个数不能被样本容量整除,则要先剔除几个个体,再分组.在剔除过程中,每个个体被剔除的概率相等,所以每个个体被抽到包括两个过程,一是不被剔除,二是选中,这两个过程是相互独立的,所以每人入选的概率P=502018=251009.故选C.2.【答案】B【考点】变量间的相关关系【解析】根据所学函数关系和相关关系的概念逐一核对四个选项即可得到正确答案.【解答】如果当一个变量的取值一定时,另一个变量的取值带有一定的随机性,我们称这样的两个变量具有相关关系,也就是说两个变量之间即不存在函数关系,又不是完全没有关系,选项A中的两个变量具有函数关系;选项B中居民收入与储蓄存款具有相关关系,一般来说,居民收入越高对应的储蓄存款越多;选项C中的电视机产量与苹果产量吴任何关系;选项D中某种商品的销售额与销售价格具有函数关系.互选B.3.【答案】A【考点】茎叶图【解析】根据茎叶图提供的数据,去掉1个最高分和1个最低分后,利用公式求平均数可得x的值.【解答】解:选手的7个得分中去掉1个最高分96,去掉1个最低分86,剩余5个得分为88,93,90,94,(90+x);它们的平均分为88+93+90+94+(90+x)5=91,∴ x =0; 故选:A . 4. 【答案】 A【考点】 简单随机抽样 分层抽样方法 系统抽样方法【解析】样本代表性的好坏直接影响统计结论的准确性,所以抽样过程中,考虑的最主要原则是保证样本能够很好地代表总体.而随机抽样的出发点是使每个个体都有相同的机会被抽中,这是基于对样本数据代表性的考虑. 【解答】解:根据抽样的定义知道,三种抽样方法的特点就是保证了每个个体从总体中抽到的可能性都相同, 保证了总体中每个个体被抽到的概率相等的公平性. 故选A . 5.【答案】 D【考点】 散点图 【解析】将散点图近似判断为所学函数图象,根据近似函数图象选择合适的回归方程即可. 【解答】解:由散点图分布可知,散点图分布在一个对数函数的图象附近, 因此,最适宜作为发芽率y 和温度x 的回归方程类型的是 y =a +b ln x . 故选D . 6. 【答案】 D【考点】极差、方差与标准差 众数、中位数、平均数【解析】根据变量之间均值和方差的关系和定义,直接代入即可得到结论. 【解答】解:由题意知y i =x i +100,则y ¯=110(x 1+x 2+...+x 10+100×10)=110(x1+x2+⋯+x10)+100=x¯+100,方差:s2=110[(x1+100−x¯−100)2+(x2+100−x¯−100)2+⋯+(x10+100−x¯−100)2]=110[(x1−x¯)2+(x2−x¯)2+⋯+(x10−x¯)2]=s2.故选D.7.【答案】C【考点】系统抽样方法【解析】由题意,求得高二学生的编号为496−988,再得出分组的组距为147049=30,根据第一组用简单随机抽样的方法抽取的号码为23,得出抽取的号码满足30n−7,列出不等式,即可求解.【解答】解:由题意得高二学生的编号为496−988,分组的组距为147049=30,因为由第一组用简单随机抽样的方法抽取的号码为23,所以抽取的号码满足23+(n−1)×30=30n−7,n∈N+,令496≤30n−7≤988,解得50330≤n≤99530,n∈N+,所以n可取17个数.故选C.8.【答案】B【考点】分层抽样方法【解析】求出样本容量与总容量的比,然后用各层的人数乘以得到的比值即可得到各层应抽的人数.【解答】解:由30150=15,所以,高级职称人数为15×15=3(人);中级职称人数为45×15=9(人);一般职员人数为90×15=18(人).所以高级职称人数、中级职称人数及一般职员人数依次为3,9,18.故选B.9.【答案】D【考点】利用散点图识别两变量之间关系【解析】仔细观察图象,寻找散点图间的相互关系,主要观察这些散点是否围绕一条曲线附近排列着,由此能够得到正确答案.【解答】解:散点图(1)中,所有的散点都在曲线上,所以(1)具有函数关系;散点图(2)中,所有的散点都分布在一条直线的附近,所以(2)具有相关关系;散点图(3)中,所有的散点都分布在一条曲线的附近,所以(3)具有相关关系,散点图(4)中,所有的散点杂乱无章,没有分布在一条曲线的附近,所以(4)没有相关关系.故选D.10.【答案】A【考点】极差、方差与标准差【解析】设出原来的一组数据,使数据中的每一个数据都都乘以2,再都减去80,得到一组新数据求得新数据的平均数是1.2,方差是4.4,根据这些条件列出算式,合并同类项,做出原来数据的平均数,再利用方差的关系式求出方差结果.【解答】设原来的一组数据是x1,x2...x n,∵每一个数据乘以2,再都减去80得到新数据且求得新数据的平均数是1.2,方差是4.4,2x1−80+2x2−80+⋯2x n−80=1.2n∴2x1+2x2+⋯2x n=1.2+80=81.2nx1+x2+⋯x n=40.6n又∵数据都减去同一个数,没有改变数据的离散程度,∴2x1,2x2...2x n的方差为:4.4,×4.4=1.1.从而原来数据x1,x2...x n的方差为:122二、多选题(本题共计 7 小题,每题 3 分,共计21分)11.【答案】A,B,C【考点】收集数据的方法【解析】由比例图,可得是否倾向选择生育二胎与户籍、性别有关,倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,倾向选择生育二胎的人员中的男性人数与女性人数,即可得出结论.【解答】解:由不同群体中倾向选择生育二胎与倾向选择不生育二胎的人数比例图,知:城镇户籍倾向选择生育二胎的比例为40%,农村户籍倾向选择生育二胎的比例为80%,∴是否倾向选择生育二胎与户籍有关,故A正确;男性倾向选择生育二胎的比例为80%,女性倾向选择生育二胎的比例为60%,∴是否倾向选择生育二胎与性别有关,故B正确;男性倾向选择生育二胎的比例为80%,人数为60×80%=48人,女性倾向选择生育二胎的比例为60%,人数为80×60%=48人,∴倾向选择生育二胎的人群中,男性人数与女性人数相同,故C正确;倾向选择不生育二胎的人群中,农村户籍人数为70×(1−80%)=14人,城镇户籍人数为70×(1−40%)=42人,∴倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数,故D错误.故选ABC.12.【答案】B,D【考点】条件概率与独立事件离散型随机变量的期望与方差分步乘法计数原理复数的基本概念两个变量的线性相关【解析】A选项根据纯虚数的概念利用特殊值a=−1即可判断错误. B选项根据离散型分布列期望与方差的性质可以进行判断. C选项考查简单计数问题. D选项考查两个变量的线性相关性. E 选项考查条件概率的计算方式.【解答】解:A,当a=−1,(a+1)i=(−1+1)i=0,故A错误;B,随机变量X∼N(3,22),则E(X)=3,D(X)=4,若X=2η+3,则D(X)=22×D(η)=4,解得D(η)=1,故B正确;C,由分步乘法计数原理可知,每位乘客下车方法有5种,所以乘客下车的可能方式有510中,故C错误;D,由回归方程的形式可知,0.85>0,变量y与x具有正的线性相关关系,变量x增加1个单位时,y平均增加0.85个单位,故D正确;E,由条件概率公式可得P(A|B)=P(AB)P(B)=23,故E错误.故选BD.13.【答案】B,C,D【考点】用样本的数字特征估计总体的数字特征【解析】此题暂无解析 【解答】解:由2018年1月至2018年11月期间每月跑步的里程的数据,绘制的折线图,知: 在A 中,月跑步里程2月、7月、8月和11月减少,故A 错误; 在B 中,月跑步里程高峰期大致在9、10月,故B 正确;在C 中,月跑步里程的中位数为5月份对应的里程数,故C 正确;在D 中,1月至5月的月跑步里程相对于6月至11月,波动性更小,变化比较平稳,故D 正确. 故选BCD . 14. 【答案】 A,D【考点】 简单随机抽样 【解析】根据简单随机抽样的定义和使用条件,逐项判定,即可求解. 【解答】解:对于A 中,从50个零件中随机抽取5个做质量检验,符合简单随机抽样的定义和条件,所以是简单的随机抽样;对于B 中,从50个零件中有放回地抽取5个做质量检验是又放回抽样,不符合简单随机抽样的使用条件,不是简单的随机抽样;对于C 中,从整数集中随机抽取10个分析奇偶性,其中整数集为无限集,不符合简单随机抽样的条件,不是简单的随机抽样;对于D 中,运动员从8个跑道中随机选取一个跑道,符合简单随机抽样的定义和条件,所以是简单随机抽样. 故选AD . 15.【答案】 B,C,D 【考点】求解线性回归方程 【解析】根据所给的两条直线的方程和五个坐标点,求出用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和,用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和,比较分析A ,B ,D 的正误,再求得①的R 2与②的R 2分析C 的正误. 【解答】解:用y =13x +1作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为: S 1=(1−43)2+(2−2)2+(3−3)2+(4−103)2+(5−113)2=73.用y =12x +12作为拟合直线时,所得y 的实际值与y 的估计值的差的平方和为: S 2=(1−1)2+(2−2)2+(3−72)2+(4−4)2+(5−92)2=12.∵S2<S1,∴ ①的残差和大于②的残差和,①的残差平方和大于②的残差平方和,则②的拟合效果更好,故A错误,B正确;残差图中直线②的残差点分布的水平带状区域比①的残差点分布的水平带状区域更窄,所以直线②拟合效果更好,故D正确;①的R2=1−7310=2330,②的R2=1−1210=1920,①的R2小于②的R2,②拟合效果更好,故C正确.故选BCD.16.【答案】A,D【考点】分层抽样方法系统抽样方法【解析】此题暂无解析【解答】解:(360+240+120)÷60=12,无论是运用系统抽样还是分层抽样,都不需要先剔除个体,A正确,B错误.系统抽样确定起始号时需要用到简单随机抽样,C错误.分层抽样时,所有个体被抽到的机会均等,D正确.故选AD.17.【答案】B,C,D【考点】分层抽样方法【解析】根据简单随机抽样的特点知应选分层抽样,按照抽样比即可得三种型号的轿车分别应抽取的数量.【解答】解:A.因为个体数目多,用抽取法制签难,搅拌不均匀,抽出的样本不具有好的代表性,故A错误;B,因为是三种型号的轿车,个体差异明显,所以选择分层抽样,故B正确;C,抽样比为761500+6000+2000=1125,三种型号的轿车依次应抽取1500×1125=12辆,6000×1125=48辆,2000×1125=16辆,故C正确;D,分层抽样中,每一个个体被抽到的可能性相同,故D正确.故选BCD.三、填空题(本题共计 10 小题,每题 3 分,共计30分)18.【答案】1【考点】频率分布直方图【解析】=根据频率分布直方图中纵横坐标的意义,易得长方形的面积为长乘宽,即组距×频率组距频率,而所有频率和为1可知频率分布直方图中各小长方体的面积和为1.【解答】解:在频率直方图中纵坐标表示频率,横坐标表示组距,组距,小长方形的长表示组距,则小长方形的高表示频率组距=频率;则长方形的面积为长乘宽,即组距×频率组距根据所有频率和为1可知频率分布直方图中各小长方体的面积和为1;故答案为:119.【答案】206【考点】简单随机抽样【解析】找到第7行第4列的数开始向右读,依次寻找号码小于500的即可得到结论.【解答】解:找到第7行第4列的数开始向右读,第一个符合条件的是217,第二个数553,不成立,第三个数157,第四个数245,这样依次读出结果,合适的数是217,157,245,217,206,其中217前面已经重复舍掉,故第四个数是206.故答案为:20620.【答案】23【考点】散点图【解析】由散点图可知函数的图象经过(1.6, 5)(3.2, 5.2),把点的坐标代入函数的解析式得到关于a,b的方程组,两个方程相减得到a的值.【解答】解:由散点图可知函数的图象经过(1.6, 5)(3.2, 5.2)把点的坐标代入函数的解析式得到5=a lg1.6+b①5.2=a lg3.2+b②用②-①得0.2=a lg2∴ a =0.2lg 2=23故答案为:23 21. 【答案】 ①②④【考点】频率分布折线图、密度曲线 【解析】 此题暂无解析 【解答】解:由图可知,①1∼6月,商品B 的月销售量曲线在商品A 之上,故①正确; ②7月份商品A 与商品B 的销售量都为13/万份,故②正确;③对于商品B ,7∼8月的月销售量增长率为负,8∼9月的月销售量增长率为0,故③错误;④2019年前三季度商品A 的销量折线呈上升趋势,故④正确. 故答案为:①②④. 22.【答案】 7【考点】 系统抽样方法 【解析】根据系统抽样的定义,即可得到结论. 【解答】解:∵ 样本容量为20,首个号码为003, ∴ 样本组距为100÷20=5∴ 对应的号码数为3+5(x −1)=5x −2, 由48≤5x −2≤81, 得10≤x ≤16.6,即x =10,11,12,13,14,15,16,共7个, 故答案为:7. 23.【答案】 11.15 【考点】求解线性回归方程 【解析】由表格可得平均值x ¯,y ¯,由回归直线过点(x ¯, y ¯)可得其方程,把x =9代入计算可得. 【解答】解:由表格可得x ¯=15(2+3+4+5+6)=4, y ¯=15(2.2+3.8+5.5+6.5+7.0)=5。

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习

高中数学:统计与统计案例练习一、选择题1.某校为了解学生平均每周的上网时间(单位:h),从高一年级1 000名学生中随机抽取100 名进行了调查,将所得数据整理后,画出频率分布直方图(如图),其中频率分布直方图从左到右前3个小矩形的面积之比为1 : 3 : 5,据此估计该校高一年级学生中平均每周上网时间少于4 h的学生人数为()领率组距A. 200 C. 400 0.0350.015B. 240D. 48010平均每周上网时间(h)解析:选C 设频率分布直方图中从左到右前3个小矩形的面积分别为A3K5P.由频率分布直方图可知,最后2个小矩形的面积之和为(0.015+0.035)X2 = 0.1.由于频率分布直方图中各个小矩形的面积之和为1,所以P+3P+5P=0.9,即尸=0.1.所以平均每周上网时间少于4h的学生所占比例为尸+3P=0.4,由此估计学生人数为0.4X1 000 =400.2. AQI(Air Quality Index,空气质量指数)是报告每日空气质量的参数,描述了空气清洁或污染的程度.AQI共分六级,一级优(0〜50),二级良(51〜100),三级轻度污染(101〜150),四级中度污染(151〜200),五级重度污染(201〜300),六级严重污染(大于300).如图是昆明市2021年4月份随机抽取的10天的AQI茎叶图,利用该样本估计昆明市2021年4月份空气质量优的天数为 ()A. 3B. 4C. 12D. 2142解析:选c 从茎叶图知,10天中有4天空气质量为优,所以空气质量为优的频率为 1 V.Z 22所以估计昆明市2021年4月份空气质量为优的天数为30X5=12,应选C.3.〔成都模拟〕某城市收集并整理了该市2021年1月份至10月份各月最低气温与最高气 温〔单位:C 〕的数据,绘制了下面的折线图.该城市各月的最低气温与最高气温具有较好的线性关系,那么根据折线图,以下结论错误 的是〔〕A.最低气温与最高气温为正相关B. 10月的最高气温不低于5月的最高气温C.月温差〔最高气温减最低气温〕的最大值出现在1月D.最低气温低于0C 的月份有4个解析:选D 在A 中,最低气温与最高气温为正相关,故A 正确;在B 中,10月的最高气温 不低于5月的最高气温,故B 正确;在C 中,月温差〔最高气温减最低气温〕的最大值出现在1月, 故C 正确:在D 中,最低气温低于0℃的月份有3个,故D 错误.应选D.4 .〔承德模拟〕为了解户籍、性别对生育二胎选择倾向的影响,某地从育龄人群中随机抽取 了容量为100的样本,其中城镇户籍与农村户籍各50人;男性60人,女性40人,绘制不同群体 中倾向选择生育二胎与倾向选择不生育二胎的人数比例图〔如下图〕,其中阴影局部表示倾向 选择生育二胎的对应比例,那么以下表达中错误的选项是〔〕A.是否倾向选择生育二胎与户籍有关B.是否倾向选择生育二胎与性别无关♦最高气温 ♦最低气温C.倾向选择生育二胎的人员中,男性人数与女性人数相同D.倾向选择不生育二胎的人员中,农村户籍人数少于城镇户籍人数解析:选C 由题图,可得是否倾向选择生育二胎与户籍有关、与性别无关;倾向选择不 生育二胎的人员中,农村户籍人数少于城镇户籍人数;倾向选择生育二胎的人员中,男性人数为 60X60% =36,女性人数为40X60%=24,不相同.应选C.5 .(石家庄模拟)某学校48两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过 茎叶图比拟两个班兴趣小组成绩的平均值及标准差.3 4 28 8 4 6 8 65152①A 班兴趣小组的平均成绩高于B 班兴趣小组的平均成绩; ②B 班兴趣小组的平均成绩高于A 班兴趣小组的平均成绩; ③A 班兴趣小组成绩的标准差大于B 班兴趣小组成绩的标准差;@B 班兴趣小组成绩的标准差大于A 班兴趣小组成绩的标准差. 其中正确结论的编号为()A.①④C. ®®其方差为白义[(53—78尸+(62—78/ +…+ (95—78)2]=121.6, 那么其标准差为'121.6%11.03;45+48+5H -------- F91B 班兴趣小组的平均成成为'」=66,其方差为表义[(45—66)2+(48 - 66)2 + ... + (91-66)2] =169.2, 那么其标准差为1169.2%13.01.应选A.6 .某商场对某一商品搞活动,该商品每一个的进价为3元,销售价为8元,每天售出的 第20个及之后的半价出售.该商场统计了近10天这种商品的销量,如下图,设M 个)为每天商 品的销量,M 元)为该商场每天箱售这种商品的利润.从日利润不少于96元的几天里任选2天, 那么选出的这2天日利润都是97元的概率为()4 5 5 1 6 2 7 38班8 3 6 4 5 3 4 02B.②③D.①③解析:选A A 班兴趣小组的平均成绩为 53+62+64+…+92+95--------------- ---------------- =785x, x=18, 19, y =<l95+(x-19)(4-3), x=20, 21, J5x, x=18, 19, 即 L176+x, x=20, 21.当日销量不少于20个时,日利泗不少于96元, 当日销量为20个时,日利润为96元, 当日销量为21个时,日利润为97元,日利泗为96元的有3天,记为日利泗为97元的有2天,记为人丛从中任选2天有 (.4),(〃石),(.力),(.1),3/),(48),3«),(c4),(.,8),(48),共 10 种情况.其中选出的这2天日利泗都是97元的有(A,8)1种情况. 故所求概率为关.应选B. 二、填空题7 .某小卖部销售某品牌饮料的零售价与销量间的关系统计如下:单价x/元 3.0 3.2 3.4 3.6 3.8 4.0 销量w 瓶504443403528x,y 的关系符合回归方程£=£+2其中分=-20.假设该品牌饮料的进价为2元,为使利润 最大,零售价应定为 元.解析:依题意得:x =3.5, y =40,A所以.=40—(- 20)X3.5=110,所以回归直线方程为f=-20x+110,利润 L = (A —2)(-20A + 110)= -201+ 150x-220,B 选• •1 - 9 1 - 5 A.C 解BioD.g由题意知频数(天)0 18 19 20 2 俏量〔个〕所以x=* = 3.75元时,利润最大.答案:3.758.某高校调查了200名学生每周的自习时间(单位:小时),制成了如下图的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30].根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是.解析:设所求的人数为〃,由频率分布直方图,自习时间不少于22.5小时的频率为(0.04+0.08 +0.16) X 2.5=0.7, n=0.7 X 200=140.答案:1409.为比拟甲乙两地某月11时的气温情况,随机选取该月5天11时的气温数据(单位:C) 制成如下图的茎叶图,甲地该月11时的平均气温比乙地该月11时的平均气温高1 ℃,那么甲地该月11时的平均气温的标准差为.甲9 8 2 62 m 03 I解析:甲地该月11时的气温数据(单位:℃)为28,29,30,30+〃?,32;乙地该月11时的气温数据(单位:℃)为26,28,29,31,31,那么乙地该月11时的平均气温为(26+28+29+31+31计5 = 29(℃),所以甲地该月11时的平均气温为30 ℃,故(28+29+30+30+m + 32)+5 = 30,解得〃?=1,那么甲地该月11时的平均气温的标准差为嗝义[(28 - 30产+(29 - 30)2+(30 - 30/+(31 - 30/+(32 - 30户]=\(2.答案:^2三、解做题10.某篮球运发动的投篮命中率为50%,他想提升自己的投篮水平,制定了一个夏季练习计划,为了了解练习效果,执行练习前他统计了10场比赛的得分,计算出得分的中位数为15,平均得分为15,得分的方差为463执行练习后也统计了10场比赛的得分,茎叶图如下图:0 8 91 2 4 4 5 6 82 1 3(1)请计算该篮球运发动执行练习后统计的10场比赛得分的中位数、平均得分与方差;⑵如果仅从执行练习前后统计的各10场比赛得分数据分析,你认为练习方案对该运发动的投篮水平的提升是否有帮助?为什么?解:(1)练习后得分的中位数为上芋=14.5;平均得分为8+9+12+14+14+15+16+18 + 21+23= 15:10方差为击义[(8—15)2 + (9 — 15>+(12 —15>+(14 — 15)2+(14 — 15> + (15 —15>+(16 — 15产+(18-15)2+(21-15)2+(23 —15)2]=20.6.(2)尽管中位数练习后比练习前稍小,但平均得分一样,练习前方差20.6小于练习前方差46.3, 说明练习后得分稳定性提升了(阐述观点合理即可),这是投篮水平提升的表现.故此练习方案对该篮球运发动的投篮水平的提升有帮助.11.(西安八校联考)在2021年俄罗斯世界杯期间,莫斯科的局部餐厅销售了来自中国的小龙虾,这些小龙虾均标有等级代码.为得到小龙虾等级代码数值x与销售单价y(单位:元)之间的关系,经统计得到如下数据:⑴销售单价),与等级代码数值x之间存在线性相关关系,求),关于x的线性回归方程(系数精确到0.1);(2)假设莫斯科某餐厅销售的中国小龙虾的等级代码数值为98,请估计该等级的中国小龙虾销售单价为多少元?参考公式:对于一组数据(xi1 ),3,光),…其回归直线f=源+2的斜率和截距的最小2Xyi一〃x y八 '। A — A——二乘估计分别为Z? = ----------------- a= y —b x .n _Xxr-n x 26 6参考数据:2>»=8 440, 2e = 25 564.—38+48 + 58 + 68 + 78 + 88解:(1)由题意,得x -■= 63,- 16.8+18.8+20.8 + 22.8 + 24+25.8 _y = 6 =21.5,yA_8 440 - 6X63X21.5〜h = ~~6Z—=25 564—6X63X63「026 A 2A — A 一a= y -bx =21.5-0.2X63 = 8.9.故所求线性回归方程为f=0.2x+8.9.⑵由(1)知,当%=98 时,>=0.2X98+8.9=28.5.・•・估计该等级的中国小龙虾销售单价为28.5元.12.(长沙模拟)某职称晋级评定机构对参加某次专业技术测试的100人的成绩进行了统计, 绘制的频率分布直方图如下图.规定80分以上者晋级成功,否那么晋级失败(总分值为100分).(1)求图中.的值;(2)估计该次测试的平均分不(同一组中的数据用该组的区间中点值代表);(3)根据条件完成下面2X2列联表,并判断能否有85%的把握认为“晋级成功〞与性别有关.P(K?2k)0.40 0.25 0.15 0.1()0.050.025k0.708 1.323 2.072 2.706 3.841 5.024解:(1)由频率分布直方图中各小长方形面积总和为1,得(2.+ 0.020+0.03.+0.040)义10=1,解得〃=0...5.⑵由频率分布直方图知洛小组的中点值依次是55,65,75,85,95, 对应的频率分别为0.05.30,0.40,0.20.05,那么估计该次测试的平均分为 x = 55X0.05 + 65X0.30 + 75X0.40 + 85X0.20 + 95X0.05 = 74(分). ⑶由频率分布直方图知,晋级成功的频率为0.20+0.05=0.25, 故晋级成功的人数为100X0.25 = 25,填写2X2列联表如下:晋级成功 晋级失败合计男 16 34 50 女 9 41 50 合计2575100100X(16X41 ——25X75X50X50^2,613>2.072,所以有85%的把握认为“晋级成功〞与性别有关.1 .为检查某工厂所生产的8万台电风扇的质量,抽查了其中20台的无故障连续使用时限(单 位:小时)如下:248 256 232 243 188 268 278 266 289 312 274296 288 302 295 228 287 217 329 283K 2=n(acl-bc)2(1)完成下面的频率分布表,并作出频率分布直方图;(2)估计8万台电风扇中有多少台无故障连续使用时限不低于280小时;(3)用组中值(同一组中的数据在该组区间的中点值)估计样本的平均无故障连续使用时限.解:(1)频率分布表及频率分布直方图如下所示:0.0100 ——⑵由题意可得8乂(0.30+0.10+0.05) = 3.6,所以估计8万台电风扇中有3.6万台无故障连续使用时限不低于280小时.(3)由频率分布直方图可知x =190X0.05 + 210X0.05 + 230X0.10 + 250X0.15 + 270X0.20 + 290X0.30 + 310X0.10 + 330X0.05 = 269(小时),所以样本的平均无故障连续使用时限为269小时.2 .海水养殖场进行某水产品的新、旧网箱养殖方法的产量比照,收获时各随机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)记A 表示事件“旧养殖法的箱产量低于50kg 〞,估计A 的概率;⑵填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量V50 kg箱产量250 kg旧养殖法新养殖法(3)根据箱产量的频率分布直方图,对这两种养殖方法的优劣进行比拟. 附:P (心2)0.050 0.010 0.001 k3.841 6.635 10.8280.01500.0125频率 仇距0.0075 0.0050 0.0025.厂工丁丁丁丁厂!无故障连续使用时用/小时新养殖法、n(ad-bc)1 _ .K-= . , , ,,其中〃=a+/?+c+d.(a+Z?)(c 十d)(a十c)(Z?+d)解:⑴旧养殖法的箱产量低于50 kg的频率为(0.012+0.014+0.024+0.034+0.040)X5=0.62.因此,事件A的概率估计值为0.62.⑵根据箱产量的频率分布直方图得到联表:K2=---------- -------------------- 15 705100X100 X 96X104由于15.705>6.635,故有99%的把握认为箱产量与养殖方法有关.(3)箱产量的频率分布直方图说明:新养殖法的箱产量平均值(或中位数)在50 kg到55 kg 之间,旧养殖法的箱产量平均值(或中位数)在45 kg到50 kg之间,且新养殖法的箱产量分布集中程度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从而新养殖法优于旧养殖法.3.为了监控某种零件的一条生产线的生产过程,检验员每隔30 min从该生产线上随机抽取一个零件,并测量其尺寸(单位:cm).下面是检验员在一天内依次抽取的16个零件的尺寸:经计算得x =+£即=9.97,5=、*ZG L x )21 /=1 \ / 1O/=1/ 1 16 _ / 16 16 _=、/讳16 X 2比0.212, / L G-8.5)2^ 18.439,Z (x,- x )(L8.5)=—2.78,其中为为抽取的第i个零件的尺寸,i= 1,2, (16)(1)求⑶,i)(i= 12…,16)的相关系数二并答复是否可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小(假设加V0.25,那么可以认为零件的尺寸不随生产过程的进行而系统地变大或变小);(2)一天内抽检零件中,如果出现了尺寸在(刀-35,7 +3s)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.①从这一天抽检的结果看,是否需对当天的生产过程进行检查?②在(7 -35,7 +3s)之外的数据称为离群值,试剔除离群值,估计这条生产线当天生产的零件尺寸的均值与标准差.(精确到0.01)附:样本(H,v)(i = 12…4的相关系数£(X,-7)(57-7)r=I ______/ / ・、/(),008公丫0・09・、/ £ d )2、/ £ 8 - 5 )216 _Z (XL x )(/—8.5)尸1解:(1)由样本数据得8,i)(i= 1,2,…,16)的相关系数为r= --------- /--- 1/16 _ / 16、/ Z (即- X C-8.5)2 -2.78剔除第13个数据,剩下数据的样本方差为aX 〔1 591.134 —9.22?—15X 10.022〕=0.008,A Q 这条生产线当天生产的零件尺寸的标准差的估计值为廊而比0.09.4.〔昆明模拟〕〞工资条里显红利,个税新政入民心〞.随着2021年新年钟声的敲响,我国 自1980年以来,力度最大的一次个人所得税〔简称个税〕改革迎来了全面实施的阶段.某IT 从业 者为了解自己在个税新政下能享受多少税收红利,绘制了他在26〜35岁〔2021〜2021年〕之间各 年的月平均收入〕,〔单位:千元〕的散点图:20・・・・ 16- ・ , 12- ., 8 ■ •4°123456789 io"年龄代码工注:年龄代码1~10分别对应年的26〜35岁⑴由散点图知,可用回归模型y=h\n x+a 拟合〕,与x 的关系,试根据有关数据建立〕,关于x 的回归方程;〔2〕如果该IT 从业者在个税新政下的专项附加扣除为3 000元/月,试利用〔1〕的结果,将月平 均收入视为月收入,根据新旧个税政策,估计他36岁时每个月少缴纳的个人所得税.1010 10 _10_ _ 10附注:参考数据:= 55,2〕〉= 155.5,N 〔即一x 〕2 =82.5,2 — x〕〔F — y 〕 = 94.9,26= i=li=li=lJ =1io _ io _ _15.1,2 缶- 1〕2=4.84,£〔力一 t 〕〔yi- y 〕 =242其中"=ln 为;取 In 11 =24,In 36=361=1 /=1参考公式:回归方程.=筋+味中斜率和截距的最小二乘估计分别为公= n ______ _X 〔出一〃〕〔.- V 〕 曰 A - A — -------------------------- \a= v —b u .Z 〔3一 〃 〕2月平均收入y千元解:(1)令 f=lnx,那么 y=bf+a10__Z & -,)()L y)24.2, b ~ ~__Z _痴_5ze —)2r=l10Zu-_2__155.5-_2_=而=-^-=15.55, t =苗A — A —a= y —b t = 15.55 —5X 1.51=8,所以〕,关于/的回归方程为〕,=5/+8.1015.1 lo"=L51由于/=lnx,所以y关于x的回归方程为y=51nx+8.⑵由⑴得,该IT从业者36岁时月平均收入为y=51n 11+8 = 5X2.4+8 = 20〔千元〕.旧个税政策下每个月应缴纳的个人所得税为1 500X3%+3 000X10%+4 500X20%+〔20 000-3 500-9 000〕X25% = 3 120〔元〕.新个税政策下每个月应缴纳的个人所得税为3 000X3%+〔20 000-5 OOO-3OOO-3 000〕X 10%=990〔元〕.故根据新旧个税政策,该IT从业者36岁时每个月少缴纳的个人所得税为3 120-990=2 130(70).I— 0 180.212X716X18.439 ',由于lrlV0.25,因此可以认为这一天生产的零件尺寸不随生产过程的进行而系统地变大或变小.(2)①由于7 =9.97,产0.212,由样本数据可以看出抽取的第13个零件的尺寸在(T—3s,7 + 3s)以外,因此需对当天的生产过程进行检查.②剔除离群值,即第13个数据,剩下数据的平均数为右义(16义9.97—9.22)=10.02,这条生产线当天生产的零件尺寸的均值的估计值为10.02.162X?=16X0.212I2+16X9.972^1 591.134,。

高一数学统计练习题

高一数学统计练习题

高一下概率统计练习题一.选择题1.某单位有老年人28人,中年人54人,青年人81人.为了调查他们的身体状况,需从他们中抽取一个容量为36的样本,最适合抽取样本的方法是( )A .简单随机抽样B .系统抽样C .分层抽样D .先从老年人中剔除一人,然后分层抽样2.10名工人某天生产同一零件,生产的件数是15,17,14,10,15,17,17,16,4,12.设其平均数为a ,中位数为b ,众数为c ,则有( )A .a>b>cB .b>c>aC .c>a>bD .c>b>a3.下列说法中正确的是 ( )A .数据5,4,4,3,5,2的众数是4B .一组数据的标准差是这组数据的方差的平方C .数据2,3,4,5的标准差是数据4,6,8,10的标准差的一半D .频率分布直方图中各小长方形的面积等于相应各组的频数4.下列说法正确的是( )A .根据样本估计总体,其误差与所选择的样本容量无关B .方差和标准差具有相同的单位C .从总体中可以抽取不同的几个样本D .如果容量相同的两个样本的方差满足S 21<S 22,那么推得总体也满足S 21<S 225.某同学使用计算器求30个数据的平均数时,错将其中一个数据105输人为15,那么由此求出的平均数与实际平均数的差是( )A .3.5B .-3C .3D .-0.56如图所示是一批产品中抽样得到数据的频率直方图,由图可看出概率最大时数据所在范围是( )A .(8.1,8.3)B .(8.2,8.4)C .(8.4,8.5)D .(8.5,8.7)7.将编号为1、2、3、4的四个小球任意地放入A 、B 、C 、D 四个小盒中,每个盒中放球的个数不受限制,恰好有一个盒子是空的的概率为( ) ()169A ()41B ()43C ()167D 8从区间()0,1内任取两个数,则这两个数的和小于56的概率是 A 、35 B 、45 C 、1625 D 、2572 9 把一条长10厘米的线段随机地分成三段,这三段能够构成三角形的概率是( )A. ;31B. ;41C. ;103D. .53 10 ABCD 为长方形,AB =2,BC =1,O 为AB 的中点,在长方形ABCD 内随机取一点,取到的点到O 的距离大于1的概率为( )A.4π B.14π- C.8π D.18π- 11 在样本的频率分布直方图中,一共有n 个小矩形,若中间某一个小矩形的面积等于其余n -1个小矩形面积和的14,且样本容量为160,则中间这一组的频数是 A.32 B.20 C.40 D.2512一块各面均涂有油漆的正方体被锯成1000个大小相同的小正方体,若将这些小正方体均匀地搅混在一起,则任意取出一个正方体其两面涂有油漆的概率是A .121 B .101 C .253 D .12512二、填空题:13.连续两次掷一颗质地均匀的骰子(一种各面上分别标有1,2,3,4,5,6个点的正方体玩具),记出现向上的点数分别为,m n ,设向量(),m n =a ,()3,3=-b ,则a 与b 的夹角为锐角的概率是 14某单位200名职工的年龄分布情况如图2,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是 。

高一数学统计试题答案及解析

高一数学统计试题答案及解析

高一数学统计试题答案及解析1.从测量所得数据中取出个,个,个,个组成一个样本,则这个样本的平均数是()A.B.C.D.【答案】C【解析】利用平均数计算公式平均数=,故选C。

【考点】本题考查了平均数的概念及计算.点评:运用求平均数公式:。

2.一位教师出了一份含有3个问题的测验卷,每个问题1分.班级中30%的学生得了3分,50%的学生得了2分,10%的学生得了1分,另外还有10%的学生得0分,则全班的平均分是_________.【答案】2分【解析】=3×30%+2×50%+1×10%+0=2.【考点】本题考查了平均数的概念及计算、频率分布表的意义、加权平均数的求法.点评:运用求平均数公式:。

3.某校在一次学生身体素质调查中,在甲、乙两班中随机抽10名男生测验100m短跑,测得成绩如下(单位:):【答案】甲班男生短跑水平高些【解析】,.,甲班男生短跑水平高些.【考点】本题考查了平均数的概念及计算.点评:运用求平均数公式:,分别计算比较,平均数高者为优秀,数基本题型。

4.如果五个数的平均数是7,那么这五个数的平均数是()A.5B.6C.7D.8【答案】D【解析】利用平均数计算,或利用结论:样本x1,x2, (x)n的平均数为7,∴样本x1+1,x2+1,…,xn+1的平均数=7+1=8,故选D.【考点】本题主要考查平均数的意义及其计算。

点评:基本题型,注意掌握平均数计算公式。

在此基础上推出一般结论更好。

5.一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组对应数据:判断它们是否有相关关系.【答案】解:两者之间具有相关关系.【解析】本题只给出了样本数据,对于给定的两个变量是否具有相关关要用散点图来分析,散点图中的点若很集中,则具有相关关系并且集中趋势越强则相关性越强,若很分散,则不具相关关系。

散点图为:可看出样本点都集中在一条直线附近,所以两者之间具有相关关系。

人教A版高一数学必修第二册第九章《统计》单元练习题卷含答案解析 (55)

人教A版高一数学必修第二册第九章《统计》单元练习题卷含答案解析 (55)

高一数学必修第二册第九章《统计》单元练习题卷8(共22题)一、选择题(共10题)1. 某位教师 2018 年的家庭总收入为 80000 元,各种用途占比统计如下面的折线图.2019 年家庭总收入的各种用途占比统计如下面的条形图,已知 2019 年的就医费用比 2018 年的就医费用增加了 4750 元,则该教师 2019 年的旅行费用为 ( )A . 21250 元B . 28000 元C . 29750 元D . 85000 元2. 总体由编号为 01,02,⋯,19,20 的 20 个个体组成,利用下面的随机数表选取 5 个个体,选取方法是从随机数表第 1 行的第 11 列和第 12 列数字开始由左到右依次选取两个数字,则选出来的第 5 个个体的编号为 ( )4698637162332616804560111410959774246762428114572042533237322707A . 11B . 14C . 16D . 203. 设 x 1,x 2,⋯,x n 为样本数据,令 f (x )=∑(x i −x )2n i=1,则 f (x ) 的最小值点为 ( )A .样本众数B .样本中位数C .样本标准差D .样本平均数4. 我国古代数学名著《九章算术》有“米谷粒分”题:粮仓开仓收粮,有人送来米 1534 石,验得米内夹谷,抽样取米一把,数得 254 粒内夹谷 28 粒,则这批米内夹谷约为 ( ) A . 134 石B . 169 石C . 338 石D . 1365 石5. 如图所示的茎叶图记录了甲、 乙两组各 5 名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则 x 和 y 的值分别为 ( )A .3,5B .5,5C .3,7D .5,76. 为了解某地农村经济情况,对该地农户家庭年收入进行抽样调查,将农户家庭年收入的调查数据整理得到如下频率分布直方图:根据此频率分布直方图,下面结论中不正确的是 ( )A .该地农户家庭年收入低于 4.5 万元的农户比率估计为 6%B .该地农户家庭年收入不低于 10.5 万元的农户比率估计为 10%C .估计该地农户家庭年收入的平均值不超过 6.5 万元D .估计该地有一半以上的农户,其家庭年收入介于 4.5 万元至 8.5 万元之间7. 为比较甲、乙两地某月 14 时的气温情况,随机选取该月中的 5 天,这 5 天中 14 时的气温数据(单位:∘C )如下:甲:2628293131乙:2829303132以下结论:①甲地该月 14 时的平均气温低于乙地该月 14 时的平均气温; ②甲地该月 14 时的平均气温高于乙地该月 14 时的平均气温; ③甲地该月 14 时的气温的标准差小于乙地该月 14 时的气温的标准差; ④甲地该月 14 时的气温的标准差大于乙地该月 14 时的气温的标准差. 其中根据数据能得到的统计结论的编号为 ( ) A .①③B .①④C .②③D .②④8. 某项测试成绩满分为 10 分,现随机抽取 30 名学生参加测试,得分情况如图所示,假设得分值的中位数为 m e ,平均数为 x ,众数为 m 0,则 ( )A . m e =m 0=xB . m e =m 0<xC . m e <m 0<xD . m 0<m e <x9. 对某商店一个月内每天的顾客人数进行了统计,得到样本的茎叶图(如图所示),则该样本的中位数,众数,极差分别是 ( )125202333124489455577889500114796178A . 46,45,56B . 46,45,53C . 47,45,56D . 45,47,5310. 气象意义上从春季进入夏季的标志为“联系 5 天的日平均温度均不低于 22∘C ”.现有甲、乙、丙三地连续 5 天的日平均温度的记录数据(记录数据都是正整数). ① 甲地:5 个数据的中位数为 24,众数为 22; ② 乙地:5 个数据的中位数为 27,平均数为 24;③ 丙地:5 个数据中有一个数据是 32,平均数为 26,方差为 10.8. 则肯定进入夏季的地区有 ( ) A . 0 个 B . 1 个 C . 2 个 D . 3 个二、填空题(共6题)11. 从甲、乙、丙三个厂家生产的同一种产品中各抽取 8 件产品,对其使用寿命(单位:年)跟踪调查结果如下:甲:3,4,5,6,8,8,8,10; 乙:4,6,6,6,8,9,12,13; 丙:3,3,4,7,9,10,11,12.三个厂家在广告中都称该产品的使用寿命是 8 年,请根据结果判断厂家在广告中分别运用了平均数、众数、中位数中的哪一种集中趋势的特征数:甲 ,乙 ,丙 .12. 某工厂生产A ,B ,C 三种不同型号的产品,产品数量之比依次为 2:3:5,现用分层抽样方法抽出一个容量为 n 的样本,样本中A 种型号产品有 16 件,那么此样本的容量 n = .13. 某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 5 次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程 y ^=0.67x+54.9.零件数x/个1020304050加工时间y/min62■758189现发现表中有一个数据模糊看不清,请你推断出该数据的值为.14.下图是根据部分城市某年6月份的平均气温(单位:∘C)数据得到的样本频率分布直方图,其中平均气温的范围是[20.5,26.5],样本数据的分组为[20.5,21.5),[21.5,22.5),[22.5,23.5),[23.5,24.5),[24.5,25.5),[25.5,26.5).已知样本中平均气温低于22.5∘C的城市个数为11,则样本中平均气温不低于25.5∘C的城市个数为.15.从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图).由图中数据可知a=(结果保留3位小数).若要从身高在[120,130),[130,140),[140,150]内的三组学生中,用分层随机抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为.16.样本容量为10的一组样本数据依次为:3,9,0,4,1,6,6,8,2,7,该组数据的第50百分位数是,第75百分位数是.三、解答题(共6题)17.要做频率分布表,需要对原始数据做哪些工作?18.某学校对男、女学生进行有关“习惯与礼貌”的评分,记录如下:男:54,70,57,46,90,58,63,46,85,73,55,66,38,44,56,75,35,58,94,58女:77,55,69,58,76,70,77,89,51,52,63,63,69,83,83,65,100,74分别求男生、女生得分的四分位数.19.某班40个学生平均分成两组,两组学生某次考试成绩情况如表所示:组别平均数标准差第一组904第二组806求该班学生这次考试成绩的平均数和标准差.20.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,试计算样本在[40,50),[50,60)内的数据个数之和.21.某武警大队共有第一、第二、第三三支中队,人数分别为30,30,40人.为了检测该大队的射击水平,从整个大队用分层随机抽样共抽取了30人进行射击考核,统计得三个中队参加射击比赛的平均环数分别为8.8环,8.5环,8.1环,试估计该武警大队队员的平均射击水平.22.为提倡节能减排,同时减轻居民负担,广州市积极推进“一户一表”工程.非一户一表用户电费采用“合表电价”收费标准:0.65元/度.“一户一表”用户电费采用阶梯电价收取,其11月到次年4月起执行非夏季标准如下:第一档第二档第三档每户每月用电量(单位:度)[0,200](200,400](400,+∞)电价(单位:元/度)0.610.660.91例如:某用户11月用电410度,采用合表电价收费标准,应交电费410×0.65=266.5元,若采用阶梯电价收费标准,应交电费元200×0.61+(400−200)×0.66+(410−400)×0.91=263.1元.为调查阶梯电价是否能取到“减轻居民负担”的效果,随机调查了该市100户的11月用电量,工作人员已经将90户的月用电量填在下面的频率分布表中,最后10户的月用电量(单位:度)为:88,268,370,140,440,420,520,320,230,380.(1) 完成频率分布表,并绘制频率分布直方图;(2) 根据已有信息,试估计全市住户11月的平均用电量(同一组数据用该区间的中点值作代表);(3) 设某用户11月用电量为x度(x∈N),按照合表电价收费标准应交y1元,按照阶梯电价收费标准应交y2元,请用x表示y1和y2,并求当y2≤y1时,x的最大值,同时根据频率分布直方图估计“阶梯电价”能否给不低于75%的用户带来实惠?答案一、选择题(共10题)1. 【答案】C【解析】由题意可知,2018年的就医花费为80000×10%=8000(元),×35=则2019年的就医花费为8000+4750=12750(元),2019年的旅行费用为1275015 29750(元).【知识点】频率分布直方图2. 【答案】D【解析】由随机数法的抽样过程及题意知,选出的5个个体的编号为:16,11,14,10,20,故第5个个体的编号是20.【知识点】简单随机抽样3. 【答案】D【知识点】样本数据的数字特征4. 【答案】B≈169石,故选:B.【解析】由题意,这批米内夹谷约为1534×28254【知识点】简单随机抽样5. 【答案】A【解析】由已知中甲组数据的中位数为65,故乙组数据的中位数也为65,即y=5,则乙组数据的平均数为:66,故x=3.【知识点】茎叶图、样本数据的数字特征6. 【答案】C【解析】因为频率直方图中的组距为1,所以各组的直方图的高度等于频率.样本频率直方图中的频率即可作为总体的相应比率的估计值.该地农户家庭年收入低于4.5万元农户的比率估计值为0.02+0.04=0.06=6%,故A正确;该地农户家庭年收入不低于10.5万元的农户比率估计值为0.04+0.02×3=0.10=10%,故B 正确;该地农户家庭年收入介于4.5万元至8.5万元之间的比例估计值为0.10+0.14+0.20×2=0.64=64%>50%,故D正确;该地农户家庭年收入的平均值的估计值为3×0.02+4×0.04+5×0.10+6×0.14+7×0.20+8×0.20+9×0.10+10×0.10+11×0.04+12×0.02+13×0.02+14×0.02=7.68(万元),超过6.5万元,故C错误.综上,给出结论中不正确的是C . 故选:C .【知识点】样本数据的数字特征7. 【答案】B【解析】因为 x 甲=26+28+29+31+315=29,x 乙=28+29+30+31+325=30,所以 x 甲<x 乙.又 s 甲2=9+1+0+4+45=185,s 乙2=4+1+0+1+45=2,所以 s 甲>s 乙,故由样本估计总体可知结论①④正确. 【知识点】样本数据的数字特征8. 【答案】D【解析】由图知 m 0=5.由中位数的定义知应该是第 15 个数与第 16 个数的平均值,由图知将数据从小到大排,第 15 个数是 5,第 16 个数是 6, 所以 m e =5+62=5.5,x =3×2+4×3+5×10+6×6+7×3+8×2+9×2+10×230≈5.97>5.5,所以 m 0<m e <x .【知识点】样本数据的数字特征、频率分布直方图9. 【答案】A【解析】由概念知中位数是中间两数的平均数,即 45+472=46,众数是 45,极差为 68−12=56.所以选A .【知识点】茎叶图、样本数据的数字特征10. 【答案】C【解析】甲地肯定进入,因为众数为 22,所以 22 至少出现两次,若有一天低于 22∘C ,则中位数不可能为 24;丙地肯定进入,令 x 为其中某天的日平均温度,则 10.8×5−(32−26)2=18>(x −26)2,若 x ≤21,上式显然不成立;乙地不一定进入,如 13,23,27,28,29.【知识点】样本数据的数字特征二、填空题(共6题)11. 【答案】众数;平均数;中位数【解析】甲、乙、丙三个厂家从不同角度描述了一组数据的特征.甲:该组数据8出现的次数最多;乙:该组数据的平均数x=4+6×3+8+9+12+138=8;丙:该组数据的中位数是7+92=8.【知识点】样本数据的数字特征12. 【答案】80【知识点】分层抽样13. 【答案】68【解析】由表知x=30,设模糊不清的数据为m,则y=15×(62+y+75+81+89)=307+m5,因为y=0.67x+54.9,即307+m5=0.67×30+54.9,解得m=68.【知识点】样本数据的数字特征14. 【答案】9【解析】设样本容量为n,则(0.1+0.12)n=11,解得n=50,故气温不低于25.5∘C的城市个数为50×0.18=9.【知识点】频率分布直方图15. 【答案】0.030;3【解析】因为0.005×10+0.035×10+a×10+0.020×10+0.010×10=1,所以a=0.030.设身高在[120,130),[130,140),[140,150]内的三组学生分别有x,y,z人.则x100=0.030×10,解得x=30.同理,y=20,z=10.故从身高在[140,150]内的学生中选取的人数为1030+20+10×18=3.【知识点】分层抽样、频率分布直方图16. 【答案】5;7【解析】样本容量为10的一组样本数据依次为:3,9,0,4,1,6,6,8,2,7,从小到大排列为:0,1,2,3,4,6,6,7,8,9,因为10×50%=5,所以该组数据的第50百分位数是4+62=5.因为10×75%=7.5,第75百分位数是7.【知识点】样本数据的数字特征三、解答题(共6题)17. 【答案】分组,频数累计,计算频数和频率.【知识点】频率分布直方图18. 【答案】对男生得分由小到大排序为35,38,44,46,46,54,55,56,57,58,58,58,63,66,70,73,75,85,90,94,共20个数据,所以20×25%=5,20×50%=10,20×75%=15,则25%分位数为46+542=50,50%分位数为58+582=58,75%分位数为70+732=71.5.对女生得分由小到大排序为51,52,55,58,63,63,65,69,69,70,74,76,77,77,83,83,89,100,共18个数据.所以18×25%=4.5,18×50%=9,18×75%=13.5,则25%分位数为63,50%分位数为69+702=69.5,75%分位数为77.【知识点】样本数据的数字特征19. 【答案】根据题意,全班平均成绩为x=90×2040+80×2040=85,第一组的平均数为x1=90,方差为s12=16.第二组的平均数为x2=80,方差为s22=36.则该班学生的方差为s2=2040[s12+(x1−x)2]+2040[s22+(x2−x)2]=12[16+(90−85)2]+12[36+(80−85)2]=51.所以s=√51.综上可得,该班学生这次考试成绩的平均数和标准差分别为85和√51.11 【知识点】样本数据的数字特征20. 【答案】根据题意,设分布在 [40,50),[50,60) 内的数据个数分别为 x ,y .因为样本中数据在 [20,60) 内的频率为 0.6,样本容量为 50,所以4+5+x+y 50=0.6,解得 x +y =21.即样本在 [40,50),[50,60) 内的数据个数之和为 21.【知识点】频率与频数21. 【答案】该武警大队共有 30+30+40=100(人),按比例分配所以第一中队参加考核人数为30100×30=9(人),第二中队参加考核人数为 30100×30=9(人), 第三中队参加考核人数为 40100×30=12(人).所参加考核的 30 人的平均射击环数为 930×8.8+930×8.5+1230×8.1=8.43(环).所以估计该武警大队的平均射击水平为 8.43 环.【知识点】分层抽样22. 【答案】(1) 频率分布表如下:频率分布直方图如下:(2) 该 100 户用户 11 月的平均用电量 x =50×0.04+150×0.12+250×0.24+350×0.3+450×0.26+550×0.04=324 度,所以估计全市住户 11 月的平均用电量为 324 度.(3) y 1=0.65x ,y 2={0.61x,0≤x ≤2000.66(x −200)+122=0.66x −10,200<x ≤4000.91(x −400)+254=0.91x −110,x >400. 由 y 2≤y 1 得 {0.61x ≤0.65x,0≤x ≤200或 {200<x ≤400,0.66x −10≤0.65x 或 {0.91x −110≤0.65x,x >400, 解得 x ≤1100.26≈423.1,因 x ∈N ,故 x 的最大值为 423,根据频率分布直方图,x ≤423 时的频率为 0.04+0.12+0.24+0.3+23×0.26=0.7598>0.75,故估计“阶梯电价”能给不低于 75% 的用户带来实惠.【知识点】频率分布直方图、样本数据的数字特征、函数模型的综合应用。

人教A版高一数学必修第二册第九章《统计》单元练习题卷含答案解析 (27)

人教A版高一数学必修第二册第九章《统计》单元练习题卷含答案解析 (27)

高一数学必修第二册第九章《统计》单元练习题卷9(共22题)一、选择题(共10题)1.某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A.月接待游客量逐月增加B.年接待游客量逐年增加C.各年的月接待游客量高峰期大致在7,8月D.各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳2.A,B两名同学在5次数学考试中的成绩统计如图的茎叶图所示,若A,B两人的平均成绩分别是x A,x B,观察茎叶图,下列结论正确的是( )A.x A<x B,A比B成绩稳定B.x A>x B,A比B成绩稳定C.x A<x B,B比A成绩稳定D.x A>x B,B比A成绩稳定3.演讲比赛共有9位评委分别给出某选手的原始评分,评定该选手的成绩时,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分.7个有效评分与9个原始评分相比,不变的数字特征是( )A.中位数B.平均数C.方差D.极差4.如图所示的茎叶图记录了甲、乙两名同学在10次英语听力比赛中的成绩(单位:分),已知甲得分的中位数为76分,乙得分的平均数是75分,则下列结论正确的是( )A.x甲=76B.甲数据中x=3,乙数据中y=6 C.甲数据中x=6,乙数据中y=3D.乙同学成绩较为稳定5.如图所示的是一容量为100的样本的频率分布直方图,则由图形中的数据,可知其中位数为( )A.12.5B.13C.13.5D.146.右面茎叶图表示的是甲、乙两人在5次综合测评中的成绩,其中一个数字被污损.则甲的平均成绩超过乙的平均成绩的概率为( )A.25B.710C.45D.9107.为了了解某校高三学生每天的作业量,通过简单随机抽样从该校高三学生中抽取了60名学生,通过调查发现这60名学生每天完成作业平均用时2小时,则可以推测该校高三学生每天完成作业所需时间的平均数( )A.一定为2小时B.高于2小时C.低于2小时D.约为2小时8.某班有48名学生,在一次考试中统计出平均分为70,方差为75,后来发现有2名学生的成绩有误,学生甲实得80分却记为50分,学生乙实得70分却记为100分,更正后平均分和方差分别是( )A.70,25B.70,50C.70,5√2D.65,259.已知100个数据的75%分位数是9.3,则下列说法正确的是( )A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数10.16位参加百米半决赛同学的成绩各不相同,按成绩取前8位进入决赛.如果小刘知道了自己的成绩后,要判断他能否进入决赛,则其他15位同学成绩的下列数据中,能使他得出结论的是( )A.平均数B.极差C.中位数D.众数二、填空题(共6题)11.某住宅小区有居民2万户,从中随机抽取200户,调查是否安装宽带,调查结果如下表所示:宽带动迁户原住户已安装6035未安装4560则该小区已安装宽带的户数估计有户.12.某单位工会组织75名会员观看《光荣与梦想》、《觉醒年代》、《跨过鸭绿江》三部建党百年优秀电视,对这三部剧的观看情况统计如表,则会员中看过《跨过鸭绿江》的共有人,三部电视剧中,看过至少一部的有人.观看情况观看人数只看过《光荣与梦想》12只看过《觉醒年代》11只看过《跨过鸭绿江》8只看过《光荣与梦想》和《觉醒年代》7只看过《光荣与梦想》和《跨过鸭绿江》4只看过《觉醒年代》和《跨过鸭绿江》5同时看过《光荣与梦想》、《觉醒年代》和《跨过鸭绿江》2113.某高中在校学生有2000人,为了响应“阳光体育运动”的号召,学校开展了跑步和登山的比赛活动,每人都参与而且只能参与其中一项比赛,各年级参与比赛的人数情况如下表:高一年级高二年级高三年级跑步a b c登山x y z其中a∶b∶c=2∶3∶5,全校参与登山的人数占总人数的2.为了了解学生对本次活动的满意程度,从中抽取一个200人的样本进行调查,则从高二年级5参与跑步的学生中应抽取的人数为.14.某单位200名职工的年龄分布情况如图所示,现要从中随机抽取50名职工的年龄作为样本,若采用分层随机抽样的方法,则40∼50岁年龄段应抽取人.15.某学校为调查学生的身高情况,从高二年级的220名男生和180名女生中,根据性别采用按比例分配的分层抽样方法,随机抽取容量为40的样本.样本中男,女生的平均身高分别是178.6cm,164.8cm,该校高二年级学生的平均身高估计为cm.(精确到0.01cm)16.判断下列结论是否正确(请在括号中打“√”或“×”).(1)简单随机抽样每个个体被抽到的机会不一样,与先后有关.( )(2)一组数据的众数可以是一个或几个,那么中位数也具有相同的结论.( )(3)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.( )三、解答题(共6题)17.某超市计划按月订购一种酸奶,每天进货量相同,已知每售出一箱酸奶的利润为50元,当天未售出的酸奶降价处理,以每箱亏损10元的价格全部处理完.若供不应求,可从其它商店调拨,每销售1箱可获利30元.假设该超市每天的进货量为14箱,超市的日利润为y元.为确定以后的订购计划,统计了最近50天销售该酸奶的市场日需求量,其频率分布表如图所示.(1) 求a,b,m,n,P的值;(2) 求y关于日需求量x(10≤x≤20)的函数表达式;(3) 以50天记录的酸奶需求量的频率作为酸奶需求量发生的概率,估计日利润在区间[580,760)内的概率.18.为了解学生的周末学习时间(单位:小时),高一年级某班班主任对本班40名学生某周末的学习时间进行了调査,将所得数据整理绘制出如图所示的频率分布直方图,根据直方图所提供的信息:(1) 求该班学生周末的学习时间不少于20小时的人数.(2) 估计这40名同学周末学习时间的25%分位数.(3) 如果用该班学生周末的学习时间作为样本去推断该校高一年级全体学生周末的学习时间,这样推断是否合理?说明理由.19.某科研课题组通过一款手机APP软件,调查了某市1000名跑步爱好者平均每周的跑步量(简称“周跑量”),得到如下的频数分布表:周跑量(km/周)[10,15)[15,20)[20,25)[25,30)[30,35)[35,40)[40,45)[45,50)[50,55)人数100120130180220150603010(1) 补全该市1000名跑步爱好者周跑量的频率分布直方图;注:请先用铅笔画,确定后再用黑色水笔描黑.(2) 根据以上图表数据计算得样本的平均数为28.5km,试求样本的中位数(保留一位小数),并用平均数、中位数等数字特征估计该市跑步爱好者周跑量的分布特点.(3) 根据跑步爱好者的周跑量,将跑步爱好者分成以下三类,不同类别的跑者购买的装备的价格不一样,如表:周跑量小于20公里20公里到40公里不小于40公里类别休闲跑者核心跑者精英跑者装备价格(单位:元)250040004500根据以上数据,估计该市每位跑步爱好者购买装备,平均需要花费多少元?20.为保障食品安全,某地食品监管部门对辖区内甲、乙两家食品企业进行检查,分别从这两家企业生产的某种同类产品中随机抽取了100件作为样本,并以样本的一项关键质盘指标值为检测依据.已知该质量指标值对应的产品等级如下:质量指标值[15,20)[20,25)[25,30)[30,35)[35,40)[40,45]等级次品二等品一等品二等品三等品次品根据质量指标值的分组,统计得到了甲企业的样本频率分布直方图和乙企业的样本频数分布表(图表如图,其中a>0).质量指标值频数[15,20)2[20,25)18[25,30)48[30,35)14[35,40)16[40,45]2合计100(1) 现从甲企业生产的产品中任取一件,试估计该件产品为次品的概率.(2) 根据图表数据,请自定标准,对甲、乙两企业食品质量的优劣情况进行比较.21.一个频数分布表(样本容量为50)不小心被损坏了一部分,只记得样本中数据在[20,60)内的频率为0.6,试计算样本在[40,50),[50,60)内的数据个数之和.22.某生产企业对其所生产的甲、乙两种产品进行质量检测,分别抽取6件产品检测其质量的误差,测得数据如下(单位:mg):甲:13,15,13,8,14,21;乙:15,13,9,8,16,23.(1) 画出样本数据的茎叶图;(2) 分别计算甲、乙两组数据的方差,并分析甲、乙两种产品的质量(精确到0.1).答案一、选择题(共10题)1. 【答案】A【解析】对于选项A,由图易知月接待游客量每年7,8月份明显高于12月份,故A错;对于选项B,观察折线图的变化趋势可知年接待游客量逐年增加,故B正确;对于选项C,D,由图可知显然正确.【知识点】频率分布直方图2. 【答案】C【解析】由茎叶图知,可知道甲的成绩为96,91,92,103,128,平均成绩为102;乙的成绩为99,108,107,114,112,平均成绩为106;从茎叶图上可以看出B的数据比A的数据集中,B比A成绩稳定,故选:C.【知识点】样本数据的数字特征、茎叶图3. 【答案】A【解析】根据题意,从9个原始评分中去掉1个最高分,1个最低分,得到7个有效评分,7个有效评分与9个原始评分相比,最中间的一个数不变,即中位数不变.【知识点】样本数据的数字特征4. 【答案】C【解析】因为甲得分的中位数为76分,所以x=6,=75,故A,B错误;所以x甲因为乙得分的平均数是75分,=75,解得y=3,故C正确;由茎叶图中甲、乙成绩的所以56+68+68+70+72+(70+y)+80+86+88+8910分布可知D错误.【知识点】样本数据的数字特征、茎叶图5. 【答案】B【解析】中位数是把频率分布直方图分成两个面积相等部分的平行于纵轴的直线的横坐标,第一个矩形的面积是0.2,第二个矩形的面积是0.5,第三个矩形的面积是0.3,故将第二个矩形分成3:2即可,所以中位数是13.【知识点】频率分布直方图6. 【答案】C【解析】由已知中的茎叶图可得甲的5次综合测评中的成绩分别为88,89,90,91,92,则甲的平均成绩甲=88+89+90+91+925=90设污损数字为X,则乙的5次综合测评中的成绩分别为83,83,87,99,90+X则乙的平均成绩乙=83+83+87+99+90+X5=88.4+X5当X=8或9时,甲≤乙即甲的平均成绩不超过乙的平均成绩的概率为210=15则甲的平均成绩超过乙的平均成绩的概率P=1−15=45.【知识点】样本数据的数字特征、茎叶图7. 【答案】D【知识点】简单随机抽样8. 【答案】B【解析】学生甲少记30分,学生乙多记30分,则总分不变,由此可知平均分不发生变化.设其余46名学生的成绩分别为x1,x2,⋯,x46,则原方差s2=148[(x1−70)2+(x2−70)2+⋯+(x46−70)2+(50−70)2+(100−70)2]=75,更正后方差sʹ2=148[(x1−70)2+(x2−70)2+⋯+(x46−70)2+(80−70)2+(70−70)2]=s2−148×[(50−70)2+(100−70)2]+148×[(80−70)2+(70−70)2]=50.【知识点】样本数据的数字特征9. 【答案】C【解析】因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为75%分位数,是9.3.【知识点】样本数据的数字特征10. 【答案】C【解析】判断是不是能进入决赛,只要判断是不是前8名,所以只要知道其他15位同学的成绩中是不是有8个高于他,也就是把其他15位同学的成绩排列后看第8个的成绩即可,小刘的成绩高于这个成绩就能进入决赛,低于这个成绩就不能进入决赛,这个第8名的成绩就是这15位同学成绩的中位数.【知识点】样本数据的数字特征二、填空题(共6题)11. 【答案】9500【知识点】用样本估计总体12. 【答案】38;68【解析】根据题意,将数据利用韦恩图表示,如图所示:由图可知看过《跨过鸭绿江》的共有21+4+5+8=38人;三部电视剧中,看过至少一部的有12+7+21+4+8+5+11=68人.【知识点】频率分布直方图13. 【答案】36【解析】根据题意,可知样本中参与跑步的人数为200×35=120.所以从高二年级参与跑步的学生中应抽取的人数为120×32+3+5=36.【知识点】分层抽样14. 【答案】15【解析】50×30%=15(人).【知识点】分层抽样15. 【答案】172.39【解析】高二年级男女比例为220180=119,所以平均身高为: 178.6×1120+164.8×920=98.23+74.16=172.39.故该校高二学生平均身高为172.39cm.【知识点】样本数据的数字特征16. 【答案】 × ; × ; √【知识点】样本数据的数字特征、简单随机抽样、频率分布直方图三、解答题(共6题)17. 【答案】(1) a =50×0.16=8,b =1250=0.24,m =50×0.3=15,n =50−8−12−15−5=10,P =1050=0.2;(2) 超市的日利润 y 关于日需求量 x 的函数表达式为y ={50×14+30×(x −14),14≤x ≤20,50x −10×(14−x ),10≤x <14,即 y ={30x +280,14≤x ≤2060x −140,10≤x <14.(3) 由(2)知:当 10≤x <14 时,y =60x −140,令 580≤y <760,解得 12≤x <14.当 14≤x ≤20 时,y =30x +280,令 580≤y <760,解得 14≤x <16;所以 y ∈[580,760) 时,x ∈[12,16),故所求概率为 0.24+0.30=0.54.【知识点】函数模型的综合应用、频率分布直方图、建立函数表达式模型18. 【答案】(1) 由图可知,该班学生周末的学习时间不少于 20 小时的频率为 (0.03+0.015)×5=0.225, 则 40 名学生中周末的学习时间不少于 20 小时的人数为 40×0.225=9.(2) 学习时间在 5 小时以下的频率为 0.02×5=0.1<0.25,学习时间在 10 小时以下的频率为 0.1+0.04×5=0.3>0.25,所以 25% 分位数在 (5,10),5+5×0.25−0.10.2=8.75,则这 40 名同学周末学习时间的 25% 分位数为 8.75.(3) 不合理,样本的选取只选在高一某班,不具有代表性.【知识点】频率分布直方图、样本数据的数字特征19. 【答案】(1) 补全该市 1000 名跑步爱好者周跑量的频率分布直方图,如下:(2) 中位数的估计值:由 5×0.02+5×0.024+5×0.026=0.35<0.5,0.35+5×0.036=0.53>0.5,所以中位数位于区间 [25,30) 中,设中位数为 x ,则 0.35+(x −25)×0.036=0.5,解得 x ≈29.2,因为 28.5<29.2,所以估计该市跑步爱好者多数人的周跑量多于样本的平均数.(3) 依题意可知,休闲跑者共有 (5×0.02+5×0.024)×1000=220 人,核心跑者 (5×0.026+5×0.036+5×0.044+5×0.030)×1000=680 人,精英跑者 1000−220−680=100 人,所以该市每位跑步爱好者购买装备,平均需要 220×2500+680×4000+100×45001000=3720 元.【知识点】样本数据的数字特征、频率分布直方图20. 【答案】(1) 由题意知 (a +0.020+0.022+0.028+0.042+0.080)×5=1,解得 a =0.008,所以甲企业的样本中次品的频率为 (a +0.020)×5=0.14,故从甲企业生产的产品中任取一件,该件产品是次品的概率约为 0.14.(2) 答案不唯一,只要言之有理便可(下面给出几种参考答案).①以产品的合格率(非次品的占有率)为标准,对甲、乙两家企业的食品质量进行比较.由图表可知:甲企业产品的合格率约为 0.86,乙企业产品的合格率约为 0.96,即乙企业产品的合格率高于甲企业产品的合格率,所以可以认为乙企业的食品生产质量更高.②以产品次品率为标准,对甲、乙两家企业的食品质量进行比较(略).③以产品中一等品的概率为标准,对甲、乙两家企业的食品质量进行比较.根据图表可知,甲企业产品中一等品的概率约为 0.4;乙企业产品中一等品的概率约为 0.48,即乙企业产品中一等品的概率高于甲企业产品中一等品的概率,所以乙企业的食品生产质量更高.【知识点】频率分布直方图21. 【答案】根据题意,设分布在 [40,50),[50,60) 内的数据个数分别为 x ,y .因为样本中数据在 [20,60) 内的频率为 0.6,样本容量为 50,所以4+5+x+y 50=0.6,解得 x +y =21.即样本在 [40,50),[50,60) 内的数据个数之和为 21.【知识点】频率与频数22. 【答案】(1) 如图所示.(2) 甲的平均数是8+13+13+14+15+216=14, 乙的平均数是 8+9+13+15+16+236=14; 甲的方差是 s 甲2=16×[(−6)2+(−1)2+(−1)2+02+12+72]≈14.7,乙的方差是 s 乙2=16×[(−6)2+(−5)2+(−1)2+12+22+92]≈24.7. 所以甲产品质量好,较稳定.【知识点】样本数据的数字特征。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

高一数学统计试题1.样本中共有五个个体,其值分别为a,0,1,2,3,若该样本的平均值为1,则样本方差为()A.B.C.D.2【答案】D【解析】由题意知,解得a=-1,∴样本方差为S2=,故选D.【考点】方差与标准差.2.已知x与y之间的几组数据如下表:则y与x的线性回归方程=x+必过点()A.(1,2) B.(2,6) C. D.(3,7)【答案】C【解析】回归直线必过样本中心点,由表格可求得.【考点】回归分析.3.用秦九韶算法计算多项式在时的值时,的值为【答案】-57【解析】由秦九韶算法知,当时,.【考点】算法案例.4.为预防X病毒爆发,某生物技术公司研制出一种X病毒疫苗,为测试该疫苗的有效性(若疫苗有效的概率小于90%,则认为测试没有通过),公司选定2000个样本分成三组,测试结果如下表:组组组67390已知在全体样本中随机抽取1个,抽到组疫苗有效的概率是0.33.(1)现用分层抽样的方法在全体样本中抽取360个测试结果,应在组抽取样本多少个?(2)已知,,求通过测试的概率.【答案】(1)90(2)【解析】(I)根据分层抽样的定义,按每层中的比例即可计算出组抽取样本的个数;(II)由(I),再结合题设条件,列举出所有可能的组合的个数及没有通过测试的组合的个数,再由概率公式及概率的性质求出通过测试的概率.(I)∵,∴,∵,∴应在组抽取样个数是(个).(II)∵,,,∴(,)的可能性是 (465,35),(466,34),(467,33),(468,32),(469,31),(470,30),若测试没有通过,则,,(,)的可能性是(465,35),(466,34),通过测试的概率是.【考点】1、分层抽样;2.、古典概型;3、估测能力.5.某校从高一年级学生中随机抽取40名学生作为样本,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六组:,,后得到如图的频率分布直方图.(Ⅰ)求图中实数的值;(Ⅱ)若该校高一年级共有学生500人,试估计该校高一年级在考试中成绩不低于60分的人数;(Ⅲ)若从样本中数学成绩在与两个分数段内的学生中随机选取两名学生,试用列举法求这两名学生的数学成绩之差的绝对值不大于10的概率.【答案】(1)0.03(2)425(3)【解析】解:(Ⅰ)由可得 2分(Ⅱ)数学成绩不低于60分的概率为:4分数学成绩不低于60分的人数为人 5分(Ⅲ)数学成绩在的学生人数:人 6分数学成绩在的学生人数:人 7分设数学成绩在的学生为,数学成绩在的学生为 8分两名学生的结果为:,共种 10分其中两名学生的数学成绩之差的绝对值不大于10的情况有,,,,,,共7种, 12分因此,抽取的两名学生的数学成绩之差的绝对值不大于10的概率为 13分【考点】直方图以及古典概型点评:主要是考查了直方图以及古典概型概率的计算,属于基础题。

6.某交警部门对城区上下班交通情况作抽样调查,上下班时间各抽取12辆机动车的行驶速度(单位:km/h)作为样本进行研究,做出样本的茎叶图,则上班、下班时间行驶速度的中位数分别是()A.2827.5B.2828.5C.2927.5D.2928.5【答案】C【解析】据已知中的茎叶图,我们易得到左右两边两组数据的值,然后根据中位数的定义,即可得到答案.解:由已知中茎叶图,我们易得左右两边的数据分别为:左:18,20,21,26,27,28,30,32,33,35,36,40;右:16,17,19,22,25,27,28,30,30,32,36,37;左右两边的中位数分别为:,故可知选C.【考点】中位数、茎叶图点评:本题考查的知识点是中位数、茎叶图,其中根据茎叶图分析出两组数据是解答本题的关键.7.某商品销售量y(件)与销售价格x()负相关,则其回归方程可能是()A. B. C. D【答案】A【解析】由于某商品销售量y(件)与销售价格x()负相关,所以画成的散点图是从左上方到右下方分布,则回归直线的斜率小于0,又因为C项中销售价格,所以销售量,这显然不成立。

故选A。

【考点】回归分析点评:若数据成负相关,则画成的散点图是从左上方到右下方分布;若数据成正相关,则画成的散点图是从左下方到右上方分布。

8.在我县举行的“建县2700年”唱红歌比赛活动中,共有40支参赛队。

有关部门对本次活动的获奖情况进行了统计,并根据收集的数据绘制了图6、图7两幅不完整的统计图,请你根据图中提供的信息解答下面的问题:1、获一、二、三等奖各有多少参赛队?2、在答题卷上将统计图图6补充完整。

3、计算统计图图7中“没获将”部分所对应的圆心角的度数4、求本次活动的获奖概率。

图6【答案】(1)6;10;16(2)见解析(3)(4)【解析】(1)先求得获一、二等奖的人数,再求得没等奖所占的百分比,从而得出三等奖的人数;(2)根据(1)的数据将图1补全即可;(3)用人数除以总人数乘以360°即可;(4)用获一、二、三等奖的人数之和除以总人数即可.解:(1)一等奖:40×15%=6(支)二等奖:(支)三等奖:40-10-6-8=16(2)(3)(4)9.(本题满分12分)对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到的观测值如下:甲:6080709070乙:8060708075问:甲、乙谁的平均成绩好?谁的各门功课较平衡?【答案】甲的平均成绩较好,乙的各门功课较平衡.【解析】第一问中,利用给出的数据,结合平均值的公式可知甲,乙,s甲,s乙然后根据平均值来看谁的平均数大就是成绩好,而方差越小说明越平稳。

解:甲=×(60+80+70+90+70)=74,乙=×(80+60+70+80+75)=73,s甲=≈10.2,s乙=≈7.5.因为甲>乙,s甲>s乙.所以甲的平均成绩较好,乙的各门功课较平衡.10.,,,的平均数为,方差为,则数据,,,的平均数和方差分别是()A.和B.和C.和D.和【答案】C【解析】故选C11.调查机构对本市小学生课业负担情况进行了调查,设平均每人每天做作业的时间为分钟.有1000名小学生参加了此项调查,调查所得数据用程序框图处理,若输出的结果是680,则平均每天做作业的时间在0~60分钟内的学生的频率是] ()A. 680B. 320C. 0.68D. 0.32【答案】C【解析】略12.(12分)一个路口的红绿灯,红灯的时间为秒,黄灯的时间为秒,绿灯的时间为秒,当你到达路口时看见下列三种情况的概率各是多少?(1) 红灯 (2) 黄灯 (3) 不是红灯【答案】解:总的时间长度为秒,设红灯为事件,黄灯为事件,(1)出现红灯的概率·········4分(2)出现黄灯的概率········8分(3)不是红灯的概率·········12分【解析】略13.甲乙两位同学在高三的5次月考中数学成绩统计如茎叶图所示,若甲乙两人的平均成绩分别是,则下列正确的是()A.;甲比乙成绩稳定B.;甲比乙成绩稳定C.;乙比甲成绩稳定D.;乙比甲成绩稳定【答案】C【解析】略14.一个社会调查机构就某地居民的月收入调查了10 000人,并根据所得数据画了样本的频率分布直方图(如下图).为了分析居民的收入与年龄、学历、职业等方面的关系,要从这10 000人中再用分层抽样方法抽出80人作进一步调查,则在[1 500,2 000)(元)月收入段应抽出人.【答案】16【解析】略15.统计某校1000名学生的数学水平测试成绩,得到样本频率分布直方图如图所示,若满分为100分,规定不低于60分为及格,则及格率是()A.20%B.25%C.6%D.80%【答案】D【解析】略16.如图是总体的一个样本频率分布直方图,且在[15,18)内频数为8.则样本容量=_________【答案】【解析】略17.有如下四个游戏盘,撒一粒黄豆,若落在阴影部分,怎可以中奖,小明希望中奖,则他应该选择的游戏是【答案】A【解析】四个游戏盘中奖的概率分别是,最大的是,故选A[18.将参加夏令营的600名学生编号为:001,002,…,600.采用系统抽样方法抽取个容量为50的样本,且在第一段中随机抽得的号码是003.这600名学生分别住在三个营区,从001到300在第一营区,从301到495在第二营区,从496到600在第三营区.则三个营区被抽到的人数分别为A.25,17,8B.25,16,9C.26,16,8D.24,17,9【答案】A【解析】析:由于是系统抽样,故先随机抽取第一数,再确定间隔,可知样本组成以3为首项,12为公差的等差数列,由此可得结论.解答:解:由题意,在随机抽样中,首次抽到003号,以后每隔12个号抽到一个人,则分别是003、015、027、039构成以3为首项,12为公差的等差数列,故可分别求出在001到300中有25人,在301至495号中共有17人,则496到600中有8人.故选A.19.如图是甲、乙两名篮球运动员某赛季一些场次得分的茎叶图,中间的数字表示得分的十位数,据图可知()A.甲运动员的最低得分为0分B.甲运动员得分的众数为44分C.乙运动员得分的中位数是29分D.乙运动员得分的平均值在区间(11、19)内【答案】B【解析】略20.阅读程序,输出的结果是____________________【答案】5,9,2【解析】略。

相关文档
最新文档