统计有关经典例题解析、及高考题50道,带答案
(精选试题附答案)高中数学第九章统计经典大题例题

(名师选题)(精选试题附答案)高中数学第九章统计经典大题例题单选题1、某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数表法在该中学抽取容量为n的样本,则n等于()A.80B.160C.200D.280答案:C分析:每个个体被抽的可能性等于样本容量除以总体数,由此列出关于n的方程并求解出结果.=0.2,解得n=200,由题意可知:n400+320+280故选:C.2、某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:则该校学生一周进行课外锻炼的时间的第40百分位数是()A.8.5B.8C.7D.9答案:A分析:根据百分位数的求法计算即可.抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,=8.5.即8+92故选: A.3、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.4、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错.误.的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,B 由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.5、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A6、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A .1组B .2组C .3组D .4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s =4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B .8、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( )A .4a mB .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1, 对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有a m =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.9、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19 C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为310. 故选:C10、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是( )A .1200名学生是总体B .每个学生是个体C .样本容量是100D .抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.填空题11、某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取__________________.答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A区的人数,得到A区要抽取的人数.解:由题意知A区在样本中的比例为700020000∴A区应抽取的人数是700020000×600=210.所以答案是:210.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)答案:a=b##b=a分析:由百分位数求法得50为第60百分位数,并确定数据的众数,即可比较它们的大小关系.因为8×60%=4.8,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是a=b.所以答案是:a=b14、某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152 ,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170 ,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.答案:172分析:根据百分位数的意义求解.百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,=173,x=172本题第90百分位数是173,所以x+1742故答案为:172小提示:本题考查样本数据的第多少百分位数的概念.15、气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_____.答案:①③分析:根据数据的特点进行估计甲、乙、丙三地连续5天的日平均气温的记录数据,分析数据的可能性进行解答即可得出答案.①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22、22、24、25、26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19、20、27、27、27,可知其连续5天的日平均温度有低于22,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22,如22、25、25、26、32,这组数据的平均值为26,方差为10.8,但是进一步扩大方差就会超过10.8,故③对.则肯定进入夏季的地区有甲、丙两地,故答案为①③.小提示:本题考查中位数、众数、平均数、方差的数据特征,简单的合情推理,解答此题应结合题意,根据平均数的计算方法进行解答、取特殊值即可.解答题16、为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a的值;(2)估计这种植物果实重量的平均数x̅(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于37.5克的即为优质果实,现对该种植物果实的某批10000个果实进行检测.据此估算这批果实中的优质果实的个数.答案:(1)a=0.050(2)40(3)7000分析:(1)由各组频率之和为1(面积之和为1)可求得;(2)频率分布直方图用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和估计平均数;(3)用样本频率估计总体概率进行求解.(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050;(2)这种植物果实重量的平均数约为:30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40,∴这种植物果实重量的平均数x̅的估计值约为40.(3)样本中,这种植物果实重量不低于37.5克,即优质果实的频率为0 .075×5+0.050×5+0.015×5=0.7,由此估计某批10000个果实中,重量不低于37.5克,即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10000×0.7=7000个.17、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可. (1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.18、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.19、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.。
统计案例练习题(附答案)

统计案例练习题(附答案)一、选择题 1.对具有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b( ) A.可以小于0 B.只能大于0 C.可能等于0 D.只能小于0 【解析】b可能大于0,也可能小于0,但当b=0时,x,y不具有线性相关关系.【答案】 A 2.下列两个变量间的关系不是函数关系的是( ) A.正方体的棱长与体积 B.角的弧度数与它的正弦值 C.单产为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量【解析】∵A、B、C都可以得出一个函数关系式,而D不能写出确定的函数关系式,它只是一个不确定关系.【答案】 D 3.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元) 4 2 3 5 销售额y(万元) 49 26 39 54 根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.36万元 B.65.5万元C.67.7万元 D.72.0万元【解析】x=4+2+3+54=3.5, y=49+26+39+544=42,∴a=y-bx=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B. 【答案】 B 4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y) B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(xn,bn)中的一个点 C.直线y=bx+a的斜率为∑ni=1xiyi-nx•y∑ni=1x2i-nx2 D.直线y=bx+a的纵截距为y-bx 【解析】回归直线可以不经过任何一个点.其中A:由a=y-bx代入回归直线方程y=bx+y-ax,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B 5.已知两个变量x和y 之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y 的观测数据的平均数都是t,则下列说法正确的是( ) A.l1与l2一定有公共点(s,t) B.l1与l2相交,但交点一定不是(s,t) C.l1与l2必定平行 D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A 二、填空题 6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg 7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1xiyi=1 481. b=1 481-6×72×7179--1.818 2, a=71-(-1.8182)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】由上表可得,y=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.【答案】 1.818 2 8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 【答案】0.254 三、解答题 9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y关于工作年限x的线性回归方程; (2)若第6名推销员的工作年限为11年,试估计他的年推销金额.【解】(1)设所求的线性回归方程为y=bx+a,则b=i=--=-=1020=0.5, a=y-bx=0.4. 所以年推销金额y关于工作年限x的线性回归方程为y=0.5x+0.4. (2)当x=11时,y=0.5x+0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元. 10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11). (1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程. (2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】(1)设回归方程为y=a+bx,则x=8+12+14+164=12.5, y=5+8+9+114=8.25,∑4i=1x2i=660,∑4i =1xiyi=438, b=∑4i=1xiyi-4xy∑4i=1x2i-4x2=438-4×12.5×8.25660-4×12.52≈0.73, a=y-bx=8.25-0.73×12.5=-0.875,所以所求回归方程为y=-0.875+0.73x. (2)由y≤10,即-0.875+0.73x≤10,得x≤10.8750.73≈15,即机器速度不得超过15转/秒. 11.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 xi 24 15 23 19 16 11 20 16 17 13 yi 9279 97 89 64 47 83 68 71 59 xiyi 2 208 1 185 2 231 1 691 1 024 517 1 660 1 088 1 207 767 ∑10i=1x2i=3 182,∑10i=1xiyi=13 578于是可得b=∑10i=1xiyi-10xy∑10i=1x2i-10x2=545.4154.4≈3.53, a=y-bx=74.9-3.53×17.4≈13.5. 因此可求得回归直线方程为y=3.53x+13.5. 当x=18时,y=3.53×18+13.5≈77. 故该同学预计可得77分左右.。
2021新高考数学专题24统计图表的应用附参考答案3

方法技巧专题24 统计图表的应用学生篇一、统计图表的应用知识框架二、统计图表的应用题型分析【一】频率分布直方图在频率分布直方图中:①各小矩形的面积表示相应各组的频率,各小矩形的高=;频率组距②各小矩形面积之和等于1;③中位数左右两侧的直方图面积相等,因此可以估计其近似值,为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标;④众数是最高矩形中点的横坐标;⑤频率分布直方图中均值等于组中值与对应概率乘积的和.1.1.例题例题【例1】我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨).将数据按照[0,0.5),[0.5,1),…,[4,4.5]分成9组,制成了如图所示的频率分布直方图.(1)求直方图中a 的值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数,说明理由;(3)估计居民月均用水量的中位数.【例2】(2019年高考全国Ⅲ卷文数)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.(1)求乙离子残留百分比直方图中a,b的值;(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).2.巩固提升综合练习【练习1】某工厂有工人1000名,其中250名工人参加过短期培训(称为A类工人),另外750名工人参加过长期培训(称为B类工人),现用分层抽样方法(按A类、B类分二层)从该工厂的工人中共抽查100名工人,调查他们的生产能力(此处生产能力指一天加工的零件数).(Ⅰ)求甲、乙两工人都被抽到的概率,其中甲为A类工人,乙为B类工人;(Ⅱ)从A类工人中的抽查结果和从B类工人中的抽查结果分别如下表1和表2.表1:生产能力分组[100,110) [110,120) [120,130) [130,140) [140,150)人数 4 8 x 5 3 表2生产能力分组[110,120) [120,130) [130,140) [140,150)人数 6 y36 18(i)先确定x,y,再在答题纸上完成下列频率分布直方图.就生产能力而言,A类工人中个体间的差异程度与B类工人中个体间的差异程度哪个更小?(不用计算,可通过观察直方图直接回答结论)图1 A类工人生产能力的频率分布直方图图2 B类工人生产能力的频率分布直方图(ii)分别估计A类工人和B类工人生产能力的平均数,并估计该工厂工人的生产能力的平均数(同一组中的数据用该组区间的中点值作代表).【练习2】某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[20,30),[30,40),┄,[80,90],并整理得到如下频率分布直方图:(Ⅰ)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(Ⅱ)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[40,50)内的人数;(Ⅲ)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相等.试估计总体中男生和女生人数的比例.【练习3】某校从高一年级学生中随机抽取40名学生,将他们的期中考试数学成绩(满分100分,成绩均为不低于40分的整数)分成六段:,,…,后得到如图的频率分布直方图.(1)求图中实数的值;a (2)若该校高一年级共有学生640人,试估计该校高一年级期中考试数学成绩不低于60分的人数;(3)若从数学成绩在与两个分数段内的学生中随机选取两名学生,求这两名学生的[)40,50[]90,100数学成绩之差的绝对值不大于10的概率.【练习4】某市民用水拟实行阶梯水价.每人用水量中不超过立方米的部分按4元/立方米收费,超出w 立方米的部分按10元/立方米收费.从该市随机调查了10000位居民,获得了他们某月的用水量w 数据,整理得到如下频率分布直方图:方方方(方方方)方方方方0.50.40.30.20.1 4.543.532.521.510.5O(Ⅰ)如果为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w w至少定为多少?(Ⅱ)假设同组中的每个数据用该组区间的右端点值代替.当=3时,估计该市居民该月的人均水w 费.【二】茎叶图的应用茎叶图1、当数据有两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图.2、当数据有三位有效数字,前两位相对比较集中时,常以前两位为茎,第三位(个位)为叶(其余类推).3、通过茎叶图可观察出平均数、众数、中位数,数据分布的对称性等等,由于茎叶图保留了原始数1.例题【例1】如图所示的茎叶图记录了甲、乙两组各5名工人某日的产量数据(单位:件).若这两组数据的中位数相等,且平均值也相等,则x和y的值分别为 ( )分别为A. 3,5B. 5,5C. 3,7D. 5,7【例2】某学校A、B两个班的兴趣小组在一次对抗赛中的成绩如茎叶图所示,通过茎叶图比较两个班兴趣小组成绩的平均值及标准差.①A班兴趣小组的平均成绩高于B班兴趣小组的平均成绩;②B班兴趣小组的平均成绩高于A班兴趣小组的平均成绩;③A班兴趣小组成绩的标准差大于B班兴趣小组成绩的标准差;④B班兴趣小组成绩的标准差大于A班兴趣小组成绩的标准差.其中正确结论的编号为()A.①④B.②③ C.②④D.①③【例3】随机抽取某中学甲、乙两班各10名同学,测量他们的身高(单位:cm),获得身高数据的茎叶图(1)根据茎叶图判断哪个班的平均身高较高;(2)计算甲班的样本方差;(3)现从乙班这10名同学中随机抽取两名身高不低于173cm的同学,求身高为176cm的同学被抽中的概率.2.巩固提升综合练习【练习1】某兄弟俩都推销某一小家电,现抽取他们其中8天的销售量(单位:台),得到的茎叶图如图所示,已知弟弟的销售量的平均数为34,哥哥的销售量的中位数比弟弟的销售量的众数大2,则x +y 的值为【练习2】从甲、乙两种树苗中各抽测了株树苗的高度,其茎叶图如图所示.根据茎叶图,下列描述正10确的是( ( ) ) A .甲种树苗的高度的中位数大于乙种树苗高度的中位数,且甲种树苗比乙种树苗长得整齐B .甲种树苗的高度的中位数大于乙种树苗高度的中位数,但乙种树苗比甲种树苗长得整齐C .乙种树苗的高度的中位数大于甲种树苗高度的中位数,且乙种树苗比甲种树苗长得整齐D .乙种树苗的高度的中位数大于甲种树苗高度的中位数,但甲种树苗比乙种树苗长得整齐【练习3】甲、乙两名同学在】甲、乙两名同学在 6 次数学考试中,所得成绩用茎叶图表示如下,若甲、乙两人这 6 次考试的平均成绩分别用 表示,则下列结论正确的是( ) ,x x 乙甲A . ,且甲成绩比乙成绩稳定x x >乙甲B .B . ,且乙成绩比甲成绩稳定x x >乙甲C . ,且甲成绩比乙成绩稳定x x <乙甲D .D .,且乙成绩比甲成绩稳定x x <乙甲【三】其它类型的统计图表频率分布折线图:连结频率分布直方图各个长方形上边的中点,就得到频率分布折线图.总体密度曲线:随着样本容量的增加,分组的组距不断缩小,相应的频率分布折线图就会越来越接近于一条光滑曲线,这条光滑曲线就叫做总体密度曲线.总体密度曲线精确地反映了一个总体在各个区域内取值的规律.散点图:两个变量的关系可通过它们所对应的点在平面上表现出来,这些点对应的图形叫做散点图.【例1】某城市为了解游客人数的变化规律,提高旅游服务质量,收集并整理了2014年1月至2016年12月期间月接待游客量(单位:万人)的数据,绘制了下面的折线图.根据该折线图,下列结论错误的是( )A .月接待游客量逐月增加B .年接待游客量逐年增加C .各年的月接待游客量高峰期大致在7,8月D .各年1月至6月的月接待游客量相对于7月至12月,波动性更小,变化比较平稳【例2】已知随机变量,其正态分布密度曲线如图所示,若向长方形中随机投掷1()2,1X N ~OABC点,则该点恰好落在阴影部分的概率为( )附:若随机变量,则,()2,,Nξμσ~()0.6826Pμσξμσ-<≤+=. ()220.9544P μσξμσ-<≤+=A .0.1359 B .0.7282C .0.8641D .0.93205【例3】 图1是某县参加2007年高考的学生身高条形统计图,从左到右的各条形表示的学生人数依次记为A 1、图1 图2A 2、…、A m (如A 2表示身高(单位:cm)在[150,155)内的学生人数).图2是统计图1中身高在一定范围内学生人数的一个算法流程图.现要统计身高在160~180cm(含160cm ,不含180cm)的学生人数,那么在流程图中的判断框内应填写的条件是______. 2.巩固提升综合练习【练习1】是衡量空气质量的重要指标,我国采用世卫组织的最宽值限定值,即日均值在2.5PM 2.5PM 以下空气质量为一级,在空气量为二级,超过为超标.如图是某335/g m μ335~75/g m μ375/g m μ地12月1日至10日的(单位:)的日均值,则下列说法不正确的是( )2.5PM 3/g m μA .这天中有天空气质量为一级103B .从日到日日均值逐渐降低69 2.5PMC .这天中日均值的中位数是10 2.5PM 55D .这天中日均值最高的是月日10 2.5PM 126【练习2】 某学校为了了解本校学生的上学方式,在全校范围内随机抽查部分学生,了解到上学方式主要有:A 结伴步行,B 自行乘车,C 家人接送,D 其他方式,并将收集的数据整理绘制成如下两幅不完整的统计图.根据图中信息,可知本次抽查的学生中A 类人数是()A.30B.40 C.42 D.48【练习3】某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中A 点表示十月的平均最高气温约为15℃,B 点表示四月的平均最低气温约为5℃.下面叙述不正确的是A .各月的平均最低气温都在0℃以上 B .七月的平均温差比一月的平均温差大C .三月和十一月的平均最高气温基本相同D.平均最高气温高于20℃的月份有5个三、课后自我检测1.某单位200名职工的年龄分布情况如图,现要从中抽取40名职工作样本,用系统抽样法,将全体职工随机按1-200编号,并按编号顺序平均分为40组(1-5号,6-10号,…,196-200号).若第5组抽出的号码为22,则第8组抽出的号码应是______,若用分层抽样方法,则40岁以下年龄段应抽取______人.2.某位教师2017年的家庭总收入为80000元,各种用途占比统计如下面的折线图.2018年收入的各种用途占比统计如下面的条形图,已知2018年的就医费用比2017年增加了4750元,则该教师2018年的家庭总收入为()A.100000元 B.95000元 C.90000元 D.85000元3.(2018全国卷Ⅰ)某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例.得到如下饼图:则下面结论中不正确的是( )A.新农村建设后,种植收入减少 B.新农村建设后,其他收入增加了一倍以上C.新农村建设后,养殖收入增加了一倍D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半4.某高校调查了200名学生每周的自习时间(单位:小时),制成了如图所示的频率分布直方图,其中自习时间的范围是[17.5,30],样本数据分组为[17.5,20),[20,22.5),[22.5,25),[25,27.5),[27.5,30).根据直方图,这200名学生中每周的自习时间不少于22.5小时的人数是()A.56 B.60 C.120 D.1405.高三年级267位学生参加期末考试,某班37位学生的语文成绩,数学成绩与总成绩在全年级中的排名情况如下,甲、乙、丙为该班三位学生.从这次考试成绩看,①在甲、乙两人中,其语文成绩名次比其总成绩名次靠前的学生是 ;②在语文和数学两个科目中,丙同学的成绩名次更靠前的科目是 .6.2019年春节期间,我国高速公路继续执行“节假日高速免费政策”.某路桥公司为掌握春节期间车辆出行的高峰情况,在某高速收费点处记录了大年初三上午9:20~10:40这一时间段内通过的车辆数,统计发现这一时间段内共有600辆车通过该收费点,它们通过该收费点的时刻的频率分布直方图如图所示,其中时间段9:20~9:40记作区间[20,40)[40,60)[60,80),9:40~10:00记作,10:00~10:20记作,10:20~10:40记作.比方:10点04分,记作时刻64. [80,100](1)估计这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值(同一组中的数据用该组区间的中点值代表);(2)为了对数据进行分析,现采用分层抽样的方法从这600辆车中抽取10辆,再从这10辆车中随机抽取4辆,记为9:20~10:00之间通过的车辆数,求的分布列与数学期望;X X (3)由大数据分析可知,车辆在春节期间每天通过该收费点的时刻服从正态分布,其中T 2(,)N μσμ可用这600辆车在9:20~10:40之间通过该收费点的时刻的平均值近似代替,可用样本的方差近似代2σ替(同一组中的数据用该组区间的中点值代表),已知大年初五全天共有1000辆车通过该收费点,估计在9:46~10:40之间通过的车辆数(结果保留到整数).参考数据:若,则2(,)T N a μ ,,()0.6826P T μσμσ-<≤+=()220.9544P T μσμσ-<≤+=. ()330.9974P T μσμσ-<≤+=7.(2018全国卷Ⅰ)某家庭记录了未使用节水龙头50天的日用水量数据(单位:)和使用了节水龙3m 头50天的日用水量数据,得到频数分布表如下:未使用节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)[0.6,0.7)频数1 3 2 4 9 26 5 使用了节水龙头50天的日用水量频数分布表日用水量[0,0.1)[0.1,0.2)[0.2,0.3)[0.3,0.4)[0.4,0.5)[0.5,0.6)频数1 5 13 10 16 5 (1)在下图中作出使用了节水龙头50天的日用水量数据的频率分布直方图:(2)估计该家庭使用节水龙头后,日用水量小于0.35 的概率;3m(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)8.我国已进入新时代中国特色社会主义时期,人民生活水平不断提高.某市随机统计了城区若干户市民十月人均生活支出比九月人均生活支出增加量(记为P 元)的情况,并根据统计数据制成如图频率分布直方图.(1)根据频率分布直方图估算P 的平均值;P (2)若该市城区有4户市民十月人均生活支出比九月人均生活支出分别增加了42元,元,5050元,元,5252元,元,6060元,从这4户中随机抽取2户,求这2户P 值的和超过100元的概率.9. 从甲、乙两品种的棉花中各抽测了25根棉花的纤维长度(单位:mm),结果如下:甲品种:271 273 280 285 285 287 292 294 295 301 303 303 307308 310 314 319 323 325 325 328 331 334 337 352乙品种:284 292 295 304 306 307 312 313 315 315 316 318 318320 322 322 324 327 329 331 333 336 337 343 356由以上数据设计了如下茎叶图根据以上茎叶图,对甲、乙两品种棉花的纤维长度作比较,写出两个统计结论:①_________________________________________________________________________ __________________________________________________________________________;②_________________________________________________________________________ __________________________________________________________________________.解析附后方法技巧专题24 统计图表的应用解析篇二、统计图表的应用题型分析【一】频率分布直方图 1.1.例题例题【例1】【解析】 (1)由频率分布直方图可知,月均用水量在[0,0.5)的频率为0.08×0.5=0.04,同理,在[0.5,1),[1.5,2),[2,2.5),[3,3.5),[3.5,4),[4,4.5] 组的频率分别为0.08,0.21,0.25,0.06,0.04,0.02.由1-(0.04+0.08+0.21+0.25+0.06+0.04+0.02)=0.5×a +0.5×a ,解得a =0.30.(2)由(1)知,该市100位居民中月均用水量不低于3吨的频率为0.06+0.04+0.02=0.12.由以上样本的频率分布,可以估计30万居民中月均用水量不低于3吨的人数为300 000×0.12=36 000.(3)设中位数为x 吨.因为前5组的频率之和为0.04+0.08+0.15+0.21+0.25=0.73>0.5,而前4组的频率之和为0.04+0.08+0.15+0.21=0.48<0.5,所以2≤x <2.5.由0.50×(x -2)=0.5-0.48,解得x =2.04.故可估计居民月均用水量的中位数为2.04吨.【例2】【解析】(1)由已知得,故.0.700.200.15a =++0.35a =.10.050.150.700.10b =---=(2)甲离子残留百分比的平均值的估计值为.20.1530.2040.3050.2060.1070.05 4.05⨯+⨯+⨯+⨯+⨯+⨯=乙离子残留百分比的平均值的估计值为.30.0540.1050.1560.3570.2080.15 6.00⨯+⨯+⨯+⨯+⨯+⨯=2.巩固提升综合练习【练习1】【解析】(Ⅰ)甲乙被抽到的概率都是101,而且事件“甲工人被抽到”与“乙工人被抽到”相互独立,所以甲、乙两工人都被抽到的概率⋅=⨯=1001101101p A 类工人中和B 类工人中分别抽查25名和75名.(Ⅱ)(i)由4+8+x +5+3=25,得x =5;6+y +36+18=75,得y =15.频率分布直方图如下图1 A 类工人生产能力的频率分布直方图图2 B 类工人生产能力的频率分布直方图从直方图可以判断:B 类工人中个体间的差异程度更小.,123145253135255125255115258105254)ii (=⨯+⨯+⨯⋅+⨯+⨯=Ax ,8.133145751813575361257515115756=⨯+⨯+⨯+⨯=B x 1.1318.1331007512310025=⨯+⨯=x .A 类工人生产能力的平均数,B 类工人生产能力的平均数以及全厂工人生产能力的平均数的估计值分别为123,133.8和131.1.【练习2】【解析】(1)由频率分布直方图知,分数在[[)70,80的频率为0.04100.4⨯=,分数在[)80,90的频率为0.02100.2⨯=,则分数小于70的频率为10.40.20.4--=,故从总体的400名学生中随机抽取一人,估计其分数小于70的概率为0.4.(2)由频率分布直方图知,样本中分数在区间[]50,90的人数为()0.010.020.040.021010090+++⨯⨯= (人),已知样本中分数小于40的学生有5人,所以样本中分数在区间[)40,50内的人数为1009055--= (人),设总体中分数在区间[)40,50内的人数为x ,则5100400x =,得20x =,所以总体中分数在区间[)40,50内的人数为20人.(3)由频率分布直方图知,分数不小于70的人数为()0.040.021010060+⨯⨯= (人),已知分数不小于70的男女生人数相等,故分数不小于70分的男生人数为30人,又因为样本中有一半男生的分数不小于70,故男生的频率为: 0.6,即女生的频率为: 0.4,即总体中男生和女生人数的比例约为:3:2.【练习3】【解析】(1)由于图中所有小矩形的面积之和等于1,所以. 10(0.0050.010.02⨯++0.0250.01)1a+++=解得.0.03a =(2)根据频率分布直方图,成绩不低于60分的频率为.110(0.0050.01)-⨯+0.85=由于该校高一年级共有学生640人,利用样本估计总体的思想,可估计该校高一年级数学成绩不低于60分的人数约为人.6400.85544⨯=(3)成绩在分数段内的人数为人,[)40,50400.052⨯=分别记为,.A B 成绩在分数段内的人数为人,分别记为,,,.[]90,100400.14⨯=C D E F 若从数学成绩在与两个分数段内的学生中随机选取两名学生,[)40,50[]90,100则所有的基本事件有:,,,,,,,,(),A B (),A C (),A D (),A E (),A F (),B C (),B D (),B E ,,,,,,共15种.(),B F (),C D (),C E (),C F (),D E (),D F (),E F如果两名学生的数学成绩都在分数段内或都在分数段内,那么这两名学生的数学成绩[)40,50[]90,100之差的绝对值一定不大于10.如果一个成绩在分数段内,另一个成绩在分数段内,那[)40,50[]90,100么这两名学生的数学成绩之差的绝对值一定大于10.记“这两名学生的数学成绩之差的绝对值不大于10”为事件,则事件包含的基本事件有:M M ,,,,,,共7种.(),A B (),C D (),C E (),C F (),D E (),D F (),E F 所以所求概率为. ()715P M =【练习4】【解析】(I )由用水量的频率分布直方图知,该市居民该月用水量在区间,,,,内的频[]0.5,1(]1,1.5(]1.5,2(]2,2.5(]2.5,3率依次为,,,,.0.10.150.20.250.15所以该月用水量不超过立方米的居民占%,用水量不超过立方米的居民占%.385245依题意,至少定为.w 3(II )由用水量的频率分布直方图及题意,得居民该月用水费用的数据分组与频率分布表:组号12345678分组[]2,4(]4,6(]6,8(]8,10(]10,12(]12,17(]17,22(]22,27频率0.10.150.20.250.150.050.050.05根据题意,该市居民该月的人均水费估计为:40.160.1580.2100.25120.15170.05220.05270.05⨯+⨯+⨯+⨯+⨯+⨯+⨯+⨯(元).10.5=【二】茎叶图的应用 1.例题【例1】【答案】A【解析】由已知中甲组数据的中位数为65,故乙数据的中位数为65,即y =5,可得乙数据的平均数为66,即甲数据的平均数为66,故 x =3,故选A.56+62+65+70+x +745=66,【例2【答案】 A【解析】A 班兴趣小组的平均成绩为=78,53+62+64+…+92+9515其方差为×[(53-78)2+(62-78)2+…+(95-78)2]=121.6, 则其标准差为≈11.03;115121.6B 班兴趣小组的平均成绩为=66,45+48+51+…+9115其方差为×[(45-66)2+(48-66)2+…+(91-66)2]=175.2, 则其标准差为≈13.24.故选A.115175.2【例3】【解析】(1)由茎叶图观察或计算可得乙班的平均身高较高;(2)甲班的平均身高为170(cm),样本方差为57.2;(3)从乙班随机抽取两名身高不低于173cm 的同学共有10种不同的取法:(173,176)(173,178)(173,179)(173,181)(176,178)(176,179)(176,181)(178,179)(178,181)(179,181),设A 表示随机事件“抽到身高为176cm 的同学”,则A 中的事件有4个,所求概率52)(=A P .2.巩固提升综合练习【练习1】 【答案】 13【解析】 根据茎叶图中的数据知,弟弟的销售量的众数是34,则哥哥的销售量的中位数是34+2=36,∴=36-30, 解得x =5,x +72又(27+20+y +34+34+34+32+42+41)÷8=34, 解得y =8,∴x +y =5+8=13.【练习2】【答案】D 【解析】从茎叶图的数据可以看出甲种树苗的平均高度为27,乙种树苗的平均高度为30,因此乙种树苗的平均高度大于甲种树苗的平均高度.又从茎叶图分析知道,甲种树苗的高度集中在20到30之间,因此长势更集中.【练习3】【答案】C【解析】从茎叶图提取两个人的成绩,分别求出两个人的平均分,得到甲的平均数比乙的平均数要低,但甲数据比较集中,所以成绩比较稳定.,,757782838590826x +++++==甲727681869192836x +++++==乙所以,x x <乙甲因为甲数据比较集中,所以成绩比较稳定.【三】其它类型的统计图表【例1】【答案】A【解析】 根据折线图可知,2014年8月到9月、2014年10月到11月等月接待游客量都是减少,所以A 错误.【例2】【答案】D【解析】由题意,根据正态分布密度曲线的对称性,可得:,()()1(01)220.13592PX P X P X μσμσμσμσ≤≤=-≤≤+--≤≤+=⎡⎤⎣⎦故所求的概率为.故选D.0.135910.932052P =-=【例3】【答案】i <8或i ≤7【解析】条形图的横坐标是身高,纵坐标为每个身高区间内的人数.条形图没有提供具体的数据信息.程序框图的算法含义是统计[160,180)内学生人数,即求A 4+A 5+A 6+A 7的和.2.巩固提升综合练习【练习1】【答案】C【解析】这10天中第一天,第三天和第四天共3天空气质量为一级,所以A 正确;从图可知从日到日日均值逐渐降低,所以B 正确;69 2.5PM 从图可知,这天中日均值最高的是月日,所以D 正确;10 2.5PM 126由图可知,这天中日均值的中位数是,所以C 不正确;10 2.5PM 4145432+=故选C .【练习2】【答案】 A【解析】根据选择D 方式的有18人,占15%,得总人数为=120,1815%故选择A 方式的人数为120-42-30-18=30.【练习3】【答案】D【解析】由图可知0℃在虚线框内,所以各月的平均最低气温都在0℃以上,A 正确;由图可知七月的平均温差比一月的平均温差大,B 正确;由图可知三月和十一月的平均最高气温都约为10℃,基本相同,C 正确;由图可知平均最高气温高于20℃的月份不是5个,D 不正确,故选D .三、课后自我检测1.【答案】 37;20【解析】由已知系统抽样的组距为5,所以相邻组间的号码相差5;由饼形图可知200名职工中,50岁以上人数:40-50岁人数:40岁以下人数=2∶3∶5,总样本为40人,分层抽样抽取每层人数比例为2∶3∶5.2.【答案】 D【解析】由已知得,2017年的就医费用为80 000×10%=8 000元,故2018年的就医费用为12 750元,所以该教师2018年的家庭总收入为=85 000(元).故选D.12 75015%3.【答案】A【解析】通解 设建设前经济收入为,则建设后经济收入为,则由饼图可得建设前种植收入为a 2a 0.6a,其他收入为,养殖收入为.建设后种植收入为,其他收入为,养殖收入为0.04a 0.3a 0.74a 0.1a ,养殖收入与第三产业收入的总和为,所以新农村建设后,种植收入减少是错误的.故0.6a 1.16a 选A .优解 因为,所以新农村建设后,种植收入增加,而不是减少,所以A 是错误的.0.60.372<⨯4.【答案】D【解析】自习时间不少于22.5小时的有,故选D .200(0.160.080.04) 2.5140⨯++⨯=5.【答案】乙 ; 数学【解析】①由图可知,甲的语文成绩排名比总成绩排名靠后;而乙的语文成绩排名比总成绩排名靠前,故填乙.②由图可知,比丙的数学成绩排名还靠后的人比较多;而总成绩的排名中比丙排名靠后的人数比较少,所以丙的数学成绩的排名更靠前,故填数学.6.【解析】(1)这600辆车在9:20~10:40时间段内通过该收费点的时刻的平均值为,即10点04分.()300.005500.015700.020900.0102064⨯+⨯+⨯+⨯⨯=(2)结合频率分布直方图和分层抽样的方法可知:抽取的10辆车中,在10:00前通过的车辆数就是位于时间分组中在这一区间内的车辆数,即,所以的可能取值[)20,60()0.0050.01520104+⨯⨯=X 为0,1,2,3,4.所以,,,()464101014C P X C ===()31644108121C C P X C ===()2264410327C C P X C ===,,()13644104335C C P XC ===()046441014210C C P X C ===所以的分布列为X X01234P114821374351210所以.()1834180123414217352105E X =⨯+⨯+⨯+⨯+⨯=(3)由(1)可得,64μ= ,()()()()2222230640.150640.370640.490640.2σ=-⨯+-⨯+-⨯+-⨯324=所以.18σ=估计在9:46~10:40这一时间段内通过的车辆数,也就是通过的车辆数,46100T <≤由,得 ()2,T N μσ~(641864218)P T -<≤+⨯ ,()()2222P T P T μσμσμσμσ-<≤+-<≤+=+0.8185=所以,估计在9:46~10:40这一时间段内通过的车辆数为(辆).10000.8185819⨯≈7.【解析】(1)(2)根据以上数据,该家庭使用节水龙头后50天日用水量小于0.35的频率为3m 0.2×0.1+1×0.1+2.6×0.1+2×0.05=0.48,因此该家庭使用节水龙头后日用水量小于0.35的概率的估计值为0.48.3m (3)该家庭未使用节水龙头50天日用水量的平均数为.11(0.0510.1530.2520.3540.4590.55260.655)0.4850=⨯+⨯+⨯+⨯+⨯+⨯+⨯=x该家庭使用了节水龙头后50天日用水量的平均数为.21(0.0510.1550.25130.35100.45160.555)0.3550=⨯+⨯+⨯+⨯+⨯+⨯=x 估计使用节水龙头后,一年可节省水.3(0.480.35)36547.45(m )-⨯=8.【解析】(1)根据频率分布直方图估算的平均值:P .300.01410400.02610500.03610600.01410700.011048P =⨯⨯+⨯⨯+⨯⨯+⨯⨯+⨯⨯=(2)该市城区有4户市民十月人均生活支出比九月人均生活支出分别增加了42元,50元,52元,60元,从这4户中随机抽取2户,基本事件总数,246n C ==这2户值的和超过100元包含的基本事件有,,,,共4个,P (42,60)(50,52)(50,60)(52,60)这2户值的和超过100元的概率.∴P 4263p m n ===10.【解析】(可任选两个作答)(1)乙品种棉花的纤维平均长度大于甲品种棉花的纤维平均长度;(2)甲品种棉花的纤维长度较乙品种棉花的纤维长度更分散(或乙品种棉花的纤维长度较甲品种棉花的纤维长度更集中);(3)甲品种棉花的纤维长度的中位数为307mm ,乙品种棉花的纤维长度的中位数为318mm ;(4)乙品种棉花的纤维长度基本上是对称的,而且大多集中在中间(均值附近),甲品种棉花的纤维长度除一个特殊值(352)外,也大致对称,其分布较均匀;。
统计学计算题例题(含答案)

1、某企业制定了销售额的五年计划, 该计划要求计划期的最后一年的年销售额应达到 1200万元。
实际执行最后两年情况如下表:请根据上表资料,对该企业五年计划的完成情况进行考核。
1、 计划完成相对数 =1410/1200*100%=117.5%该计划完成相对数指标为正指标, 计划完成相对数又大于 100% ,所以表示该计划超额完成。
从第 四年 5 月至第五年 4 月的一年的年销售额之和恰好为 1200 万元,所以该计划在第五年 4 月完成,提 前 8 个月完成。
2、 某地区制定了一个植树造林的五年计划,计划中设定的目标是五年累计植树造林面积为 2000 万 亩。
实际执行情况如下:请对该长期计划的完成情况进行考核。
2、 计划完成程度相对数 =2100/2000*100%=105%计划完成相对数指标大于100%, 且该指标为正指标 , 所以该计划超额完成截止第五年第三季度累计完成 2000 万亩造林面积,所以提前 1 个 季 度 完 成3、某班学生统计学课程考试成绩情况如下表:请根据上述资料计算该班统计学课程的平均成绩、成绩的中位数、众数和成绩的标准差。
3、某企业职工年龄情况如下表:X 二三于=4740/62=76.45 (分)Me=70+ (62/2-18) *10/20=76.5 (分)Mo=70+(20 J5)70/[(2CM5)+(2CM8)]=77 」4 (分)G-7(55-76.45f *3 +⋯⋯+ (95^76.45f *6/62=10.45 (分)4、某学校有5000 名学生,现从中按重复抽样方法抽取250 名同学,调查其每周观看电视的小时数的情况,获得资料如下表:请根据上述资料,以95% 的概率保证程度对全校学生每周平均收看电视时间进行区间估计。
4> 样本平均数X= Sxf/Sf-l250/250-5样 ______________ __________二>/ 刀(好予f/(工f—1 )二V 1136/249 二2. 14抽样平均误差U 二s/ Vn=0.14因为 F (t) =95%, 所以日.96抽样极限误差△ 二t U 二 1. 96*0. 14=0. 27 区间下限=5-0. 27=4. 73 区间上限二5+0. 27-5. 27全校学生每周平均收看电视的吋间在( 4.73,5.27) 小时之间,概率保证程度为95%5 、某企业对全自动生产线上的产品随机抽取1000 件进行检验,发现有45 件是不合格的,设定允许的极限误差为1.32% 。
高考数学经典试题与解析 专题九 计数原理与概率统计

专题九计数原理与概率统计——2025届高考数学考点剖析精创专题卷学校:___________姓名:___________班级:___________考号:___________一、选择题1.[2023年全国高考真题]某校文艺部有4名学生,其中高一、高二年级各2名.从这4名学生中随机选2名组织校文艺汇演,则这2名学生来自不同年级的概率为()A.16B.13C.12D.231.答案:D解析:依题意,用1A ,2A 表示高一的2名学生,1B ,2B 表示高二的2名学生,则从4名学生中随机选2名学生的选法有()12,A A ,()12,B B ,()11,A B ,()12,A B ,()21,A B ,()22,A B ,共6种,其中2名学生来自不同年级的选法有()11,A B ,()12,A B ,()21,A B ,()22,A B ,共4种,所以所求概率4263P ==,故选D.2.将甲、乙等5名同学分别保送到北京大学、上海交通大学、浙江大学三所大学就读,则每所大学至少保送一人的不同保送方法有()A.120种 B.150种 C.180种 D.240种2.答案:B解析:根据题意,分2步进行分析:①先将甲、乙等5名同学分成3组:若分成1,2,2的3组,则有12254222C C C15 A =(种)方法;若分成1,1,3的3组,则有11354322C C C 10 A =(种)方法,故将5人分成3组,每组至少有1人,有151025+=(种)分组方法.②将分好的3组对应三所大学,则每所大学至少保送一人的不同保送方法有3325A 150=(种).3.[2023春·高二·四川内江·期中校考]在12nx ⎫-⎪⎭的展开式中,只有第五项的二项式系数最大,则展开式中6x 的系数是()A.454B.358-C.358D.73.答案:C解析:依题意知第五项的二项式系数最大,所以一共是9项,所以8n =,二项式展开项的通项公式为842218811C C 22rrr rr r r r T x x x -++⎛⎫⎛⎫=-=- ⎪ ⎪⎝⎭⎝⎭,令462r +=,得4r =,所以6x 的系数为448135C 28⎛⎫-= ⎪⎝⎭.故选C.4.抛掷一枚质地均匀的骰子两次,记A ={两次的点数均为奇数},B ={两次的点数之和为8},则()P B A =∣()A.112B.29C.13D.234.答案:B解析:易知()()()n AB P BA n A =∣,其中AB 表示“两次的点数均为奇数,且两次的点数之和为8”,共有两种情况,即(3,5),(5,3),故()2n AB =.而1133()C C 9n A =⋅=,所以()2()()9n AB P B A n A ==∣.故选B.5.[2023春·高二·江苏盐城·月考联考]已知服从正态分布()2,N μσ的随机变量在区间(],μσμσ-+,(]2,2μσμσ-+和(]3,3μσμσ-+内取值的概率分别为68.26%,95.44%和99.74%.若某校高二年级1000名学生的某次考试成绩X 服从正态分布()290,15N ,则此次考试成绩在区间(]105,120内的学生大约有()A.477人B.136人C.341人D.131人5.答案:B 解析:根据题意,()()()60120751050.95440.68261051200.135922P X P X P X <≤-<≤-<≤===,则10000.1359135.9136⨯=≈,故此次考试成绩在区间(]105,120内的学生大约有136人.故选:B.6.某工厂为了对研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x (元)99.29.49.69.810销量y (件)1009493908578预计在今后的销售中,销量与单价仍然服从这种线性相关关系,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为()参考公式:对于一组数据()11,x y ,()22,x y ,…,(),n n x y ,其回归直线y bx a =+的斜率和截距的最小二乘估计分别为1221ˆniii nii x ynxy bxnx ==-=-∑∑,ˆˆay bx =-.参考数据:615116iii x y==∑,622160.7i i x x =-=∑.A.9.4元B.9.5元C.9.6元D.9.7元6.答案:B解析:由题意,得1(99.29.49.69.810)9.56x =⨯+++++=,1(1009493908578)906y =⨯+++++=,6162216511669.590ˆ200.76i ii ii x y xybxx ==--⨯⨯===--∑∑,ˆ909.520280a=+⨯=,则ˆ20280y x =-+.设工厂获得利润L 元,则2(5)(20280)20(9.5)405L x x x =--+=--+,当9.5x =时,L 取得最大值.所以当单价定为9.5元时,工厂获得最大利润,故选B.7.[2024春·高一·河南三门峡·期末校考]某高中为了积极响应国家“阳光体育运动”的号召,调查该校3000名学生每周平均体育运动时长的情况,从高一、高二、高三三个年级学生中按照4:3:3的比例进行分层随机抽样,收集了300名学生每周平均体育运动时长(单位:小时)的数据,整理后得到如图所示的频率分布直方图.下列说法不正确的是()A.估计该校学生每周平均体育运动时长为5.8小时B.估计该校高一年级学生每周平均体育运动时长不足4小时的人数为300C.估计该校学生每周平均体育运动时长不少于8小时的百分比为10%D.估计该校学生每周平均体育运动时长不少于8小时的人数为6007.答案:C解析:对于A,估计该校学生每周平均体育运动时长为10.0530.250.370.2590.15110.05 5.8⨯+⨯+⨯+⨯+⨯+⨯=(小时),故选项A 正确;对于B,该校高一年级的总人数为430001200433⨯=++,由题中频率分布直方图可知,该校学生每周平均体育运动时长不足4小时的频率为()0.0250.120.25+⨯=,所以估计该校高一年级学生每周平均体育运动时长不足4小时的人数为12000.25300⨯=,故选项B 正确;对于C,估计该校学生每周平均体育运动时长不少于8小时的百分比为()0.0750.0252100%20%+⨯⨯=,故选项C 错误;对于D,估计该校学生每周平均体育运动时长不少于8小时的人数为300020%600⨯=,故选项D 正确.故选:C.8.甲、乙、丙三人参加“社会主义核心价值观”演讲比赛,若甲、乙、丙三人能荣获一等奖的概率分别为12,23,34,且三人是否获得一等奖相互独立,则这三人中至少有两人获得一等奖的概率为()A.14B.724C.1124D.17248.答案:D解析:设甲、乙、丙获得一等奖的概率分别是()12P A =,()23P B =,()34P C =,则不获一等奖的概率分别是()11122P A =-=,()21133P B =-=,()31144P C =-=,则这三人中恰有两人获得一等奖的概率为:()()()()()()()()()()()()P ABC P ABC P ABC P A P B P C P A P B P C P A P B P C ++=++1231131211123423423424=⨯⨯+⨯⨯+⨯⨯=,这三人都获得一等奖的概率为()()()()12312344P ABC P A P B P C ==⨯⨯=,所以这三人中至少有两人获得一等奖的概率1111724424P =+=.故选:D.二、多项选择题9.[2020年全国高考真题]我国新冠肺炎疫情防控进入常态化,各地有序推动复工复产.下面是某地连续11天的复工、复产指数折线图.根据该折线图,()A.这11天复工指数和复产指数均逐日增加B.在这11天期间,复产指数的增量大于复工指数的增量C.第3天至第11天,复工指数和复产指数都超过80%D.第9天至第11天,复产指数的增量大于复工指数的增量9.答案:CD解析:由题图可知第8,9天复工指数和复产指数均减小,故A 错误;第1天时复工指数小于复产指数,第11天时两指数相等,故复产指数的增量小于复工指数的增量,故B 错误;由题图可知第3天至第11天,复工复产指数都超过80%,故C 正确;第9天至第11天,复产指数的增量大于复工指数的增量,故D 正确.10.已知()*nx n ⎛+∈ ⎝N 的展开式中共有7项,则该二项展开式中()A.所有项的二项式系数和为64 B.所有项的系数和为1C.二项式系数最大的项为第4项 D.有理项共有4项10.答案:ACD解析:由题意知6n =,则6x ⎛⎝的展开式的通项为3666216C C (0,1,2,,6)2rr rr r r r T x x r --+===⋅ .对于A ,所有项的二项式系数和为6264=,故A 正确;对于B ,令1x =,得6613122⎛⎫⎛⎫+= ⎪ ⎪⎝⎭⎝⎭,因此所有项的系数和为632⎛⎫⎪⎝⎭,不为1,故B 错误;对于C,由二项式系数的性质,可知6x ⎛⎝的展开式中第4项的二项式系数最大,为36C 20=,故C 正确;对于D ,当362r-∈Z ,即0,2,4,6r =时,对应的项为有理项,共有4项,故D 正确.故选ACD.11.[2023春·高二·江苏·期中联考]红、黄、蓝被称为三原色,选取任意几种颜色调配,可以调配出其他颜色.已知同一种颜色混合颜色不变,等量的红色加黄色调配出橙色,等量的红色加蓝色调配出紫色,等量的黄色加蓝色调配出绿色.现有红、黄、蓝颜料各2瓶,甲同学从6瓶中任取2瓶颜料,乙同学再从余下的4瓶中任取2瓶颜料,两人分别进行等量调配,A 表示事件“甲同学调配出红色”,B 表示事件“甲同学调配出绿色”,C 表示事件“乙同学调配出紫色”,则下列说法正确的是()A.1()15P A =B.1()4P C A =∣C.4()45P BC =D.事件B 与事件C 相互独立11.答案:AC解析:从6瓶中任取2瓶颜料的方法数为26C .对于A ,A 表示事件“甲同学调配出红色”,若调出红色,需要2瓶颜料均为红色,有22C 种方法,则2226C 1()C 15P A ==,故A 正确;对于B ,事件A 发生需要2瓶颜料均为红色,事件C 发生需要1瓶红色颜料和1瓶蓝色颜料,在事件A 发生的条件下,事件C 不可能发生,所以()0P CA =∣,故B 错误;对于C ,若事件B 发生,则甲同学取出1瓶黄色颜料和1瓶蓝色颜料,则112226C C 4()C 15P B ==,此时还剩1瓶黄色颜料和1瓶蓝色颜料,2瓶红色颜料,则1224C 1()C 3P C B ==∣,故414()()()15345P BC P B P C B =⨯=⨯=∣,故C 正确;对于D ,若事件C 发生,则乙取了1瓶红色颜料和1瓶蓝色颜料,甲同学取了至少1瓶黄色颜料或甲同学取了一瓶红色颜料和一瓶蓝色颜料,则21111111222242222264C C C C C C C C 4()C C 15P C ++==,444()()()151545P B P C P BC ⋅=⨯≠=,事件B 与事件C 不相互独立,故D 错误.故选AC.三、填空题12.一个三位自然数百位、十位、个位上的数字依次为a ,b ,c ,当且仅当有两个数字的和等于第三个数字时称为“有缘数”(如213,134等).若,,{1,2,3,4}a b c ∈,且a ,b ,c 互不相同,则这个三位数为“有缘数”的概率是_________.12.答案:12解析:由1,2,3组成的三位自然数为123,132,213,231,312,321,共6个;同理,由1,2,4组成的三位自然数有6个,由1,3,4组成的三位自然数有6个,由2,3,4组成的三位自然数有6个,共有24个三位自然数.由1,2,3或1,3,4组成的三位自然数为“有缘数”,共12个.所以这个三位数为“有缘数”的概率121242P ==.13.已知随机变量X 有三个不同的取值,分别是0,1,x ,其中(0,1)x ∈,又1(0)4P X ==,1(1)4P X ==,则随机变量X 方差的最小值为__________.13.答案:18解析:由1(0)4P X ==,1(1)4P X ==,得1()2P X x ==,所以随机变量X 的数学期望21()4x E X +=,则方差222221123121111()42444442162x x x D X x ⎡⎤+--⎛⎫⎛⎫⎛⎫⎛⎫=⨯+⨯+⨯=⨯-+⎢⎥ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎢⎥⎣⎦.当12x =时,()D X 取到最小值18,故答案为18.14.[2023届·西北工业大学附中·模拟考试]将8张连号的门票分给5个家庭,甲家庭需要3张连号的门票,乙家庭需要2张连号的门票,剩余的3张门票随机分给其余的3个家庭,并且甲、乙两个家庭不能连排在一起(甲、乙两个家庭内部成员的顺序不予考虑),则这8张门票不同的分配方法有_________种.14.答案:72解析:设8张门票的编号分别为1,2,3,4,5,6,7,8.若甲选123,则乙可以是56,67,78共3种,此时共有333A 18=种;若甲选234,则乙可以是67,78共2种,此时共有332A 12=种;若甲选345,则乙可以是78共1种,此时共有33A 6=种;若甲选456,则乙可以是12共1种,此时共有33A 6=种;若甲选567,则乙可以是12,23共2种,此时共有332A 12=种;若甲选678,则乙可以是12,23,34共3种,此时共有333A 18=种.综上所述,不同的分配方法有181266121872+++++=种.四、解答题15.[2024春·高一·青海西宁·期末]为了解学生的周末学习时间(单位:小时),高一年级某班班主任对本班40名学生某周末的学习时间进行了调查,将所得数据整理绘制出如图所示的频率分布直方图.根据直方图所提供的信息:(1)用分层抽样的方法在[)20,25和[]25,30中共抽取6人成立学习小组,再从该小组派3人接受检测,求检测的3人来自同一区间的概率;(2)估计这40名同学周末学习时间的25%分位数.15.答案:(1)1 5 ;(2)8.75小时.解析:(1)由图可知,40名学生中周末的学习时间在[)20,25的人数为0.035406⨯⨯=人,周末的学习时间在[]25,30的人数为0.0155403⨯⨯=人,从中用分层抽样抽取6人,则周末的学习时间在[)20,25的有4人,记为A,B,C,D;周末的学习时间在[]25,30的有2人,记为a,b;则再从中选派3人接受检测的基本事件有ABC,ABD,ABa,ABb,ACD,ACa,ACb, ADa,ADb,Aab,BCD,BCa,BCb,BDa,BDb,Bab,CDa,CDb,Cab,Dab共有20个,其中检测的3人来自同一区间的基本事件有ABC,ABD,ACD,BCD共有4个,所以检测的3人来自同一区间的概率41205 P==;(2)学习时间在5小时以下的频率为0.0250.10.25⨯=<,学习时间在10小时以下的频率为0.10.0450.30.25+⨯=>,所以25%分位数在区间[)5,10内,则0.250.1 558.750.30.1-+⨯=-,所以这40名同学周末学习时间的25%分位数为8.75小时.16.[2024春·高二·宁夏石嘴山·月考校考]2020年,是人类首次成功从北坡登顶珠峰60周年,也是中国首次精确测定并公布珠峰高程的45周年.华为帮助中国移动开通珠峰峰顶5G ,有助于测量信号的实时开通,为珠峰高程测量提供通信保障,也验证了超高海拔地区5G 信号覆盖的可能性,在持续高风速下5G 信号的稳定性,在条件恶劣地区通过简易设备传输视频信号的可能性.正如任总在一次采访中所说:“华为公司价值体系的理想是为人类服务.”有人曾问,在珠峰开通5G 的意义在哪里?“我认为它是科学技术的一次珠峰登顶,告诉全世界,华为5G 、中国5G 的底气来自哪里.现在,5G 的到来给人们的生活带来更加颠覆性的变革,某IT 公司基于领先技术的支持,5G 经济收入在短期内逐月攀升,该IT 公司在1月份至6月份的5G 经济收入y (单位:百万元)关于月份x 的数据如下表所示,并根据数据绘制了如图所示的散点图.月份x 123456收入y (百万元)6.68.616.121.633.041.0(1)根据散点图判断,y ax b =+与e dx y c =⋅(a ,b ,c ,d 均为常数)哪一个更适宜作为5G 经济收入y 关于月份x 的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的结果及表中的数据,求出y 关于x 的回归方程,并预测该公司7月份的5G 经济收入.(结果保留小数点后两位)(3)从前6个月的收入中抽取2个,记收入超过20百万元的个数为X ,求X 的分布列和数学期望.参考数据:x yu 621()i i x x =-∑61()()iii x x y y =--∑61()()iii x x uu =--∑ 1.52e 2.66e 3.5021.15 2.8517.70125.35 6.734.5714.30其中,设ln u y =,ln i i u y =(1,2,3,4,5,6i =).参考公式:对于一组具有线性相关关系的数据(),(21,2,3,,)i i x v n = ,其回归直线ˆˆˆvx βα=+的斜率和截距的最小二乘估计公式分别为()()()121ˆniii Ri i x x v v x x β==--=-∑∑,ˆˆv x αβ=-16.答案:(1)e dx y c =⋅更适宜(2) 1.520.38e ˆx y +=,65.35百万元(3)分布列见解析,1解析:(1)根据散点图判断,e dx y c =更适宜作为5G 经济收入y 关于月份x 的回归方程类型;(2)因为e dx y c =,所以两边同时取常用对数,得ln ln y c dx =+,设ln u y =,所以ln u c dx =+,因为 3.50x =, 2.85u =,所以61621()( 6.73ˆ0.380,17.70(iii ii x x u u dx x ==--==≈-∑∑所以ˆln 2.850.380 3.50 1.52c u dx=-≈-⨯=.所以ˆ 1.520.38u x =+,即ˆln 1.520.38y x =+,所以 1.520.38e ˆx y +=.令7x =,得 1.520.387 1.52 2.66ˆe e e 4.5714.3065.35y +⨯==⨯≈⨯≈,故预测该公司7月份的5G 经济收入大约为65.35百万元.(3)前6个月的收入中,收入超过20百万元的有3个,所以X 的取值为0,1,2,2326C 1(0)C 5P X ===,113326C C 3(1)C 5P X ===,2326C 1(2)C 5P X ===,所以X 的分布列为:X 012P153515所以()1310121555E X =⨯+⨯+⨯=.17.[2024春·高三·内蒙古赤峰·开学考试校考]卫生纸主要供人们生活日常卫生之用,是人民群众生活中不可缺少的纸种之一.某品牌卫生纸生产厂家为保证产品的质量,现从甲、乙两条生产线生产的产品中各随机抽取500件进行品质鉴定,并将统计结果整理如下:合格品优等品甲生产线250250乙生产线300200(1)判断能否有99.9%的把握认为产品的品质与生产线有关;(2)用频率近似为概率,从甲、乙两条生产线生产的产品中各随机抽取2件进行详细检测,记抽取的产品中优等品的件数为X ,求随机变量X 的分布列与数学期望.附:()()()()()22n ad bc K a b c d a c b d -=++++,其中n a b c d=+++()20P K k ≥0.100.050.0250.0100.0010k 2.7069.8415.0246.63510.82817.答案:(1)没有;(2)分布列见解析,95解析:(1)补充列联表如下:合格品优等品总计甲生产线250250500乙生产线300200500总计5504501000根据列联表中的数据,经计算得到221000(250200250300)10.10110.828550450500500K ⨯⨯-⨯=≈<⨯⨯⨯,所以没有99.9%的把握认为产品的品质与生产线有关.(2)由题意,甲生产线生产的产品中抽取优等品的频率为25015002=,乙生产线生产的产品中抽取优等品的频率为20025005=,所以估计从甲、乙生产线生产的产品中各随机抽取优等品的概率分别为12,25,由题意随机变量X 的所有可能取值是0,1,2,3,4,()22139025100P X ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭,()22211221312331C C 2525510P X ⎛⎫⎛⎫⎛⎫==⨯⨯+⨯⨯⨯= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()2222211221313212372C C 2525525100P X ⎛⎫⎛⎫⎛⎫⎛⎫⎛⎫==⨯+⨯⨯⨯⨯+⨯= ⎪ ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭⎝⎭,()22211221212313C C 252555P X ⎛⎫⎛⎫⎛⎫==⨯⨯+⨯⨯⨯= ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,()2212142525P X ⎛⎫⎛⎫==⨯= ⎪ ⎪⎝⎭⎝⎭,故X 的分布列为:X 01234P91003103710015125所以X 的期望()933711901234100101003255E X =⨯+⨯+⨯+⨯+⨯=.18.[2024春·高二·福建宁德·期末]毒品是人类的公敌,禁毒是社会的责任,当前宁德市正在创建全国禁毒示范城市,我市组织学生参加禁毒知识竞赛,为了解学生对禁毒有关知识的掌握情况,采用随机抽样的方法抽取了500名学生进行调查,成绩全部分布在75145~分之间,根据调查结果绘制的学生成绩的频率分布直方图如图所示.(1)求频率分布直方图中a 的值;(2)由频率分布直方图可认为这次全市学生的竞赛成绩X 近似服从正态分布()2,N μσ,其中μ为样本平均数(同一组数据用该组数据的区间中点值作代表),13.σ=现从全市所有参赛的学生中随机抽取10人进行座谈,设其中竞赛成绩超过135.2分的人数为Y ,求随机变量Y 的期望.(结果精确到0.01);(3)全市组织各校知识竞赛成绩优秀的同学参加总决赛,总决赛采用闯关的形式进行,共有20个关卡,每个关卡的难度由计算机根据选手上一关卡的完成情况进行自动调整,第二关开始,若前一关未通过,则其通过本关的概率为12;若前一关通过,则本关通过的概率为13,已知甲同学第一关通过的概率为13,记甲同学通过第n 关的概率为n P ,请写出n P 的表达式,并求出n P 的最大值.附:若随机变量X 服从正态分布()2,N μσ,则()0.6827P X μσμσ-<≤+≈,()220.9545P X μσμσ-<≤+≈,()330.9973P X μσμσ-<≤+≈.18.答案:(1)0.012;(2)0.23;(3)13217216n n P -⎛⎫=+ ⎪⎝⎭,n P 的最大值为49.解析:(1)由频率分布直方图,得()100.0050.0190.030.020.0021a a ⨯++++++=,解得0.012a =.(2)由题意得:800.05900.121000.191100.3μ=⨯+⨯+⨯+⨯1200.21300.121400.02109.2+⨯+⨯+⨯=,()2109.2,13X N ~,()()()122135.220.022752P X P X P X μσμσμσ--<≤+>=>+=≈,()10,0.02275Y B ~,()0.22750.23E Y np ==≈.(3)记甲同学第()*n n ∈N 关通过为事件n A ,依题意,113P =,当2n ≥时,()113n n P A A -=,()112n n P A A -=,()n n P P A =,所以()()()()()1111n n n n n n n P A P A P A A P A P A A ----=+,所以()111111113262n n n n P P P P ---=+-=-+,所以1313767n n P P +⎛⎫-=- ⎪⎝⎭,又因为113P =,则1320721P -=-≠,所以数列37n P ⎧⎫-⎨⎬⎩⎭是首项为221-,公比为16-的等比数列,所以13217216n n P -⎛⎫=-- ⎪⎝⎭,当n 为奇数时,113213213721672167n n n P --⎛⎫⎛⎫=--=-<⎪⎪⎝⎭⎝⎭,当n 为偶数时,13217216n n P -⎛⎫=+ ⎪⎝⎭,则n P 随着n 的增大而减小,所以,249n P P ≤=,又4397>,所以n P 的最大值为49.19.[2024春·高二·江苏南通·月考校考]篮球运动是在1891年由美国马萨诸塞州斯普林尔德市基督教青年会训练学校体育教师詹姆士·奈史密斯博士,借鉴其他球类运动项目设计发明的.起初,他将两只桃篮钉在健身房内看台的栏杆上,桃篮上沿离地面约3.05米,用足球作为比赛工具,任何一方在获球后,利用传递、运拍,将球向篮内投掷,投球入篮得一分,按得分多少决定比赛胜负.在1891年的12月21日,举行了首次世界篮球比赛,后来篮球界就将此日定为国际篮球日.甲、乙两人进行投篮,比赛规则是:甲、乙每人投3球,进球多的一方获得胜利,胜利1次,则获得一个积分,平局或者输方不得分.已知甲和乙每次进球的概率分别是12和p ,且每人、每次进球与否都互不影响.(1)若23p =,求在进行一轮比赛后甲比乙多投进2球的概率;(2)若1223p ≤≤,且每轮比赛互不影响,乙要想至少获得3个积分且每轮比赛至少要超甲2个球,求:①设事件C 表示乙每轮比赛至少要超甲2个球,求()P C ;(结果用含p 的式子表示)②从数学期望的角度分析,理论上至少要进行多少轮比赛?19.答案:(1)124;(2)①321388p p +;②15解析:(1)设事件i A 表示甲在一轮比赛中投进i 个球,i B 表示乙在一轮比赛中投进i 个球,()0123i =,,,,D 表示进行一轮比赛后甲比乙多投进2球所以2031D A B A B =+()()()2031P D P A B P A B =+2332203133331111211C C C C 22323324⎛⎫⎛⎫⎛⎫⎛⎫=⨯⨯+⨯⨯= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⨯⨯⨯⨯⎭⎝⎭⎝⎭(2)①()()()()203031P C P B A P B A P B A =++()3332231323311113C 1C 22288p p p p p ⎛⎫⎛⎫⎛⎫=-⨯++⎡⎤⎢⎥⎢⎥=+ ⎪ ⎪ ⎪⎝⎭⎝⎭⎣⎭⎦⎝;②设随机变量X 表示n 轮比赛后,乙在每轮比赛至少要超甲2个球的情况下获得的积分,则有3213,88X B n p p ⎛⎫~+ ⎪⎝⎭,故()321388E X n p p ⎛⎫=+ ⎪⎝⎭,要满足题意,则()3E X ≥,即3213388n p p ⎛⎫+≥ ⎪⎝⎭,又12,23p ⎡⎤∈⎢⎥⎣⎦,故3231388n p p ≥+,令()321388f x x x =+,12,23x ⎡⎤∈⎢⎥⎣⎦,则()()3208f x x x '=+>在12,23⎡⎤⎢⎥⎣⎦恒成立,即()f x 在12,23⎡⎤⎢⎥⎣⎦上单调递增,故()f x 的最大值为211354f ⎛⎫=⎪⎝⎭,即321388p p +的最大值为1154,于是,3231388p p +的最小值为16211,因162141511<<,故理论上至少要进行15轮比赛.。
统计学典型例题讲解参考答案

• 三个生产厂商生产的电池平均使用寿命不全相同
由于P<α,则拒绝原假设,可以认为三个生 产商生产的电池平均使用寿命不全相同。
2、多元回归分析实例
3、时间序列分析
某校学生人数逐年增加,1992年比1991年增 长8%,1993年比1992增长7%,2001年比 1993年增长56%,则1991-2001年平均增长速 度为( )。
(2)分析三个生产商生产的电池的平均寿命 之间有无显著差异?
差异源
组间 组内 总计
SS df MS F
P- F crit Value
() () 216.4 () () 14
307.8 () ()
0.000 3.885 31 29
பைடு நூலகம்
提出假设H0 : m1 = m2 =…= mk
• 三个生产厂商生产的电池平均使用寿命相同
某地区计划10年内GDP要翻两番,年均增长 率至少要保持在 ?
时间序列的长期趋势拟合为指数曲线时,若 b=1.2,表明该时间序列( )。
A.、每期增长速度为120% 增长量为1.2个单位
B、每期
C、每期增长速度为20% 降20%
D、逐期下
4、统计指数
1、为了检验不同品牌电池的质量,质检部 门抽检了3家生产商生产的5号电池,在每 个厂抽取5个,
差异源
组间 组内 总计
SS df MS F
P- F crit Value
() () 216.4 () () 14
307.8 () ()
0.000 3.885 31 29
(1)将方差分析表中的空缺数值补齐。
高中统计练习题及讲解

高中统计练习题及讲解一、选择题1. 以下哪个选项是描述数据集中趋势的统计量?- A. 方差- B. 标准差- C. 平均数- D. 极差2. 一组数据的中位数是50,众数是60,这组数据的分布可能是怎样的?- A. 正偏态分布- B. 负偏态分布- C. 对称分布- D. 无法确定二、填空题1. 某班级学生数学成绩的平均数为80分,方差为100,如果一个学生的成绩是90分,那么他的标准分是______。
2. 已知一组数据的中位数为40,如果将这组数据的每个数值都增加10,新的中位数为______。
三、解答题1. 某公司员工的月收入数据如下:4000元,5000元,6000元,7000元,8000元。
请计算这组数据的平均数、中位数和众数。
2. 某班学生期末考试成绩如下:70分,80分,90分,100分。
计算这组数据的方差和标准差。
四、数据分析题某市中学生的身高数据如下(单位:厘米):165,170,175,180,185。
请分析这组数据的分布特征,并计算其平均身高、中位数、众数、方差和标准差。
高中统计练习题讲解一、选择题1. C. 平均数是描述数据集中趋势的统计量,它表示数据集中所有数值的算术平均。
2. A. 如果中位数小于众数,通常意味着数据集呈现正偏态分布。
二、填空题1. 标准分是指一个数值与平均数的差除以标准差。
首先计算平均数:(4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000。
然后计算标准差:√(100) = 10。
最后计算标准分:(90 - 6000) / 10 = -5。
2. 当数据集中的每个数值都增加一个常数时,中位数也会增加相同的常数。
因此,新的中位数为40 + 10 = 50。
三、解答题1. 平均数 = (4000 + 5000 + 6000 + 7000 + 8000) / 5 = 6000元。
中位数 = 6000元(中间的数值)。
众数 = 6000元(出现次数最多的数值)。
统计有关经典例题解析、及高考题50道,带答案

【经典例题】【例1】(2008广东).为了调查某厂工人生产某种产品的能力,随机抽 查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,[)85,95由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)55,75的 人数是 . 【答案】13【解析】20(0.06510)13⨯⨯=,故答案为13.【例2】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ).A. 90B.75C. 60D.45【答案】A【解析】产品净重小于100克的概率为(0.050+0.100)×2=0.300,已知样本中产品净重小于100克的个数是36,设样本容量为n ,则300.036=n,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A. 【例3】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。
根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A. 甲地:总体均值为3,中位数为4B. 乙地:总体均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体均值为2,总体方差为3 【答案】D【解析】根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数;同理,在选项C 中也有可能;选项B 中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D 中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D. 【例4】(2009湖北)下图是样本容量为200的频率分布直方图。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
【经典例题】【例1】(2008广东).为了调查某厂工人生产某种产品的能力,随机抽 查了20位工人某天生产该产品的数量.产品数量的分组区间为[)45,55,[)[)[)55,65,65,75,75,85,[)85,95由此得到频率分布直方图如图3,则这20名工人中一天生产该产品数量在[)55,75的 人数是 . 【答案】13【解析】20(0.06510)13⨯⨯=,故答案为13.【例2】(2009山东)某工厂对一批产品进行了抽样检测.右图是根据抽样检测后的 产品净重(单位:克)数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106],已知样本中产品净重小于100克的个数是36,则样本中净重大于或等于98克并且小于104克的产品的个数是( ).A. 90B.75C. 60D.45【答案】A【解析】产品净重小于100克的概率为(0.050+0.100)×2=0.300, 已知样本中产品净重小于100克的个数是36,设样本容量为n , 则300.036=n,所以120=n ,净重大于或等于98克并且小于104克的产品的概率为(0.100+0.150+0.125)×2=0.75,所以样本中净重大于或等于98克并且小于104克的产品的个数是120×0.75=90.故选A.【例3】(2009上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生在规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”。
根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是( )A. 甲地:总体均值为3,中位数为4B. 乙地:总体均值为1,总体方差大于0C. 丙地:中位数为2,众数为3D. 丁地:总体均值为2,总体方差为3 【答案】D【解析】根据信息可知,连续10天内,每天的新增疑似病例不能有超过7的数,选项A 中,中位数为4,可能存在大于7的数;同理,在选项C 中也有可能;选项B 中的总体方差大于0,叙述不明确,如果数目太大,也有可能存在大于7的数;选项D 中,根据方差公式,如果有大于7的数存在,那么方差不会为3,故答案选D.第8题图【例4】(2009湖北)下图是样本容量为200的频率分布直方图。
根据样本的频率分布直方图估计,样本数据落在[6,10]内的频数为 ,数据落在(2,10)内的概率约为 。
【答案】64【解析】观察直方图易得频数为2000.08464⨯⨯=,频率为0.140.4⨯=【例5】(2009福建)点A 为周长等于3的圆周上的一个定点,若在该圆周上随机取一点B ,则劣弧AB 的长度小于1的概率为 。
【答案】23【解析】可设1AB =,则1AB =,根据几何概率可知其整体事件是其周长3,则其概率是23【例6】(2013江苏)抽样统计甲、乙两位射击运动员的5次训练成绩(单位:环),结果如下:则成绩较为稳定(方差较小)的那位运动员成绩的方差为________. 【答案】2【解析】由题知x 甲=15(87+91+90+89+93)=90,s2甲=15(9+1+0+1+9)=4;x 乙=15(89+90+91+88+92)=90,s2乙=15(1+0+1+4+4)=2,所以s2甲>s2乙,故答案为2.【例7】(2011广东)在某次测验中,有6位同学的平均成绩为75分.用x n 表示编号为n (n=1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:(1)求第6位同学的成绩6,及这6位同学成绩的标准差s ;(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率. 【答案】7;0.4【解析】(1)根据平均数的个数可得75=,∴x6=90,这六位同学的方差是(25+1+9+25+9+225)=49, ∴这六位同学的标准差是7(2)由题意知本题是一个古典概型,试验发生包含的事件是从5位同学中选2个,共有C52=10种结果, 满足条件的事件是恰有一位成绩在区间(68,75)中,共有C41=4种结果, 根据古典概型概率个数得到P==0.4.【例8】(2009广东)随机抽取某中学甲乙两班各10名同学,测量他们的身高 (单位:cm ),获得身高数据的茎叶图如图. (1)根据茎叶图判断哪个班的平均身高较高; (2)计算甲班的样本方差(3)现从乙班这10名同学中随机抽取两名身高不低于173cm 的同学,求身高为 176cm 的同学被抽中的概率. 【答案】乙班;57;25【解析】(1)由茎叶图可知:甲班身高集中于160179:之间,而乙班身高集中于170180: 之间。
因此乙班平均身高高于甲班;(2) 15816216316816817017117917918217010x +++++++++==甲班的样本方差为()()()()222221[(158170)16217016317016817016817010-+-+-+-+-()()()()()22222170170171170179170179170182170]+-+-+-+-+-=57 (3)设身高为176cm 的同学被抽中的事件为A ;从乙班10名同学中抽中两名身高不低于173cm 的同学有:(181,173) (181,176) (181,178) (181,179) (179,173) (179,176) (179,178) (178,173) (178, 176) (176,173)共10个基本事件,而事件A 含有4个基本事件; ()42105P A ∴== 【例9】(2009山东)一汽车厂生产A,B,C 三类轿车,每类轿车均有舒适型和标准型两种型号,某月的产量如下表(单位:辆):按类型分层抽样的方法在这个月生产的轿车中抽取50辆,其中有A 类轿车10辆. (1)求z 的值.(2)用分层抽样的方法在C 类轿车中抽取一个容量为5的样本.将该样本看成一个总体,从中任取2辆,求至少有1辆舒适型轿车的概率;(3)用随机抽样的方法从B 类舒适型轿车中抽取8辆,经检测它们的得分如下:9.4, 8.6, 9.2, 9.6, 8.7, 9.3, 9.0, 8.2.把这8辆轿车的得分看作一个总体,从中任取一个数,求该数与样本平均数之差的绝对值不超过0.5的概率. 【答案】400;710;34【解析】(1)设该厂本月生产轿车为n 辆,由题意得,5010100300n =+,所以n=2000. z=2000-100-300-150-450-600=400 (2)设所抽样本中有m 辆舒适型轿车,因为用分层抽样的方法在C 类轿车中抽取一个容量为5的样本,所以40010005m=,解得m=2也就是抽取了2辆舒适型轿车,3辆标准型轿车,分别记作S 1,S 2;B 1,B 2,B 3,则从中任取2辆的所有基本事件为(S 1, B 1), (S 1, B 2) , (S 1, B 3) (S 2 ,B 1), (S 2 ,B 2), (S 2 ,B 3),( (S 1, S 2),(B 1 ,B 2), (B 2 ,B 3) ,(B 1 ,B 3)共10个,其中至少有1辆舒适型轿车的基本事件有7个基本事件: (S 1, B 1), (S 1, B 2) , (S 1, B 3) (S 2 ,B 1), (S 2 ,B 2), (S 2 ,B 3),( (S 1, S 2),所以从中任取2辆,至少有1辆舒适型轿车的概率为710. (3)样本的平均数为1(9.48.69.29.68.79.39.08.2)98x =+++++++=, 那么与样本平均数之差的绝对值不超过0.5的数为9.4, 8.6, 9.2, 8.7, 9.3, 9.0这6个数,总的个数为8,所以该数与样本平均数之差的绝对值不超过0.5的概率为34. 【例10】(2011北京)以下茎叶图记录了甲、乙两组各四名同学的植树棵树。
乙组记录中有一个数据模糊,无法确认,在图中以X 表示。
(1)如果X=8,求乙组同学植树棵树的平均数和方差;(2)如果X=9,分别从甲、乙两组中随机选取一名同学,求这两名同学的植树总棵树Y 的分布列和数学期望。
(注:方差()()()2222121n s x x x x x x n ⎡⎤=-+-++-⎢⎥⎣⎦ ,其中x 为1x ,2x ,…… n x 的平均数)【答案】1116;19【解析】(1)当X=8时,由茎叶图可知,乙组同学的植树棵数是:8,8,9,10,所以平均数为;435410988=+++=x方差为.1611])43510()4359()4358()4358[(4122222=-+-+-+-=s (2)当X=9时,由茎叶图可知,甲组同学的植树棵树是:9,9,11,11;乙组同学的植树棵数是:9,8,9,10。
分别从甲、乙两组中随机选取一名同学,共有4×4=16种可能的结果,这两名同学植树总棵数Y 的可能取值为17,18,19,20,21事件“Y=17”等价于“甲组选出的同学植树9棵,乙组选出的同学植树8棵”所以该事件有2种可能的结果,因此P (Y=17)=.81162= 同理可得;41)18(==Y P ;41)19(==Y P .81)21(;41)20(====Y P Y P 所以随机变量Y 的分布列为:17(17)18(18)19(19)20(20)EY P Y P Y P Y P Y =⨯=+⨯=+⨯=+⨯=21(21)P Y +⨯==11111171819202184448⨯+⨯+⨯+⨯+⨯=19 【课堂练习】1.(2008山东)右图是根据《山东统计年整2007》中的资料作成的1997年至2006年我省城镇居民百户家庭人口数的茎叶图.图中左边的数字从左到右分别表示城镇居民百户家庭人口数的百位数字和十位数字,右边的数字表示城镇居民百户家庭人口数的个位数字,从图中可以得到1997年至2006年我省城镇居民百户家庭人口数的平均数为( ) A. 304.6 B. 303.6 C. 302.6 D. 301.62.(2011湖北)已知随机变量ξ服从正态分布N (2,σ2),且P (ξ<4)=0.8,则P (0<ξ<2)等于( ). A .0.6 B .0.4 C .0.3 D .0.23.(2009四川)设矩形的长为a ,宽为b ,其比满足b ∶a =618.0215≈-,这种矩形给人以美感,称为黄金矩形。
黄金矩形常应用于工艺品设计中。
下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是( ) A. 甲批次的总体平均数与标准值更接近 B. 乙批次的总体平均数与标准值更接近C. 两个批次总体平均数与标准值接近程度相同D. 两个批次总体平均数与标准值接近程度不能确定4.(2009陕西)某单位共有老、中、青职工430人,其中青年职工160人,中年职工人数是老年职工人数的2倍。