统计经典例题及答案
(精选试题附答案)高中数学第九章统计经典大题例题

(名师选题)(精选试题附答案)高中数学第九章统计经典大题例题单选题1、某中学高一年级有400人,高二年级有320人,高三年级有280人,若每人被抽到的可能性都为0.2,用随机数表法在该中学抽取容量为n的样本,则n等于()A.80B.160C.200D.280答案:C分析:每个个体被抽的可能性等于样本容量除以总体数,由此列出关于n的方程并求解出结果.=0.2,解得n=200,由题意可知:n400+320+280故选:C.2、某校为了解学生的课外锻炼身体的情况,随机抽取了部分学生,对他们一周的课外锻炼时间进行了统计,统计数据如下表所示:则该校学生一周进行课外锻炼的时间的第40百分位数是()A.8.5B.8C.7D.9答案:A分析:根据百分位数的求法计算即可.抽取的学生人数为6+10+9+8+7=40.由40%×40=16,故第40百分位数为所有数据从小到大排序的第16项与第17项数据的平均数,=8.5.即8+92故选: A.3、下列调查方式较为合适的是()A.为了了解灯管的使用寿命,采用普查的方式B.为了了解我市中学生的视力状况,采用抽样调查的方式C.调查一万张面值为100元的人民币中有无假币,采用抽样调查的方式D.调查当今中学生喜欢什么体育活动,采用普查的方式答案:B分析:根据实际情况选择合适的调查方式即可判断.对A,为了了解灯管的使用寿命,应采用抽样调查的方式,故A错误;对B,为了了解我市中学生的视力状况,采用抽样调查的方式,故B正确;对C,调查一万张面值为100元的人民币中有无假币,采用抽样普查的方式,故C错误;对D,调查当今中学生喜欢什么体育活动,采用抽样普查的方式,故D错误.故选:B.4、2021年3月,树人中学组织三个年级的学生进行“庆祝中国共产党成立100周年”党史知识竞赛.经统计,得到前200名学生分布的饼状图(如图)和前200名中高一学生排名分布的频率条形图(如图),则下列命题错.误.的是()A.成绩前200名的200人中,高一人数比高二人数多30人B.成绩第1-100名的100人中,高一人数不超过一半C.成绩第1-50名的50人中,高三最多有32人D.成绩第51-100名的50人中,高二人数比高一的多答案:D分析:根据饼状图和条形图提供的数据判断.由饼状图,成绩前200名的200人中,高一人数比高二人数多200×(45%−30%)=30,A正确;=45<50,B 由条形图知高一学生在前200名中,前100和后100人数相等,因此高一人数为200×45%×12正确;成绩第1-50名的50人中,高一人数为200×45%×0.2=18,因此高三最多有32人,C正确;第51-100名的50人中,高二人数不确定,无法比较,D错误.故选:D.5、某射击运动员6次的训练成绩分别为:88,91,89,88,86,85,则这6次成绩的第70百分位数为()A.89B.89.5C.90D.90.5答案:A分析:先将数据按从小到大的顺序排列,计算6×70%=4.2不是整数,则所求的是从小到大排列的第5位数6次考试数学成绩从小到大为:85,86,88,88,89,91,6×70%=4.2,∴这名学生6次训练成绩的第70百分位数为89 .故选:A6、某棉纺厂为了了解一批棉花的质量,从中随机抽取了100根棉花纤维的长度(棉花纤维的长度是棉花质量的重要指标),所得数据都在区间[5,40]中,其频率直方图如图所示,估计棉花纤维的长度的样本数据的80百分位数是()A.29 mmB.29.5 mmC.30 mmD.30.5 mm答案:A分析:先求得棉花纤维的长度在30 mm以下的比例为85%,在25 mm以下的比例为85%-25%=60%,从而可得80百分位数一定位于[25,30)内,进而可求出答案棉花纤维的长度在30 mm以下的比例为(0.01+0.01+0.04+0.06+0.05)×5=0.85=85%,在25 mm以下的比例为85%-25%=60%,因此,80百分位数一定位于[25,30)内,=29,由25+5×0.80−0.600.85−0.60可以估计棉花纤维的长度的样本数据的80百分位数是29 mm.故选:A7、根据气象学上的标准,连续5天的日平均气温低于10℃即为入冬,将连续5天的日平均温度的记录数据(记录数据都是自然数)作为一组样本,现有4组样本①、②、③、④,依次计算得到结果如下:①平均数x̅<4;②平均数x̅<4且极差小于或等于3;③平均数x̅<4且标准差s≤4;④众数等于5且极差小于或等于4.则4组样本中一定符合入冬指标的共有()A .1组B .2组C .3组D .4组答案:B分析:举反例否定①;反证法证明②符合要求;举反例否定③;直接法证明④符合要求.①举反例:0,0,0,4,11,其平均数x̅=3<4.但不符合入冬指标;②假设有数据大于或等于10,由极差小于或等于3可知,则此组数据中的最小值为10−3=7,此时数据的平均数必然大于7,与x̅<4矛盾,故假设错误.则此组数据全部小于10. 符合入冬指标;③举反例:1,1,1,1,11,平均数x̅=3<4,且标准差s =4.但不符合入冬指标;④在众数等于5且极差小于等于4时,则最大数不超过9.符合入冬指标.故选:B .8、关于圆周率π,数学发展史上出现过许多很有创意的求法,如著名的浦丰实验和查理斯实验.受其启发,我们也可以通过设计下面的实验来估计π的值:先请全校m 名同学每人随机写下一个都小于1的正实数对(x,y );再统计两数能与1构成钝角三角形三边的数对(x,y )的个数a ;最后再根据统计数a 估计π的值,那么可以估计π的值约为( )A .4a mB .a+2mC .a+2m mD .4a+2m m答案:D解析:由试验结果知m 对0~1之间的均匀随机数x,y ,满足{0<x <10<y <1,面积为1,再计算构成钝角三角形三边的数对(x,y),满足条件的面积,由几何概型概率计算公式,得出所取的点在圆内的概率是圆的面积比正方形的面积,即可估计π的值.解:根据题意知,m 名同学取m 对都小于1的正实数对(x,y ),即{0<x <10<y <1, 对应区域为边长为1的正方形,其面积为1,若两个正实数x,y 能与1构成钝角三角形三边,则有{x 2+y 2<1x +y >10<x <10<y <1,其面积S =π4−12;则有a m =π4−12,解得π=4a+2m m故选:D .小提示:本题考查线性规划可行域问题及随机模拟法求圆周率的几何概型应用问题. 线性规划可行域是一个封闭的图形,可以直接解出可行域的面积;求解与面积有关的几何概型时,关键是弄清某事件对应的面积,必要时可根据题意构造两个变量,把变量看成点的坐标,找到试验全部结果构成的平面图形,以便求解.9、某校高一共有10个班,编号为01,02,…,10,现用抽签法从中抽取3个班进行调查,设高一(5)班被抽到的可能性为a ,高一(6)班被抽到的可能性为b ,则( )A .a =310,b =29B .a =110,b =19 C .a =310,b =310D .a =110,b =110答案:C分析:根据简单随机抽样的定义,分析即可得答案.由简单随机抽样的定义,知每个个体被抽到的可能性相等,故高一(5)班和高一(6)班被抽到的可能性均为310. 故选:C10、为调查参加考试的高二级1200名学生的成绩情况,从中抽查了100名学生的成绩,就这个问题来说,下列说法正确的是( )A .1200名学生是总体B .每个学生是个体C .样本容量是100D .抽取的100名学生是样本答案:C分析:根据总体、个体、样本容量、样本的定义,结合题意,即可判断和选择.根据题意,总体是1200名学生的成绩;个体是每个学生的成绩;样本容量是100,样本是抽取的100名学生的成绩;故正确的是C.故选:C.填空题11、某市A、B、C三个区共有高中学生20000人,其中A区高中学生7000人,现采用分层抽样的方法从这三个区所有高中学生中抽取一个容量为600人的样本进行学习兴趣调查,则A区应抽取__________________.答案:210分析:根据总体数和要抽取的样本数,得到每个个体被抽到的概率,利用这个概率乘以A区的人数,得到A区要抽取的人数.解:由题意知A区在样本中的比例为700020000∴A区应抽取的人数是700020000×600=210.所以答案是:210.12、某单位有员工900人,其中女员工有360人,为做某项调查,拟采用分层抽样的方法抽取容量为150的样本,则应抽取的男员工人数是_______________________.答案:90分析:按照分层抽样的定义,按照比例抽取即可由题意,设应抽取的男员工人数是x则900−360900=x150解得:x=90所以答案是:9013、已知一组数据:20,30,40,50,50,60,70,80,记这组数据的第60百分位数为a,众数为b,则a和b的大小关系是______________.(用“<”“>”或“=”连接)答案:a=b##b=a分析:由百分位数求法得50为第60百分位数,并确定数据的众数,即可比较它们的大小关系.因为8×60%=4.8,所以这组数据的第5个数:50为第60百分位数.观察易知这组数据的众数为50,所以a和b的大小关系是a=b.所以答案是:a=b14、某校从高一新生中随机抽取了一个容量为20的身高样本,数据从小到大排序如下(单位:cm):152 ,155,158,164,164,165,165,165,166,167,168,168,169,170,170,170 ,171,x,174,175,若样本数据的第90百分位数是173,则x的值为________.答案:172分析:根据百分位数的意义求解.百分位数的意义就在于,我们可以了解的某一个样本在整个样本集合中所处的位置,=173,x=172本题第90百分位数是173,所以x+1742故答案为:172小提示:本题考查样本数据的第多少百分位数的概念.15、气象意义上从春季进入夏季的标志为连续5天的日平均温度均不低于22℃.现有甲、乙、丙三地连续5天的日平均温度的记录数据:(记录数据都是正整数)①甲地5个数据的中位数为24,众数为22;②乙地5个数据的中位数为27,总体均值为24;③丙地5个数据中有一个数据是32,总体均值为26,总体方差为10.8.则肯定进入夏季的地区有_____.答案:①③分析:根据数据的特点进行估计甲、乙、丙三地连续5天的日平均气温的记录数据,分析数据的可能性进行解答即可得出答案.①甲地:5个数据的中位数为24,众数为22,根据数据得出:甲地连续5天的日平均温度的记录数据可能为:22、22、24、25、26,其连续5天的日平均气温均不低于22;②乙地:5个数据的中位数为27,总体均值为24,当5个数据为19、20、27、27、27,可知其连续5天的日平均温度有低于22,故不确定;③丙地:5个数据中有一个数据是32,总体均值为26,若有低于22,假设取21,此时方差就超出了10.8,可知其连续5天的日平均温度均不低于22,如22、25、25、26、32,这组数据的平均值为26,方差为10.8,但是进一步扩大方差就会超过10.8,故③对.则肯定进入夏季的地区有甲、丙两地,故答案为①③.小提示:本题考查中位数、众数、平均数、方差的数据特征,简单的合情推理,解答此题应结合题意,根据平均数的计算方法进行解答、取特殊值即可.解答题16、为了了解一种植物果实的情况,随机抽取一批该植物果实样本测量重量(单位:克),按照[27.5,32.5),[32.5,37.5),[37.5,42.5),[42.5,47.5),[47.5,52.5]分为5组,其频率分布直方图如图所示.(1)求图中a的值;(2)估计这种植物果实重量的平均数x̅(同一组中的数据用该组区间的中点值作代表);(3)已知这种植物果实重量不低于37.5克的即为优质果实,现对该种植物果实的某批10000个果实进行检测.据此估算这批果实中的优质果实的个数.答案:(1)a=0.050(2)40(3)7000分析:(1)由各组频率之和为1(面积之和为1)可求得;(2)频率分布直方图用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和估计平均数;(3)用样本频率估计总体概率进行求解.(1)由题意,有(0.020+0.040+0.075+a+0.015)×5=1,解得a=0.050;(2)这种植物果实重量的平均数约为:30×0.020×5+35×0.040×5+40×0.075×5+45×0.050×5+50×0.015×5=40,∴这种植物果实重量的平均数x̅的估计值约为40.(3)样本中,这种植物果实重量不低于37.5克,即优质果实的频率为0 .075×5+0.050×5+0.015×5=0.7,由此估计某批10000个果实中,重量不低于37.5克,即优质果实的概率为0.7,∴这批果实中的优质果实的个数约为10000×0.7=7000个.17、第24届北京冬季奥林匹克运动会于2022年2月4日至2月20日在北京和张家口联合举办.这是中国历史上第一次举办冬季奥运会,它掀起了中国人民参与冬季运动的大热潮.某市举办了中学生滑雪比赛,从中抽取40名学生的测试分数绘制成茎叶图和频率分布直方图如下,后来茎叶图受到了污损,可见部分信息如图.(1)求频率分布直方图中a的值,并根据直方图估计该市全体中学生的测试分数的平均数(同一组中的数据以这组数据所在区间中点的值作代表,结果保留一位小数);(2)现要对测试成绩在前26%的中学生颁发“滑雪达人”证书,并制定出能够获得证书的测试分数线,请你用样本来估计总体,给出这个分数线的估计值.答案:(1)a=0.02,平均数为74.5(2)82分析:(1)计算出测试分数位于[90,100]个数,可求得测试分数位于[80,90)的个数,由此可求得a的值,将每个矩形底边的中点值乘以对应矩形的面积,将所得结果全加可得样本的平均数;(2)设能够获得证书的测试分数线为x,分析可得80<x<90,根据已知条件可得出关于x的等式,求解即可. (1)解:由频率分布直方图可知,测试分数位于[90,100]的频率为10×0.01=0.1,则测试分数位于[90,100]个数为40×0.1=4,所以,测试分数位于[80,90)的个数为40−(4+10+14+4)=8,÷10=0.02.所以a=840估计平均数为55×0.1+65×0.25+75×0.35+85×0.2+95×0.1=74.5.(2)解:因为测试分数位于[90,100]的频率为0.1,测试分数位于[80,90)的频率为0.2,能够获得“滑雪达人”证书的中学生测试分数要在前26%,故设能够获得证书的测试分数线为x,则80<x<90,由(90−x)×0.02=0.26−0.1,可得x=82,所以分数线的估计值为82.18、某中学要从高一年级甲乙两个班级中选择一个班参加电视台组织的“环保知识竞赛”,该校对甲乙两班的参赛选手(每班7人)进行了一次环保知识测试,他们取得的成绩(满分100分)的茎叶图如图所示,其中甲班学生的平均分是85,乙班学生成绩的中位数是85.(1)求x,y的值;(2)根据茎叶图,求甲乙两班同学方差的大小,并从统计学角度分析,该校应选择甲班还是乙班参赛.答案:(1)x=9,y=5;(2)乙班成绩比较稳定,故应选乙班参加.分析:(1)利用茎叶图,根据甲班7名学生成绩的平均分是85,乙班7名学生成绩的中位数是85.先求出x,y,(2)求出乙班平均分,再求出甲班7名学生成绩方差和乙班名学生成绩的方差,由此能求出结果.解:(1)甲班的平均分为:17(75+78+80+80+x+85+92+96)=85;解得x=9,∵乙班7名学生成绩的中位数是85,∴y=5,(2)乙班平均分为:17(75+80+80+85+90+90+95)=85;甲班7名学生成绩方差S12=17(102+72+52+42+02+72+112)=3607,乙班名学生成绩的方差S22=17(102+52+52+02+52+52+102)=3007,∵两个班平均分相同,S22<S12,∴乙班成绩比较稳定,故应选乙班参加.小提示:本题考查茎叶图的应用,解题时要认真审题,属于基础题.19、2019年下半年以来,各地区陆续出台了“垃圾分类”的相关管理条例,实行“垃圾分类”能最大限度地减少垃圾处置量,实现垃圾资源利用,改善垃圾资源环境,某部门在某小区年龄处于[20,45]岁的人中随机地抽取x人,进行了“垃圾分类”相关知识掌握和实施情况的调查,并把达到“垃圾分类”标准的人称为“环保族”,得到如图示各年龄段人数的频率分布直方图和表中的统计数据.(1)求x、y、z的值;(2)根据频率分布直方图,估计这x人年龄的平均值(同一组数据用该区间的中点值代替,结果按四舍五入保留整数);(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,并在这9人中选取2人作为记录员,求选取的2名记录员中至少有一人年龄在[30,35]中的概率.答案:(1){x=200y=0.625z=6;(2)30.75;(3)1318.分析:(1)由频率分布直方图和频数分布表能求出x、y、z;(2)根据频率分布直方图,能估计这x人年龄的平均值;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,[25,30)中选5人,分别记为A、B、C、D、E,[30,35]中选4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,利用列举法列举出所有的基本事件,然后利用古典概型的概率公式可求得所求事件的概率.(1)由题意得:{x=450.750.06×5=200y=25200×0.04×5=0.625z=200×0.03×5×0.2=6;(2)根据频率分布直方图,估计这x人年龄的平均值为:x=22.5×0.3+27.5×0.2+32 .5×0.2+37.5×0.15+42.5×0.15=30.75;(3)从年龄段在[25,35]的“环保族”中采取分层抽样的方法抽取9人进行专访,从[25,30)中选:9×2525+20=5人,分别记为A、B、C、D、E,从[30,35]中选:9×2025+20=4人,分别记为a、b、c、d,在这9人中选取2人作为记录员,所有的基本事件有:(A,B)、(A,C)、(A,D)、(A,E)、(A,a)、(A,b)、(A,c)、(A,d)、(B,C)、(B,D)、(B,E)、(B,a)、(B,b)、(B,c)、(B,d)、(C,D)、(C,E)、(C,a)、(C,b)、(C,c)、(C,d)、(D,E)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共36种,选取的2名记录员中至少有一人年龄在[30,35]包含的基本事件有:(A,a)、(A,b)、(A,c)、(A,d)、(B,a)、(B,b)、(B,c)、(B,d)、(C,a)、(C,b)、(C,c)、(C,d)、(D,a)、(D,b)、(D,c)、(D,d)、(E,a)、(E,b)、(E,c)、(E,d)、(a,b)、(a,c)、(a,d)、(b,c)、(b,d)、(c,d),共26种,因此,选取的2名记录员中至少有一人年龄在[30,35]中的概率P=2636=1318.小提示:本题考查频率、平均数、概率的求法,考查频数分布表、频率分布直方图、分层抽样、古典概型的性质等基础知识,考查数据分析能力、运算求解能力,是基础题.。
统计案例练习题(附答案)

统计案例练习题(附答案)一、选择题 1.对具有线性相关关系的两个变量建立的线性回归方程y=a+bx中,回归系数b( ) A.可以小于0 B.只能大于0 C.可能等于0 D.只能小于0 【解析】b可能大于0,也可能小于0,但当b=0时,x,y不具有线性相关关系.【答案】 A 2.下列两个变量间的关系不是函数关系的是( ) A.正方体的棱长与体积 B.角的弧度数与它的正弦值 C.单产为常数时,土地面积与粮食总产量 D.日照时间与水稻亩产量【解析】∵A、B、C都可以得出一个函数关系式,而D不能写出确定的函数关系式,它只是一个不确定关系.【答案】 D 3.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元) 4 2 3 5 销售额y(万元) 49 26 39 54 根据上表可得回归方程y=bx+a中的b为9.4,据此模型预报广告费用为6万元时销售额为( ) A.63.36万元 B.65.5万元C.67.7万元 D.72.0万元【解析】x=4+2+3+54=3.5, y=49+26+39+544=42,∴a=y-bx=42-9.4×3.5=9.1,∴回归方程为y=9.4x+9.1,∴当x=6时,y=9.4×6+9.1=65.5,故选B. 【答案】 B 4.由一组样本数据(x1,y1),(x2,y2),…,(xn,yn)得到回归直线方程y=bx+a,那么下列说法中不正确的是( ) A.直线y=bx+a必经过点(x,y) B.直线y=bx+a至少经过点(x1,y1)(x2,y2),…,(xn,bn)中的一个点 C.直线y=bx+a的斜率为∑ni=1xiyi-nx•y∑ni=1x2i-nx2 D.直线y=bx+a的纵截距为y-bx 【解析】回归直线可以不经过任何一个点.其中A:由a=y-bx代入回归直线方程y=bx+y-ax,即y=b(x-x)+y过点(x,y).∴B错误.【答案】 B 5.已知两个变量x和y 之间具有线性相关性,甲、乙两个同学各自独立地做了10次和15次试验,并且利用线性回归的方法求得回归直线分别为l1和l2,已知两个人在试验中发现对变量x的观测数据的平均数都为s,对变量y 的观测数据的平均数都是t,则下列说法正确的是( ) A.l1与l2一定有公共点(s,t) B.l1与l2相交,但交点一定不是(s,t) C.l1与l2必定平行 D.l1与l2必定重合【解析】由于回归直线y=bx+a恒过(x,y)点,又两人对变量x的观测数据的平均值为s,对变量y的观测数据的平均值为t,所以l1和l2恒过点(s,t).【答案】 A 二、填空题 6.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的线性回归方程为y=0.849x-85.712,则身高172 cm的女大学生,由线性回归方程可以预测其体重约为________.【解析】将x=172代入线性回归方程y=0.849x-85.712,有y=0.849×172-85.712=60.316(kg).【答案】60.316 kg 7.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场,以降低生产成本.某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本的资料进行线性回归分析,结果如下:x=72,y=71,∑6i=1x2i=79,∑6i=1xiyi=1 481. b=1 481-6×72×7179--1.818 2, a=71-(-1.8182)×72≈77.36,则销量每增加1 000箱,单位成本下降________元.【解析】由上表可得,y=-1.818 2x+77.36,销量每增加1千箱,则单位成本下降1.818 2元.【答案】 1.818 2 8.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.【解析】由题意知[0.254(x+1)+0.321]-(0.254x+0.321)=0.254. 【答案】0.254 三、解答题 9.某电脑公司有6名产品推销员,其工作年限与年推销金额数据如下表:推销员编号 1 2 3 4 5 工作年限x/年 3 5 6 7 9 推销金额y/万元 2 3 3 4 5 (1)求年推销金额y关于工作年限x的线性回归方程; (2)若第6名推销员的工作年限为11年,试估计他的年推销金额.【解】(1)设所求的线性回归方程为y=bx+a,则b=i=--=-=1020=0.5, a=y-bx=0.4. 所以年推销金额y关于工作年限x的线性回归方程为y=0.5x+0.4. (2)当x=11时,y=0.5x+0.4=0.5×11+0.4 =5.9(万元).所以可以估计第6名推销员的年推销金额为5.9万元. 10.一种机器可以按各种不同速度运转,其生产物件中有一些含有缺点,每小时生产有缺点物件的多少随机器运转速度而变化,用x表示转速(单位:转/秒),用y表示每小时生产的有缺点物件个数.现观测得到(x,y)的4组值为(8,5),(12,8),(14,9),(16,11). (1)假设y与x之间存在线性相关关系,求y与x之间的线性回归方程. (2)若实际生产中所容许的每小时最大有缺点物件数为10,则机器的速度不得超过多少转/秒?(精确到1) 【解】(1)设回归方程为y=a+bx,则x=8+12+14+164=12.5, y=5+8+9+114=8.25,∑4i=1x2i=660,∑4i =1xiyi=438, b=∑4i=1xiyi-4xy∑4i=1x2i-4x2=438-4×12.5×8.25660-4×12.52≈0.73, a=y-bx=8.25-0.73×12.5=-0.875,所以所求回归方程为y=-0.875+0.73x. (2)由y≤10,即-0.875+0.73x≤10,得x≤10.8750.73≈15,即机器速度不得超过15转/秒. 11.高二(3)班学生每周用于数学学习的时间x(单位:小时)与数学成绩y(单位:分)之间有如下数据:x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 若某同学每周用于数学学习的时间为18小时,试预测该同学的数学成绩.【解】显然学习时间与学习成绩间具有相关关系,可以列出下表,并用科学计算器进行计算.i 1 2 3 4 5 6 7 8 9 10 xi 24 15 23 19 16 11 20 16 17 13 yi 9279 97 89 64 47 83 68 71 59 xiyi 2 208 1 185 2 231 1 691 1 024 517 1 660 1 088 1 207 767 ∑10i=1x2i=3 182,∑10i=1xiyi=13 578于是可得b=∑10i=1xiyi-10xy∑10i=1x2i-10x2=545.4154.4≈3.53, a=y-bx=74.9-3.53×17.4≈13.5. 因此可求得回归直线方程为y=3.53x+13.5. 当x=18时,y=3.53×18+13.5≈77. 故该同学预计可得77分左右.。
统计学计算题例题(含答案)

1、某企业制定了销售额的五年计划, 该计划要求计划期的最后一年的年销售额应达到 1200万元。
实际执行最后两年情况如下表:请根据上表资料,对该企业五年计划的完成情况进行考核。
1、 计划完成相对数 =1410/1200*100%=117.5%该计划完成相对数指标为正指标, 计划完成相对数又大于 100% ,所以表示该计划超额完成。
从第 四年 5 月至第五年 4 月的一年的年销售额之和恰好为 1200 万元,所以该计划在第五年 4 月完成,提 前 8 个月完成。
2、 某地区制定了一个植树造林的五年计划,计划中设定的目标是五年累计植树造林面积为 2000 万 亩。
实际执行情况如下:请对该长期计划的完成情况进行考核。
2、 计划完成程度相对数 =2100/2000*100%=105%计划完成相对数指标大于100%, 且该指标为正指标 , 所以该计划超额完成截止第五年第三季度累计完成 2000 万亩造林面积,所以提前 1 个 季 度 完 成3、某班学生统计学课程考试成绩情况如下表:请根据上述资料计算该班统计学课程的平均成绩、成绩的中位数、众数和成绩的标准差。
3、某企业职工年龄情况如下表:X 二三于=4740/62=76.45 (分)Me=70+ (62/2-18) *10/20=76.5 (分)Mo=70+(20 J5)70/[(2CM5)+(2CM8)]=77 」4 (分)G-7(55-76.45f *3 +⋯⋯+ (95^76.45f *6/62=10.45 (分)4、某学校有5000 名学生,现从中按重复抽样方法抽取250 名同学,调查其每周观看电视的小时数的情况,获得资料如下表:请根据上述资料,以95% 的概率保证程度对全校学生每周平均收看电视时间进行区间估计。
4> 样本平均数X= Sxf/Sf-l250/250-5样 ______________ __________二>/ 刀(好予f/(工f—1 )二V 1136/249 二2. 14抽样平均误差U 二s/ Vn=0.14因为 F (t) =95%, 所以日.96抽样极限误差△ 二t U 二 1. 96*0. 14=0. 27 区间下限=5-0. 27=4. 73 区间上限二5+0. 27-5. 27全校学生每周平均收看电视的吋间在( 4.73,5.27) 小时之间,概率保证程度为95%5 、某企业对全自动生产线上的产品随机抽取1000 件进行检验,发现有45 件是不合格的,设定允许的极限误差为1.32% 。
统计地训练题目及答案详解

1.初婚年龄服从正态分布,根据21个人的抽样调查有:5.23=X〔岁〕,3=S 〔岁〕,求置信水平为95%的初婚年龄的置信区间。
〔t 0。
05(21) =1.721、t 0。
05(205、t 0。
025(21) =2.080、t 0,025(20) =2.086〕。
【22.10,24.90】2.某工厂妇女从事家务劳动时间服从正态分布N 〔μ,266.0〕。
根据36人的随机抽样调查,每天平均从事家务劳动时间X 为:X =2.65小时。
求μ的双侧置信区间〔置信度取0.95和0.99两种〕。
【2.4344,2.8656】【2.3662,2.9338】3.根据某地100户的随机抽查,其中有60户拥有电冰箱,求该地区拥有电冰箱成数P 的置信区间〔置信度为0.95〕。
【0.5040,0.6960】4.某工厂根据200名青年职工的抽样调查,得知其中有60%参加各种形式的业余学习。
求青年职工参加业余学习成数的区间估计。
〔置信水平取0.90〕 【0.5428,0.6572】5.电视台要调查电视观众收看电视剧《渴望》的收视率。
问在95%的置信度下,允许误差%5+,问样本容量需要多大才能最大限度地满足调查要求?【384,样本取整数400】6.某企业有职工1385人,现从中随机抽出50人调查其工资收入情况如下:试以0.95的置信度估计该企业职工的月平均工资收入所在X 围。
【355.6,363.6】7.某食品公司所生产的牛肉干中,随机抽7盒,称得各盒重量如下:9.6、10.2、9.8、10.0、10.4、9.8、10.2。
如牛肉干盒重量近似于正态分布,求置信水平为95%的情况下,牛肉干盒平均重量的置信区间是多少?【9.74,10.24】 8.从某校随机地抽取81名女学生,测得平均身高为163厘米,标准差为6.0厘米,试求该校女生平均身高95%的置信区间。
【161.7,164.3】9.如果认为该市农民工参保率是35%,假如要求在95%的置信水平上保证这一比例的估计误差不超过6%,试问调查的样本容量应该有多大? 【971】10.假如某一居民小区中住房拥有者的比例近似0.75,那么建立总宽度为0.03 的95%的置信区间,需要多大样本?假如住房拥有者的比例改为0. 5,那么建立总宽度为0.03 的95%的置信区间,又需要多大样本? 【3201】【4268】13. 总体X 服从正态分布N (100,32),1X ,2X ,…n X 是正态总体X的样本,X 为样本均值,假如概率P {X≤101}≥0.95,问样本容量n 至少应取多大?七、问答题1.简述统计量成为总体参数的合理估计的三个标准。
统计和概率经典例题(含答案解析和解析)

统计与概率经典例题(含答案及解析)1.(本题8分)为了解学区九年级学生对数学知识的掌握情况,在一次数学检测中,从学区2000名九年级考生中随机抽取部分学生的数学成绩进行调查,并将调查结果绘制成如下图表:⑴表中a和b所表示的数分别为:a= .,b= .;⑵请在图中补全频数分布直方图;⑶如果把成绩在70分以上(含70分)定为合格,那么该学区2000名九年级考生数学成绩为合格的学生约有多少名?2.为鼓励创业,市政府制定了小型企业的优惠政策,许多小型企业应运而生,某镇统计了该镇1﹣5月新注册小型企业的数量,并将结果绘制成如下两种不完整的统计图:(1)某镇今年1﹣5月新注册小型企业一共有家.请将折线统计图补充完整;(2)该镇今年3月新注册的小型企业中,只有2家是餐饮企业,现从3月新注册的小型企业中随机抽取2家企业了解其经营状况,请用列表或画树状图的方法求出所抽取的2家企业恰好都是餐饮企业的概率.3.(12分)一个不透明的口袋装有若干个红、黄、蓝、绿四种颜色的小球,小球除颜色外完全相同,为估计该口袋中四种颜色的小球数量,每次从口袋中随机摸出一球记下颜色并放回,重复多次试验,汇总实验结果绘制如图不完整的条形统计图和扇形统计图.根据以上信息解答下列问题:(1)求实验总次数,并补全条形统计图;(2)扇形统计图中,摸到黄色小球次数所在扇形的圆心角度数为多少度?(3)已知该口袋中有10个红球,请你根据实验结果估计口袋中绿球的数量.4.(本题10分)某校为了解2014年八年级学生课外书籍借阅情况,从中随机抽取了40名学生课外书籍借阅情况,将统计结果列出如下的表格,并绘制成如图所示的扇形统计图,其中科普类册数占这40名学生借阅总册数的40%.类别科普类教辅类文艺类其他册数(本)128 80 m 48(1)求表格中字母m的值及扇形统计图中“教辅类”所对应的圆心角a的度数;(2)该校2014年八年级有500名学生,请你估计该年级学生共借阅教辅类书籍约多少本?5.(10分)将如图所示的版面数字分别是1,2,3,4的四张扑克牌背面朝上,洗匀后放在桌面上(“A”看做是“1”)。
统计指数习题及答案

统计指数习题及答案统计学是一门研究数据收集、分析和解释的学科,具有广泛的应用领域。
在统计学学习过程中,习题是非常重要的一部分,通过解答习题可以帮助我们巩固知识,提高应用能力。
本文将介绍一些常见的统计指数习题,并给出相应的答案。
1. 平均数习题a) 某班级有10名学生,他们的身高分别为160、165、170、155、175、180、170、165、160、175(单位:厘米),求班级学生的平均身高。
答案:将所有身高相加得到:160+165+170+155+175+180+170+165+160+175=1695,然后除以学生人数10,得到平均身高为169.5厘米。
b) 一家电商公司在过去一周的每天销售额分别为5000、6000、7000、8000、9000、10000、11000元,求这一周的平均销售额。
答案:将每天销售额相加得到:5000+6000+7000+8000+9000+10000+11000=57000,然后除以7天,得到平均销售额为8142.86元。
2. 中位数习题a) 某班级有30名学生,他们的考试成绩从低到高排列如下:60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、200、205。
求班级学生的中位数。
答案:由于学生人数为偶数,中位数为第15和第16个成绩的平均值,即(135+140)/2=137.5。
b) 一家公司的员工薪资从低到高排列如下:3000、3500、4000、4500、5000、5500、6000、6500、7000、7500、8000、8500、9000、9500、10000元。
求公司员工的中位数。
答案:由于员工人数为奇数,中位数为第8个薪资,即6000元。
3. 众数习题a) 某班级有40名学生,他们的考试成绩如下:60、70、80、80、90、90、90、100、100、100、100、110、110、110、110、120、120、120、120、120、130、130、130、130、130、130、140、140、140、150、150、150、150、150、150、150、150、150、160、160。
统计学计算题例题及计算分析

μp=√σp2/n(1-n/N) =√0.16/100*(1-100/10000) =3.98%
△p=zμp=2*3.98%=7.96%
户数所占比重的下限=p-△p=20%-7.96%=12.04%
户数所占比重的上限=p+△p=20%+7.96%=27.96%
∴ μp=√σp2/n =√0.0736/100 =2.71%
△p=zμ
合格率下限=p-△p=92%-5.31%=86.69%
合格率上限=p+△p=92%+5.31%=97.31%
合格品数量下限=10000*86.69%=8669(只)
合格品数量上限=10000*97.31%=9731(只)
即在95%概率保证下,该新型灯泡合格率区间范围为86.69%~97.31%,合格品数量的区间范围为8669~9731只。
(1)这种新的电子元件平均寿命的区间范围;
(2)这种新的电子元件合格率的区间范围。
解:已知N=10000只n=100只x=1192小时σ=101.17小时p=88% z=1.96
(1)μx=√σ2/n(1-n/N) =√101.172/100*(1-100/10000) =10.07(小时)
△x=zμx=1.96*10.07=19.74(小时)
即全部农户中,户均月收入在6000元以上的户数所占比重的范围为12.04%~27.96%。
(3)户数下限=10000*12.04%=1204(户)
户数上限=10000*27.96%=2796(户)
即全部农户中,户均月收入在6000元以上的户数范围为1204~2796户。
3.2.某企业生产一种新的电子元件10000只,用简单随机不重复抽样方法抽取100只作耐用时间试验,试验得到的结果:平均寿命1192小时,标准差101.17小时,合格率88%;试在95%概率保证度下估计:
统计学综合应用题(有答案)中考23题必练经典

统计学综合应用题(有答案)中考23题必练经典1. 问题描述:某班级学生的身高数据如下:160 170 155 175 165 165 165 185 165 170请计算该班级学生的身高平均值和中位数。
解答步骤:平均值计算:首先将所有身高数据相加,得到总和:160 + 170 + 155 + 175 + 165 + 165 + 165 + 185 + 165 + 170 = 1695。
然后将总和除以学生人数,即10人,得到身高的平均值:1695 / 10 ≈ 169.5。
中位数计算:首先将身高数据从小到大排序:155, 160, 165, 165, 165, 165, 170, 170, 175, 185。
然后找到中间位置的身高数据,即第5个和第6个身高数据:165, 165。
由于这两个数据相同,所以中位数就是165。
2. 问题描述:某学生一周的研究时间如下:2 3 4 5 6 3 4请计算该学生一周的研究时间的方差。
解答步骤:首先计算研究时间的平均值:将所有研究时间相加,得到总和:2 + 3 + 4 + 5 + 6 + 3 + 4 = 27。
然后将总和除以一周的天数,即7天,得到研究时间的平均值:27 / 7 ≈ 3.857。
接下来计算每个研究时间与平均值之差的平方,并将所有平方差相加:(2 - 3.857)^2 + (3 - 3.857)^2 + (4 - 3.857)^2 + (5 - 3.857)^2 + (6 -3.857)^2 + (3 - 3.857)^2 + (4 - 3.857)^2 ≈ 3.857。
最后将平方差的总和除以一周的天数,即7天,得到研究时间的方差:3.857 / 7 ≈ 0.551。
3. 问题描述:某班级学生的考试成绩如下:85 90 95 80 85 90 90 85 95请计算该班级学生的成绩标准差。
解答步骤:首先计算成绩的平均值:将所有成绩相加,得到总和:85 + 90 + 95 + 80 + 85 + 90 + 90 + 85 + 95 = 795。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
统计专题训练1、为了解小学生的体能情况,抽取了某校一个年级的部分学生进行一分钟跳绳次数测试,将取得数据整理后,画出频率分布直方图(如图).已知图中从左到右前三个小组频率分别为0.1,0.3,0.4,第一小组的频数为5.(1)求第四小组的频率;(2)参加这次测试的学生有多少人;(3)若次数在75次以上(含75次)为达标,试估计该年级学生跳绳测试的达标率是多少.解(1)由累积频率为1知,第四小组的频率为1-0.1-0.3-0.4=0.2.(2)设参加这次测试的学生有x人,则0.1x=5,∴x=50.即参加这次测试的学生有50人.(3)达标率为0.3+0.4+0.2=90%,所以估计该年级学生跳绳测试的达标率为90%.2、对某400件元件进行寿命追踪调查情况频率分布如下:寿命(h)频率[500,600)0.10[600,700)0.15[700,800)0.40[[800,900)0.20[900,1000]0.15合计 1(1)(3)估计元件寿命在700 h以上的频率.解(1)寿命与频数对应表:寿命(h)[500,600)[600,700)[700,800)[800,900)[来源:学科网ZXXK][900,1000]频数40601608060(2)估计该元件寿命在[500,800)内的频率为0.10+0.15+0.40=0.65.(3)估计该元件寿命在700 h以上的频率为0.40+0.20+0.15=0.75.3、两台机床同时生产一种零件,在10天中,两台机床每天的次品数如下:甲1,0,2,0,2,3,0,4,1,2 乙1,3,2,1,0,2,1,1,0,1(1)哪台机床次品数的平均数较小?(2)哪台机床的生产状况比较稳定?解(1)x甲=(1+0+2+0+2+3+0+4+1+2)×110=1.5,x乙=(1+3+2+1+0+2+1+1+0+1)×110=1.2. ∵x甲>x乙,∴乙车床次品数的平均数较小.(2)s2甲=110[(1-1.5)2+(0-1.5)2+(2-1.5)2+(0-1.5)2+(2-1.5)2+(3-1.5)2+(0-1.5)2+(4-1.5)2+(1-1.5)2+(2-1.5)2]=1.65,同理s2乙=0.76,∵s2甲>s2乙,∴乙车床的生产状况比较稳定.4、某良种培育基地正在培育一种小麦新品种A.将其与原有的一个优良品种B进行对照试验.两种小麦各种植了25亩,所得亩产数据(单位:千克)如下:品种A:357,359,367,368,375,388,392,399,400,405,412,414,415,421,423,423,427,430,430,434,443,445,445,451,454品种B:363,371,374,383,385,386,391,392,394,394,395,397,397,400,401,401,403,406,407,410,412,415,416,422,430(1)完成数据的茎叶图;(2)用茎叶图处理现有的数据,有什么优点?(3)通过观察茎叶图,对品种A与B的亩产量及其稳定性进行比较,写出统计结论.解(1)(2)由于每个品种的数据都只有25个,样本不大,画茎叶图很方便;此时茎叶图不仅清晰明了地展示了数据的分布情况,便于比较,没有任何信息损失,而且还可以随时记录新的数据.(3)通过观察茎叶图可以看出:①品种A的亩产平均数(或均值)比品种B高;②品种A的亩产标准差(或方差)比品种B大,故品种A的亩产量稳定性较差.5、某个体服装店经营各种服装,在某周内获纯利润y(元)与该周每天销售这种服装件数x之间的一组数据关系如下表:x 3456789y 66697381899091已知:∑i =17x 2i =280,∑i =17x i y i =3487.(1)求x ,y ; (2)画出散点图;(3)观察散点图,若y 与x 线性相关,请求纯利润y 与每天销售件数x 之间的回归直线方程. 解 (1)x =3+4+5+6+7+8+97=6, y =66+69+73+81+89+90+917=5597≈79.86. (2)散点图如图所示.(3)观察散点图知,y 与x 线性相关.设回归直线方程为y ^=b ^x +a ^. ∵∑i =17x 2i =280,∑i =17x i y i =3487,x =6,y =5597, ∴b ^=3487-7×6×5597280-7×36=13328=4.75. a ^=5597-6×4.75≈51.36.∴回归直线方程为y ^=4.75x +51.36.6、某化肥厂甲、乙两个车间包装肥料,在自动包装传送带上每隔30分钟抽取一包产品,称其重量,分别记录如下:甲:52,51,49,48,53,48,49; 乙:60,65,40,35,25,65,60.(1)这种抽样方法是哪一种抽样方法?(2)画出茎叶图,并说明哪个车间的产品比较稳定. 解 (1)该抽样方法为系统抽样法. (2)茎叶图如图所示.由图可以看出甲车间包装的产品重量较集中,而乙车间包装的产品重量较分散,所以甲车间包装的产品重量较稳定.7、有一个容量为100的某校毕业生起始月薪的样本数据的分组及各组的频数如下:月薪[13,14)[14,15)[15,16)[16,17)[17,18)[18,19)[19,20)[20,21] (百元)频数71126231584 6(2)画出频率分布直方图和频率分布折线图;(3)根据频率分布估计该校毕业生起始月薪低于2000元的频率.解(1)样本频率分布表为.起始月薪(百元) 频数频率[13,14)70.07[14,15)110.11[15,16)260.26[16,17)230.23[17,18)150.15[18,19)80.08[19,20)40.04[20,21]60.06合计100 1(2)频率分布直方图和频率分布折线图如图.(3)起始月薪低于2000元的频率为0.07+0.11+0.26+0.23+0.15+0.08+0.04=0.94.即起始月薪低于2000元的频率估计为0.94.8.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析 由题中表格数据,得甲班:x -甲=7,s 2甲=15×(12+02+02+12+02)=25; 乙班:x -乙=7,s 2乙=15×(12+02+12+02+22)=65. ∵s 2甲<s 2乙,∴两组数据中方差较小的为s 2甲=25. 9.高一(2)班有男生27名,女生21名,在一次物理测试中,男生的平均分82分,中位数是75分,女生的平均分是80分,中位数是80分. (1)求这次测试全班平均分(精确到0.01);(2)估计全班成绩在80分以下(含80分)的学生至少有多少? (3)分析男生的平均分与中位数相差较大的主要原因是什么? 分析 根据各种数的定义及意义解决问题.解 (1)由平均数公式得x -=148×(82×27+80×21)≈81.13(分).(2)∵男生的中位数是75,∴至少有14人得分不超过75分.又∵女生的中位数是80,∴至少有11人得分不超过80分.∴全班至少有25人得分低于80分.(3)男生的平均分与中位数的差别较大,说明男生中两极分化现象严重,得分高的和低的相差较大. 10.甲、乙两名战士在相同条件下各射靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7; 乙:6,7,7,8,6,7,8,7,9,5. (1)分别计算以上两组数据的平均数; (2)分别求出两组数据的方差; (3)根据计算结果,估计一下两名战士的射击情况. 解 (1)x甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)解法1:由方差公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3.0(环2),s 2乙=1.2(环2). 解法2:由方差公式s 2=1n [(x ′21+x ′22+…+x ′2n )-n x ′2]计算s 2甲,s 2乙,由于两组数据都在7左右,所以选取a =7.∴s 2甲=110[(x ′21甲+x ′22甲+…+x ′210甲)-10x ′2甲]=110×(1+1+0+1+1+4+4+9+9+0-10×0) =110×30=3.0(环2).同理s 2乙=1.2(环2). (3)x甲=x 乙,说明甲、乙两战士的平均水平相当.又s 2甲>s 2乙,说明甲战士射击情况波动大.因此乙战士比甲战士射击情况稳定.11、假设关于某种设备的使用年限x (年)与所支出的修理费用y (万元),有如下的统计资料:由资料可知y 与x 具有线性相关关系.(1)求回归方程y =b x +a ; (2)估计使用年限为10年时维修费用是多少. 解 (1)先把数据列表如下.由表知,x =4,y =5,由公式可得b ^=112.3-5×4×590-5×42=12.310=1.23,a ^=y -b ^x =5-1.23×4=0.08, ∴回归方程为y ^=1.23x +0.08.(2)由回归方程y ^=1.23x +0.08知,当x =10时,y ^=1.23×10+0.08=12.38(万元). 故估计使用年限为10年时维修费用是12.38万元.12、下表提供了某厂节能降耗技术,改造后生产甲产品过程中记录的产量x (吨)与相应的生产能耗y (吨标准煤)的几组对照数据.(1)(2)请据上表提供的数据,用最小二乘法求出y 关于x 的线性回归方程y ^=b ^x +a ^;(3)已知该厂技改前100吨甲产品的生产能耗为90吨标准煤,试根据(2)求出的线性回归方程,预测生产100吨甲产品的生产能耗比技改前降低了多少吨标准煤?(参考值:3×2.5+4×3+5×4+6×4.5=66.5)解 (1)由题设所给数据,可得散点图如图所示. (2)由对照数据计算,得∑i =14x 2i =86,x =3+4+5+64=4.5,y =2.5+3+4+4.54=3.5. ∑i =14x i y i =66.5.∴由最小二乘法确定的回归方程的系数b ^=∑i =14x i y i -4x y∑i =14x 2i -4x 2=66.5-4×4.5×3.586-4×4.52=0.7,a ^=y -b ^x =3.5-0.7×4.5=0.35,由此所求的线性回归方程为y ^=0.7x +0.35. (3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗得降低的生产能耗约为: 90-(0.7×100+0.35)=19.65(吨标准煤).。