数据分析与建模练习
大数据建模练习(习题卷2)

大数据建模练习(习题卷2)第1部分:单项选择题,共39题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]在黑盒测试方法中,设计测试用例的主要根据是A)程序流程图B)程序内部逻辑C)程序外部功能D)程序数据结构答案:C解析:2.[单选题]以下关于字典类型的描述,正确的是:A)字典类型可迭代,即字典的值还可以是字典类型的对象B)表达式 for x in d: 中,假设d是字典,则x是字典中的键值对C)字典类型的值可以是任意数据类型的对象D)字典类型的键可以是列表和其他数据类型答案:C解析:3.[单选题]已知数据中时间字段的格式为2021-01-01 00:00:00,如果使用过滤算子,过滤出2021年5月1日以来的数据,以下哪个是正确的设置A)大于2021-05-01 00:00:00B)小于2021-05-01 00:00:00C)大于等于2021-05-01 00:00:00D)小于等于2021-05-01 00:00:00答案:C解析:4.[单选题]Jupyter notebook的记事本文件扩展名为:A)mB)pyC)pycD)ipynb答案:D解析:5.[单选题]修改数据库表结构用以下哪一项( )A)UPDATEB)CREATEC)UPDATEDD)ALTER答案:D解析:C)ORDER BY NAME DESCD)ORDER BY DESC NAME答案:A解析:7.[单选题]个栈的初始状态为空。
现将元素 1、2、3、4、5、A、B、C、D、E依次入栈,然后再依次出栈,则元素出栈的顺序是A)12345ABCDEB)EDCBA54321C)54321EDCBAD)ABCDE12345答案:B解析:8.[单选题]在Excel中,数据透视表是汇总、分析、浏览和呈现汇总数据的方法。
插入数据透视表之后,选择一个(),可以实现单元格区域的验证A)单元格B)表/区域C)公式D)文件答案:B解析:9.[单选题]在select语句的where子句中,使用正则表达式过滤数据的关键字是( )A)likeB)againstC)matchD)regexp答案:D解析:10.[单选题]如果要统计某家店铺当天的收益总和,需要按照日期分组,且对收益的统计方式是A)最大B)最小C)总数D)总和答案:D解析:11.[单选题]耦合性和内聚性是对模块独立性度量的两个标准。
5 小题分类练(五) 数学建模与数据分析

小题分类练(五)数学建模与数据分析一、单项选择题1.某辆汽车每次加油都把油箱加满,表中记录了该车相邻两次加油时的情况.加油时间加油量(升)加油时累计里程(千米) 2018年10月1日1235 0002018年10月15日6035 600(在这段时间内,该车每100千米平均耗油量为()A.6升 B.8升C.10升D.12升2.(2020·高考全国卷Ⅰ)某校一个课外学习小组为研究某作物种子的发芽率y和温度x(单位:℃)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据(x i,y i)(i=1,2,…,20)得到下面的散点图:由此散点图,在10 ℃至40 ℃之间,下面四个回归方程类型中最适宜作为发芽率y和温度x的回归方程类型的是()A.y=a+bx B.y=a+bx2C.y=a+b e x D.y=a+b ln x3.某网店在2020年1月的促销活动中,随机抽查了100名消费者的消费情况,并记录了他们的消费金额(单位:千元),将数据分成6组:[0,1),[1,2),[2,3),[3,4),[4,5),[5,6],整理得到频率分布直方图如图所示.若消费金额不超过3千元的人数占总人数的35,则消费金额超过4千元的人数为()A.12 B.15C.16D.184.某企业投入100万元购入一套设备,该设备每年的运转费用是0.5万元,此外每年都要花费一定的维护费,第一年的维护费为2万元,由于设备老化,以后每年的维护费都比上一年增加2万元.为使该设备年平均费用最低,该企业需要更新设备的年数为()A.10 B.11C.13 D.215.已知甲袋中有1个黄球和1个红球,乙袋中有2个黄球和2个红球,现随机从甲袋中取出1个球放入乙袋中,再从乙袋中随机取出1个球,则从乙袋中取出的球是红球的概率为()A.13 B.12C.59D.296.素数也叫质数,法国数学家马林·梅森是研究素数的数学家中成就很高的一位,因此后人将“2n-1”形式(n是素数)的素数称为梅森素数.已知第20个梅森素数为P=24 423-1,第19个梅森素数为Q=24 253-1,则下列各数中与P Q最接近的数为(参考数据:lg 2≈0.3)()A.1045 B.1051C.1056D.10597.中医药,是包括汉族和少数民族医药在内的我国各民族医药的统称,反映了中华民族对生命、健康和疾病的认识,具有悠久历史传统和独特理论及技术方法的医药学体系.某科研机构研究发现,某品种中医药的成分甲的含量x(单位:克)与药物功效y(单位:药物单位)之间的关系为y=10x-x2.检测这种药品同一个批次的5个样本,得到成分甲的含量的平均值为4克,标准差为2克,则估计这批这种药品的药物功效的平均值为()A.22药物单位 B.20药物单位C.12药物单位D.10药物单位8.(2020·河南“九师联盟”质量检测)坐落于伦敦泰晤士河畔的伦敦眼是世界上首座、也曾经是世界最大的观景摩天轮.已知其旋转半径为60米,最高点距地面135米,运行一周大约30分钟,某游客在最低点的位置坐上摩天轮,则第10分钟时他距离地面大约为()A.95米 B.100米C.105米D.110米二、多项选择题9.(2020·江苏南京师大附中期中)在一次社会实践活动中,某数学调研小组根据车间持续5个小时的生产情况画出了某种产品的总产量y(单位:kg)与时间x(单位:h)的函数图象,则以下关于该产品生产状况的正确判断是()A.在前三小时内,每小时的产量逐步增加B.在前三小时内,每小时的产量逐步减少C.最后一小时内的产量与第三小时内的产量相同D.最后两小时内,该车间没有生产该产品10.(2020·山东烟台期末)某大学为了了解学生对学校食堂服务的满意度,随机调查了50名男生和50名女生,每位学生对食堂的服务给出满意或不满意的评价,得到如图的列联表.经计算K2的观测值k≈4.762,则可以推断出()满意不满意男3020女4010临界值表:P(K2≥k0)0.1000.0500.010 k0 2.706 3.841 6.635A.该学校男生对食堂服务满意的概率的估计值为3 5B.调研结果显示,该学校男生比女生对食堂服务更满意C.有95%的把握认为男、女生对该食堂服务的评价有差异D.有99%的把握认为男、女生对该食堂服务的评价有差异11.近年来,我国国内文化和旅游市场潜力不断释放,大众出游热情持续高涨,行业发展整体呈好的趋势,以下为2011-2019年我国国内旅游收入情况统计图.根据统计图,下列结论正确的是()A.与2018年相比,2019年国内旅游收入增幅约为19.61%B.2011-2019年国内旅游收入的中位数为3.4万亿元C.2011-2019年国内旅游收入的平均数约为3.5万亿元D.若每年国内旅游收入y(万亿元)与年份x线性相关,且满足y=b(x-2 010)+1.205,则估计2020年的国内旅游收入为7.2万亿元12.江先生朝九晚五上班,上班通常乘坐公交加步行或乘坐地铁加步行.江先生从家到公交站或地铁站都要步行5分钟.公交车多且路程近一些,但乘坐公交路上经常拥堵,所需时间Z(单位:分)服从正态分布N(33,42).下车后从公交站步行到单位要12分钟;乘坐地铁畅通,但路线长且乘客多,所需时间Z(单位:分)服从正态分布N(44,22),下地铁后从地铁站步行到单位要5分钟.从统计的角度看,下列说法合理的是()参考数据:若Z~N(μ,σ2),则P(μ-σ<Z≤μ+σ)≈0.682 7,P(u-2σ<Z≤μ+2σ)≈0.954 5,P(μ-3σ<Z≤μ+3σ)≈0.997 3.A.若8:00出门,则乘坐公交上班不会迟到B.若8:02出门,则乘坐地铁上班不迟到的可能性更大C.若8:06出门,则乘坐公交上班不迟到的可能性更大D.若8:12出门,则乘坐地铁上班几乎不可能不迟到三、填空题13.(2020·湖北随州调研)2020年初新冠肺炎疫情袭击全国,口罩成为重要的抗疫物资,为了确保口罩供应,某工厂口罩生产线高速运转,工人加班加点生产,设该工厂连续5天生产的口罩数量依次为x1,x2,x3,x4,x5(单位:十万只),若这组数据x1,x2,x3,x4,x5的方差为1.44,且x21,x22,x23,x24,x25的平均数为4,则该工厂这5天平均每天生产口罩________十万只.14.如图,设A,B两点在河的两岸,一测量者在A同侧的河岸边选定一点C,测出AC的距离为100 m,∠ACB=30°,∠CAB=105°后,就可以计算出A,B两点间的距离为________m.15.某市某高中从高三年级甲、乙两个班中各选出7名学生参加2018年全国高中数学联赛(河南初赛),他们取得的成绩(满分140分)的茎叶图如图所示,其中甲班学生成绩的中位数是81,乙班学生成绩的平均数是86.若正实数a,b满足a,G,b成等差数列且x,G,y成等比数列,则1a+4b的最小值为________.16.某食品的保鲜时间t(单位:小时)与储藏温度x(恒温,单位:℃)满足函数关系t(x)={64,x≤0,2kx+6,x>0,且该食品在4 ℃的保鲜时间是16小时.(1)该食品在8 ℃的保鲜时间是________小时;(2)已知甲在某日上午10时购买了该食品,并将其遗放在室外,且此日的室外温度随时间变化如图所示,那么到了此日13时,甲所购买的食品________保鲜时间(填“过了”或“没过”).小题分类练(五)1.解析:选C.因为第二次加满油箱时加油量为60升,所以从第一次加油到第二次加油共用油60升,行驶了600千米,所以在这段时间内,该车每100千米平均耗油量为60600÷100=10(升).故选C.2.解析:选D.根据散点图,用光滑的曲线把图中各点依次连起来(图略),由图得并结合选项可排除A,B,C,故选D.3.解析:选B.因为消费金额不超过3千元的人数占总人数的35=0.6,所以第4,5,6组的频率之和为1-0.6=0.4,从题图中可知第4组的频率为0.25,所以第5,6组的频率之和为0.4-0.25=0.15,所以消费金额超过4千元的人数为100×0.15=15.4.解析:选A.设该企业需要更新设备的年数为x,设备年平均费用为y,则x年后的设备维护费用为2+4+…+2x=x(x+1),所以x年的平均费用为y=100+0.5x+x(x+1)x=x+100x+1.5,由基本不等式得y=x+100x+1.5≥2x·100x+1.5=21.5,当且仅当x=100x,即x=10时取等号,所以选A.5.解析:选B.设事件A:“从甲袋中取出1个红球放入乙袋中,再从乙袋中取出1个红球”,事件B:“从甲袋中取出1个黄球放入乙袋中,再从乙袋中取出1个红球”,根据题意知所求概率为P(A+B)=P(A)+P(B)=12×35+12×25=12.故选B.6.解析:选B.由题知PQ=24 423-124 253-1≈2170,令2170=k,则lg 2170=lg k.所以170lg 2=lg k .又lg 2≈0.3,所以51=lg k ,即k =1051,所以与P Q 最接近的数为1051.故选B.7.解析:选A.设5个样本的成分甲的含量分别为x 1,x 2,x 3,x 4,x 5,其平均值为x ,标准差为s ,5个样本的药物功效分别为y 1,y 2,y 3,y 4,y 5,其平均值为y ,则x =4,s =2,所以s 2=15[(x 1-x )2+(x 2-x )2+…+(x 5-x )2]=2,所以(x 1-x )2+(x 2-x )2+…+(x 5-x )2=10,所以(x 21+x 22+…+x 25)-2(x 1+x 2+…+x 5) x +5x 2=10,所以(x 21+x 22+…+x 25)-2×5x ×x +5x 2=10,所以(x 21+x 22+…+x 25)-5x 2=10,所以x 21+x 22+…+x 25=90,则y 1+y 2+…+y 5=10(x 1+x 2+…+x 5)-(x 21+x 22+…+x 25)=110,则y =22,所以估计这批这种药品的药物功效的平均值为22药物单位.故选A.8.解析:选C.设人在摩天轮上离地面的高度(米)与时间t (分)的函数关系为f (t )=A sin(ωt +φ)+B (A >0,ω>0,φ∈[0,2π)).由题意,知A =60,B =135-60=75,T =2πω=30,所以w =π15.所以f (t )=60sin ⎝ ⎛⎭⎪⎫π15t +φ+75.因为f (0)=135-120=15,所以f (0)=60sin φ+75=15,所以sin φ=-1,故φ=3π2.所以f (t )=60sin ⎝ ⎛⎭⎪⎫π15t +3π2+75=-60cos π15t +75,所以f (10)=-60×cos 2π3+75=105.故选C.9.解析:选BD.由题图得前三小时的产量在逐步减少,故A 项错误,B 项正确;最后两小时内车间没有生产产品,故C 项错误,D 项正确.故选BD.10.解析:选AC.对于A ,该学校男生对食堂服务满意的概率的估计值为3030+20=35,故A 正确.对于B ,该学校女生对食堂服务满意的概率的估计值为4040+10=45>35,故B 错误.因为3.841<k ≈4.762<6.635,所以有95%的把握认为男、女生对该食堂服务的评价有差异,C 正确,D 错误.故选AC.11.解析:选AB.选项A.由题图可知,2019年国内旅游收入比2018年增长了1万亿元,增幅约为15.1×100%≈0.196 1×100%=19.61%,故A 选项正确.选项B ,将2011-2019年这九年的国内旅游收入的金额按照由小到大的顺序排列,可得中位数是3.4万亿元,故B 选项正确.选项C ,2011-2019年国内旅游收入的平均数约为1.9+2.3+2.6+3.3+3.4+3.9+4.6+5.1+6.19≈3.69(万亿元),故C 选项不正确.选项D ,由题意可得 x =2 011+2 012+2 013+2 014+2 015+2 016+2 017+2 018+2 0199=2 015,将(2 015,3.69)代入y =b (x -2 010)+1.205,得5b +1.205=3.69,可得b =0.497,所以y =0.497(x -2 010)+1.205,将x =2 020代入,可得y =6.175,D 选项不正确.12.解析:选CD.对于选项A ,江先生乘坐公交的时间不大于43分钟才不会迟到,因为P (Z ≤43)<P (Z ≤45),且P (33-12<Z ≤33+12)≈0.997 3,所以P (Z ≤43)<P (Z ≤45)≈0.5+0.5×0.997 3≈0.998 7,所以“江先生上班迟到”还是有可能发生的,所以选项A 不合理;对于选项B ,若江先生乘坐地铁上班,则其乘坐地铁的时间不大于48分钟才不会迟到,因为P (44-4<Z ≤44+4)≈0.954 5,所以P (Z ≤48)≈0.5+0.954 5×0.5≈0.977 3,所以“江先生8:02出门,乘坐地铁上班不迟到”发生的可能性约为0.977 3,若江先生乘坐公交上班,则其乘坐公交的时间不大于41分钟才不会迟到,因为P (33-8<Z ≤33+8)≈0.954 5,所以P (Z ≤41)≈0.5+0.954 5×0.5≈0.977 3,所以“江先生8:02出门,乘坐公交上班不迟到”发生的可能性约为0.977 3,二者可能性一样,所以选项B 不合理;对于选项C ,若江先生乘坐公交上班,则其乘坐公交的时间不大于37分钟才不会迟到,因为P (33-4<Z ≤33+4)≈0.682 7,所以P (Z ≤37)≈0.5+0.5×0.682 7≈0.841 4,所以“江先生8:06出门,乘坐公交上班不迟到”发生的可能性约为0.841 4,若江先生乘坐地铁上班,则其乘坐地铁的时间不大于44分钟才不会迟到,因为P (Z ≤44)=0.5,所以“江先生8:06出门,乘坐地铁上班不迟到”发生的可能性约为0.5,又0.841 4>0.5,所以选项C 是合理的;对于选项D ,江先生乘坐地铁的时间不大于38分钟才不会迟到,因为P (44-6<Z ≤44+6)≈0.997 3,所以P (Z ≤38)≈(1-0.997 3)×0.5≈0.001 4,所以“江先生8:12出门,乘坐地铁上班不迟到”发生的可能性非常小,所以选项D 合理.所以选CD.13.解析:依题意,得x 21+x 22+…+x 25=20.设x 1,x 2,x 3,x 4,x 5的平均数为x ,根据方差的计算公式有15[(x 1-x )2+(x 2-x )2+…+(x 5-x )2]=1.44,所以(x 21+x 22+…+x 25)-2x (x 1+x 2+…+x 5)+5x 2=7.2,即20-10x 2+5x 2=7.2,解得x =1.6.则该工厂这5天平均每天生产口罩1.6十万只.答案:1.614.解析:由三角形内角和定理可得∠CBA =180°-30°-105°=45°.由正弦定理知AC sin ∠CBA =AB sin ∠ACB ,则AB =AC ·sin ∠ACB sin ∠CBA =100×1222=502(m),即A ,B 两点间的距离为50 2 m.答案:50 215.解析:由甲班学生成绩的中位数是81,可知81为甲班7名学生的成绩按从小到大的顺序排列的第4个数,故x =1.由乙班学生成绩的平均数为86,可得(-10)+(-6)+(-4)+(y -6)+5+7+10=0,解得y =4.由x ,G ,y 成等比数列,可得G 2=xy =4,可得G =±2,由正实数a ,b 满足a ,G ,b 成等差数列,可得G =2,a +b =2G =4,所以1a +4b =⎝ ⎛⎭⎪⎫1a +4b ×⎝ ⎛⎭⎪⎫a 4+b 4=14⎝ ⎛⎭⎪⎫1+b a +4a b +4≥14×(5+4)=94(当且仅当b =2a 时取等号).故1a +4b 的最小值为94. 答案:9416.解析:(1)因为食品在4 ℃的保鲜时间是16小时,所以24k +6=16.解得k =-12.所以t (8)=2-4+6=4.(2)由题图可知在11时之前,温度已经超过了10 ℃,此时该食品的保鲜期少于21=2小时,而食品在11时之前已放了一段时间.所以到13时,该食品过了保鲜时间.答案:(1)4(2)过了。
数学建模练习试题

1、放射性废料的处理问题美国原子能委员会以往处理浓缩的放射性废料的方法,一直是把它们装入密封的圆桶里,然后扔到水深为90多米的海底。
生态学家和科学家们表示担心,怕圆桶下沉到海底时与海底碰撞而发生破裂,从而造成核污染。
原子能委员会分辨说这是不可能的。
为此工程师们进行了碰撞实验。
发现当圆桶下沉速度超过12.2 m/s 与海底相撞时,圆桶就可能发生碰裂。
这样为避免圆桶碰裂,需要计算一下圆桶沉到海底时速度是多少? 这时已知圆桶重量为239.46 kg,体积为0.2058m3,海水密度为1035.71kg/m3,如果圆桶速度小于12.2m/s就说明这种方法是安全可靠的,否则就要禁止使用这种方法来处理放射性废料。
假设水的阻力与速度大小成正比例,其正比例常数k=0.6。
现要求建立合理的数学模型,解决如下实际问题:1.判断这种处理废料的方法是否合理?2.一般情况下,v大,k也大;v小,k也小。
当v很大时,常用kv来代替k,那么这时速度与时间关系如何? 并求出当速度不超过12.2 m/s,圆桶的运动时间和位移应不超过多少? (的值仍设为0.6)鱼雷攻击问题在一场战争中,甲方一潜艇在乙方领海进行秘密侦察活动。
当甲方潜艇位于乙方一潜艇的正西100千米处,两方潜艇士兵同时发现对方。
甲方潜艇开始向正北60千米处的营地逃跑,在甲方潜艇开始逃跑的同时,乙方潜艇发射了鱼雷进行追踪攻击。
假设甲方潜艇与乙方鱼雷是在同一平面上进行运动。
已知甲方潜艇和乙方鱼雷的速度均匀且鱼雷的速度是甲方潜艇速度的两倍。
试建立合理的数学模型解决以下问题:1) 求鱼雷在追踪攻击过程中的运动轨迹;2) 确定甲方潜艇能否安全的回到营地而不会被乙方鱼雷击中3、贷款买房问题某居民买房向银行贷款6万元,利息为月利率1%,贷款期为25年,要求建立数学模型解决如下问题:1)问该居民每月应定额偿还多少钱?2)假设此居民每月可节余700元,是否可以去买房?4、养老保险问题养老保险是保险中的一种重要险种,保险公司将提供不同的保险方案以供选择,分析保险品种的实际投资价值。
大数据建模练习(习题卷7)

大数据建模练习(习题卷7)第1部分:单项选择题,共37题,每题只有一个正确答案,多选或少选均不得分。
1.[单选题]在视图上不能完成的操作是( )A)更新视图数据B)在视图上定义新的基本表C)在视图上定义新的视图D)查询答案:B解析:2.[单选题]在SQL语言中的视图VIEW是数据库的( )A)外模式B)存储模式C)模式D)内模式答案:A解析:3.[单选题]创建数据库使用以下哪项( )A)create mytestB)create table mytestC)database mytestD)create database mytest答案:D解析:4.[单选题]存储过程是一组预先定义并( )的Transact-SQL语句A)保存B)编写C)编译D)解释答案:C解析:5.[单选题]天算建模平台数据集市支持多种数据分类,可以对接大数据平台推送的数据、民警自己的个人数据、建模运行结果数据以及对接警种业务库。
以下数据资源是所有账号都默认可以看到的。
A)数据资源目录B)个人数据C)模型结果数据D)警种业务数据答案:A解析:C)基于WEB的OLAM是WEB技术与OLAM技术的结合D)OLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作答案:D解析:7.[单选题]文件 book.txt 在当前程序所在目录内,其内容是一段文本:book,下面代码的输出结果是:txt =open("book.txt", "r")print(txt)txt.close()A)book.txtB)txtC)bookD)以上答案都不对答案:D解析:8.[单选题]在数据结构中的非线性结构中,()中的结点之间,存在一对多的关系,每个结点最多只有一个前驱,但可以有多个后继,可以有多个终端结点。
A)网状结构B)树状结构C)图状结构D)集合答案:B解析:9.[单选题]删除经销商1018的数据记录的代码为( ) from distributors where distri_num=1018A)drop tableB)delete *C)drop columnD)delete答案:D解析:10.[单选题]为了提高测试的效率,应该A)集中对付那些错误群集的程序B)随机选取测试数据C)在完成编码以后制定软件的测试计划D)取一切可能的输入数据作为测试数据答案:A解析:11.[单选题]以下关于函数参数和返回值的描述,正确的是:A)采用名称传参的时候,实参的顺序需要和形参的顺序一致B)可选参数传递指的是没有传入对应参数值的时候,就不使用该参数C)函数能同时返回多个参数值,需要形成一个列表来返回D)Python支持按照位置传参也支持名称传参,但不支持地址传参答案:D解析:12.[单选题]当用户输入abc时,下面代码的输出结果是:try: n = 0 n = input("请输入一个整数: ") def pow10(n):D)输出:程序执行错误答案:B解析:13.[单选题]查找数据库中所有的数据表用以下哪一项( )A)SHOW DATABASEB)SHOW TABLESC)SHOW DATABASESD)SHOW TABLE答案:B解析:14.[单选题]Python内置函数( )可以返回列表、元组、字典、集合、字符串以及range对象中元素个数A)dimB)lenC)setD)compute答案:B解析:15.[单选题]从数据表中查找记录用以下哪一项( )A)UPDATEB)FINDC)SELECTD)CREATE答案:C解析:16.[单选题]在用Excel处理数据时,若需要根据某个判断来得到一个值,或另外一个值,这个时候就需要使用if函数。
关于bd的练习题

关于bd的练习题BD的练习题:挑战你的智力和创造力在现代社会,大数据(Big Data)已经成为了企业和组织中不可或缺的一部分。
随着科技的发展和互联网的普及,海量的数据被不断产生和积累。
然而,如何从这些海量的数据中提取有用的信息并做出正确的决策,成为了一个重要的课题。
为了培养人们在大数据分析方面的能力,越来越多的人开始进行BD的练习。
这些练习题旨在挑战人们的智力和创造力,帮助他们培养分析和解决问题的能力。
BD的练习题通常包括以下几个方面:1. 数据处理和清洗:在大数据中,数据质量和准确性是至关重要的。
练习题会要求参与者清洗和处理数据,去除重复项、填补缺失值等,以保证数据的可靠性。
2. 数据分析和建模:在处理好数据后,练习题会要求参与者进行数据分析和建模。
这包括使用统计学方法和机器学习算法对数据进行分析和预测,以帮助企业做出正确的决策。
3. 数据可视化:数据可视化是将数据转化为图表或图形的过程,可以帮助人们更直观地理解数据。
练习题会要求参与者使用各种工具和技术,将分析结果可视化展示出来。
通过参与BD的练习题,人们可以提高自己的数据分析能力和解决问题的能力。
这对于从事数据分析工作的人员来说尤为重要,也对于任何希望在信息时代中脱颖而出的人来说都是有益的。
此外,BD的练习题也可以帮助人们培养创造力。
在解决实际问题的过程中,人们需要思考各种可能的解决方案,并选择最佳的方案。
这锻炼了人们的创造力和创新能力,使他们能够在面对复杂问题时找到独特的解决方法。
综上所述,BD的练习题是一种挑战人们智力和创造力的方式,通过参与这些练习,人们可以提高自己的数据分析能力和解决问题的能力。
无论是从事数据分析工作的人员还是希望在信息时代中脱颖而出的人,都可以从中受益。
让我们一起投身于BD的练习题中,不断挑战自己,不断提高自己的能力!。
高考专题练习: 概率统计中的数学建模与数据分析

(2020·广东六校第一次联考)某机构组织语文、数学学科能力竞赛,按照一定比例淘汰后,颁发一、二、三等奖(分别对应成绩等级的一、二、三等级).现有某考场所有考生的两科成绩等级统计如图1所示,其中获数学二等奖的考生有12人.图1(1)求该考场考生中获语文一等奖的人数;(2)用随机抽样的方法从获得数学和语文二等奖的考生中各抽取5人,进行综合素质测试,将他们的综合得分绘成茎叶图(如图2所示),求样本的平均数及方差并进行比较分析;图2(3)已知本考场的所有考生中,恰有3人两科均获一等奖,在至少一科获一等奖的考生中,随机抽取2人进行访谈,求这2人两科均获一等奖的概率.【解】 (1)因为获数学二等奖的考生有12人, 所以该考场考生的总人数为121-0.40-0.26-0.10=50.故该考场获语文一等奖的考生人数为50×(1-0.38×2-0.16)=4.(2)设获数学二等奖考生综合得分的平均数和方差分别为x -1,s 21,获语文二等奖考生综合得分的平均数和方差分别为x -2,s 22.x -1=81+84+92+90+935=88,x -2=79+89+84+86+875=85,s 21=15×[(-7)2+(-4)2+42+22+52]=22, s 22=15×[(-6)2+42+(-1)2+12+22]=11.6,因为88>85,11.6<22,所以获数学二等奖考生较获语文二等奖考生综合素质测试的平均分高,但是成绩差距较大.(3)两科均获一等奖的考生共有3人,则仅数学获一等奖的考生有2人,仅语文获一等奖的考生有1人,把两科均获一等奖的3人分别记为A 1,A 2,A 3,仅数学获一等奖的2人分别记为B 1,B 2,仅语文获一等奖的1人记为C ,则在至少一科获一等奖的考生中,随机抽取2人的基本事件有A 1A 2,A 1A 3,A 1B 1,A 1B 2,A 1C ,A 2A 3,A 2B 1,A 2B 2,A 2C ,A 3B 1,A 3B 2,A 3C ,B 1B 2,B 1C ,B 2C ,共15个.记“这2人两科均获一等奖”为事件M ,则事件M 包含的基本事件有A 1A 2,A 1A 3,A 2A 3,共3个, 所以P (M )=315=15,故这2人两科均获一等奖的概率为15.统计与概率“搭台”,方案选择“唱戏”破解此类频率分布直方图、分层抽样与概率相交汇的开放性问题的关键:一是会观图读数据,能从频率分布直方图中读出频率,进而求出频数;二是能根据分层抽样的抽样比或各层之间的比例,求出分层抽样中各层需取的个数;三是会转化,会对开放性问题进行转化.某校学生参与一项社会实践活动,受生产厂家委托采取随机抽样方法,调查我市市民对某新开发品牌洗发水的满意度,同学们模仿电视问政的打分制,由被调查者在0分到100分的整数分中给出自己的认可分数,现将收集到的100位市民的认可分数分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],绘制出如图所示的频率分布直方图.(1)求这100位市民认可分数的中位数(精确到0.1),平均数(同一组中的数据用该组区间的中点值作代表);(2)生产厂家根据同学们收集到的数据,拟随机在认可分数为80及其以上的市民中选出2位市民当产品宣传员,求这2位宣传员都来自认可分数为[90,100]的概率.解:(1)由于[40,50),[50,60),[60,70)的频率分别有0.1,0.2,0.3.故中位数位于[60,70)中,其值为60+10×23≈66.7.平均数为10×(45×0.01+55×0.02+65×0.03+75×0.025+85×0.01+95×0.005)=67.(2)认可分数位于[80,90)的人数为10,认可分数位于[90,100]的人数为5,从认可分数位于[90,100]的5人中随机选择2人的基本事件数为1+2+3+4=10,从认可分数位于[80,90)和[90,100]的15人中随机选择2人的基本事件数为1+2+3+…+14=105.故这2位宣传员都来自认可分数为[90,100]的概率为10105=2 21.图表与独立性检验相交汇(师生共研)某种常见疾病可分为Ⅰ,Ⅱ两种类型.为了了解所患该疾病类型与地域、初次患该疾病的年龄(单位:岁)(以下简称初次患病年龄)的关系,在甲、乙两个地区随机抽取100名患者调查其所患疾病类型及初次患病年龄,得到如下数据.初次患病年龄甲地Ⅰ型疾病患者/人甲地Ⅱ型疾病患者/人乙地Ⅰ型疾病患者/人乙地Ⅱ型疾病患者/人[10,20)815 1[20,30)433 1[30,40)352 4[40,50)384 4[50,60)392 6[60,70]21117(2)记“初次患病年龄在[10,40)内的患者”为“低龄患者”,“初次患病年龄在[40,70]内的患者”为“高龄患者”.根据表中数据,解决以下问题.①将以下两个列联表补充完整,并判断“地域”“初次患病年龄”这两个变量中哪个变量与所患疾病的类型有关联的可能性更大.(直接写出结论,不必说明理由)表一疾病类型患者所在地域Ⅰ型Ⅱ型总计甲地乙地总计100.问:是否有99.9%的把握认为所患疾病的类型与X有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.【解】(1)依题意,甲、乙两地区Ⅰ型疾病患者共40人,甲、乙两地区Ⅰ型疾病患者初次患病年龄小于40岁的人数分别为15,10,则从Ⅰ型疾病患者中随机抽取1人,其初次患病年龄小于40岁的概率的估计值为15+1040=58.(2)①填空结果如下.表一低龄 25 15 40 高龄 15 45 60 总计4060100“初次患病年龄”与所患疾病的类型有关联的可能性更大.②由①可知X 为初次患病年龄,根据表二中的数据可得a =25,b =15,c =15,d =45,n =100,则K 2=100×(25×45-15×15)240×60×40×60≈14.063,因为14.063>10.828,故有99.9%的把握认为所患疾病类型与初次患病年龄有关.本题的易错点有三处:一是审题不认真,误认为甲、乙两地区Ⅰ型疾病患者的总数为100,错误列式15+10100=0.25;二是不能从频数分布表中获取相关数据,无法正确填写列联表,不能根据列联表中数据的含义做出正确判断;三是代错公式或计算错误,从而导致统计判断出错.(2021·福州市适应性考试)世界互联网大会是由中华人民共和国倡导并每年在浙江省嘉兴市桐乡乌镇举办的世界性互联网盛会,大会旨在搭建中国与世界互联互通的国际平台和国际互联网共享共治的中国平台,让各国在争议中求共识、在共识中谋合作、在合作中创共赢.2020年11月23日至24日,第七届世界互联网大会如期举行,为了大会顺利召开,组委会特招募了1 000名志愿者.某部门为了了解志愿者的基本情况,调查了其中100名志愿者的年龄(单位:岁),得到了他们年龄的中位数为34,年龄在[40,45)内的人数为15,并根据调查结果画出如图所示的频率分布直方图.(1)求m,n的值并估算出志愿者的平均年龄(同一组的数据用该组区间的中点值代表);(2)这次大会志愿者主要通过现场报名和登录大会官网报名,即现场和网络两种方式报名参加.这100名志愿者的报名方式部分数据如下表所示,完善下面的表格,通过计算说明能否在犯错误的概率不超过0.001的前提下,认为“选择哪种报名方式与性别有关系”?男性女性总计现场报名50网络报名31总计50参考公式及数据:K2=2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.050.010.0050.001k0 3.841 6.6357.87910.828解:(1)因为志愿者年龄在[40,45)内的人数为15,所以志愿者年龄在[40,45)内的频率为15100=0.15.由频率分布直方图得,(0.020+2m+4n+0.010)×5+0.15=1,即m+2n=0.07,①由中位数为34可得,0.020×5+2m×5+2n×(34-30)=0.5,即5m+4n=0.2,②由①②解得m=0.020,n=0.025.所以志愿者的平均年龄为(22.5×0.020+27.5×0.040+32.5×0.050+37.5×0.050+42.5×0.030+47.5×0.010)×5=34(岁).(2)根据题意得到列联表,男性女性总计现场报名193150网络报名311950总计5050100所以K2=100×(19×19-31×31)250×50×50×50=2×[(19+31)×(19-31)]250×50×50=5.76<10.828,所以不能在犯错误的概率不超过0.001的前提下,认为“选择哪种报名方式与性别有关系”.图表与线性回归分析相交汇(师生共研)如图是某部门公布的一年内道路交通事故成因分析,由图可知,超速驾驶已经成为交通事故的一个主要因素.研究表明,急刹车时的停车距离等于反应距离与制动距离的和,下表是根据某部门的调查结果整理所得的数据(v表示行车速度,单位:km/h;d1,d2分别表示反应距离和制动距离,单位m).v6472808997105113121128135 d113.415.216.718.620.121.923.525.326.828.5好有1起属于超速驾驶的概率(用频率代替概率);(2)已知d 2与v 的平方成正比,且当行车速度为100 km/h 时,制动距离为65 m.①由表中数据可知,d 1与v 之间具有线性相关关系请建立d 1与v 之间的回归方程,并估计车速为110 km/h 时的停车距离;②我国《道路交通安全法》规定:车速超过100 km/h 时,应该与同车道前车保持100 m 以上的距离,请解释一下上述规定的合理性.参考数据:∑10i =1v i =1 004,∑10i =1(d 1)i =210,∑10i =1v i (d 1)i =22 187.3,∑10i =1v 2i =106 054,11 03352 524≈0.21. 参考公式:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘估计分别为:b =∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2,a =y--b x -.【解】 (1)由题意可知,从一年内发生的交通事故中随机抽出一起事故,则该起事故是恰好是超速驾驶的概率为0.2,设“恰好有一起事故属于超速驾驶”为事件A ,则P (A )=3×15×⎝ ⎛⎭⎪⎫1-152=48125.(2)由题意,设d 2=k ·v 2,当行车速度为100 km/h 时,制动距离为65 m. 所以k =0.006 5,即d 2=0.006 5v 2, ①设d 1=b v +a ,因为b =∑i =1n (x i -x ) (y i -y ) ∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,所以b=∑i =110v i(d1)i-10v-d-1∑i=110v2i-10v-2=22 187.3-10×100.4×21106 054-10×100.42=1 103.35 252.4≈0.21,故d1=0.21v+a*,把(100.4,21)代入*式,解得a=-0.084,所以d1与v i之间的回归方程为d1=0.21v-0.084.设停车距离为d,则d=d1+d2,则d=0.006 5v2+0.21 v-0.084,当v=110 km/h时,d=101.666,即车速为110 km/h时的停车距离为101.666 m.②易知当车速为100 km/h时,停车距离为85.916 m,该距离小于100 m,又因为当车速为110 km/h时的停车距离为101.666 m,该距离大于100 m,由以上两个数据可知,当车速超过100 km/h时,必须与同车道前车保持100 m以上的距离才能保证行驶安全.破解此类分层抽样、概率、线性回归相交汇的开放性问题的关键:一是会制图,即会根据频数分布表,把两组数据填入茎叶图中;二是会对开放性问题进行转化;三是熟练掌握求线性回归方程的步骤,求出a^,b^,即可写出线性回归方程.一个工厂在某年里连续10个月每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据,x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26加以说明;(2)①建立月总成本y 与月产量x 之间的线性回归方程;②通过建立的y 关于x 的回归方程,估计某月产量为1.98万件时,产品的总成本为多少万元?(均精确到0.001)附注:①参考数据:∑10i =1x i =14.45,∑10i =1y i =27.31,∑10i =1x 2i -10x -2≈0.850, ∑10i =1y 2i -10y -2≈1.042,b^≈1.223.②参考公式:相关系数r =∑ni =1x i y i -n x - y-(∑ni =1x 2i -n x -2)(∑ni =1y 2i -n y -2),回归直线y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为b ^=∑ni =1x i y i -n x - y-∑ni =1x 2i -n x-2,a ^=y --b ^x .解:(1)由已知条件得,r =b^·∑10i =1x 2i -10x-2∑10i =1y 2i -10y-2,所以r =1.223×0.8501.042≈0.998, 这说明y 与x 正相关,且相关性很强. (2)①由已知求得x -=1.445,y -=2.731, a ^=y --b ^x -=2.731-1.223×1.445≈0.964, 所以所求回归直线方程为y ^=1.223x +0.964.②当x =1.98时,y =1.223×1.98+0.964≈3.386(万元), 此时产品的总成本约为3.386万元.[A 级 基础练]1.(2020·高考全国卷Ⅰ)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下,甲分厂产品等级的频数分布表(1)(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解:(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为40=0.4;100=0.28.乙分厂加工出来的一件产品为A级品的概率的估计值为28100(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为65×40+25×20-5×20-75×20=15.100由数据知乙分厂加工出来的100件产品利润的频数分布表为70×28+30×17+0×34-70×21100=10.比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务. 2.(2021·福州市质量检测)垃圾分一分,城市美十分;垃圾分类,人人有责.某市为进一步推进生活垃圾分类工作,调动全民参与的积极性,举办了“垃圾分类游戏挑战赛”.据统计,在为期2个月的活动中,共有640万人参与.为鼓励市民积极参与活动,市文明办随机抽取200名参与该活动的网友,以他们单次游戏得分作为样本进行分析,由此得到如下频数分布表,中的数据用该组区间的中点值作代表,其中标准差的计算结果要求精确到0.01);(2)若要从单次游戏得分在[30,40),[60,70),[80,90]的三组参与者中,用分层抽样的方法选取7人进行电话回访,再从这7人中任选2人赠送话费,求此2人单次游戏得分不在同一组内的概率.附:185≈13.60,370≈19.24.解:(1)参与该活动的网友单次游戏得分的平均值x -=1200×(35×10+45×40+55×60+65×40+75×30+85×20)=60. 标准差s =252×10+152×40+52×60+52×40+152×30+252×20200=185≈13.60.(2)用分层抽样抽取7人,其中得分在[30,40)的有1人,得分在[60,70)的有4人,得分在[80,90]的有2人.分别记为a ,b 1,b 2,b 3,b 4,c 1,c 2,7人中任选2人,有21种结果,分别是(a ,b 1),(a ,b 2),(a ,b 3),(a ,b 4),(a ,c 1),(a ,c 2),(b 1,b 2),(b 1,b 3),(b 1,b 4),(b 1,c 1),(b 1,c 2),(b 2,b 3),(b 2,b 4),(b 2,c 1),(b 2,c 2),(b 3,b 4),(b 3,c 1),(b 3,c 2),(b 4,c 1),(b 4,c 2),(c 1,c 2).其中2人得分在同一组的有7种,分别是{b 1,b 2},{b 1,b 3},{b 1,b 4},{b 2,b 3},{b 2,b 4},{b 3,b 4},{c 1,c 2},故2人得分不在同一组内的概率P =1-721=23.3.最近青少年的视力健康问题引起家长们的高度重视,某地区为了解当地24所小学,24所初中和12所高中的学生的视力状况,准备采用分层抽样的方法从这些学校中随机抽取5所学校对学生进行视力调查.(1)若从所抽取的5所学校中再随机抽取3所学校进行问卷调查,求抽到的这3所学校中,小学、初中、高中分别有一所的概率;(2)若某小学被抽中,调查得到了该小学前五个年级近视率y 的数据如下表,并根据方程预测六年级学生的近视率.附:回归直线y ^=b ^x +a ^的斜率和截距的最小二乘法估计公式分别为b ^=∑ni =1x i y i -n x - y -∑ni =1x 2i -n x-2,a ^=y --b ^x -. 参考数据:∑5i =1x i y i =2.76,∑5i =1x 2i =55.解:(1)由24∶24∶12=2∶2∶1,得抽取的5所学校中有2所小学、2所初中、1所高中,分别设为a 1,a 2,b 1,b 2,c ,从这5所学校中随机抽取3所学校的所有基本事件为(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,c ),(a 1,b 1,b 2),(a 1,b 1,c ),(a 1,b 2,c ),(a 2,b 1,b 2),(a 2,b 1,c ),(a 2,b 2,c ),(b 1,b 2,c ),共10种,设事件A 表示“抽到的这3所学校中,小学、初中、高中分别有一所”,则事件A 包含的基本事件为(a 1,b 1,c ),(a 1,b 2,c ),(a 2,b 1,c ),(a 2,b 2,c ),共4种,故P (A )=410=25.(2)由题中表格数据得x -=3,y -=0.15,5x - y -=2.25,5x -2=45,且由参考数据:∑5i =1x i y i =2.76,∑5i =1x 2i =55,得b ^=2.76-2.2555-45=0.051,a^=0.15-0.051×3=-0.003, 得线性回归方程为y ^=0.051x -0.003.当x =6时,代入得y ^=0.051×6-0.003=0.303, 所以六年级学生的近视率在0.303左右.[B 级 综合练]4.某网络平台从购买该平台某课程的客户中,随机抽取了100位客户的数据,并将这100个数据按学时数、客户性别等进行统计,整理得到下表:组区间的中点值作代表,结果保留小数点后两位);(2)从这100位客户中,对购买该课程学时数在20以下的女性客户按照分层抽样的方式随机抽取7人,再从这7人中随机抽取2人,求这2人购买的学时数都不低于15的概率;(3)将购买该课程达到25学时及以上者视为“十分爱好该课程者”,25学时以下者视为“非十分爱好该课程者”,请根据已知条件完成以下2×2列联表,并判断是否有99.9%的把握认为“十分爱好该课程者”与性别有关?附:K2=(a+b)(c+d)(a+c)(b+a),其中n=a+b+c+d.解:(1)依题意,在这100位购买该课程的客户中,男性客户购买该课程学时数的平均值x-=160×(7.5×18+12.5×12+17.5×9+22.5×9+27.5×6+32.5×4+37.5×2)≈16.92.所以估计男性客户购买该课程学时数的平均值为16.92.(2)设“所抽取的2人购买的学时数都不低于15”为事件A,依题意按照分层抽样的方式分别从学时数为[5,10),[10,15),[15,20)的女性客户中抽取1人(设为a),2人(分别设为b1,b2),4人(分别设为c1,c2,c3,c4).则从这7人中随机抽取2人所包含的基本事件为ab1,ab2,ac1,ac2,ac3,ac4,b1b2,b1c1,b1c2,b1c3,b1c4,b2c1,b2c2,b2c3,b2c4,c1c2,c1c3,c1c4,c2c3,c2c4,c3c4,共21个,其中事件A所包含的基本事件为c1c2,c1c3,c1c4,c2c3,c2c4,c3c4,共6个.所以事件A发生的概率P(A)=621=2 7.(3)依题意得2×2列联表如下,女性 16 24 40 总计6436100K 2=100×(48×24-16×12)264×36×60×40≈16.667>10.828.故有99.9%的把握认为“十分爱好该课程者”与性别有关.5.某客户考察了一款热销的净水器,使用寿命为十年,该款净水器为三级过滤,每一级过滤都由核心部件滤芯来实现.在使用过程中,一级滤芯需要不定期更换,其中每更换3个一级滤芯就需要更换1个二级滤芯,三级滤芯无需更换.其中一级滤芯每个200元,二级滤芯每个400元.记一台净水器在使用期内需要更换的二级滤芯的个数构成的集合为M .如图是根据100台该款净水器在十年使用期内更换的一级滤芯的个数制成的柱状图.(1)结合柱状图,写出集合M ;(2)根据以上信息,求一台净水器在使用期内更换二级滤芯的费用大于1 200元的概率(以100台净水器更换二级滤芯的频率代替1台净水器更换二级滤芯发生的概率);(3)若在购买净水器的同时购买滤芯,则滤芯可享受5折优惠(使用过程中如需再购买无优惠).假设上述100台净水器在购机的同时,每台均购买a 个一级滤芯、b 个二级滤芯作为备用滤芯(其中b ∈M ,a +b =14),计算这100台净水器在使用期内购买滤芯所需总费用的平均数,并以此作为决策依据,如果客户购买净水器的同时购买备用滤芯的总数也为14,则其中一级滤芯和二级滤芯的个数应分别是多少?解:(1)由题意可知,当一级滤芯更换9,10,11个时,二级滤芯需要更换3个,当一级滤芯更换12个时,二级滤芯需要更换4个,所以M={3,4}.(2)由题意可知,二级滤芯更换3个,需1 200元,二级滤芯更换4个,需1 600元,在100台净水器中,二级滤芯需要更换3个的净水器共70台,二级滤芯需要更换4个的净水器共30台,设“一台净水器在使用期内更换二级滤芯的费用大于1 200元”为事件A,则P(A)=30=0.3.100(3)a+b=14,b∈M,①若a=10,b=4,则这100台净水器更换滤芯所需费用的平均数为100×10×30+(100×10+200)×40+(100×10+400)×30+200×4×100100=2 000.②若a=11,b=3,则这100台净水器更换滤芯所需费用的平均数为100×11×70+(100×11+200)×30+200×3×70+(200×3+400)×30100=1 880.所以如果客户购买净水器的同时购买备用滤芯的总数为14,客户应该购买一级滤芯11个,二级滤芯3个.6.互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下简称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表,(1)业的经营状况;(2)据统计表明,y 与x 之间具有线性关系.①请用相关系数r 对y 与x 之间的相关性强弱进行判断(若|r |>0.75,则可认为y 与x 有较强的线性相关关系(r 值精确到0.001));②经计算求得y 与x 之间的回归方程为y ^=1.382x -2.674,假定每单外卖业务,企业平均能获取纯利润3元,试预测当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润的大致范围(x 值精确到0.01).相关公式:r =∑ni =1 (x i -x -)(y i -y -)∑ni =1(x i -x -)2∑ni =1(y i -y -)2.参考数据:∑5i =1(x i -x -)(y i -y -)=66,∑5i =1(x i -x -)2∑5i =1(y i -y -)2≈77.解:(1)由题可知x -=5+2+9+8+115=7(百单),y -=2+3+10+5+155=7(百单).外卖甲的日接单量的方差s 2甲=10,外卖乙的日接单量的方差s 2乙=23.6, 因为x -=y -,s 2甲<s 2乙,即外卖甲平均日接单量与外卖乙相同,且外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①计算可得,相关系数r ≈6677≈0.857>0.75, 所以可认为y 与x 之间有较强的线性相关关系. ②令y ≥25,得1.382x -2.674≥25,解得x ≥20.02, 又20.02×100×3=6 006,所以当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润大约不低于6 006元.。
高考数学数学建模练习题及答案

高考数学数学建模练习题及答案一、综合分析题某城市2019年的二氧化硫(SO2)和氮氧化物(NOx)排放量分别为15.2万吨和20.8万吨。
根据监测数据,该城市出现了严重的空气污染,为了改善空气质量,政府制定了下列措施:1. 实施尾气治理方案,使汽车尾气排放的SO2和NOx总量每年减少10%。
2. 推广清洁能源车辆,使其占机动车保有量的比例增加4%。
3. 建设新的绿化景观,增加每年吸收的SO2和NOx总量3%。
根据以上措施,解答以下问题:1. 计算2023年该城市汽车尾气排放的SO2和NOx总量。
2. 估计2023年该城市机动车保有量。
3. 计算新绿化景观每年吸收的SO2和NOx总量。
解答:1. 计算2023年汽车尾气排放的SO2和NOx总量:2019年汽车尾气排放的SO2总量:15.2万吨2019年汽车尾气排放的NOx总量:20.8万吨汽车尾气排放的SO2和NOx总量每年减少10%,即每年剩余原量的90%。
2023年汽车尾气排放的SO2总量:15.2万吨 * 0.9 = 13.68万吨 2023年汽车尾气排放的NOx总量:20.8万吨 * 0.9 = 18.72万吨因此,2023年该城市汽车尾气排放的SO2总量为13.68万吨,NOx总量为18.72万吨。
2. 估计2023年该城市机动车保有量:假设2019年该城市机动车保有量为A辆。
推广清洁能源车辆,使其占机动车保有量的比例每年增加4%。
这可以表示为公式:A * (1 + 0.04)^4 = 1.04^4 * A2023年该城市机动车保有量:1.04^4 * A因此,估计2023年该城市机动车保有量为1.1699A辆。
3. 计算新绿化景观每年吸收的SO2和NOx总量:新绿化景观每年吸收的SO2和NOx总量增加3%。
假设2019年新绿化景观每年吸收的SO2总量为B吨,NOx总量为C吨。
2023年新绿化景观每年吸收的SO2总量:B * (1 + 0.03)^42023年新绿化景观每年吸收的NOx总量:C * (1 + 0.03)^4因此,2023年新绿化景观每年吸收的SO2总量为B * 1.1255吨,NOx总量为C * 1.1255吨。
Excel数据分析与建模的应用案例有哪些

Excel数据分析与建模的应用案例有哪些在当今数字化的时代,数据已经成为企业和个人决策的重要依据。
Excel 作为一款广泛使用的电子表格软件,不仅具备强大的数据处理功能,还能够进行数据分析与建模,为我们提供有价值的见解和决策支持。
下面将为您介绍一些 Excel 数据分析与建模的应用案例。
一、销售数据分析对于销售部门来说,分析销售数据是至关重要的。
通过 Excel,可以轻松整合和分析各类销售数据,例如销售额、销售量、销售渠道、客户地域分布等。
以一家电子产品公司为例,他们使用 Excel 来分析不同产品在不同地区的销售情况。
首先,将销售数据按照产品类别和地区进行分类汇总。
然后,利用数据透视表功能,快速计算出每个地区每种产品的销售额和销售量占比。
通过这种分析,他们发现某些地区对特定产品的需求较高,而某些地区则对其他产品更感兴趣。
基于这些发现,公司可以调整市场策略,优化产品投放和促销活动,提高销售业绩。
二、财务预算与预测财务部门经常需要进行预算编制和财务预测。
Excel 可以帮助他们建立模型,预测收入、成本和利润。
例如,一家制造企业使用 Excel 来预测下一年度的成本。
他们收集了过去几年的原材料价格、劳动力成本、能源费用等数据,并在 Excel 中建立了回归分析模型。
通过这个模型,他们能够根据市场趋势和企业自身的生产计划,预测未来的成本变化。
这有助于企业制定合理的预算,控制成本,提高资金使用效率。
三、库存管理库存管理对于企业的运营效率和成本控制有着重要影响。
Excel 可以用于分析库存水平、库存周转率和缺货情况。
假设一家服装零售商,他们在 Excel 中记录了每款服装的进货量、销售量和库存余量。
通过计算库存周转率,他们可以发现哪些款式的服装库存周转较快,哪些款式存在积压。
同时,利用条件格式功能,突出显示库存低于安全库存水平的商品,及时补货,避免缺货导致的销售损失。
四、人力资源数据分析在人力资源管理中,Excel 也能发挥重要作用。