数学建模案例分析--概率统计方法建模9习题四
数学建模-第四章-概率统计模型

数
学 建
4.2 报纸零售商最优购报问题
模
报纸零售商售报: a (零a-b;退回一份赔 b-c 题 每天购进多少份可使收入最大?
购进太多卖不完退回赔钱
分 析
购进太少不够销售赚钱少
应根据需求确定购进量
存在一个合 适的购进量
每天需求量是随机的
每天收入是随机的
△+6 △+2
多雨 P(N3)=0.1
△+1.2
数
学 例4.4.1只包括一个决策点,称为单级决策问 建 题。在有些实际问题中将包括两个或两个以 模 上的决策点,称为多级决策问题,可利用同
样的思路进行决策。
例4.1.2 某工程采用正常速度施工,若无坏天气的 影响,可确保在30天内按期完成工程,但据天气预 报,15天后天气肯定变坏,有40%的可能出现阴雨 天气,但这不会影响工程进度,有50%的可能遇到 小风暴,而使工期推迟15天;另有10%的可能遇到 大风暴而使工期推迟20天。对于以上可能出现的情 况,考虑两种方案:
3
1
1
1
55
E(A2 ) 3 30 3 25 3 0 3
1
1
1
E(A3 ) 3 10 3 10 3 10 10
显然 E(A 1)E(A2)都达到最大值,这时究竟选
那一个策略可由决策者的偏好决定,若是乐观型的,
可选A1,否则选A2 。
数
学
建
模 从本例可以看出,对不确定型的决策问题,采 用不同的决策准则所得到的结果并非完全一致。 但难说哪个准则好,哪个准则不好。究竟在实 际问题中采用哪个准则,依决策者对各种自然 状态的看法而定。因此,为了改进不确定型决 策,人们总是设法得到各自然状态发生的概率, 然后进行决策。
概率论与数理统计_浙大四版_习题解_第9章_方差分析

概率论与数理统计(浙大四版)习题解 第9章 方差分析约定:以下各个习题所涉及的方差分析问题均满足方差分析模型所要求的条件。
【习题9.1】今有某种型号的电池三批,它们分别是C B A ,,三个工厂所生产的。
为评比其质量,各随机抽取5只电池为样品,经试验得其寿命(小时)如下表。
三批电池样品的寿命检测结果 A B C 40 42 26 28 39 50 48 45 34 32 40 50 383043(1)试在显著性水平0.05下检验电池的平均寿命有无显著的差异。
(2)若差异显著,试求B A μμ-、C A μμ-及C B μμ-的置信水平为0.95的置信区间。
〖解(1)〗设,,A B C μμμ分别表C B A ,,三厂所产电池的寿命均值,则问题(1)归结为检验下面的假设(单因素方差分析)01::,,不全相等A B CA B C H H μμμμμμ==设A 表因素(工厂),设,,,T R A CR 分别表样本和、样本平方和、因素A 计算数、矫正数,其值的计算过程和结果如下表。
样本数据预处理表A B C 预处理结果40 42 26 28 39 50 n=15 48 45 34 32 40 50 a=338 30 43 CR=22815 j T 213 150 222 T=585 2j j T n9073.8 4500 9856.8 A=23430.6 2ijx∑913745409970R=23647112221121158558522815152364723430.6jjj n aij j i n aijj i n a ij j j i T x T CR n R x A x n =============⎛⎫== ⎪ ⎪⎝⎭∑∑∑∑∑∑计算平方和及自由度如下23647228158321151142364723430.6216.41531223430.622815615.61312T E A SST R CR df n SSE R A df n a SSA A CR df a =-=-==-=-==-=-==-=-==-=-==-=-= 方差分析表方差来源 平方和 自由度 均方 F 值()0.052,12F因素A 615.6 2 307.8 17.07 3.89 误差 216.4 12 18.0333总和83214因17.07 3.89值F =>在拒绝域内,故在0.05水平上拒绝0H ,即认定各厂生产的电池寿命有显著的差异。
数学建模中的概率统计方法选讲

数学建模中的概率统计方法选讲案例一:常用分布及中心极限定理与“DVD 在线租赁”问题(2005B )“DVD 在线租赁”为2005年全国大学生建模竞赛的B 题,原题参见附件中的文件“2005B ”。
现考虑问题(1):网站正准备购买一些新的DVD ,通过问卷调查1000个会员,得到了愿意观看这些DVD 的人数(表1给出了其中5种DVD 的数据)。
此外,历史数据显示,60%的会员每月租赁DVD 两次,而另外的40%只租一次。
假设网站现有10万个会员,对表1中的每种DVD 来说,应该至少准备多少张,才能保证希望看到该DVD 的会员中至少50%在一个月内能够看到该DVD ?如果要求保证在三个月内至少95%的会员能够看到该DVD 呢?问题(1)的分析与求解:可以通过“点估计”的方法,得到抽样的1000名会员租赁上述5种DVD 的概率为● 通过1000个样本来推断10万个会员的“总体”: 假设随机变量,否则种个会员租第第⎩⎨⎧=,0,1DVDj i ij ξ 其中10000,...,2,1=i . 显然,ij ξ服从两点分布,即j ij p P ==)1(ξ,而上表就给出了这些概率的估计值。
进一步,设∑==Ni ij j 1ξη,10000=N ,即表示10000人中愿意租赁第j 张DVD 的人数,显然,随机变量),10000(~j j p B η。
● 由De Moivre —Laplace 中心极限定理,如果准备了)5.0(j E η张DVD ,则满足至少jη5.0人看到该DVD 的概率(可靠性)为5.0)0(}0)5.0()5.0(5.0{)}5.0(5.0{=Φ≈≤-=≤j j j j j D E P E P ηηηηη显然,为了增加右边的可靠性,比如,增加到0.99,则由等式99.0)33.2(})5.0()5.0()5.0()5.0(5.0{}5.0{=Φ≈-≤-=≤j j j j j j D E X D E P X P ηηηηηη,可知)1(100002133.25000)5.0(33.2)5.0(j j j j j p p p D E X -⨯⨯+=+=ηη如何考虑“60%的会员每个月会租赁DVD 两次,40%的会员每个月会租赁DVD 一次”的问题?方法一:10万人的60%为6万人,每个月租赁两次,即12万次;40%为4万人,每月租赁一次,即4万次,合计每月有16万人次的租赁,对于第j 张DVD ,能否类似地假设为∑==Mi ij j 1ξη,16000=M ,而且随机变量),16000(~j j p B η,然后再求?答案是否定的,因为),16000(~j j p B η不再成立。
概率统计方法建模讲座

f = 94.5863
f = 94.7597
再算一次!!
每天平均的收益的模拟值
随机模拟求最佳订购数量
clear a=2.0;b=1.0;c=0.5;M=[50:150]'; k=length(M);A=zeros(k,1); for J=1:k N=5000;G=zeros(N,1);m=M(J); X=poissrnd(100,N,1); for I=1:N if X(I)>=m G(I)=(a-b)*m; else G(I)=(a-b)*X(I)-(b-c)*(m-X(I)); end end A(J)=mean(G); end [Y,I] = max(A) n=M(I) Y
案例1:如何估计池塘中鱼的数量
一、问题:要估计一个池塘里有多少条鱼,可以采用“标志重捕法”,即:先重池塘中捕出r条,每条鱼都做上记号,经过一段时间后,再从池塘中捕出s条(s>r),统计其中标有记号的鱼的条数t,利用这些信息,估计池塘中鱼的条数N.
需要作哪些假设?
1、实验期间,标记个体不会变化。 2、标记不会对鱼造成伤害。 3、期间没有迁出、迁入、新生和死亡。 4、所有鱼被捕获的概率相等。
数学建模概率模型例题

随机性模型 马氏链模型
9.1 传送系统的效率
背 景
传送带 挂钩 产品 工作台
工人将生产出的产品挂在经过他上方的空钩上运走,若 工作台数固定,挂钩数量越多,传送带运走的产品越多。 在生产进入稳态后,给出衡量传送带效率的指标,研 究提高传送带效率的途径
问题分析
• 进入稳态后为保证生产系统的周期性运转,应 假定工人们的生产周期相同,即每人作完一件产 品后,要么恰有空钩经过他的工作台,使他可将 产品挂上运走,要么没有空钩经过,迫使他放下 这件产品并立即投入下件产品的生产。 • 可以用一个周期内传送带运走的产品数占产 品总数的比例,作为衡量传送带效率的数量指标。 • 工人们生产周期虽然相同,但稳态下每人生 产完一件产品的时刻不会一致,可以认为是随机 的,并且在一个周期内任一时刻的可能性相同。
n 1 m n n( n 1) D [1 (1 )] 1 2 2m n m 2m 定义E=1-D (一周期内未运走产品数与生产总数之比)
当n远大于1时, E n/2m 若n=10, m=40, D87.5%
E与n成正比,与m成反比
提高效率的途径: • 增加m
9.2 报童的诀窍
x s u 0, x u S
确定(s, S), 使目标函数——每周总费用的平均值最小 s ~ 订货点, S ~ 订货值 订货费c0, 购进价c1, 贮存费c2, 缺货费c3, 销售量 r 平均 费用
c0 c1u L( x u ), J (u ) L( x )
求解
J ( z)
( z )
( z )
dJ 0 dz
( z) ( z)( z) 0
( z) ( z)
( z ) z ( y )dy
2013高考数学专题通关必杀技:9-4 算法初步与统计、统计案例(高效作业,含详解)

一、填空题1.(2011年四川)有一个容量为66的样本,数据的分组及各组的频数如下:[11.5,15.5) 2 [15.5,19.5) 4 [19.5,23.5) 9 [23.5,27.5) 18 [27.5,31.5) 11 [31.5,35.5) 12 [35.5,39.5) 7 [39.5,43.5) 3根据样本的频率分布估计,大于或等于31.5的数据约占________.解析:由题意知,样本的容量为66,而落在[31.5,43.5)内的样本数为12+7+3=22,故 所求的概率为2266=13.答案:132.在抽查产品的尺寸过程中,将其尺寸分成若干组,[a ,b)是其中的一组,抽查出的个体在该组上的频率为m ,该组在频率分布直方图的高为h ,则|a -b|等于________. 解析:在频率分布直方图中横轴是组距,高为频率组距,所以|a -b|=mh .答案:mn3.设矩形的长为a ,宽为b ,其比满足b ∶a =5-12≈0.618,这种矩形给人以美感,称为黄金矩形.黄金矩形常应用于工艺品设计中.下面是某工艺品厂随机抽取两个批次的初加工矩形宽度与长度的比值样本: 甲批次:0.598 0.625 0.628 0.595 0.639 乙批次:0.618 0.613 0.592 0.622 0.620根据上述两个样本来估计两个批次的总体平均数,与标准值0.618比较,正确结论是 ________.①甲批次的总体平均数与标准值更接近 ②乙批次的总体平均数与标准值更接近 ③两个批次总体平均数与标准值接近程度相同 ④两个批次总体平均数与标准值接近程度不能确定 解析:x 甲=0.598+0.625+0.628+0.595+0.6395=0.617,x 乙=0.618+0.613+0.592+0.622+0.6205=0.613,∴x甲与0.618更接近,故填①.答案:①4.甲、乙两名同学在五次考试中数学成绩统计用茎叶图表示如图所示,则下列说法 正确的是________.①甲的平均成绩比乙的平均成绩高 ②甲的平均成绩比乙的平均成绩低 ③甲成绩的方差比乙成绩的方差大 ④甲成绩的方差比乙成绩的方差小 解析:x 甲=15(98+99+105+115+118)=107, x乙=15(95+106+108+112+114)=107. s 2甲=15[(98-107)2+(99-107)2+(105-107)2+(115-107)2+(118-107)2]=66.8, s 2乙=15[(95-107)2+(106-107)2+(108-107)2+(112-107)2+(114-107)2]=44. 答案:③5.某校甲、乙两个班级各有5名编号为1,2,3,4,5的学生进行投篮练习,每人投10次,投中的次数如下表:学生 1号 2号 3号 4号 5号 甲班 6 7 7 8 7 乙班67679解析:甲班的方差较小,数据的平均值为7,故方差s 2=(6-7)2+02+02+(8-7)2+025=25. 答案:0.46.将容量为n 的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组数据的频率之比为2∶3∶4∶6∶4∶1,且前三组数据的频数之和等于27,则n 等于________. 解析:27n =2+3+42+3+4+6+4+1,∴n =60.答案:607.甲、乙两位同学某学科的连续五次考试成绩用茎叶图表示如图,则平均分数较高的是________,成绩较为稳定的是________.解析:甲同学的成绩为68,69,70,71,72, x 甲=68+69+70+71+725=70;乙同学的成绩为63,68,69,69,71, x 乙=63+68+69+69+715=68.∴x甲>x 乙,甲平均分数高.从茎叶图看甲同学的成绩集中于平均值附近,而乙同学的成绩与平均值差距较大,故甲成绩较为稳定. 答案:甲 甲8.如图是样本容量为200的频率分布直方图.根据样本的频率分布直方图估计,样本数据落在[6,10)内的频数为________,数据落在 [2,10)内的概率约为______. 解析:200×0.08×4=64; (0.02+0.08)×4=0.4. 答案:64 0.49.在如图所示的茎叶图中,甲、乙两组数据的中位数分别是________,________.甲 乙 8 2 9 9 1 3 4 5 2 5 4 8 2 6 7 8 5 5 3 56 6 7解析:中位数是指将统计数据从小到大(或从大到小)排列,中间位置的数(或平均数).由题中茎叶图显然可知甲的中位数是45,乙的中位数是46.答案:4546二、解答题10.有一个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.6),6;[15.5,18.5),16;[18.5,21.5),18;[21.5,24.5),22;[24.5,27.5),20;[27.5,30.5),10;[30.5,33.5),8.(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计数据小于30.5的频率.解析:(1)样本的频率分布表如下:分组频数频率[12.5,15.5) 6 0.06[15.5,18.5) 16 0.16[18.5,21.5) 18 0.18[21.5,24.5) 22 0.22[24.5,27.5) 20 0.20[27.5,30.5) 10 0.10[30.5,33.5) 8 0.08合计100 1.00(2)频率分布直方图如图:(3)小于30.5的频率为0.06+0.16+0.18+0.22+0.20+0.10=0.92.11.对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表:(1)(2)分别求出甲、乙两名自行车赛手最大速度(m /s )数据的平均数、中位数、极差、标准 差,并判断选谁参加比赛比较合适?解析:(1)画茎叶图、中间数为数据的十位数.甲 乙7 2 9 8 1 5 7 0 8 3 3 8 4 6从茎叶图上看,甲、乙的得分情况都是分布均匀的,只是乙更好一些,乙的中位数是 33.5,甲的中位数是33,因此乙发挥比较稳定,总体得分情况比甲好. (2)x 甲=27+38+30+37+35+316=33.x 乙=33+29+38+34+28+366=33.s 2甲=16[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]≈15.67, s 甲≈3.96.s 2乙=16[(33-33)2+(29-33)2+(38-33)2+(34-33)2+(28-33)2+(36-33)2]≈12.67. s 乙≈3.56.甲的中位数是33,极差为11. 乙的中位数是33.5,极差为10.综合比较以上数据可知,选乙参加比赛较合适.12.(2011年广东)在某次测验中,有6位同学的平均成绩为75分.用x n 表示编号为n(n =1,2,…,6)的同学所得成绩,且前5位同学的成绩如下:(1)求第66(2)从前5位同学中,随机地选2位同学,求恰有1位同学成绩在区间(68,75)中的概率. 解析:(1)∵这6位同学的平均成绩为75分, ∴16(70+76+72+70+72+x 6)=75,解得x 6=90, 这6位同学成绩的方差s 2=16×[(70-75)2+(76-75)2+(72-75)2+(70-75)2+(72-75)2+(90-75)2]=49,∴标准差s =7.(2)从前5位同学中,随机地选出2位同学的成绩有:(70,76),(70,72),(70,70),(70,72), (76,72)(76,70),(76,72),(72,70),(72,72),(70,72),共10种,恰有1位同学成绩在区间(68,75)中的有:(70,76),(76,72),(76,70),(76,72),共4种, 所求的概率为410=0.4,即恰有1位同学成绩在区间(68,75)中的概率为0.4.。
高中教育数学必修第二册湘教版《6.5 数学建模案例4 统计概率的应用》教学课件

解决问题 问题1:从标有号码的10个球中,每次依次摸出3个,假设取了30次, 其结果为863,352,698,935,872,653,123,012,903,654, 704,256,478,092,864,750,158,230,027,471,568,924, 023,981,143,783,254,845,879,672. 这样相当于做了30次试验,其中恰有2个数字在0,1,2,3,4,5中, 则表示恰有两天下雨,它们分别是935,653,903,654,704,256, 092,750,158,027,471,924,845,共有13个数,所以这三天中 恰有两天下雨的概率约为p=1330≈0.433.
问题2:如图,设圆的半径为1,假设向正方形内随机撒了100颗黄豆,
其
中
落
在
圆
内
的
黄
豆
数
为
81
颗
,
则
S⊙O SABCD
=
81 100
,
即
π 4
=
81 100
,
得
π
=
81≈3.24.
25
问题3:假设如图是将矩形按比例缩小成原来的1010后的图形,矩形
的长为4 cm.宽为3 cm,设阴影部分(池塘)的面积为S,向矩形内随机
提出问题 思考下列问题: 问题1:某地气象台说,在今后三天中,每天下雨的概率均为60%, 你能够设计一种方法,估计这三天中恰有两天下雨的概率吗? 问题2:圆周率的计算方法很多,你能用概率估算圆周率的近似值吗? 问题3;如图在一块矩形草地中,有一口不规则的小池塘,你能根据 矩形的面积,用概率估计池塘的面积吗?
6.5 数学建模案例(四):统计概率的应用
高考专题练习: 概率统计中的数学建模与数据分析

(2020·广东六校第一次联考)某机构组织语文、数学学科能力竞赛,按照一定比例淘汰后,颁发一、二、三等奖(分别对应成绩等级的一、二、三等级).现有某考场所有考生的两科成绩等级统计如图1所示,其中获数学二等奖的考生有12人.图1(1)求该考场考生中获语文一等奖的人数;(2)用随机抽样的方法从获得数学和语文二等奖的考生中各抽取5人,进行综合素质测试,将他们的综合得分绘成茎叶图(如图2所示),求样本的平均数及方差并进行比较分析;图2(3)已知本考场的所有考生中,恰有3人两科均获一等奖,在至少一科获一等奖的考生中,随机抽取2人进行访谈,求这2人两科均获一等奖的概率.【解】 (1)因为获数学二等奖的考生有12人, 所以该考场考生的总人数为121-0.40-0.26-0.10=50.故该考场获语文一等奖的考生人数为50×(1-0.38×2-0.16)=4.(2)设获数学二等奖考生综合得分的平均数和方差分别为x -1,s 21,获语文二等奖考生综合得分的平均数和方差分别为x -2,s 22.x -1=81+84+92+90+935=88,x -2=79+89+84+86+875=85,s 21=15×[(-7)2+(-4)2+42+22+52]=22, s 22=15×[(-6)2+42+(-1)2+12+22]=11.6,因为88>85,11.6<22,所以获数学二等奖考生较获语文二等奖考生综合素质测试的平均分高,但是成绩差距较大.(3)两科均获一等奖的考生共有3人,则仅数学获一等奖的考生有2人,仅语文获一等奖的考生有1人,把两科均获一等奖的3人分别记为A 1,A 2,A 3,仅数学获一等奖的2人分别记为B 1,B 2,仅语文获一等奖的1人记为C ,则在至少一科获一等奖的考生中,随机抽取2人的基本事件有A 1A 2,A 1A 3,A 1B 1,A 1B 2,A 1C ,A 2A 3,A 2B 1,A 2B 2,A 2C ,A 3B 1,A 3B 2,A 3C ,B 1B 2,B 1C ,B 2C ,共15个.记“这2人两科均获一等奖”为事件M ,则事件M 包含的基本事件有A 1A 2,A 1A 3,A 2A 3,共3个, 所以P (M )=315=15,故这2人两科均获一等奖的概率为15.统计与概率“搭台”,方案选择“唱戏”破解此类频率分布直方图、分层抽样与概率相交汇的开放性问题的关键:一是会观图读数据,能从频率分布直方图中读出频率,进而求出频数;二是能根据分层抽样的抽样比或各层之间的比例,求出分层抽样中各层需取的个数;三是会转化,会对开放性问题进行转化.某校学生参与一项社会实践活动,受生产厂家委托采取随机抽样方法,调查我市市民对某新开发品牌洗发水的满意度,同学们模仿电视问政的打分制,由被调查者在0分到100分的整数分中给出自己的认可分数,现将收集到的100位市民的认可分数分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],绘制出如图所示的频率分布直方图.(1)求这100位市民认可分数的中位数(精确到0.1),平均数(同一组中的数据用该组区间的中点值作代表);(2)生产厂家根据同学们收集到的数据,拟随机在认可分数为80及其以上的市民中选出2位市民当产品宣传员,求这2位宣传员都来自认可分数为[90,100]的概率.解:(1)由于[40,50),[50,60),[60,70)的频率分别有0.1,0.2,0.3.故中位数位于[60,70)中,其值为60+10×23≈66.7.平均数为10×(45×0.01+55×0.02+65×0.03+75×0.025+85×0.01+95×0.005)=67.(2)认可分数位于[80,90)的人数为10,认可分数位于[90,100]的人数为5,从认可分数位于[90,100]的5人中随机选择2人的基本事件数为1+2+3+4=10,从认可分数位于[80,90)和[90,100]的15人中随机选择2人的基本事件数为1+2+3+…+14=105.故这2位宣传员都来自认可分数为[90,100]的概率为10105=2 21.图表与独立性检验相交汇(师生共研)某种常见疾病可分为Ⅰ,Ⅱ两种类型.为了了解所患该疾病类型与地域、初次患该疾病的年龄(单位:岁)(以下简称初次患病年龄)的关系,在甲、乙两个地区随机抽取100名患者调查其所患疾病类型及初次患病年龄,得到如下数据.初次患病年龄甲地Ⅰ型疾病患者/人甲地Ⅱ型疾病患者/人乙地Ⅰ型疾病患者/人乙地Ⅱ型疾病患者/人[10,20)815 1[20,30)433 1[30,40)352 4[40,50)384 4[50,60)392 6[60,70]21117(2)记“初次患病年龄在[10,40)内的患者”为“低龄患者”,“初次患病年龄在[40,70]内的患者”为“高龄患者”.根据表中数据,解决以下问题.①将以下两个列联表补充完整,并判断“地域”“初次患病年龄”这两个变量中哪个变量与所患疾病的类型有关联的可能性更大.(直接写出结论,不必说明理由)表一疾病类型患者所在地域Ⅰ型Ⅱ型总计甲地乙地总计100.问:是否有99.9%的把握认为所患疾病的类型与X有关?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.【解】(1)依题意,甲、乙两地区Ⅰ型疾病患者共40人,甲、乙两地区Ⅰ型疾病患者初次患病年龄小于40岁的人数分别为15,10,则从Ⅰ型疾病患者中随机抽取1人,其初次患病年龄小于40岁的概率的估计值为15+1040=58.(2)①填空结果如下.表一低龄 25 15 40 高龄 15 45 60 总计4060100“初次患病年龄”与所患疾病的类型有关联的可能性更大.②由①可知X 为初次患病年龄,根据表二中的数据可得a =25,b =15,c =15,d =45,n =100,则K 2=100×(25×45-15×15)240×60×40×60≈14.063,因为14.063>10.828,故有99.9%的把握认为所患疾病类型与初次患病年龄有关.本题的易错点有三处:一是审题不认真,误认为甲、乙两地区Ⅰ型疾病患者的总数为100,错误列式15+10100=0.25;二是不能从频数分布表中获取相关数据,无法正确填写列联表,不能根据列联表中数据的含义做出正确判断;三是代错公式或计算错误,从而导致统计判断出错.(2021·福州市适应性考试)世界互联网大会是由中华人民共和国倡导并每年在浙江省嘉兴市桐乡乌镇举办的世界性互联网盛会,大会旨在搭建中国与世界互联互通的国际平台和国际互联网共享共治的中国平台,让各国在争议中求共识、在共识中谋合作、在合作中创共赢.2020年11月23日至24日,第七届世界互联网大会如期举行,为了大会顺利召开,组委会特招募了1 000名志愿者.某部门为了了解志愿者的基本情况,调查了其中100名志愿者的年龄(单位:岁),得到了他们年龄的中位数为34,年龄在[40,45)内的人数为15,并根据调查结果画出如图所示的频率分布直方图.(1)求m,n的值并估算出志愿者的平均年龄(同一组的数据用该组区间的中点值代表);(2)这次大会志愿者主要通过现场报名和登录大会官网报名,即现场和网络两种方式报名参加.这100名志愿者的报名方式部分数据如下表所示,完善下面的表格,通过计算说明能否在犯错误的概率不超过0.001的前提下,认为“选择哪种报名方式与性别有关系”?男性女性总计现场报名50网络报名31总计50参考公式及数据:K2=2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.050.010.0050.001k0 3.841 6.6357.87910.828解:(1)因为志愿者年龄在[40,45)内的人数为15,所以志愿者年龄在[40,45)内的频率为15100=0.15.由频率分布直方图得,(0.020+2m+4n+0.010)×5+0.15=1,即m+2n=0.07,①由中位数为34可得,0.020×5+2m×5+2n×(34-30)=0.5,即5m+4n=0.2,②由①②解得m=0.020,n=0.025.所以志愿者的平均年龄为(22.5×0.020+27.5×0.040+32.5×0.050+37.5×0.050+42.5×0.030+47.5×0.010)×5=34(岁).(2)根据题意得到列联表,男性女性总计现场报名193150网络报名311950总计5050100所以K2=100×(19×19-31×31)250×50×50×50=2×[(19+31)×(19-31)]250×50×50=5.76<10.828,所以不能在犯错误的概率不超过0.001的前提下,认为“选择哪种报名方式与性别有关系”.图表与线性回归分析相交汇(师生共研)如图是某部门公布的一年内道路交通事故成因分析,由图可知,超速驾驶已经成为交通事故的一个主要因素.研究表明,急刹车时的停车距离等于反应距离与制动距离的和,下表是根据某部门的调查结果整理所得的数据(v表示行车速度,单位:km/h;d1,d2分别表示反应距离和制动距离,单位m).v6472808997105113121128135 d113.415.216.718.620.121.923.525.326.828.5好有1起属于超速驾驶的概率(用频率代替概率);(2)已知d 2与v 的平方成正比,且当行车速度为100 km/h 时,制动距离为65 m.①由表中数据可知,d 1与v 之间具有线性相关关系请建立d 1与v 之间的回归方程,并估计车速为110 km/h 时的停车距离;②我国《道路交通安全法》规定:车速超过100 km/h 时,应该与同车道前车保持100 m 以上的距离,请解释一下上述规定的合理性.参考数据:∑10i =1v i =1 004,∑10i =1(d 1)i =210,∑10i =1v i (d 1)i =22 187.3,∑10i =1v 2i =106 054,11 03352 524≈0.21. 参考公式:对于一组数据(x 1,y 1),(x 2,y 2),…,(x n ,y n ),其回归直线y =bx +a 的斜率和截距的最小二乘估计分别为:b =∑ni =1(x i -x -)(y i -y -)∑ni =1(x i -x -)2,a =y--b x -.【解】 (1)由题意可知,从一年内发生的交通事故中随机抽出一起事故,则该起事故是恰好是超速驾驶的概率为0.2,设“恰好有一起事故属于超速驾驶”为事件A ,则P (A )=3×15×⎝ ⎛⎭⎪⎫1-152=48125.(2)由题意,设d 2=k ·v 2,当行车速度为100 km/h 时,制动距离为65 m. 所以k =0.006 5,即d 2=0.006 5v 2, ①设d 1=b v +a ,因为b =∑i =1n (x i -x ) (y i -y ) ∑i =1n(x i -x )2=∑i =1nx i y i -n x y∑i =1nx 2i -n x2,所以b=∑i =110v i(d1)i-10v-d-1∑i=110v2i-10v-2=22 187.3-10×100.4×21106 054-10×100.42=1 103.35 252.4≈0.21,故d1=0.21v+a*,把(100.4,21)代入*式,解得a=-0.084,所以d1与v i之间的回归方程为d1=0.21v-0.084.设停车距离为d,则d=d1+d2,则d=0.006 5v2+0.21 v-0.084,当v=110 km/h时,d=101.666,即车速为110 km/h时的停车距离为101.666 m.②易知当车速为100 km/h时,停车距离为85.916 m,该距离小于100 m,又因为当车速为110 km/h时的停车距离为101.666 m,该距离大于100 m,由以上两个数据可知,当车速超过100 km/h时,必须与同车道前车保持100 m以上的距离才能保证行驶安全.破解此类分层抽样、概率、线性回归相交汇的开放性问题的关键:一是会制图,即会根据频数分布表,把两组数据填入茎叶图中;二是会对开放性问题进行转化;三是熟练掌握求线性回归方程的步骤,求出a^,b^,即可写出线性回归方程.一个工厂在某年里连续10个月每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据,x 1.08 1.12 1.19 1.28 1.36 1.48 1.59 1.68 1.80 1.87 y 2.25 2.37 2.40 2.55 2.64 2.75 2.92 3.03 3.14 3.26加以说明;(2)①建立月总成本y 与月产量x 之间的线性回归方程;②通过建立的y 关于x 的回归方程,估计某月产量为1.98万件时,产品的总成本为多少万元?(均精确到0.001)附注:①参考数据:∑10i =1x i =14.45,∑10i =1y i =27.31,∑10i =1x 2i -10x -2≈0.850, ∑10i =1y 2i -10y -2≈1.042,b^≈1.223.②参考公式:相关系数r =∑ni =1x i y i -n x - y-(∑ni =1x 2i -n x -2)(∑ni =1y 2i -n y -2),回归直线y ^=a ^+b ^x 中斜率和截距的最小二乘估计公式分别为b ^=∑ni =1x i y i -n x - y-∑ni =1x 2i -n x-2,a ^=y --b ^x .解:(1)由已知条件得,r =b^·∑10i =1x 2i -10x-2∑10i =1y 2i -10y-2,所以r =1.223×0.8501.042≈0.998, 这说明y 与x 正相关,且相关性很强. (2)①由已知求得x -=1.445,y -=2.731, a ^=y --b ^x -=2.731-1.223×1.445≈0.964, 所以所求回归直线方程为y ^=1.223x +0.964.②当x =1.98时,y =1.223×1.98+0.964≈3.386(万元), 此时产品的总成本约为3.386万元.[A 级 基础练]1.(2020·高考全国卷Ⅰ)某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下,甲分厂产品等级的频数分布表(1)(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?解:(1)由试加工产品等级的频数分布表知,甲分厂加工出来的一件产品为A级品的概率的估计值为40=0.4;100=0.28.乙分厂加工出来的一件产品为A级品的概率的估计值为28100(2)由数据知甲分厂加工出来的100件产品利润的频数分布表为65×40+25×20-5×20-75×20=15.100由数据知乙分厂加工出来的100件产品利润的频数分布表为70×28+30×17+0×34-70×21100=10.比较甲、乙两分厂加工的产品的平均利润,应选甲分厂承接加工业务. 2.(2021·福州市质量检测)垃圾分一分,城市美十分;垃圾分类,人人有责.某市为进一步推进生活垃圾分类工作,调动全民参与的积极性,举办了“垃圾分类游戏挑战赛”.据统计,在为期2个月的活动中,共有640万人参与.为鼓励市民积极参与活动,市文明办随机抽取200名参与该活动的网友,以他们单次游戏得分作为样本进行分析,由此得到如下频数分布表,中的数据用该组区间的中点值作代表,其中标准差的计算结果要求精确到0.01);(2)若要从单次游戏得分在[30,40),[60,70),[80,90]的三组参与者中,用分层抽样的方法选取7人进行电话回访,再从这7人中任选2人赠送话费,求此2人单次游戏得分不在同一组内的概率.附:185≈13.60,370≈19.24.解:(1)参与该活动的网友单次游戏得分的平均值x -=1200×(35×10+45×40+55×60+65×40+75×30+85×20)=60. 标准差s =252×10+152×40+52×60+52×40+152×30+252×20200=185≈13.60.(2)用分层抽样抽取7人,其中得分在[30,40)的有1人,得分在[60,70)的有4人,得分在[80,90]的有2人.分别记为a ,b 1,b 2,b 3,b 4,c 1,c 2,7人中任选2人,有21种结果,分别是(a ,b 1),(a ,b 2),(a ,b 3),(a ,b 4),(a ,c 1),(a ,c 2),(b 1,b 2),(b 1,b 3),(b 1,b 4),(b 1,c 1),(b 1,c 2),(b 2,b 3),(b 2,b 4),(b 2,c 1),(b 2,c 2),(b 3,b 4),(b 3,c 1),(b 3,c 2),(b 4,c 1),(b 4,c 2),(c 1,c 2).其中2人得分在同一组的有7种,分别是{b 1,b 2},{b 1,b 3},{b 1,b 4},{b 2,b 3},{b 2,b 4},{b 3,b 4},{c 1,c 2},故2人得分不在同一组内的概率P =1-721=23.3.最近青少年的视力健康问题引起家长们的高度重视,某地区为了解当地24所小学,24所初中和12所高中的学生的视力状况,准备采用分层抽样的方法从这些学校中随机抽取5所学校对学生进行视力调查.(1)若从所抽取的5所学校中再随机抽取3所学校进行问卷调查,求抽到的这3所学校中,小学、初中、高中分别有一所的概率;(2)若某小学被抽中,调查得到了该小学前五个年级近视率y 的数据如下表,并根据方程预测六年级学生的近视率.附:回归直线y ^=b ^x +a ^的斜率和截距的最小二乘法估计公式分别为b ^=∑ni =1x i y i -n x - y -∑ni =1x 2i -n x-2,a ^=y --b ^x -. 参考数据:∑5i =1x i y i =2.76,∑5i =1x 2i =55.解:(1)由24∶24∶12=2∶2∶1,得抽取的5所学校中有2所小学、2所初中、1所高中,分别设为a 1,a 2,b 1,b 2,c ,从这5所学校中随机抽取3所学校的所有基本事件为(a 1,a 2,b 1),(a 1,a 2,b 2),(a 1,a 2,c ),(a 1,b 1,b 2),(a 1,b 1,c ),(a 1,b 2,c ),(a 2,b 1,b 2),(a 2,b 1,c ),(a 2,b 2,c ),(b 1,b 2,c ),共10种,设事件A 表示“抽到的这3所学校中,小学、初中、高中分别有一所”,则事件A 包含的基本事件为(a 1,b 1,c ),(a 1,b 2,c ),(a 2,b 1,c ),(a 2,b 2,c ),共4种,故P (A )=410=25.(2)由题中表格数据得x -=3,y -=0.15,5x - y -=2.25,5x -2=45,且由参考数据:∑5i =1x i y i =2.76,∑5i =1x 2i =55,得b ^=2.76-2.2555-45=0.051,a^=0.15-0.051×3=-0.003, 得线性回归方程为y ^=0.051x -0.003.当x =6时,代入得y ^=0.051×6-0.003=0.303, 所以六年级学生的近视率在0.303左右.[B 级 综合练]4.某网络平台从购买该平台某课程的客户中,随机抽取了100位客户的数据,并将这100个数据按学时数、客户性别等进行统计,整理得到下表:组区间的中点值作代表,结果保留小数点后两位);(2)从这100位客户中,对购买该课程学时数在20以下的女性客户按照分层抽样的方式随机抽取7人,再从这7人中随机抽取2人,求这2人购买的学时数都不低于15的概率;(3)将购买该课程达到25学时及以上者视为“十分爱好该课程者”,25学时以下者视为“非十分爱好该课程者”,请根据已知条件完成以下2×2列联表,并判断是否有99.9%的把握认为“十分爱好该课程者”与性别有关?附:K2=(a+b)(c+d)(a+c)(b+a),其中n=a+b+c+d.解:(1)依题意,在这100位购买该课程的客户中,男性客户购买该课程学时数的平均值x-=160×(7.5×18+12.5×12+17.5×9+22.5×9+27.5×6+32.5×4+37.5×2)≈16.92.所以估计男性客户购买该课程学时数的平均值为16.92.(2)设“所抽取的2人购买的学时数都不低于15”为事件A,依题意按照分层抽样的方式分别从学时数为[5,10),[10,15),[15,20)的女性客户中抽取1人(设为a),2人(分别设为b1,b2),4人(分别设为c1,c2,c3,c4).则从这7人中随机抽取2人所包含的基本事件为ab1,ab2,ac1,ac2,ac3,ac4,b1b2,b1c1,b1c2,b1c3,b1c4,b2c1,b2c2,b2c3,b2c4,c1c2,c1c3,c1c4,c2c3,c2c4,c3c4,共21个,其中事件A所包含的基本事件为c1c2,c1c3,c1c4,c2c3,c2c4,c3c4,共6个.所以事件A发生的概率P(A)=621=2 7.(3)依题意得2×2列联表如下,女性 16 24 40 总计6436100K 2=100×(48×24-16×12)264×36×60×40≈16.667>10.828.故有99.9%的把握认为“十分爱好该课程者”与性别有关.5.某客户考察了一款热销的净水器,使用寿命为十年,该款净水器为三级过滤,每一级过滤都由核心部件滤芯来实现.在使用过程中,一级滤芯需要不定期更换,其中每更换3个一级滤芯就需要更换1个二级滤芯,三级滤芯无需更换.其中一级滤芯每个200元,二级滤芯每个400元.记一台净水器在使用期内需要更换的二级滤芯的个数构成的集合为M .如图是根据100台该款净水器在十年使用期内更换的一级滤芯的个数制成的柱状图.(1)结合柱状图,写出集合M ;(2)根据以上信息,求一台净水器在使用期内更换二级滤芯的费用大于1 200元的概率(以100台净水器更换二级滤芯的频率代替1台净水器更换二级滤芯发生的概率);(3)若在购买净水器的同时购买滤芯,则滤芯可享受5折优惠(使用过程中如需再购买无优惠).假设上述100台净水器在购机的同时,每台均购买a 个一级滤芯、b 个二级滤芯作为备用滤芯(其中b ∈M ,a +b =14),计算这100台净水器在使用期内购买滤芯所需总费用的平均数,并以此作为决策依据,如果客户购买净水器的同时购买备用滤芯的总数也为14,则其中一级滤芯和二级滤芯的个数应分别是多少?解:(1)由题意可知,当一级滤芯更换9,10,11个时,二级滤芯需要更换3个,当一级滤芯更换12个时,二级滤芯需要更换4个,所以M={3,4}.(2)由题意可知,二级滤芯更换3个,需1 200元,二级滤芯更换4个,需1 600元,在100台净水器中,二级滤芯需要更换3个的净水器共70台,二级滤芯需要更换4个的净水器共30台,设“一台净水器在使用期内更换二级滤芯的费用大于1 200元”为事件A,则P(A)=30=0.3.100(3)a+b=14,b∈M,①若a=10,b=4,则这100台净水器更换滤芯所需费用的平均数为100×10×30+(100×10+200)×40+(100×10+400)×30+200×4×100100=2 000.②若a=11,b=3,则这100台净水器更换滤芯所需费用的平均数为100×11×70+(100×11+200)×30+200×3×70+(200×3+400)×30100=1 880.所以如果客户购买净水器的同时购买备用滤芯的总数为14,客户应该购买一级滤芯11个,二级滤芯3个.6.互联网使我们的生活日益便捷,网络外卖也开始成为不少人日常生活中不可或缺的一部分,某市一调查机构针对该市市场占有率较高的甲、乙两家网络外卖企业(以下简称外卖甲、外卖乙)的经营情况进行了调查,调查结果如下表,(1)业的经营状况;(2)据统计表明,y 与x 之间具有线性关系.①请用相关系数r 对y 与x 之间的相关性强弱进行判断(若|r |>0.75,则可认为y 与x 有较强的线性相关关系(r 值精确到0.001));②经计算求得y 与x 之间的回归方程为y ^=1.382x -2.674,假定每单外卖业务,企业平均能获取纯利润3元,试预测当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润的大致范围(x 值精确到0.01).相关公式:r =∑ni =1 (x i -x -)(y i -y -)∑ni =1(x i -x -)2∑ni =1(y i -y -)2.参考数据:∑5i =1(x i -x -)(y i -y -)=66,∑5i =1(x i -x -)2∑5i =1(y i -y -)2≈77.解:(1)由题可知x -=5+2+9+8+115=7(百单),y -=2+3+10+5+155=7(百单).外卖甲的日接单量的方差s 2甲=10,外卖乙的日接单量的方差s 2乙=23.6, 因为x -=y -,s 2甲<s 2乙,即外卖甲平均日接单量与外卖乙相同,且外卖甲日接单量更集中一些,所以外卖甲比外卖乙经营状况更好.(2)①计算可得,相关系数r ≈6677≈0.857>0.75, 所以可认为y 与x 之间有较强的线性相关关系. ②令y ≥25,得1.382x -2.674≥25,解得x ≥20.02, 又20.02×100×3=6 006,所以当外卖乙日接单量不低于25百单时,外卖甲所获取的日纯利润大约不低于6 006元.。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
习题四
1、在一个人数很多的团体中普查某种疾病,为此要抽验N 个人的血,可以用两种方法进行。
(1)将每个人的血分别检验,这就需要验N 次;(2)按k 个人一组进行分组,把从k 个人抽来的血混合在一起进行检验,如果这混合血液呈阴性反应,就说明这k 个人的血都呈阴性反应,这样,这k 个人的血就只需验一次。
若呈阳性,则再对这k 个人的血分别进行化验。
这样,k 个人的血总共要化验k+1次。
假设每个人的血呈阳性的概率为p ,且这些人的试验反应是相互独立的。
试说明当p 较小时,选取适当的k ,按第二种方法可以减少化验的次数。
并说明当k 取什么值时最适宜?
2、人群中有健康人和病人两类,病人可以通过与健康人接触将疾病传染给健康人。
任何两人之间的接触是随机的,当健康人与病人接触时是否被感染也是随机的。
如果通过实际数据或经验掌握了这些随机规律,试估计平均每天有多少健康人被感染。
3、某商店要订购一批商品零售,设购进价1c ,售出价2c ,订购费0c (与数量无关)。
随机需求量r 的概率密度为p(r),每件商品的贮存费为3c (与时间无关)。
问如何确定订购量才能使商店的平均利润最大。
这个平均利润是多少?为使这个平均利润为正值,需要对订购费0c 加什么限制?
4、若零件寿命服从指数分布,证明不存在预防性更换策略。
又问,若失效率r(t)为减函数,是否会存在预防性更换策略?
5、用连续热轧方法制造钢材时要经过两道工序,第一道是粗轧(热轧),形成钢材的雏形;第二道是精轧(冷轧),得到规定长度的钢材。
粗轧时由于设备,环境等方面随机因素的影响,钢材冷却后的长度大致上呈正态分布,其均值可以在轧制过程中由轧机调整,而其均方差则是由设备的精确度决定的,不能随意改变。
精轧时把多出规定的部分切掉,但是如果发现粗轧后的钢材已经比规定长度短,则整根报废。
精轧设备精度很高,可以认为轧出的成品材完全符合规定长度要求。
根据轧制工艺的要求,要在成品材规定长度l 和粗轧后钢材长度的均方差σ已知的条件下,确定粗轧后的均值m ,使得当轧机调整到m 进行粗轧,再精轧后得到成品材时的浪费最少。
6、若上题中钢材粗轧后,长度在l l 与1之间时降级使用(比如经济价值上每一根降级材相当于α根成品材)。
长度小于1l 才整根报废。
试选用合适的目标函数建立优化模型,使某种意义下的浪费量最小。
7、某种水泥在凝固时放出的热量Y (卡/克)与其中的四种化学成分X 1,X 2,X 3,X 4有关,现有13个水泥样品的样本数据列于下表:
序号X1 X2 X3 X4Y
1 7 26 6 60 78.5
2 1 29 15 52 74.3
3 11 56 8 20 104.3
4 11 31 8 47 87.6
5 7 52
6 33 95.9
6 11 55 9 22 109.2
7 3 71 17 6 102.7
8 1 31 22 44 72.5
9 2 54 18 22 93.1
10 21 47 4 26 115.9
11 1 40 23 34 83.8
12 11 66 9 12 113.3
13 10 68 8 12 109.4
试建立Y关于X1,X2,X3,X4的线性回归方程。
8和飘尘浓度X如下表所示:
12
X1和飘尘浓度X2分别为(5.6,18.1)和(8.2,17.9)的样本,试确定丙、丁两个地区的大气环境类型。
9、在第7题中,试以X1,X2,X3,X4为指标,对这13个水泥样品进行分类,你认为应该分成几类比较合理?分类结果与Y的值有什么关系?。