概率统计补充案例

合集下载

高中数学教案:概率与统计的应用实例

高中数学教案:概率与统计的应用实例

高中数学教案:概率与统计的应用实例概率与统计是高中数学中的重要内容,也是数学知识在实际生活中的应用之一。

本文将以概率与统计的应用实例为背景,从不同角度介绍其在现实生活中的具体运用,并探讨其对我们日常生活和决策的重要性。

一、汽车保险费率的确定首先,我们来看一个与汽车保险相关的应用实例。

概率与统计可以帮助保险公司确定汽车保险费率。

保险公司需要根据过去发生事故的数据和驾驶员个人情况等因素来评估保险合同风险,并根据风险程度来确定相应的保险费率。

例如,假设某保险公司要确定年龄在25至30岁之间、有两年以上驾龄且拥有豪华轿车的客户发生事故的概率。

通过搜集大量客户数据以及他们最近几年内发生事故次数和驾龄等信息,可以利用统计方法对这些数据进行分析,并得出频率和概率分布。

通过对数据进行适当处理后,假设得到了某一特定区间内发生事故次数的分布:25岁至30岁之间有两年及以上驾龄的客户发生事故次数符合正态分布,均值为2次,标准差为0.5次。

那么在获得这一分布之后,保险公司可以通过概率计算得出该客户群体在某一时期内发生事故的概率。

基于这个概率和对风险的评估,保险公司可以制定不同的保险费率。

比如,对于一个驾驶员来说,如果他属于所述年龄段、驾龄满足要求,并且其事故频率低于平均水平,则其保险费率将被设定在较低的水平;反之,如果该驾驶员的事故频率高于平均水平,则保险费率可能会相应增加。

二、市场调研与新产品开发其次,我们将介绍概率与统计在市场调研和新产品开发中的应用实例。

当企业开发新产品或服务时,了解目标市场需求和顾客喜好是至关重要的。

而这些信息往往需要通过市场调研得到,并借助概率与统计方法进行分析。

以某电子产品公司为例,它希望了解消费者对一款新型智能手机功能特性的喜好程度。

为达到这个目的,公司可以通过搜集大量消费者对不同特性的评价数据,并利用统计方法进行分析。

假设通过市场调研收集到了1000份消费者对不同功能的满意度评价数据,其中包括拍照质量、电池续航能力、操作系统流畅度等关键功能特性。

中考数学中的概率与统计实际问题解决思路实例总结

中考数学中的概率与统计实际问题解决思路实例总结

中考数学中的概率与统计实际问题解决思路实例总结概率与统计是中学数学中的一个重要内容,它不仅是数学的一部分,也是日常生活中经常遇到的实际问题的解决思路。

在中考中,概率与统计常常会出现在选择题、应用题等题型中,考察学生解决实际问题的能力。

本文将通过几个实例来总结中考数学中概率与统计问题的解决思路。

实例一:掷骰子游戏小明和小李玩一个掷骰子的游戏,规则是谁先掷出6点谁就赢。

他们轮流掷骰子,小明先掷。

如果小明掷到6点,则小明胜利;如果小明掷到1~5点,则轮到小李掷骰子。

假设掷到6点和1~5点的概率相等,求小明获胜的概率。

解决思路:首先分析每一次掷骰子的可能结果:小明掷到6点的概率为1/6,小李掷到6点和小明掷到1~5点的概率均为1/6。

则小明胜利的概率等于小明掷到6点的概率加上小明掷到1~5点后小李再掷到6点的概率。

由于小明与小李轮流掷骰子,所以两者的胜率相等。

则小明获胜的概率为1/6 + 1/6 * 1/6 = 7/36。

实例二:统计调查某中学为了解学生对校园环境的评价情况,进行了一次校园调查,调查对象为全校学生。

调查结果如下:学生总数2000人,其中喜欢校园环境的有1500人,不喜欢的有300人,其他无意见的有200人。

现在需要根据调查结果回答以下问题:学生喜欢校园环境的概率是多少?学生不喜欢校园环境的概率是多少?解决思路:根据调查结果,我们可以得到喜欢校园环境的学生有1500人,不喜欢校园环境的学生有300人。

而总学生数为2000人。

学生喜欢校园环境的概率等于喜欢校园环境的学生数除以总学生数,即1500/2000 = 0.75。

同理,学生不喜欢校园环境的概率等于不喜欢校园环境的学生数除以总学生数,即300/2000 = 0.15。

通过以上两个实例,我们可以看出解决概率与统计问题的思路是分析情况并计算概率。

概率的计算可以通过确定样本空间、事件和事件发生的可能性来进行。

在解决问题时,需要注意概率的公式和概率的加法、乘法原理的应用。

《概率论与数理统计》案例

《概率论与数理统计》案例

实例1 发行彩票的创收利润某一彩票中心发行彩票 10万张, 每张2元. 设头等奖1个, 奖金 1万元, 二等奖2个,奖金各 5 千元;三等奖 10个, 奖金各1千元; 四等奖100个, 奖金各100元; 五等奖1000个, 奖金各10 元.每张彩票的成本费为 0.3 元, 请计算彩票发行单位的创收利润.每张彩票平均能得到奖金05512()10000500001010E X p =⨯+⨯++⨯0.5(),=元每张彩票平均可赚20.50.3 1.2(),--=元因此彩票发行单位发行 10 万张彩票的创收利润为:100000 1.2120000().⨯=元 实例2 如何确定投资决策方向?某人有10万元现金,想投资于某项目,预估成功的机会为 30%,可得利润8万元 , 失败的机会为70%,将损失 2 万元.若存入银行,同期间的利率为5% ,问是否作此项投资?解:设 X 为投资利润,则()80.320.71(),E X =⨯-⨯=万元存入银行的利息:1050.5(),%⨯=万元故应选择投资.实例3 商店的销售策略某商店对某种家用电器的销售采用先使用后付款的方式,记使用寿命为X (以年计),规定1,1500;12,2000;23,2500;3,3000.X X X X ≤<≤<≤>一台付款元一台付款元一台付款元一台付款元10,1e ,0,()100,0.x X x f x x Y -⎧>⎪=⎨⎪≤⎩ 设寿命服从指数分布概率密度为试求该商店一台家用电器收费的数学期望解:11001{1}e d 10x P X x -≤=⎰0.11e -=-0.0952,= 21011{12}e d 10x P X x -<≤=⎰0.10.2e e --=-0.0861,= 31021{23}e d 10x P X x -<≤=⎰0.20.3e e 0.0779,--=-= 1031{3}e d 10x P X x +∞->=⎰0.3e 0.7408.-== Y 因而一台收费的分布律为()2732.15,E Y =得2732.15.即平均一台家用电器收费元例1 某单位内部有260部电话分机,每个分机有4%的时间要与外线通话,可以认为每个电话分机用不同的外线是相互独立的,问总机需备多少条外线才能95%满足每个分机在用外线时不用等候?解: 令),260,2,1(01 =⎩⎨⎧=k k k X K 个分机不要用外线第个分机要用外线第,26021,,,X X X 是260个相互独立的随机变量,且04.0)(=i X E ,26021X X X m +++= 表示同时使用外线的分机数,根据题意应确定最小的x 使%95}{≥<x m P 成立。

七年级概率与统计的应用实例

七年级概率与统计的应用实例

七年级概率与统计的应用实例概率和统计作为数学的一个重要分支,在我们的日常生活中扮演着重要的角色。

它们帮助我们对事物进行分析和预测,促使我们更好地做出决策。

在这篇文章中,我将通过几个实例来展示七年级学生如何运用概率和统计的知识解决问题。

实例一:抛硬币问题小明和小红在玩抛硬币的游戏。

硬币正面朝上的概率为50%,反面朝上的概率也为50%。

小明和小红决定连续抛掷硬币10次,他们想知道出现正面和反面的次数相等的概率有多大。

解析:在这个问题中,我们可以使用组合数公式来计算得到与期望结果相等的概率。

正面出现的次数和反面出现的次数都应为5次,我们需要计算得到正面出现5次的概率。

根据组合数公式,我们可以得到:P(5次正面) = C(10, 5) × (0.5)^5 × (0.5)^5其中,C(10, 5)表示10个硬币中选取5个正面的组合数。

计算得出的结果为0.246。

因此,小明和小红出现正面和反面次数相等的概率为0.246,约为24.6%。

实例二:调查统计问题某班级有30名学生,老师想了解学生们的喜好,于是随机调查了20名学生。

根据调查结果,有15名学生喜欢科学,而剩下的5名学生不喜欢科学。

老师想知道在该班级中随机抽取一个学生,他喜欢科学的概率是多少。

解析:在这个问题中,我们可以通过简单计算来得到答案。

喜欢科学的学生占总人数的比例为15/30=0.5,而不喜欢科学的学生占比为5/30=0.167。

因此,随机抽取一个学生,他喜欢科学的概率为0.5,即50%。

实例三:柱状图问题某班级的学生对不同种类的水果喜好程度进行了调查,并将结果制成了柱状图如下:(此处应插入柱状图图片)从图中可以看出,学生们对苹果和橙子的喜好程度最高,分别为25%和20%。

而对香蕉的喜好程度最低,只有5%的学生喜欢。

解析:通过这个柱状图,我们可以清楚地了解学生们对不同种类水果的喜好程度。

苹果和橙子是最受欢迎的水果,而香蕉则是最不受欢迎的。

小学生数学习题练习巧用概率解决实际问题

小学生数学习题练习巧用概率解决实际问题

小学生数学习题练习巧用概率解决实际问题数学习题一直是小学生们学习数学的重要部分,通过解答习题,他们可以巩固所学的知识,并培养逻辑思维和解决问题的能力。

然而,有时候习题的题目与实际生活的场景并不是完全契合的,这就需要我们巧妙地运用概率理论来解决实际问题。

本文将以一些具体的例子来说明小学生如何巧用概率来解决数学习题。

例一:小明的自行车小明每天上学都骑自行车,但他发现自己的自行车容易打滑。

他向老师请教后,老师告诉他只要把自行车胎上的气打满,就可以减少打滑的可能。

根据老师的建议,小明想知道如果他连续骑行10次,气打满的自行车胎打滑的概率是多少?解答:假设自行车胎打滑的概率为p,那么自行车胎不打滑的概率就是1-p。

根据概率的乘法法则,连续骑行10次,并且自行车胎都不打滑的概率可以表示为(1-p)^10。

因此,小明连续骑行10次,气打满的自行车胎打滑的概率就是1-(1-p)^10。

例二:魔术师的抽牌魔术一位魔术师希望展示一种抽牌魔术,他让小明从一副52张的扑克牌中随机抽取5张,并告诉小明他能准确猜中小明抽到的牌。

小明感到非常好奇,但也有点怀疑。

小明想知道他从一副52张的扑克牌中随机抽取的5张牌和魔术师猜中牌的概率有多大?解答:一副扑克牌中有52张牌,小明从中抽取5张牌的可能性有C(52, 5)种,即从52个中取5个的组合数。

而魔术师能准确猜中小明抽到的牌的可能性只有1种。

因此,小明从一副52张的扑克牌中随机抽取的5张牌和魔术师猜中牌的概率就是1/C(52, 5)。

通过以上两个例子,我们可以看到在解决实际问题时,通过巧用概率理论我们可以得出准确的答案。

这也提醒了我们,在学习数学的过程中,我们要与实际生活结合,理论与实践相结合,不仅要懂得解答习题,还要懂得将数学知识应用于解决实际问题。

不断锻炼自己的思维和解决问题的能力,才能在以后的学习和工作中更加出色。

大学三年级应用概率论解决统计问题

大学三年级应用概率论解决统计问题

大学三年级应用概率论解决统计问题概率论是数学中的一个重要分支,广泛应用于各个领域。

在统计学中,概率论有着重要的作用,可以帮助我们解决各种统计问题。

本文将通过几个具体案例,展示大学三年级应用概率论解决统计问题的方法和步骤。

案例一:调查人口比例在某个城市进行人口普查时,我们需要估算出男女人口的比例。

为了节省时间和资源,我们只能随机地抽取一部分人进行调查。

假设我们需要达到90%的置信度,误差不超过5%。

我们可以运用概率论中的抽样分布理论来解决这个问题。

首先,我们需要确定样本容量。

根据概率论的知识,我们可以用二项分布来描述样本中男女人口的比例。

根据二项分布的性质,我们可以计算出需要的样本容量。

其次,我们进行抽样调查,并记录男女人口的数目。

根据样本数据,我们可以计算出样本中男女人口的比例。

然后,我们计算出置信区间。

根据抽样分布理论,我们可以计算出样本比例的标准误差,并结合置信度来确定置信区间。

最后,我们进行统计推断。

根据置信区间中的男女人口比例,我们可以推断出整个城市男女人口的比例。

案例二:质量控制某工厂需要进行产品质量控制,以确保产品符合相关标准。

为了了解产品的合格率,我们进行了一次抽样调查,并记录了产品合格和不合格的数量。

我们可以使用概率论和假设检验来解决这个统计问题。

首先,我们制定假设。

通常我们会假设产品合格率符合某个特定的数值,例如50%。

然后,我们可以根据概率分布计算出合格和不合格产品的概率。

其次,我们进行抽样调查,并记录产品的合格和不合格数量。

然后,我们计算出样本的合格率,并与假设进行比较。

使用假设检验的方法,我们可以计算出假设的可信程度,从而得出结论。

最后,我们进行质量控制决策。

根据假设检验的结果,我们可以决定是否接受或拒绝假设,从而采取相应的质量控制措施。

案例三:风险评估在金融领域,风险评估是非常重要的。

通过应用概率论,我们可以对金融市场的风险进行定量分析。

以股票市场为例,我们可以使用概率分布来描述股票价格的变动,然后基于概率论进行风险评估。

2.4 补充例题——概率统计课件PPT

2.4 补充例题——概率统计课件PPT

解 X 的分布函数为
F(x)
1
1x
e 2000
,
0 ,
x0, x0.
(1) P{X 1000} 1 P{X 1000} 1 F (1000)
1
e 2 0.607 .
(2) P{ X 2000 X 1000}
P{ X 2000, X 1000} P{ X 1000}
P{ X 2000} P{ X 1000}
解 X 的分布密度函数为
f
(
x
)
1 3
,
2 x5,
0 , 其他.
设 A 表示“对 X 的观测值大于 3 的次数”,
即 A={ X >3 }.
由于 P( A) P{ X 3}
51
2
dx ,
33
3
设Y 表示3次独立观测中观测值大于3的次数,
则 因而有
Y
~
b
3,
2 3
.
P{Y
2}
3 2
故有 F (a) lim F( x) , F (a) lim F( x) ,
xa
xa

A
B
arcsin
a a
A πB 0 , 2
A
B
arcsin
a a
A
πB 1, 2
解得 A 1 , 2
B 1 . π
所以
0,
x a ,
F(x)
1
1 arcsin
x
,
a xa,
2 1
,
π
a xa.
(2) P{a X a} F(a) F(a)
补充5 已知 X ~ N ( μ,σ2 ) , 求 P{c X d } .

统计和概率经典例题(含答案解析和解析)

统计和概率经典例题(含答案解析和解析)

统计与概率经典例题(含答案及解析)1.(本题8分)为了解学区九年级学生对数学知识的掌握情况,在一次数学检测中,从学区2000名九年级考生中随机抽取部分学生的数学成绩进行调查,并将调查结果绘制成如下图表:⑴表中a和b所表示的数分别为:a= .,b= .;⑵请在图中补全频数分布直方图;⑶如果把成绩在70分以上(含70分)定为合格,那么该学区2000名九年级考生数学成绩为合格的学生约有多少名?2.为鼓励创业,市政府制定了小型企业的优惠政策,许多小型企业应运而生,某镇统计了该镇1﹣5月新注册小型企业的数量,并将结果绘制成如下两种不完整的统计图:(1)某镇今年1﹣5月新注册小型企业一共有家.请将折线统计图补充完整;(2)该镇今年3月新注册的小型企业中,只有2家是餐饮企业,现从3月新注册的小型企业中随机抽取2家企业了解其经营状况,请用列表或画树状图的方法求出所抽取的2家企业恰好都是餐饮企业的概率.3.(12分)一个不透明的口袋装有若干个红、黄、蓝、绿四种颜色的小球,小球除颜色外完全相同,为估计该口袋中四种颜色的小球数量,每次从口袋中随机摸出一球记下颜色并放回,重复多次试验,汇总实验结果绘制如图不完整的条形统计图和扇形统计图.根据以上信息解答下列问题:(1)求实验总次数,并补全条形统计图;(2)扇形统计图中,摸到黄色小球次数所在扇形的圆心角度数为多少度?(3)已知该口袋中有10个红球,请你根据实验结果估计口袋中绿球的数量.4.(本题10分)某校为了解2014年八年级学生课外书籍借阅情况,从中随机抽取了40名学生课外书籍借阅情况,将统计结果列出如下的表格,并绘制成如图所示的扇形统计图,其中科普类册数占这40名学生借阅总册数的40%.类别科普类教辅类文艺类其他册数(本)128 80 m 48(1)求表格中字母m的值及扇形统计图中“教辅类”所对应的圆心角a的度数;(2)该校2014年八年级有500名学生,请你估计该年级学生共借阅教辅类书籍约多少本?5.(10分)将如图所示的版面数字分别是1,2,3,4的四张扑克牌背面朝上,洗匀后放在桌面上(“A”看做是“1”)。

  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

补充案例:概率部分:案例1、“三人行必有我师焉”案例2、抓阄问题案例3、贝叶斯方法运用案例介绍案例4、化验呈阳性者是否患病案例5、敏感性问题的调查案例6、泊松分布在企业评先进中的应用案例7、碰运气能否通过英语四级考试案例8、检验方案的确定问题案例9、风险型决策模型案例10、一种很迷惑游客的赌博游戏案例11、标准分及其应用案例12、正态分布在人才招聘中的应用案例13、预测录取分数线和考生考试名统计部分:案例14、随机变量函数的均值和标准差的近似计算方法案例15、如何表示考试成绩比较合理案例16、如何估计湖中黑、白鱼的比例案例17、预测水稻总产量案例18、工程师的建议是否应采纳案例19、母亲嗜酒是否影响下—代的健康案例20、银行经理的方案是否有效案例21、一元线性回归分析的Excel实现案例22、方差分析的Excel实现案例23、预测高考分数案例24、两次地震间的间隔时间服从指数分布案例1、“三人行必有我师焉”我们可以运用概率知识解释孔子的名言“三人行必有我师焉”. 首先我们要明确一个问题,即只要在某一方面领先就可以为师(韩愈说“术业有专攻”). 俗语说“三百六十行,行行出状元”,我们不妨把一个人的才能分成360个方面。

孔子是个大圣人,我们假设他在一个方面超过某个人的概率为99%,那么孔子在这方面超过与他“同行”的两个人的概率为99% ×99% =98.0l %,在360个方面孔子总比这两人强的概率为(98.01%)360=0.07% ,即这两个人在某一方面可以做孔子老师的概率为99.93%.从数学角度分析,孔子的话是很有道理的. 案例2、抓阄问题一项耐力比赛胜出的10人中有1 人可以获得一次旅游的机会,组织者决定以抓阄的方式分配这一名额. 采取一组10人抓阄,10张阄中只有一张写“有”. 每个人都想争取到这次机会,你希望自己是第几个抓阄者呢? 有人说要先抓,否则写有“有”的阄被别人抓到,自己就没有机会了;有人说不急于先抓,如果前面的人没有抓到写有“有”的阄,这时再抓抓到“有”的机会会大一些. 为了统一认识,用概率的方法构造一个摸球模型来说明问题.摸球模型:袋中装有1 个红球和9 个黄球除颜色不同外球的大小、形状、质量都相同. 现在10 人依次摸球(不放回),求红球被第 k 个人摸到的概率( k = 1, 2, ⋯, 10).解决问题 :设k A = “{第 k 个人摸到红球}, k = 1, 2, ⋯, 10. 显然,红球被第一个人摸到的概率为101)(1=A P . 因为 12A A ⊆,于是红球被第二个人摸到的概率为 10191109)()()()(121212=⨯===A A P A P A A P A P .同样,由213A A A ⊆知红球被第三个人摸到的概率为1018198109)()()()()(2131213213=⨯⨯===A A A P A A P A P A A A P A P .如此继续,类似可得 )(4A P ===ΛΛ)(5A P 101)(10=A P . 由此可见,其结果与 k 无关,表明10 个人无论摸球顺序如何,每个人摸到红球的机会相等. 这也说明10 个人抓阄,只要每个人在抓之前不知道他前边那些已经抓完的结果,无论先后, 抓到的机会是均等的. 在现实生活中单位分房、学生分班、短缺物品的分配等,人们常常乐于用抓阄的办法来解决,其合理性保证当然得归功于“概率”. 通过上面的摸球模型,我们总结出分配中的“抓阄”问题,无论先抓后抓, 结果是一样的.学完概率之后再遇到抓阄问题时不必争先恐后,我们要发扬风格让他人先抓.案例3、贝叶斯方法运用案例介绍 什么是贝叶斯过滤器?垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。

正确识别垃圾邮件的技术难度非常大。

传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。

前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。

它们的识别效果都不理想,而且很容易规避。

2002年,Paul Graham提出使用"贝叶斯推断"过滤垃圾邮件。

他说,这样做的效果,好得不可思议。

1000封垃圾邮件可以过滤掉995封,且没有一个误判。

另外,这种过滤器还具有自我学习的功能,会根据新收到的邮件,不断调整。

收到的垃圾邮件越多,它的准确率就越高。

建立历史资料库贝叶斯过滤器是一种统计学过滤器,建立在已有的统计结果之上。

所以,我们必须预先提供两组已经识别好的邮件,一组是正常邮件,另一组是垃圾邮件。

我们用这两组邮件,对过滤器进行"训练"。

这两组邮件的规模越大,训练效果就越好。

Paul Graham使用的邮件规模,是正常邮件和垃圾邮件各4000封。

"训练"过程很简单。

首先,解析所有邮件,提取每一个词。

然后,计算每个词语在正常邮件和垃圾邮件中的出现频率。

比如,我们假定"sex"这个词,在4000封垃圾邮件中,有200封包含这个词,那么它的出现频率就是5%;而在4000封正常邮件中,只有2封包含这个词,那么出现频率就是0.05%。

(【注释】如果某个词只出现在垃圾邮件中,Paul Graham 就假定,它在正常邮件的出现频率是1%,反之亦然。

随着邮件数量的增加,计算结果会自动调整。

)有了这个初步的统计结果,过滤器就可以投入使用了。

贝叶斯过滤器的使用过程现在,我们收到了一封新邮件。

在未经统计分析之前,我们假定它是垃圾邮件的概率为50%。

(【注释】有研究表明,用户收到的电子邮件中,80%是垃圾邮件。

但是,这里仍然假定垃圾邮件的"先验概率"为50%。

)我们用S表示垃圾邮件(spam),H表示正常邮件(healthy)。

因此,P(S)和P(H)的先验概率,都是50%。

然后,对这封邮件进行解析,发现其中包含了sex这个词,请问这封邮件属于垃圾邮件的概率有多高?我们用W表示"sex"这个词,那么问题就变成了如何计算P(S|W)的值,即在某个词语(W)已经存在的条件下,垃圾邮件(S)的概率有多大。

根据条件概率公式,马上可以写出公式中,P(W|S)和P(W|H)的含义是,这个词语在垃圾邮件和正常邮件中,分别出现的概率。

这两个值可以从历史资料库中得到,对sex这个词来说,上文假定它们分别等于5%和0.05%。

另外,P(S)和P(H)的值,前面说过都等于50%。

所以,马上可以计算P(S|W)的值:因此,这封新邮件是垃圾邮件的概率等于99%。

这说明,sex这个词的推断能力很强,将50%的"先验概率"一下子提高到了99%的"后验概率"。

联合概率的计算做完上面一步,请问我们能否得出结论,这封新邮件就是垃圾邮件?回答是不能。

因为一封邮件包含很多词语,一些词语(比如sex)说这是垃圾邮件,另一些说这不是。

你怎么知道以哪个词为准?Paul Graham的做法是,选出这封信中P(S|W)最高的15个词,计算它们的联合概率。

(【注释】如果有的词是第一次出现,无法计算P(S|W),Paul Graham就假定这个值等于0.4。

因为垃圾邮件用的往往都是某些固定的词语,所以如果你从来没见过某个词,它多半是一个正常的词。

)所谓联合概率,就是指在多个事件发生的情况下,另一个事件发生概率有多大。

比如,已知W1和W2是两个不同的词语,它们都出现在某封电子邮件之中,那么这封邮件是垃圾邮件的概率,就是联合概率。

在已知W1和W2的情况下,无非就是两种结果:垃圾邮件(事件E1)或正常邮件(事件E2)。

其中,W1、W2和垃圾邮件的概率分别如下:如果假定所有事件都是独立事件(【注释】严格地说,这个假定不成立,但是这里可以忽略),那么就可以计算P(E1)和P(E2):又由于在W1和W2已经发生的情况下,垃圾邮件的概率等于下面的式子:即将P(S)等于0.5代入,得到将P(S|W1)记为P1,P(S|W2)记为P2,公式就变成这就是联合概率的计算公式。

最终的计算公式将上面的公式扩展到15个词的情况,就得到了最终的概率计算公式:一封邮件是不是垃圾邮件,就用这个式子进行计算。

这时我们还需要一个用于比较的门槛值。

Paul Graham 的门槛值是0.9,概率大于0.9,表示15个词联合认定,这封邮件有90%以上的可能属于垃圾邮件;概率小于0.9,就表示是正常邮件。

有了这个公式以后,一封正常的信件即使出现sex 这个词,也不会被认定为垃圾邮件了。

案例4、化验呈阳性者是否患病在医疗中经常通过化验来诊断。

当某人做癌症检查结果呈阳性时,他就患癌症了?其实不然。

假设某一地区患有癌症的人占0.005,患者对一种试验反应是阳性的概率为0.95,正常人对这种试验反应是阳性的概率为0.04,现抽查了一个人,试验反应是阳性,问此人是癌症患者的概率有多大?设C={抽查的人患有癌症},A={试验结果是阳性},则C 表示“抽查的人不患癌症”。

已知()0.005P C =, ()0.995P C =,()0.95P A C =,()0.04P A C =。

由贝叶斯公式,可得)()()()()()()(C A P C P C A P C P C A P C P A C P +=代入数据计算得: P (C |A )= 0.1066 。

在以上假设下,做癌症检查结果呈阳性的人确患癌症的概率为仅为0.1066,平均来说,1000个人中大约只有107人确患癌症。

这是不是意味着这种试验对于诊断一个人是否患有癌症没有意义呢?不是!如果不做试验,一人是患者的概率为0.005。

若试验后得阳性反应,则此人是患者的概率为0.1066, 从0.005增加到0.1066,将近增加约21倍,说明这种试验对于诊断一个人是否患有癌症有意义。

案例5、敏感性问题的调查学生阅读不健康书刊或录像会严重影响学生的身心健康. 但这些都是避着家长和教师进行的,属个人隐私行为. 我们如何设计一种调查方案,能够估计出大学生中看过不健康书刊或录像的人数的比率呢?对这种敏感性问题的调查,被调查者会有一种顾虑,害怕调查者不能很好的保守秘密. 如果被调查者不愿意真实回答问题,将使调查数据失真,这样的统计结果将没有意义. 因此巧妙设计调查方案是获得真实数据的关键. 经过多年的研究和实践,一些统计学家和心理学家发明了一种能消除人们抵触情绪的“随机化应答”方法. 被调查者只需回答两个问题之一,而且只需回答“是”或“否”,设计的问题如下:问题A :你的生日是否在 7月1日 之前? 问题B :你是否看过不健康书刊?被调查者在没有外人的情况下,从一个装有黑球和白球的箱子中随机抽取一个球,看过颜色后又放回.若抽出白球则回答问题A ;若抽出黑球则回答问题B. 箱中黑球所占比率 α是已知的,即{}P α=任意抽取一个是黑球, {}1P α=-任意抽取一个是白球.被调查者无论回答A 或B ,都只需在一张只有“是”、“否”两个选项的答案上做出选择,然后投入密封的投票箱内. 上述抽球和答卷都在无人的情况下进行,这样就可以消除被调查者的顾虑,从而可以保证答卷的真实可靠性.打开投票箱进行统计,设共有 n 张有效答卷,其中 k 张选择“是”,那么可用频率 nk估计回答“是”的概率 ϕ为:{}/P k nϕ==答“是”.回答“是”有两种情况:一种是摸到白球后对问题A 回答“是”,也就是被调查者 “生日在7月1日之前”的概率,一般认为这个概率是0.5,即 }{0.5P =答“是”抽白球;另一种是摸到黑球后对问题B 回答“是”,这个条件概率就是看不健康书刊的学生在参加调查的学生中的比率 p ,即}{P p=答“是”抽黑球.利用全概率公式得{}{}}{{}}{P P P P P =⋅+⋅答“是”抽白球答“是”抽白球抽黑球答“是”抽黑球,即 ααϕp +-=)(15.0. 由此可获得/0.5(1)k n p αα--==.假设在一次实际调查中,箱子中共有50个球,其中30个是黑球,20个白球,则 6.0=α. 调查结束时共收到1583张有效答卷,其中有389张回答“是”,据此可估算出0762.06.04.0211583389=⨯-=p .这表明1583名学生中,约 62.7%的学生看过不健康书刊.案例6、泊松分布在企业评先进中的应用某工业系统在进行安全管理评选时,有两家企业在其它方面得分相等,难分高下。

相关文档
最新文档