贝叶斯定理(第三章)
贝叶斯定理(第三章)

利用贝叶斯法则预测,符合下列条件的人员购买计算机的可能 利用贝叶斯法则预测, 收入=中 学生否 学生否=Y,信用 一般 信用=一般 性 X=(年龄 (年龄<30,收入 中,学生否 收入 信用 一般)
本例只有两个类别,即 购买计算机},C2={不购买计 本例只有两个类别 即C1={购买计算机 购买计算机 不购买计 算机},P(Ci)为每个事件的事前概 为每个事件的事前概,P(C1)=9/14=0.643, P 算机 为每个事件的事前概 为了计算P(X|Ci)(i=1,2),先进行以下 (C2)=5/14=0.357,为了计算 为了计算 先进行以下 运算: 运算: P(年龄 年龄<30|C1)=2/9, 1 年龄 P(收入 中|C1)=4/9, 收入=中 1 收入 P(学生否 学生否=Y|C1)=6/9, 学生否 1 P(信用 一般 1)=6/9, 信用=一般 信用 一般|C1 P(年龄 年龄<30|C2)=3/5 2 年龄 P(收入 中|C2)=2/5 收入=中 2 收入 P(学生否 学生否=Y|C2)=1/5 学生否 2 P(信用 一般 2)=2/5 信用=一般 信用 一般|C2
因此 P(X|C1)=(2/9)*(4/9)*(6/9)*(6/9)=0.044 1 P(X|C2)=(3/5)*(2/5)*(1/5)*(2/5)=0.019 2 最后计算 P(X|Ci)*P(Ci) (i=1,2) ) ( P(X|C1)*P(C1) =0.044*0.643=0.028 P(X|C2)*P(C2)=0.019*0.357=0.007
P(H )
Tid Refund Marital Status 1 2 3 4 5 6 7 8 9 10
10
Taxable Income Cheat 125K 100K 70K 120K No No No No Yes No No Yes No Yes
概率论中的贝叶斯定理解析

概率论中的贝叶斯定理解析贝叶斯定理是概率论中非常重要的一条定理。
它可以用来更新我们对事件的估计和概率。
贝叶斯定理是一个非常强大的工具,可以在许多领域得到应用,如医学、金融、自然语言处理等。
一、贝叶斯定理是什么贝叶斯定理是指在已知某个事件发生的条件下,我们可以计算出另一个相关事件的概率。
换句话说,它可以帮助我们更新关于某个事件的概率估计。
公式:P(A|B) = P(B|A) * P(A) / P(B)其中,P(A)是事件A的先验概率,即我们在未观察到B的情况下对A的概率估计;P(B)是事件B的先验概率;而P(A|B)是在已知B发生的情况下对A的概率估计,叫做后验概率;P(B|A)是在A发生的情况下对B的概率估计,叫做似然概率。
二、贝叶斯定理的应用1.医学诊断在医学领域,贝叶斯定理被广泛应用于疾病诊断。
在医生做出病情判断之前,一般先为病人做一些检验,根据这些检验的结果再判断是否出现某种病症。
这些检验有时往往是有误差的,可能会出现假阳性或假阴性的情况。
这时贝叶斯定理可以帮助医生更好地做出诊断。
例如,对于一个病人来说,有70%的可能性是患有某种病,30%的可能性是健康的。
我们希望通过某些检测手段来确认这个病人是否真的患有这种病。
我们先假设这个测试方法的准确性是95%,即对于那些患病的人,这个测试会在95%的情况下给出正确的结果;对于那些健康的人,也有95%的概率正确地给出结果。
现在假设在这个测试中,这个病人得到了阳性结果。
那么,我们利用贝叶斯定理可以计算出这个病人患病的概率是多少?首先,我们需要计算出阳性结果的概率:P(阳性结果) = P(阳性结果|患病) * P(患病) + P(阳性结果|健康) * P(健康)P(阳性结果) = 0.95 * 0.7 + 0.05 * 0.3 = 0.665然后,我们可以利用贝叶斯定理来计算出患病的概率:P(患病|阳性结果) = P(阳性结果|患病) * P(患病) / P(阳性结果)P(患病|阳性结果) = 0.95 * 0.7 / 0.665 = 0.953即,这个病人患病的概率是95.3%。
贝叶斯定理简介及应用

贝叶斯定理简介及应用贝叶斯定理是概率论中的一项重要定理,它能够根据已知的条件概率来计算出相反事件的概率。
贝叶斯定理的应用非常广泛,涉及到许多领域,如医学诊断、信息检索、机器学习等。
本文将简要介绍贝叶斯定理的原理,并探讨其在实际应用中的一些例子。
一、贝叶斯定理的原理贝叶斯定理是由英国数学家托马斯·贝叶斯于18世纪提出的。
它是一种条件概率的计算方法,用于计算在已知某些条件下,另一事件发生的概率。
贝叶斯定理的数学表达式如下:P(A|B) = (P(B|A) * P(A)) / P(B)其中,P(A|B)表示在事件B发生的条件下,事件A发生的概率;P(B|A)表示在事件A发生的条件下,事件B发生的概率;P(A)和P(B)分别表示事件A和事件B的概率。
贝叶斯定理的核心思想是通过已知的条件概率来推断未知的概率。
它将先验概率(即在没有任何其他信息的情况下,事件发生的概率)与后验概率(即在已知某些条件下,事件发生的概率)相结合,从而得出更准确的概率估计。
二、贝叶斯定理的应用1. 医学诊断贝叶斯定理在医学诊断中有着广泛的应用。
医生通常会根据患者的症状和检查结果,来判断患者是否患有某种疾病。
贝叶斯定理可以帮助医生计算出在已知症状和检查结果的情况下,患者患病的概率。
例如,假设某种疾病的患病率为1%,而某种检查方法的准确率为95%。
如果一个人接受了这种检查,并且结果显示他患有该疾病,那么他真正患病的概率是多少呢?根据贝叶斯定理,我们可以计算出在已知检查结果为阳性的情况下,患者真正患病的概率。
假设事件A表示患者患病,事件B表示检查结果为阳性,那么根据贝叶斯定理,我们可以得到:P(A|B) = (P(B|A) * P(A)) / P(B)P(A|B) = (0.95 * 0.01) / (0.95 * 0.01 + 0.05 * 0.99) ≈ 0.161即在检查结果为阳性的情况下,患者真正患病的概率约为16.1%。
贝叶斯定理解析

贝叶斯定理解析贝叶斯定理是概率论中一项重要的理论,它可以用来计算在已知一些先验信息的情况下,某个事件的后验概率。
这个定理的应用范围非常广泛,从数据分析到机器学习,都可以看到贝叶斯定理的影子。
本文将对贝叶斯定理进行详细解析,并介绍一些其相关的应用。
一、贝叶斯定理的基本公式贝叶斯定理是基于条件概率推导而来的,它的基本公式如下所示:P(A|B) = (P(B|A) * P(A)) / P(B)在这个公式中,P(A|B)表示在已知事件B发生的条件下,事件A发生的概率。
P(B|A)表示在事件A发生的条件下,事件B发生的概率。
P(A)和P(B)分别表示事件A和事件B发生的概率。
二、贝叶斯定理的应用举例为了更好地理解贝叶斯定理的应用,我们将通过一个简单的问题来说明。
假设有一家医院,该医院的1000名病人中,100人感染了某种罕见疾病。
而这种疾病的检测准确率为99%。
现在,如果一个病人的检测结果呈阳性,那么他实际上感染这种疾病的概率是多少?根据贝叶斯定理的公式,我们可以将这个问题表示为:P(感染疾病|阳性) = (P(阳性|感染疾病) * P(感染疾病)) / P(阳性)其中,P(感染疾病|阳性)表示在检测结果为阳性的条件下,病人实际上感染疾病的概率。
P(阳性|感染疾病)表示在感染疾病的条件下,检测结果为阳性的概率。
P(感染疾病)表示病人感染疾病的概率。
P(阳性)表示检测结果为阳性的概率。
根据题目中提供的信息,P(阳性|感染疾病)为0.99,P(感染疾病)为100/1000=0.1,即10%。
而P(阳性)的计算稍微复杂一些,需要考虑两种情况:检测结果为真阳性(病人实际上感染了疾病并被正确检测出来)和检测结果为假阳性(病人实际上未感染疾病但被错误地检测出来)的概率。
根据提供的信息,病人实际上感染疾病的概率为100/1000=0.1,即10%。
而检测结果为真阳性的概率为 P(真阳性) = P(感染疾病) * P(阳性|感染疾病) = 0.1 * 0.99 = 0.099。
贝叶斯定理研究贝叶斯定理在随机事件中的应用

贝叶斯定理研究贝叶斯定理在随机事件中的应用贝叶斯定理(Bayes' theorem)是一种在统计学和概率论中常用的计算方法,它基于贝叶斯概率理论,用于计算事件发生的概率。
贝叶斯定理的应用广泛,特别在随机事件的研究和预测中具有重要意义。
本文将介绍贝叶斯定理的基本原理,并深入探讨其在随机事件中的应用。
一、贝叶斯定理简介贝叶斯定理是基于贝叶斯概率理论的一种计算方法。
其基本原理可以用以下公式表示:P(A|B) = (P(B|A) * P(A)) / P(B)其中,P(A|B)代表在事件B已经发生的条件下,事件A发生的概率;P(B|A)代表在事件A已经发生的条件下,事件B发生的概率;P(A)和P(B)分别代表事件A和事件B发生的概率。
二、贝叶斯定理的应用之预测疾病贝叶斯定理在医学领域的应用非常广泛,尤其在疾病的预测和诊断中具有重要意义。
通过利用已知的病例和相应的特征,可以利用贝叶斯定理计算出患者在不同条件下患病的概率,从而辅助医生进行诊断。
三、贝叶斯定理的应用之垃圾邮件过滤随着互联网的普及,垃圾邮件的数量也越来越多。
贝叶斯定理可以用来进行垃圾邮件的过滤,准确地判断某封邮件是垃圾邮件还是正常邮件。
通过统计已知的垃圾邮件和正常邮件的特征,利用贝叶斯定理计算出某封邮件是垃圾邮件的概率,从而实现自动化的垃圾邮件过滤。
四、贝叶斯定理的应用之金融风险评估金融领域面临着各种风险,如股票价格的波动、债券违约等。
贝叶斯定理可以用来进行金融风险的评估和预测。
通过统计已知的金融数据和相应的特征,利用贝叶斯定理计算出某种金融风险发生的概率,从而帮助投资者做出合理的投资决策。
五、贝叶斯定理的应用之自然语言处理贝叶斯定理在自然语言处理领域也有广泛的应用。
例如,在文本分类中,可以利用贝叶斯定理计算出某个词语在某个类别下的条件概率,从而实现对文本进行分类和归类。
六、贝叶斯定理的应用之机器学习贝叶斯定理在机器学习中也起到重要的作用。
贝叶斯定理简介及应用

贝叶斯定理简介及应用贝叶斯定理是概率论中的一个重要定理,它描述了在已知某些条件下,事件的概率如何被更新。
贝叶斯定理的提出者是英国数学家托马斯·贝叶斯(Thomas Bayes),他在1763年发表的一篇论文中首次提出了这一定理。
贝叶斯定理在统计学、机器学习、人工智能等领域有着广泛的应用,能够帮助我们更好地理解和处理不确定性问题。
贝叶斯定理的数学表达式如下:\[ P(A|B) = \frac{P(B|A) \cdot P(A)}{P(B)} \]在这个公式中,\( P(A|B) \)表示在事件B发生的条件下事件A发生的概率,\( P(B|A) \)表示在事件A发生的条件下事件B发生的概率,\( P(A) \)和\( P(B) \)分别表示事件A和事件B发生的概率。
贝叶斯定理的核心思想是通过已知的条件概率来推断未知的概率。
在实际应用中,我们通常将事件A看作假设,将事件B看作观测到的证据,利用贝叶斯定理来更新我们对假设的信念。
通过不断地观测和更新,我们可以逐渐提高对事件的预测准确性。
贝叶斯定理在各个领域都有着重要的应用。
下面我们将介绍一些贝叶斯定理在实际问题中的具体应用。
1. 医学诊断在医学诊断中,贝叶斯定理可以帮助医生根据患者的症状和检查结果来判断患某种疾病的概率。
通过将症状看作证据,将疾病看作假设,医生可以利用贝叶斯定理来更新对患病概率的估计,从而更准确地进行诊断和治疗。
2. 信用评估在金融领域,贝叶斯定理可以用于信用评估。
银行和金融机构可以根据客户的信用记录、收入情况等信息来评估其信用风险。
通过将客户的信息看作证据,将信用风险看作假设,可以利用贝叶斯定理来计算客户违约的概率,从而制定相应的信贷政策。
3. 自然语言处理在自然语言处理领域,贝叶斯定理常常用于文本分类和情感分析。
通过将文本中的词语看作证据,将文本所属类别看作假设,可以利用贝叶斯定理来计算文本属于每个类别的概率,从而实现文本分类和情感分析的任务。
贝叶斯估计

a1
a2
a3
1 3 -2 0
2 1
4 -3
3 -4 -1 2
17
这是一个典型的双人博弈(赌博)问题。不少实际问 题可归纳为双人博弈问题。把上例中的乙方改为自然 或社会,就形成人与自然(或社会)的博弈问题。
例2 农作物有两个品种:产量高但抗旱能力弱的
品种 a1 和抗旱能力强但产量低的品种 a2 。 在明年雨量不知的情况下,农民应该选播哪个品
这表明,当 ˆ ˆE 时,可使后验均方差达到最小, 实际中常取后验均值作为 的贝叶斯估计值.
9
例2 设一批产品的不合格率为 ,检查是一个一个进行,
直到发现第一个不合格品为止,若X为发现第一个不合 格品时已检查的产品数,则X服从几何分布,其分布列为
P(X x ) (1 )x1, x 1,2,
设ˆ 是 的一个贝叶斯估计,在样本给定后,ˆ 是一 个数,在综合各种信息后, 是按 ( x) 取值,所以
评价一个贝叶斯估计的误差的最好而又简单的方式是
用θ对 ˆ的后验均方差或平方根来度量,定义如下:
定义3.2 设参数θ的后验分布为 ( x) ,
贝叶斯估计为
ˆ ,则
ˆ 的后验期望
MSE(ˆ x) E x (
0 4 8
L
1
0
2
3.7 1.8 0
a1 , a2 , a3
23
2、损失函数
构成决策问题的三要素: A a L , a
由收益函数容易获得损失函数
计^
MD
更合适一些。
ˆE
要比最大后验估
第三、 的后验期望值估计要比最大后验估计更合适一
些。 表2.1列出四个实验结果,在试验1与试验2中,“抽 检3个产品没有一件不合格”与抽检10个产品没有一件 是不合格”这两件事在人们心目中留下的印象是不同 的。后者的质量要比前者的质量更信得过。
(完整版)贝叶斯统计-习题答案)

第一章 先验分布与后验分布1.1 解:令120.1,0.2θθ==设A 为从产品中随机取出8个,有2个不合格,则22618()0.10.90.1488P A C θ== 22628()0.20.80.2936P A C θ== 从而有5418.03.02936.07.01488.07.01488.0)()|()()|()()|()|(2211111=⨯+⨯⨯=+=θπθθπθθπθθπA P A P A P A 4582.0)|(1)|(4582.03.02936.07.01488.03.02936.0)()|()()|()()|()|(122211222=-==⨯+⨯⨯=+=A A or A P A P A P A θπθπθπθθπθθπθθπ1.2 解:令121, 1.5λλ==设X 为一卷磁带上的缺陷数,则()XP λ∴3(3)3!e P X λλλ-==R 语言求:)4(/)exp(*)3(^gamma λλ-1122(3)(3)()(3)()0.0998P X P X P X λπλλπλ∴===+== 从而有111222(3)()(3)0.2457(3)(3)()(3)0.7543(3)P X X P X P X X P X λπλπλλπλπλ==========1.3 解:设A 为从产品中随机取出8个,有3个不合格,则3358()(1)P A C θθθ=-(1) 由题意知 ()1,01πθθ=<< 从而有.10,)1(504)|(504)6,4(/1)6,4(1)6,4()1()1()1()1()1()1()1()()|()()|()|(535311614531535315338533810<<-==-=--=--=--==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求(2).10,)1(840)|(840)7,4(/1)7,4(1)7,4()1()1()1()1()1()1(2)1()1(2)1()()|()()|()|(636311714631636315338533810<<-==-=--=--=----==⎰⎰⎰⎰--θθθθπθθθθθθθθθθθθθθθθθθθθθπθθπθθπA beta B R B d d d C C d A P A P A :语言求1.5 解:(1)由已知可得.5.125.11,110110/1)()|()()|()|(,2010,101)(5.125.111)|(2112211)|(12,2121,1)|(5.125.11201011111111<<===<<=<<=+<<-==+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθd d x p x p x x p x p x x x p ,,即,时,当(2)由已知可得.6.115.11,1010110/1)()|,,()()|,,(),,|(,2010,101)(6.115.111)|,,(,219.1121,214.1121,211.1121,217.1121215.11212112211)|,,(9.11,4.11,1.11,7.11,5.11,0.12,6,2,1,2121,1)|,,(6.115.112010621621621621621654321621<<===<<=<<=+<<-+<<-+<<-+<<-+<<-+<<-========+<<-=⎰⎰θθθθπθθπθθπθθπθθθθθθθθθθθθθθθθθθd d x x x p x x x p x x x x x x p x x x p x x x x x x i x x x x p i ,即,,时,当【原答案:由已知可得 ()1,0.50.5P x x θθθ=-<<+1(),102010πθθ=<< 11.611.51()0.0110m x d θ==⎰从而有()()()10,11.511.6()P x x m x θπθπθθ==<< 】1.6 证明:设随机变量()XP λ,λ的先验分布为(,)Ga αβ,其中,αβ为已知,则即得证!),(~),,|()()|,,(),,|(,0,)()(,!!)|,,(121)(121211112111βαλπλλπλλπλλαβλπλλλλβαβλααλλ++∑∑∝•∝>Γ=∑===+--+--=-=-==∏∏n x Ga x x x ex x x p x x x e x e x ex x x p ni i n n x n n ni in x ni i x n ni i ni ii【原答案: (),0!x e P x x λλλλ-=>1(),0()e ααβλβπλλλα--=>Γ 因此 11(1)()()()x x x P x e e e λαβλαβλπλλπλλλλ---+--+∝•∝= 所以 (,1)x Ga x λαβ++】 1.7 解:(1)由题意可知.1},max{,1)/(1)/(122)()|,,()()|,,(),,|(,10,1)(,,2,1,10,22)|,,(121},max{221},max{2121121212112122111<<∝===<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθπθθπθθπθθπθθθθn nx x nn x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 ()1,01πθθ=<< 因此122()12(1)xxm x d x θθ=•=-⎰因此 2()()1(),1()1P x x x x m x x θπθπθθθ==<<- (实质是新解当n=1的情形)】(2) 由题意可知.1},max{,1)/(1)/(13232)()|,,()()|,,(),,|(,10,3)(,,2,1,10,22)|,,(12-21},max{2-22-21},max{2212211212121212122111<<∝=⨯⨯==<<==<<<==⎰⎰∏∏⎰∏∏====θθθθθθθθθθθθπθθπθθπθθθπθθθθn n x x n n x x nni in nni inn n n ni i nni inin x x d d x xd x x x p x x x p x x x n i x xx x x x p n n【原答案:由题意可知 1222()36xm x d x θθθ=•=⎰因此 ()()()1,01()P x x m x θπθπθθ==<<】 1.8 解:设A 为100个产品中3个不合格,则3397100()(1)P A C θθθ=-由题意可知 199(202)()(1),01(200)πθθθθΓ=-≤≤Γ 因此 3971994296()()()(1)(1)(1)A P A πθθπθθθθθθθ∝•∝--=- 由上可知)297,5(~)|(Be A θπ1.9 解:设X 为某集团中人的高度,则2(,5)XN θ∴25(,)10XNθ ∴2(176.53)5()p x θθ--=由题意可知 2(172.72)5.08()θπθ--=又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222(176.53)(172.72)(174.64)55.0821.26eeeθθθ------⨯∝•∝因此 (174.64,1.26)x N θ1.10 证明:设22(,),,N u u θσσ其中为已知又由于X 是θ的充分统计量,从而有()()()()x x p x πθπθθπθ=∝•222222251()()11252()11225252u x x u eeeσθθθσσσ+----+⨯--⨯+⨯∝∝因此 222251(,)112525u x xN σθσσ+++又由于21112525σ≤+ 所以 θ的后验标准差一定小于151.11 解:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)X U θ.8,861)/(1192192)()|,,()()|,,(),,|(,4,192)(.81)|,,(8,8,5.3,2,1,0,1)|,,(768778774321321321433213213321>⨯====≥=>=====<<=⎰⎰⎰∞∞∞θθθθθθθθθθπθθπθθπθθθπθθθθθθd d d x x x p x x x p x x x x x x p x x x i x x x x p i ,时,当【原答案:设X 为某人每天早上在车站等候公共汽车的时间,则(0,)XU θ∴1(),0p x x θθθ=<<当8θ>时,31()p x θθ=43819211()8192m x d θθθ+∞==⎰从而有 7()()3()()128p x x m x θπθπθθ==, 计算错误】1.12 证明:由题意可知 1(),0,1,2,...,i np x x i n θθθ=<<=从而有 ()()()()x x p x πθπθθπθ∝•00111n n n ααααθθθθθ++++∝•∝ 因此 θ的后验分布仍是Pareto 分布。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
不难想象,数据并不是总体或系统建 模是唯一可利用的信息资源。 贝叶斯方法提供了一套将外部客观信 息融入数据分析过程中的原理方法。这个 分析过程是先给出一个待分析数据集的概 率分布。因为这个分布是没有考虑任何数 据而给出的,所以称为先验分布。这个新 的数据集将先验分布修正后得到后验分布。 贝叶斯定理就是在知道新的信息后修正数 据集概率分布的基本工具。
可以通过贝叶斯定理计算这些概率:
P(Ci X )
[ P( X Ci ) P(Ci )]
P( X )
因为 P( X ) 对所有的类别都是个常量,仅要
求乘积 P( X Ci ).P(Ci ) 的最大值。我们用下面的 式子计算一个类别的先验概率。 P(Ci ) = 类别 Ci 的训练样本数量/m(m是训 练样本的总数). 因为P( X Ci ) 的计算是极其复杂的,特别 是对大量的数据集来说,所以要给出零假设: 样本各属性之间条件独立。利用这个假设, P( X . i ) C 我们用一个乘积来表示 n P( X Ci ) = P( xt Ci ) 其中 xt 是样本X的属性值,
表3-2 对应于属性的概率
属性 性别 值 男 女 身高 (0,1.6] 1 3 2 计 数 矮 中 2 6 0 0 3 高 3 0 0 0 0 矮 1/4 3/4 2/4 2/4 0 概 率 中 2/8 6/8 0 0 3/8 高 3/3 0/3 0 0 0
(1.6,1.7] 2 (1.7,1.8] 0
Taxable Income Cheat 75K 50K 150K ? ? ? ? ? ?
Yes No No Yes No No Yes No No No
Single Married Single Married
Divorced 95K Married 60K
Divorced 90K Single Married 40K 80K
(1.8,1.9] 0
(1.9,2.0] 0 (2.0,∞) 0
4
1 0
0
1 2
0
0 0
4/8
1/8 0
0
1/3 2/3
利用训练数据可以估计出先验概率 P(矮)=4/15=0.267, P(中)=8/15=0.533 , P(高)=3/15=0.2 利用上述数值对一个新元组进行分类。例如,希望对 t=(Adam,男,1.95m)进行分类。由上述数值及对应于性 别和身高的相应概率,可得到下列估计 P(t|矮)=1/4*0=0 P(t|中)=2/8*1/8=0.031 P(t|高)=3/3*1/3=0.333 进而可得 P(t|矮) P(矮)=0*0.267=0 P(中) P(t|中)= 0.031*0.533=0.0166 P(高) P(t|高)= 0.333*0.2=0.0666 由于t 可能为矮、中、高三者之一,所以三个单个的似然 值加起来,即可得到P(t)的估计,即 P(t)=0+0.0166+0.0666=0.0832
最后,可得到每个事件的实际概率为: P(矮|t)=0*0.267/0.0832=0
P(中|t)=0.031*0.533/0.0832=0.2
P(高|t)=0.333*0.2/0.0832=0.8 因此基于这些概率,可以将新元组分配到身高为高的类别 中,这是因为它具有最高的概率。 怎样可视化?
X1=(<30, 高, N, 一般,N);
X2=(<30, 高, N, 很好,N); X3=(30~40, 高, N, 一般,Y); X4=(>40, 中, N, 一般,Y); X5=(>40,低, Y, 一般,Y); X6=(>40, 低, Y, 很好,N); X7=(30~40,低, Y,很好,Y); X8=(<30, 中,N, 一般,N); X9=(<30,低, Y,一般,Y); X10=(>40,中, Y,一般,Y); X11=(<30,中,Y,很好,Y); X12=(30~40,中,N,很好,Y); X13=(30~40,高,Y, 一般,Y); X14= (>40,中,N,很好,N); 利用贝叶斯法则预测,符合下列条件的人员购买计算机的可能 性 X=(年龄<30,收入=中,学生否=Y,信用=一般)
因为
P(X|C1)*P(C1)>P(X|C2)*P(C2) 所以根据贝叶斯分类方法可知,数据对象 X属于购买计算机类,即X∈C1
分母相同只需比较分子的大小即可。
应用例2
Name Kristina Jim Maggie Martha Stephanie Debbie Todd Kim Amy W ynette
贝叶斯定理为解决归纳-推理分类 问题的统计方法提供了理论背景。我 们首先介绍贝叶斯定理中的基本概念, 然后在运用这个定理说明朴素贝叶斯 分类过程和简单贝叶斯分类。
设X是一个未知类标号的数据样本, 设H为某种假定: 数据样本X属于某特 定的类C。我们希望确定 ,即 P( H X ) 给定观测数据样本X后假定H成立的概 率。它是表示给出数据集X后我们对假 定的信任度的后验概率。相反,不管 数据样本看上去如何,对于任何样本 P( H ) 来说 都是先验概率。后验概率 P( H X ) 比先验概率 基于更多的信息。
t 1
P( xt Ci )
能够通过训练数据集来计算 .
例如:一个销售的顾客数据库(训练样本集合),对购买计算机
的人员进行分类: 字段为(年龄(取值:<30,30~40,>40);收入(高,中,低);学生否 (Y,N);信用(一般,很好);购买计算机否(Y,N)) 记录为14个,具体数据如下:
P( H )
Tid Refund Marital Status 1 2 3 4 5 6 7 8 9 10
10
Taxable Income Cheat 125K 100K 70K 120K No No No No Yes No No Yes No Yes
10
Refund Marital Status No Yes No Yes No No Single Married Married
P( X )
现在假定有一组m个元素的样本
S={ S1 , S2 ,..., Sm }(训练数据集),其中每一个 样本代表了一个n维向量{ x1 , x2 ,..., xn }。 i x 值分别和样本属性 A1 , A2 ,..., An 相对应。并且 有k个样本类 C1 , C2 ,..., Ck , 每一个样本属于其中一个类。另外给出一个 数据样本X(它的类是未知的),可以用最 高的条件概率 P(Ci X ) 来预测X的类,这里 i=1,…,k。这是朴素贝叶斯分类的基本思想。
本例只有两个类别,即C1={购买计算机},C2={不购买计
算机},P(Ci)为每个事件的事前概,P(C1)=9/14=0.643, P (C2)=5/14=0.357,为了计算P(X|Ci)(i=1,2),先进行以下 运算:
P(年龄<30|C1)=2/9, P(收入=中|C1)=4/9, P(学生否=Y|C1)=6/9, P(信用=一般|C1)=6/9,
表2-1身高分类样本数据
Gender F M F F F M F M M M F M F F F Height 1.6m 2m 1.9m 1.88m 1.7m 1.85m 1.6m 1.7m 2.2m 2.1m 1.8m 1.95m 1.9m 1.8m 1.75m Output1 Short Tall Medium Medium Short Medium Short Short Tall Tall Medium Medium Medium Medium Medium Output2 Medium Medium Tall Tall Medium Medium Medium Medium Tall Tall Medium Medium Tall Medium Medium
P(年龄<30|C2)=3/5 P(收入=中|C2)=2/5 P(学生否=Y|C2)=1/5 P(信用=一般|C2)=2/5
因此 P(X|C1)=(2/9)*(4/9)*(6/9)*(6/9)=0.044 P(X|C2)=(3/5)*(2/5)*(1/5)*(2/5)=0.019 最后计算 P(X|Ci)*P(Ci) (i=1,2) P(X|C1)*P(C1) =0.044*0.643=0.028 P(X|C2)*P(C2)=0.019*0.357=0.007
Divorced 220K Single Married Single 85K 75K 90K
数据样本是数据挖掘过程的基本组成部分
贝叶斯定理提供了一种由概率 P( H ) 、 ( X ) P
和 P( X H ) 来计算后验概率的方法,其基本关系 是:
[ P( X H ) P( H )] P( H X )