贝叶斯统计

合集下载

贝叶斯统计联合概率

贝叶斯统计联合概率贝叶斯统计是一种基于概率的统计方法，其核心思想是通过利用先验概率和观测数据来更新对事件发生概率的估计。

而联合概率则是贝叶斯统计中重要的概念之一，它描述了两个或多个事件同时发生的概率。

在贝叶斯统计中，联合概率是指两个或多个事件同时发生的概率。

它可以通过乘法规则计算得出，即将各个事件发生的概率相乘。

假设有事件A和事件B，它们的联合概率记作P(A∩B)，表示事件A 和事件B同时发生的概率。

联合概率的计算可以通过条件概率和边缘概率来实现。

条件概率是指在已知事件B发生的条件下，事件A发生的概率。

条件概率可以用P(A|B)表示，读作“在B的条件下A发生的概率”。

通过条件概率可以计算出联合概率，即P(A∩B) = P(A|B) × P(B)。

其中，P(B)表示事件B发生的概率，也称为边缘概率。

边缘概率可以通过将事件A和事件B同时发生的概率相加来计算，即P(B) = P(A∩B) + P(A'∩B)，其中A'表示事件A的补集。

贝叶斯统计的核心思想是通过观测数据来更新对事件发生概率的估计。

贝叶斯定理是贝叶斯统计的重要工具，它可以用来计算在给定观测数据的条件下，某个事件发生的概率。

根据贝叶斯定理，可以得到后验概率P(A|B) = P(B|A) × P(A) / P(B)。

其中，P(A|B)表示在观测数据B的条件下事件A发生的概率，P(B|A)表示在事件A发生的条件下观测数据B的概率，P(A)表示事件A的先验概率，P(B)表示观测数据B的边缘概率。

贝叶斯统计在实际应用中具有广泛的应用价值。

在机器学习领域，贝叶斯统计可以用于构建分类模型，通过观测数据来估计不同类别的后验概率，从而进行分类预测。

在医学诊断中，贝叶斯统计可以用于估计患病的概率，帮助医生做出准确的诊断。

在金融风险管理中，贝叶斯统计可以用于估计不同投资组合的风险，帮助投资者做出合理的投资决策。

贝叶斯统计中的联合概率是一种描述多个事件同时发生的概率的重要概念。

贝叶斯统计的基本原理与方法

贝叶斯统计的基本原理与方法贝叶斯统计作为一种概率统计方法，具有广泛的应用领域和强大的实用性。

本文将介绍贝叶斯统计的基本原理与方法，并探讨其在实际问题中的应用。

一、贝叶斯定理贝叶斯定理是贝叶斯统计的基础，它建立了先验概率和后验概率之间的关系。

贝叶斯定理的数学表达为：P(A|B) = ( P(B|A) * P(A) ) / P(B)其中，P(A|B) 表示在给定B发生的条件下A发生的概率，P(B|A)表示在给定A发生的条件下B发生的概率，P(A) 表示A发生的先验概率，P(B) 表示B发生的先验概率。

二、贝叶斯统计方法贝叶斯统计方法基于贝叶斯定理，通过不断更新概率分布来推断模型参数或进行预测。

主要包括先验分布、似然函数和后验分布的计算。

1. 先验分布先验分布是对参数的先验信息的概率分布。

在没有实际观测数据前，我们通常根据经验或领域知识来选择合适的先验分布。

常见的先验分布有均匀分布、正态分布等。

2. 似然函数似然函数是在给定参数值的情况下，观测数据出现的可能性。

通过似然函数，我们可以评估参数值对观测数据的拟合程度。

似然函数越大，说明参数值越能解释观测数据。

3. 后验分布后验分布是在考虑观测数据后，对参数进行更新和修正得到的概率分布。

根据贝叶斯定理，后验分布与先验分布和似然函数的乘积成正比。

通过后验分布，我们可以得到参数的点估计或区间估计。

三、贝叶斯统计的应用贝叶斯统计具有广泛的应用领域，我们将以两个具体问题来说明其应用。

1. 医学诊断贝叶斯统计在医学诊断中有重要的应用。

在医学检测中，我们通常需要根据患者的检测结果判断其是否患有某种疾病。

贝叶斯统计可以帮助我们评估患病的概率，并根据患者的症状和其他相关因素进行精确的诊断。

2. 文本分类贝叶斯统计在文本分类中被广泛应用。

通过对已知类别的文本进行训练，我们可以得到每个单词在不同类别下的概率分布，即先验概率。

然后，根据贝叶斯定理，我们可以根据给定的文本内容来计算其在不同类别下的后验概率，从而实现文本的自动分类。

贝叶斯统计 pdf

贝叶斯统计贝叶斯统计是一种基于贝叶斯定理的统计学方法，它广泛应用于概率论、统计学、机器学习等领域。

贝叶斯统计与经典统计有所不同，它强调的是个体概率和主观概率的结合，即在缺乏足够的信息来确定一个确定的结论时，通过引入主观概率来得出一个可能的结论。

贝叶斯统计的基本思想是将概率定义为某个事件发生的可能性，并将其作为主观概率来考虑。

主观概率是指人们对于某个事件发生的可能性大小的估计。

在贝叶斯统计中，主观概率被赋予了数学意义，并且可以用于计算和推理。

贝叶斯定理是贝叶斯统计的核心，它描述了一个事件发生的概率与先验概率和似然函数之间的关系。

先验概率是指人们在观察到任何数据之前对于某个事件发生的概率的估计。

似然函数是指基于观测数据对于参数的估计函数。

贝叶斯定理将这三个因素结合起来，为人们提供了一种将先验知识和观测数据结合起来得出结论的方法。

贝叶斯统计在实际应用中有很多优点。

首先，它能够考虑到人们对于未知信息的先验知识，从而更加准确地描述了现实世界中的不确定性。

其次，它能够结合多个来源的信息，使得结论更加准确和可靠。

最后，贝叶斯统计方法可以很容易地扩展到处理复杂的问题，例如在机器学习中的分类、聚类等问题。

然而，贝叶斯统计也存在一些挑战和限制。

首先，主观概率的估计需要人们的经验和专业知识，因此可能会存在误差和不准确的情况。

其次，在一些复杂的问题中，参数的先验分布可能难以确定，这也会影响结论的准确性。

最后，贝叶斯统计方法在处理大数据集时需要大量的计算资源，因此可能会存在效率和性能方面的问题。

总之，贝叶斯统计是一种基于主观概率和贝叶斯定理的统计学方法，它具有很多优点和实际应用价值。

虽然存在一些挑战和限制，但随着技术的不断发展和应用场景的不断扩大，贝叶斯统计将会得到越来越广泛的应用和发展。

贝叶斯统计方法

贝叶斯统计方法贝叶斯统计方法是一种基于贝叶斯定理的统计分析方法，它在各个领域中被广泛应用。

本文将介绍贝叶斯统计方法的原理、应用以及优势。

一、贝叶斯统计方法的原理贝叶斯统计方法基于贝叶斯定理，该定理描述了如何根据已知的先验知识和新的数据进行推理和预测。

其基本公式如下：P(A|B) = (P(B|A) * P(A)) / P(B)其中，P(A|B)表示在已知B发生的前提下，A发生的概率；P(B|A)表示在已知A发生的前提下，B发生的概率；P(A)和P(B)分别表示A 和B分别独立发生的概率。

贝叶斯统计方法通过更新先验概率得到后验概率，从而更准确地估计参数或预测结果。

二、贝叶斯统计方法的应用1. 机器学习中的分类问题贝叶斯统计方法在机器学习中的分类任务中得到广泛应用。

通过构建贝叶斯分类器，可以根据已知的先验概率和数据集训练结果，对新的样本进行分类。

2. 自然语言处理中的文本分类贝叶斯统计方法在文本分类任务中也有着重要应用。

通过构建朴素贝叶斯分类器，可以根据文本的词频信息将其分类到不同的类别中。

3. 医学诊断中的预测贝叶斯统计方法在医学诊断中的预测也得到了广泛应用。

通过结合病人的先验信息和检测结果，可以计算患病的后验概率，从而辅助医生进行准确的诊断。

三、贝叶斯统计方法的优势1. 考虑先验知识贝叶斯统计方法通过引入先验知识，能够较好地处理具有先验信息的问题。

相比之下，频率统计方法仅根据样本数据进行推断，无法很好地利用已有的先验概率信息。

2. 灵活性高贝叶斯统计方法可以适应不同的问题和数据情况。

通过不同的先验分布和模型选择，可以灵活地对参数进行估计和预测。

3. 适用于小样本情况贝叶斯统计方法在小样本情况下仍能表现出良好的性能。

由于引入了先验知识，能够在样本量较小的情况下提供相对可靠的推断结果。

四、总结贝叶斯统计方法基于贝叶斯定理，通过更新先验概率得到后验概率，可用于各个领域中的数据分析、模型估计和预测问题。

统计师如何进行贝叶斯统计

统计师如何进行贝叶斯统计贝叶斯统计是一种基于贝叶斯定理的统计推断方法，它能够帮助统计师在处理各种不确定性问题时做出准确的判断。

本文将介绍贝叶斯统计的基本原理和应用方法，并探讨统计师如何运用贝叶斯统计来提高工作效率和结果准确性。

一、贝叶斯定理的基本原理贝叶斯定理是指在有新的证据出现时，我们可以根据已有的先验知识和新的证据来调整自己的信念或概率分布。

其数学表达为：P(A|B) = (P(B|A) * P(A)) / P(B)其中，P(A|B)表示在B发生的条件下A发生的概率，P(B|A)表示在A发生的条件下B发生的概率，P(A)和P(B)分别表示A和B各自独立发生的概率。

二、贝叶斯统计的应用方法1. 先验概率的设定：在进行贝叶斯推断之前，需要根据现有的经验和知识来设定先验概率。

先验概率通常是根据历史数据或领域专家的建议来确定的，可以是主观的或客观的。

2. 数据收集和观测：在贝叶斯统计中，数据的收集和观测起着至关重要的作用。

通过观测数据，我们可以更新先验概率，得到后验概率，从而对未知问题进行推断。

3. 后验概率的计算：根据贝叶斯定理，我们可以通过已知的先验概率和观测数据来计算后验概率。

后验概率的计算可以借助于统计软件或编程语言进行，以提高计算的效率和准确性。

4. 结果的解释和评估：在得到后验概率之后，需要对结果进行解释和评估。

通过分析结果的可信度和置信区间，可以评估推断的准确性和可靠性。

三、贝叶斯统计在实际工作中的应用1. 风险评估和决策分析：贝叶斯统计可以帮助统计师对风险进行评估和决策分析。

通过建立合理的模型和设定先验概率，可以对未知风险进行推断，并根据推断结果做出相应的决策。

2. 数据挖掘和模式识别：贝叶斯统计在数据挖掘和模式识别中有着广泛的应用。

通过建立贝叶斯网络模型，可以对大规模数据进行分析和挖掘，从而发现数据中的隐藏模式和关联规律。

3. 生物医学统计和药物研发：贝叶斯统计在生物医学统计和药物研发中也有着重要的应用。

贝叶斯统计ppt课件

29
二参数的Bayes点估计
（3）后验中位数估计
若 Me是后验分布h(θ| x )的中位数，则 Me称为θ的后验中位数估计。即若
u0.5 h( x)d 0.5
则后验分布中位数估计
Me u0.5
30
二参数的Bayes点估计
以上三种估计统称θ的Bayes估计，记为
或简记B 为。它们皆是样本观察值
18
历史迭代图
不收敛收敛
19
(2)观察自相关性图（m）
自相关性图用于描述（m）序列在不同迭代
延迟下的相关性，延迟i的自相关性是指相距i步的两迭代之间的相关性。具有较差的性质的链随着迭代延迟的增加会表现出较慢的自相关衰弱。
20
21
22
23
Bayes Bayes统计推断
Bayes统计推断概述参数的Bayes点估计 Bayes区间估计 Bayes假设检验
选择检验统计量，确定抽样分布，等等。
41
四 Bayes假设检验
Bayes假设检验不同型：
简单假设简单假设
复杂假设复杂假设假单假设复杂假设
42
四 Bayes假设检验
Bayes因子
设两个假设Θ0，Θ1的先验概率分布为π0与π1，
即：
0 P( 0 ),1 P( 1)
则 0 1 称为先验概率比。
3
（一）预备知识
4
5
（二）基本思想
6
（三）常用MCMC算法 Gibbs抽样（吉布斯采样算法）
7
8
立即更新的Gibbs抽样
每次迭带的时候的一些元素已经被跟新了，如果在更
新其他的元素时不使用这些更新后的元素会造成一定程度的浪费。事实上， Gibbs抽样可通过在每一步都利用近似得到的其他元素的值来获得更好的效果。这种方法改进了练的混合，换句话说，链能更加迅速，更加详尽的搜索目标分布的支撑空间。

在报告中如何解释和分析贝叶斯统计结果

在报告中如何解释和分析贝叶斯统计结果导语:贝叶斯统计是一种基于贝叶斯定理的统计方法，其独特之处在于能够在已有数据和先验知识的基础上更新我们的概率推断。

在报告中，准确解释和分析贝叶斯统计结果对于传达研究成果至关重要。

本文将详细探讨如何在报告中解释和分析贝叶斯统计结果。

一、揭示背景和目的在报告中，首先应该明确研究的背景和目的。

背景介绍可以包括相关研究领域的现状和研究的重要性。

目的可以描述研究的目标和使用贝叶斯统计的原因。

二、介绍贝叶斯统计方法在报告中，应该对贝叶斯统计方法进行简要介绍，以保证读者对其基本概念和原理有一定的了解。

可以简要描述贝叶斯定理、先验和后验概率的概念以及贝叶斯统计的计算方法。

三、说明数据收集和处理的过程在报告中，需要清晰地说明研究数据的来源、数据收集的过程以及对数据的处理方法。

这有助于读者理解数据的质量和可信度，并对后续的统计分析结果有更好的认识。

四、详细解释贝叶斯统计结果在报告中，应该详细解释贝叶斯统计结果。

可以从以下六个方面展开论述：1. 数据摘要和描述统计：首先，对数据进行摘要和描述统计，包括计算数据的均值、中位数、标准差等指标。

这有助于读者对数据的整体分布有一个初步的了解。

2. 先验分布：解释数据的先验分布，即在进行实际观测之前对待研究对象存在的关于其概率分布的不确定性进行建模。

可以使用图表或文字描述先验分布的形状、参数及其影响。

3. 后验分布：解释数据的后验分布，即在考虑了已有数据的情况下，对待研究对象的概率分布进行更新。

可以描述后验分布的形状、参数及与先验分布的差异。

4. 解读贝叶斯因果效应：如果研究的目标是探究变量之间的因果关系，可以使用贝叶斯因果效应分析。

解释因果效应的计算过程和结果，以及因果效应的置信区间和置信水平。

5. 模型比较和选择：如果使用了多个模型进行贝叶斯分析，需要进行模型比较和选择。

解释模型比较的指标和判据，以及选取最优模型的原因和依据。

6. 检验和解释结果的可信度：对贝叶斯统计结果进行检验和解释其可信度的方法。

统计学中的贝叶斯统计推断

统计学中的贝叶斯统计推断统计学是一门研究如何收集、整理、分析数据并作出推断的学科。

其中，贝叶斯统计推断是一种基于贝叶斯定理的统计方法，其应用广泛且在实际问题中表现出了很高的准确性和灵活性。

本文将介绍贝叶斯统计推断的概念、原理及其在实际应用中的重要性。

一、贝叶斯统计推断的概念贝叶斯统计推断是以英国数学家托马斯·贝叶斯（Thomas Bayes）命名的，它基于贝叶斯定理，通过对已知信息和新数据的观察来作出推断。

贝叶斯统计推断的核心思想在于将观察到的数据看做是参数的函数，通过贝叶斯公式来计算参数的后验分布，从而对未知参数进行估计。

二、贝叶斯统计推断的原理贝叶斯统计推断的核心是贝叶斯公式，其数学表达为：Posterior = (Prior x Likelihood) / Evidence在公式中，Prior表示先验分布，是对参数的先前知识或主观判断；Likelihood表示似然函数，表示观测数据给定参数的条件下的概率分布；Evidence表示证据，是归一化因子，用于保证后验概率的总和为1。

根据贝叶斯公式，我们可以通过计算先验分布、似然函数和证据来获得参数的后验分布。

三、贝叶斯统计推断在实际应用中的重要性1. 参数估计：贝叶斯统计推断提供了一种更加准确和灵活的参数估计方法。

通过引入先验分布和观测数据的信息，贝叶斯方法可以更好地利用已有的知识来作出推断，从而得到更加准确的参数估计结果。

2. 贝叶斯网络：贝叶斯网络是一种用于建模和推断概率关系的图形模型。

基于贝叶斯统计推断的思想，贝叶斯网络可以根据已有观测数据来学习变量之间的概率关系，并根据新的观测数据作出预测。

贝叶斯网络在人工智能、风险分析等领域有着广泛的应用。

3. 决策分析：贝叶斯统计推断在决策分析中发挥着重要的作用。

通过对不同决策的后验概率进行比较，可以选择具有最大期望效用的决策，从而为决策者提供决策支持。

四、总结贝叶斯统计推断是一种基于贝叶斯定理的统计方法，其核心是贝叶斯公式。

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

贝叶斯公式
• 全概率贝叶斯公式
pA
p B p A B
i i i 1
n
• 例1.4．设甲袋有3个白球4个红球，乙袋有1个白球2个红球，现从甲袋中任取2球放入乙袋，再从乙袋中任取2球，求从乙袋取出2个红球的概率。
贝叶斯公式
• 事件形式的贝叶斯公式
p B m A p Bm p A B m

2
经典统计和贝叶斯的区别二
当总体服从正态分布可得
对于给定的置信度
U X
/
~ N ( 0 ,1 )
n
1 , 查分位点
u / 2 , 使得
P {| U | u / 2 } 1
/2
u/2 0
/2
u/2
经典统计和贝叶斯的区别二
得到
X P u / n
PX u n
1 /2

n 1 /2
从而
/2
X
u
这样得到了置信度为
1 的置信区间为
( X u / 2

n
, X u / 2

n
)
经典统计和贝叶斯的区别二
由于在经典统计的理论体系中参数μ是一个固定的常数，并不具有随机性，因而式
经典统计和贝叶斯的区别四
• 假设检验问题 • 经典统计中，选择原假设或备择假设具有一定的倾向性。 • 而有些问题不能谈倾向性
经典统计和贝叶斯的区别四
• 假设检验问题 • Eg：U检验（正态总体方差已知，判断均值是否相等） • 经典统计学派判断方法：让检验统计量与临界值进行比较。若令U>1.96（臵信水平为 0.95时的临界值），拒绝H0，认为两个总体均值不相等。 • 但是，如果U=1.95？？？结论不能令人满意
• 贝叶斯把未知常量看做随机变量，所以用概率分布来描述是合适的
经典统计和贝叶斯的区别二
设 ( X 1 , X 2 , , X n ) 为:
X 1
为来自正态总体
N ( ,
2
)
的一
个样本，μ 是未知参数，样本均值和样本方差分别
n
1
n
X
n
i
i 1
S
2

X n 1
i 1
i
X
当有了新的信息（知道A发生），人们对诸事件发生可能性大小有了新的估计即P(Bi|A) （后验概率）
例1.6 某地发生了一个案件，怀疑对象有甲、乙、丙三人. 在不了解案情细节(事件A) 偏小之前，侦破人员根据过去丙乙甲的前科，对他们作案的可 P(B1) P(B2) P(B3) 能性有一个估计，设为但在知道案情细节后, 这个估计就有了变化.
（1702-1761）
贝叶斯统计的历史发展
• 争论不休: 经典学派VS贝叶斯学派 • 困难所在: 模型复杂、计算量巨大 • 欣欣向荣：电子计算机、算法、近几十年来有很大发展 • 应用广泛：不仅在统计学本身，更在其他学科有重要应用
贝叶斯之欣欣向荣
• “贝叶斯分析在理论上确实很完美，但遗憾的是在实际应用过程中不能计算出结果。” • 计算机技术的发展使得再复杂的模型也可以通过贝叶斯方法进行处理 • 这种改进已经吸引了许多新人加入贝叶斯研究的行列，而且还减少了关于贝叶斯方法可行性的“哲学”上的争论 • 很难发现哪个领域不存在贝叶斯的应用
经典统计和贝叶斯的区别三
• Good(1973)：
“主观主义者直述他的判断，而客观主义者以假设来掩盖其判断，并以此享受科学客观性的荣耀”。
经典统计和贝叶斯的区别三
• 博克斯（Box，1980）说：“不把纯属假设的东西看做先验……我相信，在逻辑上不可能把模型的假设与参数的先验分布区别开来。”
经典统计和贝叶斯的区别四
• 贝叶斯的判断方法：在获得后验分布之后，可分别计算原假设H0和备择假设H1的后验概率 0 和 1 • 若 0 < 1 ,接受H1 • 若 0 > 1 ,接受H0 • 若 0 = 1 ,不宜做判断，尚需进一步抽样或者进一步收集先验信息。
• 类似的说法，“某逃犯的年龄大约在35岁左右”“明天降水的概率是0.85”，“某学生考上大学的概率是0.95”，“甲队胜的概率为0.6左右”……这样的概率陈述能够为大多数人所理解、接受和采用。 • 这种陈述的基础是把未知量当做r.v.
经典统计和贝叶斯的区别三
• 主观概率： • 0.9不是大量重复试验获得的，而是学生们根据自己的生活经历积累对该事件发生的可能性给出的信念（belief），这样的概率称为为主观概率，在贝叶斯统计中允许。 • 只要符合概率的三条公理
经典统计和贝叶斯的区别二
• 然而很多试验是不可大量重复或多次观测的，导致这样的解释没有意义 • 况且人们最关心的恰好是参数μ在该范围内的概率有多大，因此在经典统计理论中区间估计问题的提法及其解答并不令人满意．
经典统计和贝叶斯的区别二
贝叶斯方法恰好不存在上述问题，因为在贝叶斯理论体系中，参数是随机变量，它本身就有统计分布．事实上，可以从贝叶斯假设直接导出与
三种信息
• 先验信息（抽样之前的信息）
–Eg1.1: 喝牛奶加茶的妇女（经验=>先验信息） –Eg1.2: 免检产品 (历史资料=>先验信息)
贝叶斯统计学：总体信息+样本信息+先验信息
经典统计和贝叶斯的区别一
• 经典学派很注重利用已经出现的样本观察值，没观察到的样本不予考虑 • 贝叶斯学派很注重先验信息的收集、挖掘和加工，使他们数量化成先验分布，参加到统计推断中，以此提高统计推断的质量
PX u n
/2
X

n
u
/2
1
式完全相同的等式，不过此时μ是随机变量，而样本均值是常数．因此，根据贝叶斯学派的观点，上式就是
( X u / 2
n , X u / 2

n
)
这一事件发生的概率是1-α。
经典统计和贝叶斯的区别二
i

i
p B p A B
i 1
贝叶斯公式
• p(Bi)称为先验概率,它们反应了各种“原因” 发生的可能性大小,是以往经验的总结,在事件A发生以前就是已知的； • p(A/Bi)是各种“原因”发生之下A发生的条件概率,可以利用技术手段获得； • p(Bi/A)称为后验概率, 它们反应了A发生以后,对各种“原因”发生可能性大小的新认识。
PX u n
/2
X

n
u
/2
1
也就
n
, X u / 2

n
)
的概率等于1-α，根据经典学派的基本观点，区间
( X u

/2
n
, X u

/2
)
n
表示多次抽样得到的这样的臵信区间能盖住参数μ的概率是 1-α 。
知道A 发生后 P(B1 | A) P(B2 | A) P(B3 | A) 最大
比如原来认为作案可能性较小的某甲，现在变成了重点嫌疑犯.
贝叶斯公式
• 密度函数形式的贝叶斯公式
( x) θ
h ( x ,θ ) m( x ) p ( x /θ ) π

θ
p ( x /θ ) d θ π
贝叶斯公式
• 例1.5. 某商店由三个厂购进一批灯泡，其中甲厂占25%，乙厂占35%,丙厂占40%，且各厂的次品率分别为5%，4%，2%.如果消费者已经买到一个次品灯泡，问是哪个厂出产的可能性大？
贝叶斯公式
P(Bi) (i=1,2,…,n)是在没有进一步信息（不知道事件A是否发生）的情况下，人们对诸事件发生可能性大小的认识. （先验概率）
《贝叶斯统计学》
——Introduction
主讲教师：张贝贝
推荐书籍
• • • • 《贝叶斯统计》茆诗松《贝叶斯统计推断》张尧庭《统计决策论与贝叶斯分析》吴喜之《现代贝叶斯统计学》吴喜之
贝叶斯统计的历史发展
• 历史悠久：Bayes; Laplace • 1812年
Pierre-Simon Laplace (1749–1827). Thomas Bayes
贝叶斯学派的基本观点
• 任一个未知量都可看做一个随机变量 • Why可以看做随机变量？ • Eg1.2：每天测量得到的产品的不合格率会有一些变化，故看做r.v.也是合适的，用一个概率分布去描述它也是很恰当的
贝叶斯学派的基本观点
• Eg1.3：学生估计一个新老师的年龄。
经典统计和贝叶斯的区别二
经典统计和贝叶斯的区别三
• 这是经典统计与贝叶斯统计在概率的理解上的分歧 • 经典统计：认为概率必须通过大量重复试验来确定，才是“客观的”，认为贝叶斯是主观的 • 比如点估计、区间估计、假设检验上犯两类错误的概率等都是重复使用多次判断好坏的标准
经典统计和贝叶斯的区别三
对此，贝叶斯学派的反驳： a.认为引入主观概率能扩展概率统计的研究范畴，扩展到不能大量重复的实验 b.主观概率确定不是随意的，而是要求当事人对所考察的事件有比较透彻的了解和丰富的经验，甚至是这一行的专家，在此基础上确定主观概率才能符合实际 c. 揭露经典学派的“客观性”：总体分布的选择对于答案所产生的影响远远超过先验分布所产生的影响重大
三种信息
• 总体信息
–Eg：“总体是正态分布” –但为了获得总体分布，往往耗资巨大。
• 样本信息
–通过对样本的加工和处理对总体中的某些特征做出较为精确的统计推断（样本越多越好）