隐马尔可夫模型PPT课件
合集下载
隐马尔科夫模型(原理图解)ppt课件

t=1
t=2
t=3
t=4
t=5
S1
a11 a13a12
S1
a11 a12
S1
a11 a12
S1
a11 a12
S1
a21
a21
a21
a21
S2 a22
S2 a22
S2 a22
S2 a22
S2
a23
a23
a23
a23
a31 a32
a32
a32
a32
S3 a33
S3 a33
S3 a33
S3 a33
S3
• 从某时刻状态到下时刻的状态按一定概率转移
t=1
t=2
转移概率
S1
a11 a13a12
S1
a11 a12
t=3
t=4
t=5
SS11
a11 a12
S11
a11 a12
S1
a21
a21
a21
a21
S22 a22
S2 a22
S2 a22
S2 a22
S22
a23
a23
a23
a23
a31 a32
a32
a32
a32
S3 a33
S33 a33
S3 a33
S11
S1
A转移概率矩阵
N
π
S22
… a11 a12 L a1N
S2
AN *N
a21
aS222
L
a2 N
L L L L
S2
S22
…
…
…
…
aN1 aN 2 L aNN
SN
隐马尔可夫模型.pptx

第28页/共85页
学习问题
• Baum-Welch重估计公式
• 已知X和 的情况下,t时刻为状态i,t+1时刻为状态j的后验概率
θ
ij
(t
)
i
(t
1)aij P(XT
b |
jk
θ)
j
(t
)
向前
向后
T
jl (t)
t 1 l
bˆ v(t )vk
jk
T
jl (t)
t 1 l
第29页/共85页
例如:ML估计
第10页/共85页
估值问题
• 直接计算HMM模型产生可见长度为T的符号序列X的概率
其中,
表示状态 的初始概率
假设HMM中有c个隐状态,则计算复杂度为
!
例如:c=10,T=20,基本运算1021次!
(1)
第11页/共85页
O(cTT )
估值问题
• 解决方案
• 递归计算
t时刻的计算仅涉及上一步的结果,以及
x1和x3统计独立,而 其他特征对不独立
第32页/共85页
相关性例子
• 汽车的状态 • 发动机温度 • 油温 • 油压 • 轮胎内气压
• 相关性 • 油压与轮胎内气压相互独立 • 油温与发动机温度相关
第33页/共85页
贝叶斯置信网
• 用图的形式来表示特征之间的因果依赖性 • 贝叶斯置信网(Bayesian belief net) • 因果网(causal network) • 置信网(belief net)
P(θi )
P(θi | X)
θi P(X | θi )
第20页/共85页
解码问题
《隐马尔可夫模型》课件

它是一种双重随机过程,包括一个状态转移的随 机过程和一个观测值生成的随机过程。
隐马尔可夫模型在许多领域都有应用,如语音识 别、自然语言处理、生物信息学和金融预测等。
隐马尔可夫模型的应用领域
01
语音识别
用于将语音转换为文本,或识别说 话人的意图。
生物信息学
用于分析基因序列、蛋白质序列和 代谢物序列等。
03 隐马尔可夫模型的建立
观察概率矩阵的确定
总结词
观察概率矩阵描述了在给定状态下,观察到不同状态的概率 分布。
详细描述
观察概率矩阵是隐马尔可夫模型中的重要组成部分,它表示 了在给定状态下,观察到不同状态的概率分布。例如,在语 音识别中,观察概率矩阵可以表示在特定语音状态下发出不 同音素的概率。
状态转移概率矩阵的确定
VS
原理
通过动态规划找到最大概率的路径,该路 径对应于最可能的隐藏状态序列。
05 隐马尔可夫模型的优化与 改进
特征选择与模型参数优化
要点一
特征选择
选择与目标状态和观测结果相关的特征,提高模型预测准 确率。
要点二
模型参数优化
通过调整模型参数,如状态转移概率和观测概率,以改进 模型性能。
高阶隐马尔可夫模型
初始状态概率分布表示了隐马尔可夫模型在初始时刻处于各个状态的概率。这个概率分布是隐马尔可 夫模型的重要参数之一,它决定了模型在初始时刻所处的状态。在某些应用中,初始状态概率分布可 以根据具体问题来确定,也可以通过实验数据来估计。
04 隐马尔可夫模型的训练与 预测
前向-后向算法
前向算法
用于计算给定观察序列和模型参 数下,从初始状态到某个终止状 态的所有可能路径的概率。
《隐马尔可夫模型》 ppt课件
隐马尔可夫模型在许多领域都有应用,如语音识 别、自然语言处理、生物信息学和金融预测等。
隐马尔可夫模型的应用领域
01
语音识别
用于将语音转换为文本,或识别说 话人的意图。
生物信息学
用于分析基因序列、蛋白质序列和 代谢物序列等。
03 隐马尔可夫模型的建立
观察概率矩阵的确定
总结词
观察概率矩阵描述了在给定状态下,观察到不同状态的概率 分布。
详细描述
观察概率矩阵是隐马尔可夫模型中的重要组成部分,它表示 了在给定状态下,观察到不同状态的概率分布。例如,在语 音识别中,观察概率矩阵可以表示在特定语音状态下发出不 同音素的概率。
状态转移概率矩阵的确定
VS
原理
通过动态规划找到最大概率的路径,该路 径对应于最可能的隐藏状态序列。
05 隐马尔可夫模型的优化与 改进
特征选择与模型参数优化
要点一
特征选择
选择与目标状态和观测结果相关的特征,提高模型预测准 确率。
要点二
模型参数优化
通过调整模型参数,如状态转移概率和观测概率,以改进 模型性能。
高阶隐马尔可夫模型
初始状态概率分布表示了隐马尔可夫模型在初始时刻处于各个状态的概率。这个概率分布是隐马尔可 夫模型的重要参数之一,它决定了模型在初始时刻所处的状态。在某些应用中,初始状态概率分布可 以根据具体问题来确定,也可以通过实验数据来估计。
04 隐马尔可夫模型的训练与 预测
前向-后向算法
前向算法
用于计算给定观察序列和模型参 数下,从初始状态到某个终止状 态的所有可能路径的概率。
《隐马尔可夫模型》 ppt课件
4第四章_隐马尔可夫模型

S2
a23 0.6
a 0 .5 b 0 .5
S3
a13 0.2
a 1 b 0
a 0.8 a11 0.3 b 0 .2
a22 0.4 a 0.3
b 0 .7
S1
a12 0.5
a 1 b 0
再根据这个缸中彩色球颜色的概率分布,随机选择
一个球,记O2,再把球放回缸中。 最后得到描述球颜色的序列O1 O2 观察,被隐藏。 ,成为观察值 序列,但每次选取的缸和缸之间的转移并不能直接
设观察到的输出符号序列是aab。试求aab的输出概率?
a 0.8 a11 0.3 b 0 .2 a 0 .3 a22 0.4 b 0 .7 a 1 b 0
S1
a12 0.5
S2
a23 0.6
a 0 .5 b 0 .5
S3
a13 0.2 a 1
b 0
从S1到S3,并且输出aab,可能的路径有三种:
S1
S1
S1
S2
S2 S3
S2 S3
0.3×0.8×0.5×1×0.6×0.5=0.036
0.5×1×0.4×0.3×0.6×0.5=0.018 0.3×0.8×0.3×0.8×0.2×0=0
S2
a23 0.6
a 0 .5 b 0 .5
S3
a13 0.2
a 1 b 0
a11 a12 a13 1 a 22 a 23 1 a b 1
从一个状态转移出去 的概率之和为1。
每次转移时输出符号a和b 的概率之和为1。
一个关于天气的3状态马尔可夫模型
第十章 隐马尔科夫模型《统计学习方法》课件

3、EM算法的M 步,极大化 第二项可写成:
求A,B,π
由约束条件 得:
,拉格朗日乘子法:
Baum Welch算法
3、EM算法的M 步,极大化 第三项:
求A,B,π
由约束条件:
学习算法 Baum Welch算法
将已上得到的概率分别用
表示:
学习算法 Baum Welch算法
四、预测算法
近似算法 维特比算法
后向算法
后向算法
前向后向统一写为:( t=1 和t=T-1分别对应)
一些概率和期望值的计算
一些概率和期望值的计算
一些概率和期望值的计算
三、学习算法
监督学习方法 Baum-Welch 算法 Baum-Welch模型参数估计公式
学习算法
监督学习方法:
假设训练数据是包括观测序列O和对应的状态序列I
1、确定完全数据的对数似然函数 完全数据 完全数据的对数似然函数
Baum Welch算法
2、EM的E步 则:
对序列总长度T进行
Baum Welch算法
3、EM算法的M 步,极大化 第一项:
求模型参数A,B,π
由约束条件:
利用拉格朗日乘子:
求偏导数,并结果为0
得:
学习算法 Baum Welch算法
向前逐步求得结点
,得到最优路径
维特比算法
导入两个变量δ和ψ,定义在时刻t状态为i的所有单个路
径
中概率最大值为:
由定义可得变量δ的递推公式:
定义在时刻t状态为i的所有单个路径 中概率最大的路径的第t-1个结点为
Viterbi 方法
Viterbi 方法
例
1、初始化:在t=1时,对每一个状态i,i=1,2,3,求状态i 观测O1为红的概率,记为:
隐马尔可夫模型HiddenMarkovmodel-PPT文档资料

通俗的说,就是在已经知道过程“现在”的条 件下,其“将来”不依赖于“过去”。
2019/3/7
知识管理与数据分析实验室
7
马尔科夫链
• 时间和状态都离散的马尔科夫过程称为马尔科夫 链 • 记作{Xn = X(n), n = 0,1,2,…} – 在时间集T1 = {0,1,2,…}上对离散状态的过程相 继观察的结果 • 链的状态空间记做I = {a1, a2,…}, ai∈R. • 条件概率Pij ( m ,m+n)=P{Xm+n = aj|Xm = ai} 为马氏 链在时刻m处于状态ai条件下,在时刻m+n转移到 状态aj的转移概率。
16
内容框架
1 隐马尔科夫模型的由来
2 隐马尔科夫模型的基本理论及实例
3 隐马尔科夫模型的三个基本算法
4 隐马尔科夫模型的应用
2019/3/7
知识管理与数据分析实验室
17
向前算法及向后算法
向前算法及向后算法主要解决评估问题,即用来 计算给定一个观测值序列O以及一个模型λ时,由 模型λ产生出观测值序列O的概率 。
13
HMM中状态与观测的对应关系示意图
2019/3/7
知识管理与数据分析实验室
14
HMM的基本要素
• 用模型五元组 =( N, M, π ,A,B)用来描述 HMM,或简写为 =(π ,A,B)
2019/3/7
知识管理与数据分析实验室
15
HMM可解决的问题
评估问题 解码问题 学习问题
给定观测序列 O=O1O2O3…Ot 和模型参数 λ=(A,B,π),怎样 有效计算某一观 测序列的概率。 此问题主要用向 前向后算法。
2
隐马尔可夫模型(HMM)的由来
2019/3/7
知识管理与数据分析实验室
7
马尔科夫链
• 时间和状态都离散的马尔科夫过程称为马尔科夫 链 • 记作{Xn = X(n), n = 0,1,2,…} – 在时间集T1 = {0,1,2,…}上对离散状态的过程相 继观察的结果 • 链的状态空间记做I = {a1, a2,…}, ai∈R. • 条件概率Pij ( m ,m+n)=P{Xm+n = aj|Xm = ai} 为马氏 链在时刻m处于状态ai条件下,在时刻m+n转移到 状态aj的转移概率。
16
内容框架
1 隐马尔科夫模型的由来
2 隐马尔科夫模型的基本理论及实例
3 隐马尔科夫模型的三个基本算法
4 隐马尔科夫模型的应用
2019/3/7
知识管理与数据分析实验室
17
向前算法及向后算法
向前算法及向后算法主要解决评估问题,即用来 计算给定一个观测值序列O以及一个模型λ时,由 模型λ产生出观测值序列O的概率 。
13
HMM中状态与观测的对应关系示意图
2019/3/7
知识管理与数据分析实验室
14
HMM的基本要素
• 用模型五元组 =( N, M, π ,A,B)用来描述 HMM,或简写为 =(π ,A,B)
2019/3/7
知识管理与数据分析实验室
15
HMM可解决的问题
评估问题 解码问题 学习问题
给定观测序列 O=O1O2O3…Ot 和模型参数 λ=(A,B,π),怎样 有效计算某一观 测序列的概率。 此问题主要用向 前向后算法。
2
隐马尔可夫模型(HMM)的由来
《隐马尔可夫模型》课件

C R F 常用在文本分类、句法分析、命名实体识别等 领域。
HMM的局限性和改进方法
1
截断、尾部效应
加入上下文信息,使用长短时记忆网络。
2
自适应马尔可夫链
使用观测序列预测假设的状态转移矩阵。
3
深度学习方法
使用神经网络建立序列到序列的映射关系,消除符号表示造成的信息损失。
总结
HMM模型的优缺点
HMM模型可以识别长时序列,具有较好的泛化 性,但是对许多情况会做出错误HMM将会在自然语言处理、语音识别、图像识 别等领域继续发挥重要作用。
参考文献
• 《统计学习方法》- 李航 • 《Python自然语言处理》- 谢益辉 • 《深度学习》- Goodfellow等
附录
最近,HMM被用于音乐生成,允许他们生成具有旋律的曲子,相信HMM会在越来越多的领域展现其重要性。
隐马尔可夫模型PPT课件
在本课件中,我们将一起了解隐马尔可夫模型的基本概念,算法和应用领域。 无论您是机器学习新手,还是专业人士,这份PPT都能帮助您了解隐马尔可夫 模型的关键要素。
隐马尔可夫模型概述
隐马尔可夫模型(Hidden Markov Model, HMM)是 一种用于描述动态系统的概率模型。
马尔可夫假设
HMM 假设未来的状态只与当前状态有关,与历史状态无关,即是一个马尔可夫过程。
HMM的基本问题
1 问题1:给出模型和观测序列,如何计算观测序列出现的 概率?
通过前向,后向算法,或者前向-后向算法计算观测序列出现的概率。
2 问题2:给出模型和观测序列,如何预测其中的状态序列?
通过维特比算法预测概率最大的状态序列。
3 问题3:给出模型和观测序列,如何调整模型数使其最优?
语音信号处理PPT_第五章_隐马尔可夫模型.jsp

孙瑜声 PB08000623 2011-12-3
隐马尔可夫模型(Hidden Markov Models,HMM) 作为语音信号的一种统计模型,今天正在语音处理领域中获 得广泛的应用。 大约100年前,数学家和工程师们就已经知道马尔可夫链, 但缺乏一种能使该模型参数与语音信号达到最佳匹配的有效 方法 20世纪60年代后期,有人提出这种匹配方法 1970年前后,Baum等人建立有关的理论基础 随后CMU的Baker和IBM的Jelinek等人将其运用到语音识别 中 20世纪80年代,Bell实验室的Rabiner等人对HMM的深入 浅出的介绍,使HMM为世界各国从事语音信号处理的研究 人员所了解和熟悉 近几十年来,隐马尔可夫模型技术无论在理论上或是在实践 上都有了许多进展。
下溢问题:概率过小超出计算机的精度 参数的初始化问题
提高HMM描述语音动态特性的能力 基本的HMM模型隐含了三个假设 1.状态转移概率与观察序列无关,且时不变 2.状态观察概率密度函数与过去状态无关 3.状态观察概率密度函数与过去观察无关 由于语音有很强的关联性,所以假设是不合理的。影响 HMM描述语音信号时间上帧间相关动态特性的能力。为 弥补这一缺陷,采用的方法是在利用语音静态参数X的同 时,增加语音动态参数
这种HMM成为连续混合密度HMM(Continuous Mixed Densities HMM,CM-HMM)
除此之外,还有高斯自回归M元混合密度、椭球对称 的概率密度和对数凹对称和/或椭球对称的概率密度 等。由于分布是连续的,比离散更好的描述时变特性 3.半连续性HMM(Semi-Continuous HMM, SCHMM) 概率密度
三个问题: (一)识别问题:给定观察符号序列O和模型M,如 何快速有效的计算观察符号序列的输出概率P(O|M)? (二)寻找与给定观察字符序列对应的最佳状态序列 (三)模型训练问题:对于初始模型和给定用于训练 的观察符号序列O,如何调整模型M的参数,似的输 出概率P(O|M)最大。
隐马尔可夫模型(Hidden Markov Models,HMM) 作为语音信号的一种统计模型,今天正在语音处理领域中获 得广泛的应用。 大约100年前,数学家和工程师们就已经知道马尔可夫链, 但缺乏一种能使该模型参数与语音信号达到最佳匹配的有效 方法 20世纪60年代后期,有人提出这种匹配方法 1970年前后,Baum等人建立有关的理论基础 随后CMU的Baker和IBM的Jelinek等人将其运用到语音识别 中 20世纪80年代,Bell实验室的Rabiner等人对HMM的深入 浅出的介绍,使HMM为世界各国从事语音信号处理的研究 人员所了解和熟悉 近几十年来,隐马尔可夫模型技术无论在理论上或是在实践 上都有了许多进展。
下溢问题:概率过小超出计算机的精度 参数的初始化问题
提高HMM描述语音动态特性的能力 基本的HMM模型隐含了三个假设 1.状态转移概率与观察序列无关,且时不变 2.状态观察概率密度函数与过去状态无关 3.状态观察概率密度函数与过去观察无关 由于语音有很强的关联性,所以假设是不合理的。影响 HMM描述语音信号时间上帧间相关动态特性的能力。为 弥补这一缺陷,采用的方法是在利用语音静态参数X的同 时,增加语音动态参数
这种HMM成为连续混合密度HMM(Continuous Mixed Densities HMM,CM-HMM)
除此之外,还有高斯自回归M元混合密度、椭球对称 的概率密度和对数凹对称和/或椭球对称的概率密度 等。由于分布是连续的,比离散更好的描述时变特性 3.半连续性HMM(Semi-Continuous HMM, SCHMM) 概率密度
三个问题: (一)识别问题:给定观察符号序列O和模型M,如 何快速有效的计算观察符号序列的输出概率P(O|M)? (二)寻找与给定观察字符序列对应的最佳状态序列 (三)模型训练问题:对于初始模型和给定用于训练 的观察符号序列O,如何调整模型M的参数,似的输 出概率P(O|M)最大。
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
仅与最近的j个状态有关
• 一阶马尔可夫过程
• 任一时刻为某状态的概率仅与上一时刻的状态相关
仅与上一个状态有关
5
-
隐马尔可夫模型
• 隐马尔可夫模型(Hidden Markov Model,缩写 为HMM)
• 状态不可见
• 在t时刻,隐藏的状态以一定的概率激发出可见的 符号 x ( t ),其取值表示为 v1,v2,v3,
end
• 最后
for t=T-1 to 1(路径回溯):
end
28
-
学习问题
• 从一组训练样本D={X1, X2,…, Xn} 中,学习HMM 的参数向量 θ
• 不存在根据训练集确定HMM最优参数的算法
• 常用算法
向前向后算法(forward-backward algorithm)
23
计算复杂度 O(c2T) O(cTT)
-
• HMM为
例子
24
-
例子
•
已知t=0时状态为
,即
1
0a100.2,1a110.3,
2a120.1,3a130.4
• 现观测到的序列为 V4{v1,v3,v2,v0} • 计算最可能的隐状态序列?
25
-
•解
例子
1(2) 1 .0027
练习:把此图填写完整,并回溯最佳状态路径
7
-
一个例子
• 盒子编号不可见 • 每次从任一盒子中取出一个小球 • 隐藏状态:盒子编号 • 可见符号:小球 • 盒子i中取出各种小球的概率
• Байду номын сангаас到某个特定小球序列的概率?
8
-
离散HMM的符号表示
• 隐藏状态集
• 可见符号集 • 状态序列
完整的HMM参数向量
• 观察序列
• 状态转移概率
• 观察到可见符号的概率
• 长度为T的离散时间上的可见符号序列
X T x ( 1 ),x (2 ), ,x ( T )
例如:X 6 v 5 ,v 1 ,v 1 ,v 5 ,v 2 ,v 3
• 观察到可见符号的概率
b jk P (x ( t) v k| ( t)j) b jk 1
k
6
-
隐马尔可夫模型
• 状态转移图
Ch 04. 参数模型
-2009
1
Part 1 隐马尔可夫模型
-2009
2
马尔可夫链
• 状态 i,i1,2,
• t时刻的状态 • 长度为T的离散时间上的状态序列
例如:
• 转移概率(矩阵)
为从状态
i 到
的转移概率
j
3
-
马尔可夫链
• 状态转移图
4
-
马尔可夫链
• j-阶马尔可夫过程
• 下一时刻为某个状态的概率仅与最近的j个状态有关
• 初始状态概率
9
-
HMM三大核心问题
• 估值问题
• 已知
• 观察到特定符号序列X • HMM模型参数向量
•求
• 似然函数
• 解码问题
• 已知
• 观察到特定符号序列X • HMM模型参数向量
•求
• 最有可能产生X的隐状态序列
10
-
HMM三大核心问题
• 学习(或参数估计)问题
• 已知
• 观察到特定符号序列X
26
-
解码问题
• 对于较长的序列,Viterbi算法可能导致计算机下 溢出
• 改进:基于对数的Viterbi算法
• 优点
• 变乘为加 • 避免下溢出 • 结果与Viterbi算法一样
27
-
解码问题
• 对数Viterbi算法
• 初始化
对每个隐状态i,计算
• 递归
for t=2 to T:
对每一个隐状态j,计算
t时刻的计算仅涉及上一步的结果,以及 ( t ) ,(t 1),和 x ( t )
• HMM向前算法 • HMM向后算法
13
-
估值问题
• HMM向前算法
定义 i ( t ):t时刻在状态i,并且已观察到x(1),x(2),…… x(t)的概率
• 初始化
对每一个隐状态i,计算
• 递归
for t=2 to T
•
贝叶斯决策
P(θi | X)
P(X|θi)P(θi)
c
P(X|θi)P(θi)
i1
• 决策结果
i*argm ax(P (X |θ i)P (θ i))
i
20
-
HMM用于语音识别
• “从左到右”(left-to-right)HMM
发音“viterbi”的“从左到右”HMM
• 为每个单词发音建立一个HMM,其参数为 θ i • 用向前算法计算发音序列X的类条件概率 P(X| θi) • P (θ i ) 取决于语言本身和上下文语义 • 用贝叶斯公式计算X的后验概率 P(θi | X) • 最大后验概率指示语音内容
(T
)
bix(T c
)(假设T时刻每个状态的概率
• 递归
for t=T-1 to 1
对每一个隐状态i,计算 i(t)c aijj(t1)bix(t)
end
j1
• 最后
c
P(X|θ) ii(1) i1
计算复杂度 O(c2T) O(cTT)
16
-
• HMM为
例子
• :吸收状态,即序列结束 时的必然状态。该状态产 生唯一的特殊可见符号v0 ,表示HMM过程结束
17
-
例子
•
已知t=0时状态为
,即
1
0a100.2,1a110.3,
2a120.1,3a130.4
• 现观测到的序列为 V4{v1,v3,v2,v0} • 计算HMM产生这个特定观测序列的概率?
18
-
例子
•解
19
-
HMM用于分类
• 为每一个类别建立一个HMM
• 每个HMM有自己的参数向量 θ i ,该参数向量可以从属于 类别i的样本中学习(估计)得到。
•求
• 模型参数向量 的估计值
例如:ML估计
11
-
估值问题
• 直接计算HMM模型产生可见长度为T的符号序列X 的概率
其中,
表示状态 (1 ) 的初始概率
假设HMM中有c个隐状态,则计算复杂度为 O (cT T ) !
例如:c=10,T=20,基本运算1021次!
12
-
估值问题
• 解决方案
• 递归计算
对每一个隐状态j,计算
end
• 最后
计算复杂度 O(c2T) O(cTT)
14
-
估值问题
• HMM向前算法
15
-
估值问题
• HMM向后算法(向前算法的时间反演版本)
定义的概 i (率t ):t时刻在状态i,并且已逆向观察到x(T),x(T-1),…… x(t)
• 初始化
对每一个隐状态i,计算i
相同)
21
-
解码问题
• 已知一个观察序列XT,寻找最可能的隐状态序列 • 穷举法
• 把所有可能的隐状态序列的概率都计算一遍 • 计算复杂度O (cT T )
22
-
解码问题
• Viterbi算法
• 初始化
对每个隐状态i,计算
• 递归
for t=2 to T:
对每一个隐状态j,计算
end
• 最后
for t=T-1 to 1(路径回溯): end