第四章 隐马尔可夫模型(HMM)
马尔可夫模型的定义
隐马尔可夫模型的定义
隐马尔可夫模型的参数
1870年,俄国有机化学家Vladimir V. Markovnikov第一次提出马尔可夫模型
HMM的由来
马尔可夫性
如果一个过程的“将来”仅依赖“现在”而不依赖“过去”,则此过程具有马尔可夫性,或称此过程为马尔可夫过程
X(t+1) = f( X(t) )
X(n+1) = f( X(n) )
马尔科夫链
时间和状态都离散的马尔科夫过程称为马尔科夫链
记作{Sn = S(n), n = 0,1,2,…}
在时间集T1 = {0,1,2,…}上对离散状态的过程相继观察的结果
链的状态空间记做I = {S1, S2,…}, Si∈R.
条件概率P{Sj|Si} 为马氏链在时刻m处于状态Si条件下,在时刻m+1转移到状态Sj的转移概率。
马尔可夫模型(MM)的定义
MM是一个输出符号序列的统计模型,具有N个状态S1,S2,…SN,它按一定的周期从一个状态转移到另外一个状态,每次转移时,输出一个符号。
S1
S2
S3
起始状态
终止状态
a/b 输出符号
转移到哪一个状态,转移时输出什么符号,分别由状态转移概率和转移时的输出概率来决定。即每一条弧上有一个状态转移概率以及输出概率。aij表示从状态Si转移到状态Sj的概率。
S1
S2
S3
马尔可夫模型(MM)的定义
S1
S2
S3
从一个状态转移出去
的概率之和为1。
每次转移时输出符号a和b
的概率之和为1。
一个关于天气的3状态马尔可夫模型
雨
S1
多云
S2
晴
S3
已知一天(t=1)的天气是晴(S3),问:其后7天的天气为“晴,晴,雨,雨,晴,多云,晴”的概率是多少?
观察序列O={S3,S3,S3,S1,S1,S3,S2,S3}
对应时间t=1,2,3,4,5,6,7,8
一般情况下,只能观察到输出符号序列(ab),而不能观测到状态之间如何转移(状态转移概率)和状态的分布(状态的概率),所以称为隐藏的马尔可夫模型。
语音信号是一个可观察的序列:它是由大脑中的思维(不可观测)及语言需要和语法知识(不可观测)所发出的参数流。
隐马尔可夫模型的定义
球和缸
S1
SN
S2
P(red)=b1(1)
P(yellow)=b1 (2)
P(bule)=b1(3)
P(green)=b1(4)
P(black)=b1(M)
P(red)=b2(1)
P(yellow)=b2 (2)
P(bule)=b2(3)
P(green)=b2(4)
P(black)=b2(M)
P(red)=bN(1)
P(yellow)=bN (2)
P(bule)=bN(3)
P(green)=bN(4)
P(black)=bN(M)
观察序列O={绿,绿,蓝,红,红,黄,….. 蓝}
设有N个缸,每个缸中装有很多彩色的球,不同颜色的球(M)的多少由一组概率分布来描述,
根据某个初始概率分布,随机选择一个缸,例如第i个缸,再根据这个缸中彩色球颜色的概率分布,随机选择一个球,记O1,再把球放回缸中。
根据缸的转移概率,选择下一个缸,例如第j个缸。再根据这个缸中彩色球颜色的概率分布,随机选择一个球,记O2,再把球放回缸中。
最后得到描述球颜色的序列O1 O2 ,成为观察值序列,但每次选取的缸和缸之间的转移并不能直接观察,被隐藏。
从S1到S3,并且输出aab,可能的路径有三种:
S1
S1
S2
S3
S1
S2
S2
S3
S1
S1
S1
S3
×××1××=
×1××××=
×××××0=0
S1
S2
S3
设观察到的输出符号序列是aab。试求aab的输出概率?
由于是隐HMM模型,不知输出aab时,到底是经过了哪一条不同状态组成的路径,因此,求aab的输出概率时,将每一种可能路径的的输出概率相加得到的总的概率值作为aab的输出概率值:
++0=
包含两个随机过程:
(1)马尔可夫链:一个随机过程描述的状态(S1,S2,S3)和状态转移序列(状态转移序列S1 S1 S2 S3、S1 S2 S2 S3和S1 S1 S1 S3 等);
(2)一个随机过程描述状态和观察值之间的统计对应关系(每次转移时输出的符号组成的符号序列,如,aab)。
总结
转移中输出符号的概率矩阵P3
包含三个概率矩阵:
每个状态存在的概率矩阵P1
状态之间转移
的概率矩阵P2
3. 一个输出概率:
将每一种可能路径的的输出概率相加得到的总的概率值作为输出概率。
隐马尔可夫模型的参数
模型中状态的数目。状态的集合
每个状态对应的观测符号数。观测符号集合
观测符号序列的长度,观测符号序列
状态转移概率分布
状态的观测符号概率分布
初始状态的概率分布
HMM的基本要素
p
B
A
M
N
参数
初始时选择某口缸的概率
初始状态空间的概率分布
每个缸中的颜色分布
给定状态下,观察值概率分布
在选定某个缸的情况下,选择另一个缸的概率
与时间无关的状态转移概率矩阵
彩球颜色数目
每个状态可能的观察值数目
缸的数目
状态数目
实例
含义