在众多文章中提到,简单的马尔可夫模型不能用于客户级别的预测,因为它没有考虑到任何协变量。隐马尔可夫模型是马尔可夫链公式的修改版本,可以用于客户级别的预测。这里的“隐”代表“隐藏状态”。本文不会讨论如何构建隐马尔可夫模型,而是探讨这些隐藏状态的实际含义。发现这个概念在网上相当模糊,而且需要很多统计知识才能理解这个简单的概念。本文将尝试用一个简单的例子来说明“隐藏状态”的物理解释。
一名囚犯试图从监狱逃脱。他被告知,如果下雨,他将在第一天得到外界的帮助。但是,他因为与同监的囚犯打架而被判在黑暗的牢房里待一天。他对概率学很在行,想要推断外面的天气。如果他得到的概率超过50%,他将采取行动,否则不会无谓地引起注意。他在黑暗的牢房里得到的唯一线索是警察来牢房时携带的配件。已知警察携带食品盘包裹在塑料袋中的概率是25%,食品盘在包装容器中的概率是25%,开放食品盘的概率是50%;那么,当囚犯在黑暗的牢房里时,当天下雨的概率是多少?
在这个案例中,有两个关键事件。第一个事件是“警察携带什么配件”,第二个事件是“囚犯在黑暗牢房的那天会下雨”。在隐马尔可夫模型中,“观察”或“所有权”是常用的术语。正如看到的,观察是囚犯在任何时候都能看到并准确确定的东西。但他在黑暗牢房的那天下雨的事件是他只能推断而不能100%确定的。
理解了隐藏状态的概念后,来计算一下囚犯在黑暗牢房的那天下雨的最终概率。囚犯对天气很焦虑,已经记录了过去几个月的天气。基于这些序列,他为给定当天天气的第二天天气制作了一个马尔可夫链。以下是链的样子:
P(Rain today/No Rain yesterday) = 5%
因此,今天下雨的可能性似乎非常低。现在,让引入一些关于观察或所有权的信息。囚犯已经知道以下条件概率矩阵:
P(A/B) = 5%, P(C/A) = 90%, P(C) = 25%
想要计算的是 P(A/B,C)。现在让看看知道的一系列概率:
P(A/B,C) = P(A,B/C)/P(B/C) = P(A,B/C)/P(B) {使用马尔可夫一阶原理} …………………………1
P(A,B/C) = P(A,B,C)/P(C) = P(C/A,B)*P(A,B)/P(C) = P(C/A)*P(A,B)/P(C) {使用马尔可夫一阶原理}
=> P(A,B/C) = P(C/A) * P(A/B)*P(B)/P(C)
将这个代入方程1,
P(A/B,C) = P(C/A) * P(A/B) / P(C) = 90%*5%/25% = 18%
P(It will rain today/no rain yesterday,policeman brings in food with a polythene) = 18%。
正如看到的,这个概率介于分别估计的5%和90%之间。结合这两个线索,可以更准确地预测关注的事件。因为这个概率小于50%,囚犯不会冒险期待今天下雨。
通过马尔可夫链简化,观察和马尔可夫链转移概率,能够找出囚犯在黑暗牢房的那天的隐藏状态。本文的范围仅限于理解隐藏状态,而不是隐马尔可夫模型的框架。在未来的一些文章中,还将涉及隐马尔可夫模型的公式和应用。
觉得这篇文章有用吗?这篇文章解决了一些疑问吗?如果是的话,与分享对这个主题的想法。
如果喜欢刚才读到的内容,并希望继续分析学习,
订阅邮件,
在推特上关注,