内容提要:
* 如何理解矩阵形式
* 例题讲解
点击蓝字 |关注我们
欢迎回来。上期【十分钟 机器学习 系列课程】讲义(82):线性条件随机场的简化形式我们给大家介绍了「线性条件随机场的简化形式」,也就是通过找到「转移特征和状态特征的简化方法」求解线性条件随机场的联合概率分布,那么本期我们继续说一下「线性条件随机场的矩阵形式」。
壹 如何理解矩阵形式?
首先,我们先来回顾一下,对于线性链条件随机场的表达形式都有哪些。
一开始,我们先从「最大团」入手,了解了条件随机场的普通形式,然后以「边或结点的特征函数」为对象,学习了参数化形式,那么本期,矩阵形式的关注点又是什么呢?
答案在于「关注落在 上」。也就意味着,对于线性链条件随机场而言,不同的关注点则会引出不同的表达形式。
1.加入虚拟起始点和结束点
那么,我们先来看张图,通过给原始的线性链加上 和 ,可以认为是「虚拟的起始点和结束点」,这样我们就可以用通用的表达式来进行统一的表示。
接着,咱们就用矩阵来表示这条线性链吧!首先,定义这个矩阵为 ,它代表了 阶的矩阵,注意此时 。
对应的结点和边的特征都可以表示在这个矩阵中,这里我们把上期推导出的简化表达式先搬过来:
然后对于矩阵 中的元素就有:
它代表了从第 结点的转态转移到第 结点的状态时发生的「条件概率」值。
我们把大括号里面的简化一下:
2.用矩阵形式表示
然后,我们把矩阵里每个元素连乘后进行规范化处理,就得到了总的条件概率分布:
注意哦,因为有虚拟结束点,所以连乘要到 位,并且这里的规范化因子为「将所有转移概率分布求和」,这里自然是对矩阵求积,方能得到所有位元素相乘求和后的值。
接着,咱们就来以一道例题入手。
贰 例题讲解
1.题目解读
❝给定一个由图11.6所示的线性链条件随机场,观测序列 ,状态序列 , ,标记 ,假设 ,各个位置的随机矩阵 分别是
试求状态序列 以start 为起点stop 为终点所有路径的非规范化概率及规范化因子。
❞
这里的观测序列,状态序列都是给定的已知量,题干中已经有了start 和stop点,可以简单绘制出对应的线性链如下:
那么四个矩阵就分别代表了什么含义呢?
很简单,由于这里的状态序列 ,那么矩阵里就有 四种转移特征,对应的 为从第 结点转移到第 结点:
注意,由于「start」时的状态已经标记为 ,第二行自然均为 , 那么从第 结点状态 转移到第 结点,要么转为状态 对应的概率为 ,要么转为转态 ,对应的概率为 ,同样,由于「stop」结点的状态也确定好了,所以对应的 最终都是要转移到 上,所以第一列均为 ,其余位为 。
类似的,同「HMM模型」类似,每个状态下的转移概率矩阵就一目了然了:
「 」 中各元素的含义:
❝❞
为第 结点状态为 转移到第 结点转态为 的概率; 为第 结点状态为 转移到第 结点转态为 的概率; 为第 结点状态为 转移到第 结点转态为 的概率; 为第 结点状态为 转移到第 结点转态为 的概率。
「 」 中各元素的含义:
❝❞
为第 结点状态为 转移到第 结点转态为 的概率; 为第 结点状态为 转移到第 结点转态为 的概率; 为第 结点状态为 转移到第 结点转态为 的概率; 为第 结点状态为 转移到第 结点转态为 的概率。
因为首末端的转移状态只有1种,而从第 结点到第 结点的转移状态有2种,我们就能枚举出对应的转移状态线路,就有 种组合。
对应每条转移线路的非规范化概率就为对应概率的乘积,这里我们用八种颜色直观的看一下对应的线路:
然后我们分别把对应的概率相乘就得到了「非规范化概率」:
而规范化因子就是八个转移概率之和:
好啦,关于「线性条件随机场的矩阵形式」就介绍到这里,下一期我们继续讲讲「线性条件随机场的概率计算问题」,感兴趣的小伙伴也可在 B 站上同步看视频学习,如果这个免费讲义对你的学习有所帮助,请帮助我们推荐给更多的朋友,回复「入群」,也可以加入我们的学习来哦!我们下期不见不散。
【条件随机场】第12讲:线性链条件随机场的矩阵形式
欢迎大家关注简博士的B站和公众号,在公众号私信“入群”,可以与小伙伴们一起讨论问题哦。
扫码关注我们
微信号|Dr_Janneil
B站|知乎 | 简博士

