大数跨境
0
0

深入浅出多维高斯分布的最大似然估计矩阵推导

深入浅出多维高斯分布的最大似然估计矩阵推导 极市平台
2021-03-20
2
导读:本文作者从矩阵的角度对协方差公式进行了推导,推导过程思路清晰,并附有python验证结果。
↑ 点击蓝字 关注极市平台

作者丨善财童子@知乎(已授权)
来源丨https://zhuanlan.zhihu.com/p/301741267
编辑丨极市平台

极市导读

 

本文作者从矩阵的角度对协方差公式进行了推导,推导过程思路清晰,并附有python验证结果。>>加入极市CV技术交流群,走在计算机视觉的最前沿

之前搞特征分析时,对一个样本矩阵  求协方差矩阵,在  中行表示样本数,列表示特征数。直接套协方差的公式:  。对于这个公式什么来的,我当时没有具体去推导过。今天就从矩阵的角度推导一下(好像这样说不太严谨,欢迎批评指正)。

首先给出多元高斯分布的公式:

其中 

定义关于参数  的似然函数为:

为了方便计算,我们对公式(2)两边取自然对数,得到:

将公式(1)代入公式(3),并利用对数的性质,将乘法展开成加法,得到:

OK,到此为止,我们的准备工作完成了,下面分别对  和  求导。

这里贴出三条求导法则:

(1)  ,若A是对称矩阵,则 

(2)  ,来自微分形式 

(3)  ,可由  推导得到。

1.对  求偏导数

这里套用法则(1),可得:

注意,公式(5)套用了链式求导法则,即:

 

注意,按照协方差矩阵的定义,协方差矩阵是一个对称矩阵,它的逆矩阵也是对称的。

令  ,可得到:

2.对  求偏导数

这里运用矩阵微分来做,可得:

根据矩阵微分与导数的关系:  ,可得:

注意,公式(8)的推导用到了  是对称矩阵的事实。

令  ,整理可得到:

OK,对比文章开始的协方差矩阵公式  ,好像和公式(9)不太一样?其实公式(9)首先对每个样本做了中心化处理,即:  。我们仔细观察一下公式(9)的求和项  。为方便理解,假如  刚好是0,那么不就是  了吗,这个是一个  矩阵,每个样本都对应这样一个矩阵,将它们相加起来再除以样本数就是协方差矩阵了。

所以可以看到原文开始的公式  只是少了中心化和除以样本数而已。

3.验证

我们在Python中验证上面的结论是否正确

  
import numpy as np# 100*10的矩阵,标准正态分布,即均值为0,方差为1,所以下面没有中心化操作X = np.random.randn(100, 10) S = X.T @ X # X^T * X
#按照公式(9)计算协方差矩阵,s = np.zeros((10, 10))# 注意,下面的for循环计算完后,我没有除以样本数100for it in X: s += it[:,None] @ it[None,:]
# 验证结果是否一致,即S是否等于snp.allclose(S,s)

运行结果截图:

可见,输出为True,所以得到验证。


推荐阅读


回归的多种写法:线性回归-贝叶斯线性回归-高斯过程回归(理论篇)

2021-03-17

贝叶斯网络,看完这篇我终于理解了!

2021-01-26

高斯过程 Gaussian Processes 原理、可视化及代码实现

2020-10-21



# CV技术社群邀请函 #

△长按添加极市小助手
添加极市小助手微信(ID : cvmart2)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~


△点击卡片关注极市平台,获取最新CV干货

觉得有用麻烦给个在看啦~  
【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读197
粉丝0
内容8.2k