内容提要:
*矩阵的范数
*矩阵变换的含义和运算
* 卷积的概念
欢迎回来。这里是数学科学思维系列,旨在帮助大家快速梳理「向量、矩阵、积分、微分、函数、优化、概率」等数据科学的基础内核。 上一期【数据科学之基础思维系列】第4讲:矩阵和矩阵运算,我们给大家系统的梳理了「矩阵和矩阵运算」的相关要点,那么这期我们继续说说「矩阵的范数、核心变换和卷积的概念」。
壹 矩阵的范数
在数据科学系列第2讲【数据科学之基础思维系列】第2讲:向量的基本运算和范数中,我们给大家介绍了向量的范数,其本质在于对「距离」的数学描述,那么矩阵的范数是不是也有同样的含义呢?答案是肯定的,并且大家要记住「范数一定是非负的」。
1.矩阵的范数
的 范数
那么,我们的思路就是从向量的范数入手,计算出矩阵的范数来。
这里的 该如何理解呢?它代表了矩阵通过与若干个任意向量计算后,选择「其中的最大值」作为当前的范数。
的 范数
它和向量一样,代表了求出矩阵中非零元素的个数。
比如对于下面的矩阵而言,其 范数为 。
的 范数
范数又称为「列和范数」。 假如我们现在有一个 的矩阵:
那么列和代表将每列进行绝对求和,即计算出 这 列元素的绝对值之和,然后从中取最大值作为矩阵 范数,记为:
的 范数
有了列和范数,自然也有「行和范数」,称为 范数。
意味着对每行绝对求和后取最大值,即计算出 这 行元素的绝对值之和,然后从中取最大值作为矩阵 范数,记为:
的 范数
范数又称为「谱范数」,它的应用非常广泛,记为:
这里的 是矩阵 的最大特征根,计算公式为:
那么它的应用是什么?如果我们想要判断一个矩阵是不是病态矩阵?
可以用谱范数的条件数来计算:
如果是奇异矩阵,那么它对应的行列式为零,那么特征根 ,这样计算出的条件数 。
最后我们再说一个「F范数」。
F范数:Frobenius范数
这个范数的思路非常简单,即把 的矩阵变成一列向量,然后把每位数平方和相加后开根号,记为:
相当于我们忽略了它的行列特征,常会写成:
用这个式子就可以对一些对不需要矩阵行列的场景进行计算。
好啦,说完了矩阵的范数,接着,我们继续说说「矩阵的变换」。
贰 矩阵变换的含义和运算
1.如何理解矩阵变换?
矩阵变换关键在于「位置的跃迁」,那么这里的位置其实就是「向量」的形式。 比如现在有一个矩阵:
当它乘以向量
相信大家对上面的求解方法非常熟悉,它代表的本质内涵是:
❝「通过矩阵乘以向量,最后则改变了向量的空间位置」,由向量 变为向量 ,换而言之,就是定了一组新的空间基之后,我们原来向量的坐标表达也发了变化。
❞
那么,这里的矩阵该怎么理解呢?咱们不妨代入数据举个例子。请大家观察下面这张图:
这是我们最熟悉的两组单位向量, ,那么注意哈,在之前的讲解中我们说过,向量常用列向量的形式,于是横轴对应的单位向量方向为 ,纵轴对应的单位向量方向为 。
将这两个列向量按照列合并为「矩阵」 ,也就是:
可以看出,因为我们采用的 就是常用的平面坐标系对应的向量基矩阵,所以向量 前后的坐标 并没有发生改变,可是一旦这个「矩阵」发生变化后,对应的坐标系也变了。如果我们要把一组二维的「平面向量」变成三维的「空间向量」时,很简单只需要给它乘以 维的矩阵即可。
2.如何应用矩阵变换?
「矩阵变换有什么用呢?」 举个例子,如果我们想对一个图像的进行变换,比如从变成关于横轴对称、关于纵轴对称、关于任意一条线对称,又或者想对图像进行等比例拉伸、缩小,或者是某一个方向的变化,那么其本质内核都在于在向量前乘以对应的「旋转矩阵」,比如下面这张图,从而实现变换。
这种思维在于可以将动态变化的二维图形用一个矩阵简单表示,只需要改变里面的数据就能实现图形的多重变换,搞清楚了目的,那我们就来说说如何运算。
3.矩阵的旋转
常见的旋转矩阵能实现「对称、伸缩、旋转、平移」等变换。
1.对称
那我们先从最简单的对称入手,比如以 轴、 轴、对角线曲线等翻转,如图我们想把哆啦A梦设为关于 轴对称的坐标系,那么该怎么得出这个矩阵呢?
很简单,只需要改变坐标系对应的列方向即可,将原来在第2列的基向量的 变为 。
对应的矩阵为:
同样的道理,继续关于 轴对称:
此时表示横轴方向的第1列就变成了 。
那么,当关于 轴对称时呢?自然就是将图片旋转90度,意味着横纵轴坐标发生对调,即把第1列和第2列对调。
而当关于 轴对称时呢?自然就是对调横纵轴的坐标后再都加上负号。
关于原点时,则对应的都为负号。
好啦,相信大家看完上面的图自然得到一个规律:「那就是用现有的单位向量去表示改变后的图,然后把横轴和纵轴的坐标分别竖着写在第1列和第2列里」。
4.矩阵的伸缩
但是到了矩阵的伸缩环节,我们就不能像上面的视角来理解。举个例子:如果想让图片等比例发生伸长 倍。这有两种思路,一种是图片不变,把我们原始的坐标系变成 倍,这样图片对于原始而言自然是放大了 倍。 比如下图:
而这里因为我们转换了坐标系,所以在新的坐标系里,其实是这样的:
另一种「坐标系不变」,而图片放大,可以写成:
这里,请注意,因为我们的旋转矩阵是要「改变原来的单位向量」,即「坐标系变化了」,因此,这样我们选择的是视角一,表达式为:
同理,如果是缩小 倍呢,就是:
如果想让图片在横轴和纵轴分别变换至原来的 倍,那么写成:
5.矩阵的旋转
现在如果我们把整个坐标系沿着逆时针旋转 ,那么还是用原来的坐标系表示新的横纵轴坐标,如图所示:
叁 卷积的概念
关于矩阵变换的应用非常常见,不过在此之前还需要大家明确卷积的含义。
1.向量卷积
❝向量卷积: 维向量 和 维向量 的卷积为
❞
这里 和 可以写成:
所谓卷积自然是将满足 的组合相乘后相加。
咱们举个例子,
这里 ,而对应的 ,意味着一共有4组数,咱们分别令 ,则 可以等于 。
对于 ,只有分别令 才行。
对于 ,可以有令 和 。
对于 ,可以有令 和 。
对于 ,可以有令 。
❝❞
2.向量卷积的应用
到这里,大家可能会觉得卷积的这个计算方式也过于复杂了吧,但是别急,如果我们是用矩阵来表达的话,可就非常简单了,令两个多项式分别为:
如果我们令:
对应的:
那么随着多项式维度的增加,这个计算量是非常大的,但是大家可以看出,这个多项式的系数恰好就是咱们卷积计算出的结果。
因此,我们可以把这些系数变成「矩阵形式」。
注意哦,这里是以 为向量的矩阵 ,整个运算记为 ,当然也可以是为 为向量的矩阵运算,写成 。
这里的矩阵发生了一个巧妙的规律,都是按照 依次移位。
我们把这类矩阵称为「Toeplitz特普利茨矩阵」。
那么,如果此时我们以 为向量在后面,那么前面的矩阵就会写成:
不知大家是否发现这个规律,「在特普利茨矩阵中,行向量的个数为 」 。
好啦,关于矩阵的变换和卷积的数学含义我们就先说到这里,下一期我们就要用一个「图像模糊化」的例子带着大家边说推导边敲代码,说卷积在图像应用中的方法。更新不易,喜欢这个系列的小伙伴请多多点赞支持,我们下期不见不散~
拓展阅读
欢迎大家关注简博士的B站和公众号,在公众号私信“入群”,可以与小伙伴们一起讨论问题哦。
扫码关注我们
微信号|Dr_Janneil
B站|简博士

