(来源:转载于中国北斗卫星导航系统)
导论
卷积运算
非线性激活
池化层
全连接层
神经网络的训练与优化
从9X9,到2X2,看起来我们已经做了很多事情了哎!似乎胜利就在前方啦(ง •_•)ง
等一下,想想我们最初和最终的目的到底是什么?是对这张照片进行识别,识别它到底是X还是O呢(其实也算是对它进行一个二分类)。那我们现在得到的是什么?是一个2X2的矩阵,好像和分类并没有什么毛线关系啊。
别急。全连接层要做的,就是对之前的所有操作进行一个总结,给我们一个最终的结果。
全连接层,顾名思义就是全部都连接起来,让我们把它与卷积层对比起来看。
这么说来的话前面的卷积层肯定就不是全连接了,没错,卷积层采用的是“局部连接”的思想,回忆一下卷积层的操作,是用一个3X3的图与原图进行连接操作,很明显原图中只有一个3X3的窗口能够与它连接起来。(我看出了4个,不过不影响理解)
还是回来看接下来的操作,得到了3个2X2的特征图后,在全连接层中有一个非常重要的函数----Softmax,它是一个分类函数(也是一种激活函数),输出的是每个对应类别的概率值。比如:【0.5,0.03,0.89,0.97,0.42,0.15】就表示有6个类别,并且属于第四个类别的概率值0.97最大,因此判定属于第四个类别。(这六个概率值之和应该等于1,不过不影响理解。)
全连接层接受来自卷积层或池化层或激活层(都行)的输入,输出N个数。N是所有类别的总数,对于本问题来说N=2,即X或O。输出数是属于某个类别的概率,概率之和为1。据此就可以判断这张图片属于哪个类别的概率最大。
注意:本例中因为只有两个类别X和O,而且数据量到此已经非常少了,因此直接将三个特征图改变维度直接变成一维的数据。变成了普通的神经网络,参见本公众号历史文章“AI赋能科学算命”。
展开的数据即为属于类别X的概率值,值大小也在对应X的线条粗细中表现出来了,再用Softmax函数计算X分类总概率。
以上所有的操作都是对标准的原图X来进行的,因此最终分类显示即为X毋庸置疑。
假设对一张看起来并不标准的图进行分类。如下

对于进行一系列操作后,假设得到的概率值如下所示:
0.9表示极其大可能是X,那么O就是0.1了。因此对应到X的黄色线条比对应到O的绿色线条要粗很多很多。
我们对结果进行统计分析后可判断这张图片里的字母为X。
(来源:整理于光明游侠)
中国的北斗 世界的北斗 一流的北斗
服务国家战略 资源开放共享 推动成果转化

﹀
﹀
﹀
天上北斗好用
地上北斗用好
辽宁北斗

