

神经网络中的参数量和FLOPs的计算

AI算法之道

2022-11-03

导读：我们从原理到例子，由前入深地介绍了卷积神经网络中卷积层参数量和计算量的定义。

引言

在看论文时，经常会看到计算CNN的parameters、FLOPs等评价指标，用来评价神经网络在推理运算上的速度与性能。本文将要来一一介绍这些指标以及相应的计算公式。

闲话少说，我们直接开始吧！

参数量定义

Parameters为模型中所有需要学习的参数量，包括卷积层、全连接层等，同时也会反映出模型占用的內存大小，当参数量越大，所需的內存就越多。

CNN中卷积层的参数由卷积核权重与bias组成，假设input feature map的维度为H_in× W_in× C_in、kernel size为K_h× K_w，总共有C_out 个kernel、output feature map的维度为H_out× W_out× C_out。

此时，卷积核的参数量是K_h× K_w× C_in× C_out，而bias的参数量是C_out，因此CNN的参数量如下图所示为两者的相加。

上述过程图示如下：

参数量计算举例

接下来我们来看个具体的例子吧，假设input feature map的维度为5× 5× 3、kernel数量为7个且kernel size为3× 3、output feature map的维度为3× 3× 7，这样一层的计算量为3× 3× 3× 7 + 7 = 196。

上述过程图示如下：

参数量计算实操

Parameters可以使用pytorch library torchinfo来进行计算，示例代码如下：

# 安裝 torchinfo$ pip install torchinfo# ================================from torchinfo import summaryimport torchimport torch.nn as nn# 自定义模型class MyModel(nn.Module):    def __init__(self, in_channels, out_channels):        super(MyModel, self).__init__()        self.layer = nn.Conv2d(in_channels, out_channels, (3, 3))            def forward(self, x):        x = self.layer(x)        model = MyModel(3, 7)batch_size = 16summary(model, input_size=(batch_size, 3, 5, 5))

输出如下：

FLOPs定义

FLOPs全名为floating point operations（浮点数的运算数），指模型前向传播的计算量、计算速度，用于衡量模型的复杂度。

模型在前向传播的过程，在卷积层、池化层、Batch Norm、active function、Upsample、Downsample等都会产生计算量，尤其是在卷积层上占比最高。这些计算量对于模型的部署有很大的影响。

❗ 值得注意的是FLOPs与FLOPS（floating point operations per second）不同，全大写的FLOPS是指每秒浮点数的运算次数，用于衡量硬件性能。

FLOPs计算示例

FLOPs的计算分为卷积核权重与bias两部分（Wx+b），令input feature map的维度为H_in× W_in× C_in、kernel size为K_h× K_w，且总共有C_out个kernel、output feature map的维度为H_out× W_out× C_out。

首先我们计算kernel的计算量，在进行一次卷积运算时，会需要（K_h× K_w× C_in）次乘法+（K_h× K_w× C_in -1）次加法。

举个例子，若input feature map的维度为5× 5× 1、kernel数量为1个且kernel size为3× 3、output feature map的维度为3× 3× 1。如下图所示，总共会有3× 3× 1 = 9个乘法、3× 3× 1 -1 = 8个加法。

接着是bias的计算量，bias只有加法的计算，在进行一次卷积运算时，若有bias则加1。因此考虑有bias后卷积层的计算量为（K_h× K_w× C_in）次乘法+（K_h× K_w× C_in -1 +1）次加法= 2× K_h× K_w× C_in。

因此输出feature map的总计算量就会是2× K_h× K_w× C_in× H_out× W_out× C_out。

上述过程，使用公式表示如下：

总结

本文我们从原理到例子，由浅入深地介绍了卷积神经网络中卷积层参数量和计算量的定义。

您学废了嘛？

点击上方小卡片关注我

万水千山总关情，点个在看行不行。

【声明】内容源于网络

AI算法之道

一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号，涵盖视觉CV、神经网络、模式识别等方面，包括相应的硬件和软件配置，以及开源项目等。

内容 573

粉丝 0

AI算法之道一个专注于深度学习、计算机视觉和自动驾驶感知算法的公众号，涵盖视觉CV、神经网络、模式识别等方面，包括相应的硬件和软件配置，以及开源项目等。

总阅读129

粉丝0

内容573