搜索
首页
大数快讯
大数活动
服务超市
文章专题
出海平台
流量密码
出海蓝图
产业赛道
物流仓储
跨境支付
选品策略
实操手册
报告
跨企查
百科
导航
知识体系
工具箱
更多
找货源
跨境招聘
DeepSeek
首页
>
石英坩埚内的小气泡如何检测?
>
0
0
石英坩埚内的小气泡如何检测?
光伏研习社
2024-02-28
1
导读:材料+能源领域一站式服务平台
获取原文,关注公众号回复07,添加管理员
获取原文,关注公众号回复07,添加管理员
0
引言
石英坩埚作为拉制单晶硅一次性使用的关键材料
,
广泛应用在太阳能电池和集成电路的制备中
,
对所制备产
品的
质量
有直接的重要影响。现有技术所生产出的石英坩
埚具有内壁透明层和外壁不透明层双层结构
,
其透明情况
由气泡数量和大小引起。外壁含有大量密集气
泡
,
使得外
观呈絮状不透明
,
可以增加热绝缘性及提供均匀辐射的热
源
,
内壁含有较稀疏的微小气泡
,
在承受长达
50h
的
1400℃
高温环境过程中
,
气泡
体积
逐渐增大
,
很容易发生破裂
,
将
气泡中的气体和石英杂质渗入硅液中
,
破坏晶体结构
。
因此
,
在使用坩埚前
,
对其内壁透明层气泡的大小及数量检
测尤为重要。
传统图像处理算法针对气泡检测一般基于边缘轮
廓和
圆周曲率进行拟合。文献在气泡图像轮廓上筛选出所
有凹点进行重叠气泡的分割
,
并基于最小二乘圆周拟合方
法实现气泡拟合定位。文献首先对气泡图像进行多尺
度分解
,
分别在低频和高频子带上进行边界检测
,
最后通过
多尺度边界融合提取气泡
,
有效检测了不同尺度大小的气
泡。但是传统算法受限于成像时的光照环境
,
以及小气泡
目标本身存在特征信息较少、分辨率较低、边界轮廓不
完整
等因素
,
存在泛化能力不足、目标漏检等问题
,
无法满足工
业检测需求。当前基于深度学习的目标检测算法主要分为
两阶段目标检测算法和单阶段目标检测算法
,
其中单阶段
目标检测算法结构简单
,
计算效率更高。相对于
传统图
像处理算法
,
基于深度学习的目标检测算法在大量的数据
样本中利用卷积神经网络强大的特征提取能力
,
获得目标
信息丰富的特征图
,
有效解决了传统算法的
难点
,
且模型
具有高度模块化的特点
,
通过改进不同的结构以应用在工
业、医学等领域中视觉测量和缺陷检测的任务。
文献提
出了一种改进
Faster
R
-
CNN
的电子元件气泡缺陷检测方
法
,
检测准确率大幅度提高
,
但参数量较大难以部署。
文献提出一种改进
YOLOv
3
模型对贴装元器件进
行检
测
,
重新设计特征金字塔结构
,
提升了小目标检测
精度
,
但大量的推理计算降低了检测
速度
。文献为提高输电线
路小目标的检测速度
,
通过减少
YOLOv
4
特征层的数量
,
大幅度提高了网络推理速度
,
但检测精度有所下降。
针对以上问题
,
为了对石英坩埚内壁实现实时有效的
微小气泡检测
,
基于目前综合性能较好的
YOLOv
5
进行网
络结构改进
,
提出了一
种
YOLOv
5-
QCB
的气泡检测网络
。
在主干网络
,
对输入图像经过大量的下采样操作会丢失细
节特征
,
因此本文针对气泡目标尺寸小、大小差异小的特
点
,
减少下采样倍数
,
将三个尺度预测改为两个尺
度
,
在此
基础上
,
使用
K
-
means
算法重新聚类目标先验框尺
寸
;
同
时为了弥补缺失的深层语义特征
,
使用空洞卷积增大特征图感受野
;
颈部利用有效通道注意力机制以增强重要通道
特征权重
,
使网络自适应地去关注与任务相关的通道特征。
实验结果表明
,
本文方法在小气泡检测的精度和速度上有
着显著提升。
1YOLOv5算法原理
YOLO
v
5
算法根据网络深度和特征层通道的宽度的
不同
,
目前有
YOLOv
5s
、
YOLOv
5m
、
YOLOv
5l
、
YOLOv
5x
等不同大小版本
,
其中
YOLO
v
5s
宽度和深度最小
,
在特定
的工业检测任务方面
,
满足检测精度的同时
,
具有速度快、
易于嵌入式部署的优势。其网络结构如图
1
所示。
主干网络
(
Bac
kbone
):
以
640×640
的输入图像为例
,
主干网络对输入图像不断进行下采样
,
再通过
C3
模块进
行深度的特征提取
,
最后使用
SPPF
模块扩大特征图感受
野
,
获取重要的上下文信息。其中
,C3
模块借鉴轻量化
CSPNet
[10]
结构的思想
,
可以降低网络计算量
,
并实现丰富
梯度信息的融合
,
增强了网络学习能力。快速空间
金字塔
池化
(
spatialpyramidpoolingfast
,
SPPF
)
是对空间金字塔
池化
(
spatialpyramidpooling
,
SPP
)
的改进结构
。改进的
SPPF
为
3
个池化核大小均为
5
的串行池化结构
,
相比于
SPP
使用的池化核大小分别为
5
、
9
、
13
的并行池化结构
,
可
有效利用上层的池化输出
,
以更小的计算代价实现了多重
感受野特征融合
。
SPPF
结构如图
2(
a
)
所示
,
SPP
结构如
图
2(b)
所示。
颈部网络
(
N
ec
k
)
:
对主干网络经过
8
、
16
、
32
倍下采样
获得的
80×80
、
40×40
、
20×20
三个尺度特征图通过路径
融合结构
(
path
aggregationnetwork
,
PAN
et
)
进行浅层
和深层的特征融合
,
在获得图像深层特征
语义信息的同
时
,
也融合了浅层特征细节信息。
头部检测
(
Head
):
由于浅层特征图分辨率高
,
预测目
标框尺寸小且分布密集
,
能有效检测小目标
;
中层特征和
深层特征图分辨率较低
,
预测目标框尺寸较
大且分布稀
疏
,
用于检测中目标和大目标。头部网络分别对各尺度特
征图的每个位置预测
3
个目标框
,
若网络预测的类别个数
为
k,
则每个目标框计算出
5+k
个预测值
,
其中前
4
个值
用于调整目标框的位置
,
第五个值表示目标框中含有目标
的置信度。
2本文算法
2.1改进的YOLOv5-QCB网络结构
YOLO
v
5
网络模型作为通用的目标检测框架具有了
良好的检测性能和推理速度
,
但由于显微镜下的图像光照
差
,
气泡边缘轮廓模糊
,
检测效果并不理想。本文基于
YOLO
v
5
提出了改进的
YOLO
v
5-
QCB
气泡检测网络
,
其
整体结构如图
3
所示。
首先
,
针对数据集气泡目标尺寸小且密集的情况
,
删
减主干网络中
32
倍下采样的相关特征层
,
对
8
倍下采
样的
(80
,
80
,
128)
浅层特征图和
16
倍下采样的
(40
,
40
,
128)
中
层特征图通过
PANet
网络进行特征信息融合
,
头部使用
40×40
和
80×80
的两个尺度特征图分别对中尺寸和小尺
寸目标进行检测。
其次
,
由于删减了
32
倍下采样的特征层
,
会导致网络
缺少部分深层语义特征
,
因此
,
在
PAN
et
结构中使用空洞
卷积
,
通过增大卷积核感受野得到全局语义特征。
最后
,
由于原始头部检测网络对所有通道同等对待的
处理方式
,
看似公平但不合理
,
针对小气泡的
检测的任务
,
增强小气泡的细节特征信息是非常重要的。因此在检测
网络前
,
利用有效通道注意力机制
,
增强重要通道特
征权
重
,
使网络更加关注与任务相关的通道特征。
2.2K-means聚类锚框
为了提高网络目标框回归能力
,
使用
K
-
means
聚类算
法在本数据集上重新聚类获得
6
组合理的先验锚框尺寸
,
并按大小分配给两个尺度的输出特征图
,
如表
1
所示。
表
1
锚框尺寸分配情况
根据
COCO
数据集对目标大小按绝对尺寸的定义
,
尺
寸小于
32×32
的目标被认为是小目标
,
尺寸大于
96×96
为大目标
,
尺寸介于
32×32
与
96×96
为中等目标
。
从聚
类的锚框尺寸可以看出
,
本数据集中无大尺寸目标
,
且绝
大部分锚框的宽高之比为
1
∶1
,
符合坩埚透明层气泡
特点。
2.3空洞卷积
随着神经网络的层数加深
,
通常通过下采样和增加卷积核的大小来扩大特征图感受野
,
但是下采样会造成特征
图分辨率降低
,
细节信息丢失
,
而增加卷积核大小会带来
大量的参数和计算量
,
降低网络性能。
空洞卷积即在标准卷积的卷积核中进行零填充
,
在不
增加计算量的情况下来扩大感受野
,
同时可以维
持输出特
征图的分辨率
,
避免了由于下采样导致的细节信息的丢失
问题
,
对于小目标的检测更加有效
[12]
。本文为了弥补删除
深层特征图所损失的语义特征
,
采用卷积核
大小为
3×3
、
步长为
1
、膨胀率为
2
的空洞卷积扩大特征图感受野
,
如
图
4
所示。
2.4引入有效通道注意力机制
由于本文研究的检测对象均为小尺寸目标
,
特征信息
较少
,
并且原网络作为通用模型并未针对小目标做出优化
策略
,
存在特征信息提取能力不足的问题。
而注意力机制
是在几乎不增加模型大小和计算量的前提下
,
通过增强重
要特征信息提高检测性能。最早提出的通道注意力模块
SE
[13]
(
squeeze
-and-excitation
)
被广泛
使用
,
但降维不可避
免带来了特征信息的丢失
,
并且计算得到所有通道间的依
赖关系是低效且不必要的。相较于
SE
模块
,
ECA
[14]
(
efficientchannelattention
)
注意力模块并不通过降维的方
式减少计算量
,
在对输入特征图经过全局平均池化后
,
得到具有全局感受野的
1×1×C
的特征图
,
然后通过卷积核
大小为
k
的快速一维卷积对每个通道与其
k
个近邻实现
局部跨通道信息交互
,
其中卷积核大小
k
与输入通道数成
正比
,
最后通过
Sigmoid
函数压缩通道权重在
0
~
1
之间
后
,
得到局部通道依赖关系
,
实现了快速有效的通道特征
值加权
,
使网络更加关注与任务相关的通道特征信息。
ECA
模块结构如图
5
所示
。
3实验结果与分析
3.1实验环境及相关参数
本文实验均在
Win
d
ows
10
操作系统下运行
,
CPU
为
2.30
GHz
的
i7-11800H
,
内存
16
GB
,
显卡为
NVIDIARTX
3050
,
显存
4
GB
,
使用
CUDA
11.1
和
CUDNN
8.1
支
持
GPU
加速
。
Python
版本为
3.6
,
深度学习框架为
Pytorch
1.9.0
。
模型输入尺寸为
640×64
0
,
所有网络参数
随机初始化并累积计算
200
个
epoc
h
。
3.2数据采集系统
实验室搭建的视频图像采集系统如图
6
所示
,
该系统
由主机、相机、定焦镜头等组件构成。由于石英坩埚中的
气泡真实存在大小在微米级别
,
普通相机无法捕捉到清晰
的气泡图像
,
因此采用可调节放大倍率的数码显微镜作为
图像采集设备
,
调节光源以模拟不同光照环境
,
为方便数
据采集
,
使用坩埚碎片作为研究对象。
对采集的视频数据进行抽帧
,
得到大量气泡图像
,
最
终选择
500
张图像作为石英坩埚气泡数据集
,
并通过
Labe
lImg
手工进行标注
,
总共标注有
6190
个气泡目
标
,
标注类别名称记为
QCB
(
quartzcrucibl
ebubbles
),
将手动
标注的
xm
l
文件格式经过程序处理
,
读取每个图像对应位
置、目标标注的坐标和类别信息
,
统一转换为
txt
格式
,
以
便
YOLO
v
5
对数据集的读取
。
将气泡数据集按
8
∶
2
随机
划分训练集和验证集
,
如表
2
所示
,
训练集有图像
400
张
,
包含
4878
个气泡目标
,
验证集有图像
100
张
,
包含
1339
个气泡目标。
3.3评估指标
对于模型性能的评价
,
通常选取检测精度
(
precision
,
P)
、召回率
(
recall
,
R)
、平均精度
(
averag
epr
ecision
,
AP
)
、
平均精度均值
(
meanAP
,
m
AP
)
、
权重大小
(
weight
)
和帧
率
(
f
ramespersecond
,
FPS
)
作为模型评价指标
。
其中检测
精度用来衡量模型的查准率
,
计算公式如式
(1)
所示
;
召回
率评估模型的查全率
,
计算公式如式
(2)
所示
;
单一的
精度
和召回率并不能全面评估网络算法的性能
,
而平均精度综
合了精度和召回率
,
是目标检测算法最主要的性能评价指
标之一
,
计算公式如式
(3)
所示
;
mAP
表示所有类别的
AP
平均值
,
当检测为单类别时
,
m
AP
等同于
AP
;
权重大小作
为评估模型复杂度
,
权重越小
,
模型越轻量化
;
FPS
指
网络
每秒处理的图像帧数
,
用于衡量网络的检测速度。
其中
,
TP
表示正确检测的正样本数量
,
即检测正样本为正样本
,
FP
表示检测错误的正样本数量
,
即检测负样本
为正样本
,
FN
表示检测错误的负样本数量
,
即检测负样本为正样本。
AP
表示为
P
-
R
曲线下的面积
,
即在每一个不
同的召回率下所有检测精度的平均值。
3.4各深度特征融合对性能的影响
原始颈部网络是对
8
倍、
16
倍、
32
倍下采
样后的
3
个
不同深度特征图进行特征融合
,
更利于检测大尺寸和中尺
寸目标
,
但对于本数据集
,
过大的下采样倍数会丢失小气
泡目标的细节特征。因此需探究各深度特征融合对模型
检测性能的影响
,
选取
4
个融合结构进行
分组实验。
A
表
示原网络
20×20
、
40×40
、
80×80
三个尺度的特征融合结
构
,
B
表示
20×20
、
40×40
深层特征融合结构
,
C
表示
80×
80
、
160×160
高分辨率特征融合结构
,
D
表示
40×40
、
80×
80
浅层特征融合结构
。
模型
A
、
B
、
C
、
D
结构如图
7
所示
,
结果如表
3
所示。
通过实验可知
,
结构
D
性能最佳
,
AP
为
97.66%
,
结
构
C
次之
,
结构
A
性能较差
,
结构
B
最差。这是因为当特
征层较浅时
,
特征图分辨率较大
,
小目标的细
节信息较为丰富
;
而当特征层数加深
,
下采样操作会获取深层语义信
息
,
但丢失了大量细节信息。由于石英坩埚气泡尺寸小
,
结构
B
与原结构
A
相比
,
仅利用了深层语义信息
,
而缺失
大量的细节特征
,
导致小目标精度大大降低
;
结
构
C
与结
构
D
相比
,
虽然含有丰富的细节特征
,
但忽略了深层的语
义特征
,
检测精度较低
;
而结构
D
能更好地融合浅层特征
和深层特征
,
避免细节特征的丢失
,
小目标的精
度得到提
升
,
相较于原结构
A
而言
,
不仅精度大大提升
,
而且大幅度
减少了权重文件大小
,
检测速度得到明显提升
,
相比于结
构
B
和结构
C
的模型性能
,
检测速度虽不及结构
C,
但其
它各项指标均为最优
,
整体性能较强。因此本文针对石英
坩埚气泡的检测
,
采用结构
D,
删除
32
倍下采样层
,
并使用
40×40
、
80×80
两个尺度的输出特征图作为
头部检测
。
3.5消融实验
图
8
为
YOLOv
5
基准网络和改进后
YOLO
v
5-
QCB
模型训练的
AP
曲线图
,
可以看出两者总体呈现上升趋势
,
但
YOLO
v
5-
QCB
的
AP
值基本上均高于
YOLOv
5
原模
型
。
发现在
50
轮迭代后
,
均趋于平缓
,
YOLOv
5-
QCB
在
75
轮迭代处出现较大波动后趋于平稳直
至收敛
,
而
YOLO
v
5
分别在
110
和
120
轮迭代处仍出现较大波动
,
最
终在相同迭代轮数下
,
改进后的
YOLO
v
5-
QCB
模型的
AP
值明显高于
YOLO
v
5
。
为证明本文改进的有效性
,
通过消融实验验证改进的
浅层网络结构、使用空洞卷积、添加有效通道注意力机制
对性能的提升效果。结果如表
4
所示
,
模型
1
使用浅层特
征网络结构
,
由于删减了大部分深层卷积
,
大幅度降低权
重文件大小的同时
,
较大保留了浅层细节特征
,
显著
提升了召回率和平均精度。模型
2
在改进的浅层网络结
构的
基础上
,
使用空洞卷积以增大卷积核的感受野
,
提取到更
加完整的有效全局语义特征信息
,
相较于模
型
1,
提高了模
型检测精度和召回率。模型
3
为引入的有效通道注意力
机制模型
,
相较于模型
1,
能够自适应地增强重要通道特
征
,
提高了检测精度。最后模型
4
同时使用三种改进方
法
,
较原始
YOLO
v
5
,
各项指标得到显著提升
,
AP
达到
98.76%
,
提高了
2.49%
,
召回率为
96.18%
,
提高了
2.27%
,
检测速度达到了
82
帧
,
提高了
17
帧
,
较
模型
1
、
模
型
2
、模型
3
不同组合的改进方法
,
在检测速度相差不多的情况下
,
召回率、平均精度有明显提升。可以看出
,
三种改
进方法相辅相成
,
对小目标检测起到重要作用。
3.6
不同检测算法对比
为证明本文改进的
YOLO
v
5-
QCB
模型的检测性能
,
将本文算法同
SSD
、
YOLOv
3
、
YOLOv
4
以及
YOLOv
5s
这
4
种主流的目标检测算法在相同数据集下进
行测试。实验结果如表
5
所示。
由表
5
可知
,
针对石英坩埚透明层气泡检测
,
改进模
型
YOLOv
5-
QCB
在各方面项性能指标上表现优异
。
本文
提出的
YOLO
v
5-
QCB
虽然精度略低于
SSD
,
但是在召回
率、平均精度、模型大小上有着显著优势
;
而相对于速度和
精度更加均衡的
YOLO
v
3
、
YOLOv
4
、
YOLOv
5s
经典算
法
,
YOLOv
5-
QCB
不仅模型权重最小
,
而且在识别精
度和
边框回归能力上均为最优
,
具有更好的综合性能。
为了更直观地展示改进模型性能
,
对不同放大倍数下
的密集气泡图像进行测试
,
分别使用
YOLO
v
5-
QCB
和性
能较优的
YOLO
v
5s
对石英坩埚气泡进行检测
,
结果如
图
9
所示
。
从图中可以看出
,
在不同场景中
YOLO
v
5-
QCB
对气泡目标检测效果均为理想。在弱光照环
境下
,
气泡图
像轮廓与背景对比度低
,
存在大量噪声干扰的情
况
,
YOLOv
5-
QCB
能够检测到
YOLO
v
5s
中一些漏检目标
,
进
一步提升了模型的密集多目标检测和小目标检测能力。
4结论
本文基于深度学习强大的特征提取能力
,
完成了石英
坩埚气泡的检测任务。针对坩埚透明层小气泡检测的难
点
,
基于构建的坩埚气泡数据集进行训练和验证。首先
,
通过实验验证了删除
32
倍下采样层能够保留了足够的局
部细节特征
,
提升了小目标的检测性能
,
同时大幅度减少
了参数和计算量。其次
,
在颈部网络中
,
使用空洞
卷积增
大卷积核感受野
,
实现局部细节特征与全局语义特征的融
合。最后
,
在输出检测层前使用有效通道注意力机制
,
增
强重要通道特征表达能力。通过在坩埚气泡数据集上的
检测结果表明
,
较原
YOLOv
5
网络
,
改进后
YOLO
v
5-
QCB
精度和召回率分别提升了
0
.26%
和
2.27%
,
平均精度达到
98.76%
,
提升了
2
.49%
,
权重大小为
6
.
11
MB
,
FPS
为
82
帧
/
s,
在速度和精度上具有显著优势
,
满足工业化实时检
测的需求
,
可为石英坩埚质量检测提供数据参考和技术支
持。后续将通过研究模型压缩方法
,
进一步使模型轻量
化
,
以应用在工业检测下的嵌入式开发环境。
【声明】内容源于网络
0
0
光伏研习社
光伏研习社是一个光伏互联网服务平台,立足互联网,依托大数据,致力于光伏产业的资源融合、产业互连和行业服务。
内容
1434
粉丝
0
关注
在线咨询
光伏研习社
光伏研习社是一个光伏互联网服务平台,立足互联网,依托大数据,致力于光伏产业的资源融合、产业互连和行业服务。
总阅读
8
粉丝
0
内容
1.4k
在线咨询
关注