大数跨境
0
0

光电子|基于近红外光谱与机器学习的圈枝/驳枝陈皮鉴别

光电子|基于近红外光谱与机器学习的圈枝/驳枝陈皮鉴别 汉斯出版社
2025-12-12
2
导读:关注汉斯出版社公众号联系小编即可投稿,还可获取最新论文模板!


点击蓝字,关注我们

01

导读

在汉斯出版社《光电子》期刊上,有文章比较了三种传统机器学习算法(支持向量机(SVM)、随机森林(RF)和K近邻(KNN))和五种前沿的时间序列深度学习算法(TSMixer、MSDMixer、TimesNet、PatchMixer和TimeMixer)在基于近红外光谱数据区分圈枝陈皮和驳枝陈皮方面的性能。同时,本研究选取了最小最大归一化等多种数据预处理方法,深入探讨了不同预处理方法对各种算法性能的影响。

02

基本信息

基于近红外光谱与机器学习的圈枝/驳枝陈皮鉴别

Identification of Chenpi from Cutting and Grafting via Near-Infrared Spectroscopy and Machine Learning

作者:

郑惠萍, 郑成勇*:五邑大学数学与计算科学学院,广东 江门

关键词:

近红外光谱;圈枝;驳枝;陈皮鉴别;SVM;深度学习

基金项目:

五邑大学港澳联合研发基金(项目编号:2022WGALH16)

doi:

https://doi.org/10.12677/oe.2025.154009

03

论文详情

上下滑动阅读更多内容


材料与方法

本研究采用了一款NIR-R210手持式反射近红外光谱仪。


陈皮的近红外光谱数据采集方法如下:

(1) 样品准备:江门新会陈皮样本按种植方式和批次保存。对于每个批次,随机抽取2~3片样本,粉碎后通过100目筛筛选。精确称量100~200 mg的粉末,采用压片法制备直径为13 mm、厚度为1~4 mm的圆形片剂。每个批次平行制备6个样品。


(2) 光谱采集:在实验前,使用标准白板对NIR-R210手持近红外光谱仪进行校准。将样品放置在仪器的检测窗口处,确保样品表面与检测窗口紧密接触。在消除环境光干扰后进行光谱扫描。


(3) 数据标注:在获取光谱数据后,系统记录了样本对应的种植方式(圈枝或驳枝)和批次代码等元数据信息,建立了一个完整的可追溯性鉴定系统。


图2展示了采集的圈枝陈皮和驳枝陈皮的近红外光谱数据特征。

结果表明,在900~1700 nm范围内,两种种植方式的原始光谱并未表现出显著差异,且其PCA投影点集在二维空间中高度重叠。这一现象揭示了传统光谱分析方法在区分陈皮种植方式方面的能力有限,需要进一步构建具有高维特征提取能力的机器学习模型以实现有效区分。


算法

在本研究中,采用标准化分类准确率(Accuracy)作为核心评估指标,其定义为正确预测样本数与总样本数之比。计算公式如下:

其中,TP (真正例)和TN (真负例)分别表示正确预测的正类和负类样本的数量,而FP (假正例)和FN (假负例)则表示被错误分类的样本数量。该指标通过混淆矩阵计算得出,并全面反映了模型的整体分类性能。


所有模型均通过10次独立重复实验进行性能评估。具体算法及配置详见原文链接。


结果与分析

1. 传统机器学习算法结果

从表1的数据可以看出,不同的预处理方法对每种算法的性能产生了显著不同的影响。MC、PTS、MM和RS等预处理方法都能显著提升SVM的分类性能,其中MC和PTS的效果最为显著。

2. 深度学习算法结果

从表2呈现的数据可以看出,当处理原始数据时,不同深度学习算法的平均准确率表现出显著差异。


使用原始数据时,TSMixer和MSDMixer的平均准确率仅为0.54和0.55,相对较低。这一现象表明,原始数据中可能存在噪声干扰和数据分布不均匀等问题,阻碍了这些模型有效提取圈枝陈皮和驳枝陈皮的关键特征。


相比之下,使用原始数据时TimesNet的平均准确率达到0.63,略高于TSMixer和MSDMixer,表明该模型在处理原始数据方面具有一定优势,但仍存在较大的优化空间。PatchMixer和TimeMixer在处理原始数据时表现相对较好,平均准确率分别高达0.86和0.93,充分展示了这两种算法在捕捉原始数据特征方面的强大能力。

不同的预处理方法对深度学习算法的性能有着显著不同的影响。MM、ZS、RS和PTS等预处理方法显著提升了大多数模型的性能,而L2范数归一化预处理方法对某些模型的效果却不尽如人意。因此,在实际应用场景中,优先采用高效的预处理方法(如MM)来处理TSMixer和MSDMixer等模型,将有助于提升模型的整体性能。


3. 传统算法与深度学习算法的比较分析

根据对各种数据的综合分析(表3),深度学习算法PatchMixer和TimeMixer在准确率方面表现出色,在识别圈枝陈皮和驳枝陈皮的任务中展现出无与伦比的强大优势。在传统算法中,SVM和KNN在适当的条件下也能实现高准确率。更重要的是,与深度学习算法相比,SVM和KNN具有更低的模型复杂性,对计算资源的需求更为精简,并且显著缩短了训练时间。


结论

本研究不仅为近红外光谱技术在圈枝陈皮和驳枝陈皮识别中的应用奠定了坚实的理论和实践基础,还为后续相关研究和技术革新提供了宝贵的参考和启示,需要指出的是,尽管部分模型在本研究中达到了接近或达到100%的准确率,但该性能是在特定仪器(NIR-R210)与受控实验室环境下取得的,且样本在批次分布与陈化时间上仍存在局限,因此其在真实工业场景中的泛化能力仍需进一步验证。未来工作将探索域自适应、多中心协同建模等策略,以提升模型在跨设备、跨批次条件下的鲁棒性,并通过构建独立外部验证集推动技术向实际应用转化,有望实现近红外光谱在陈皮品质鉴别中的标准化与智能化发展。


04

期刊详情

光电子

Optoelectronics

刊号:

ISSN Print: 2164-5450

ISSN Online: 2164-5469

征稿:季刊-26年3月版面

领域:光电子领域

RCCSE中文OA学术期刊

检索:维普、万方


投稿联系:027-86758873

    QQ:3915369426

微信号:15802748706

投稿邮箱:3915369426@qq.com

合作联系:service@hanspub.org

关注汉斯出版社,后台私信或添加编辑联系方式,获取投稿模板!

声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本公众号观点或证实其内容的真实性;如其他媒体、网站或个人从本公众号转载使用,须保留本公众号注明的“来源”,并自负版权等法律责任。如本公众号内容不妥,或者有侵权之嫌,请先联系小编删除,万分感谢!


往期

RECOMMEND

推荐

期刊推荐|体育科学进展 2025年10月13卷5期

应用物理|高传感性能的多波段太赫兹超材料吸收器

语言学论文中如何有效呈现语料

点击“阅读原文”,免费下载论文

【声明】内容源于网络
0
0
汉斯出版社
汉斯出版社(Hans Publishers)是一家国际综合性出版机构,聚焦于国际开源 (Open Access) 中文期刊全球的出版发行。
内容 2466
粉丝 0
汉斯出版社 汉斯出版社(Hans Publishers)是一家国际综合性出版机构,聚焦于国际开源 (Open Access) 中文期刊全球的出版发行。
总阅读34
粉丝0
内容2.5k