计算机论文哪里有?笔者通过分析陶瓷杯在工业生产过程中可能会产生的各类缺陷,深入研究深度学习相关理论以及各个目标检测模型,分析深度学习在表面缺陷领域的研究现状:
1绪论
1.2国内外研究现状
1.2.1深度学习国内外研究现状
在1943年,神经学家沃伦与数学家沃尔特[2]通过跨学科的合作与研究,创造性地提出了M-P模型。这一开创性的工作,为深度学习领域的未来发展奠定了坚实的基础。随后,在1980年,日本学者福岛邦彦[3]提出了神经认知机模型,该模型被视为现代卷积神经网络(CNN)的雏形,为其后续发展提供了重要的理论支持。到了1998年,法国科学家杨立昆(Yann LeCun)[4]在其发表的论文中,首次提出了LeNet-5模型,这一成果进一步推动了卷积神经网络的研究与应用。加快了卷积神经网络的实际应用,利用梯度反向传播的方式在卷积神经网络上计算,完成了对手写数字的识别,应用于各大银行系统,促进了金融行业的繁荣,使之成为神经网络最原始的形态。2006年,著名学者杰弗里在神经网络研究中发现,网络隐藏层数量的增加,梯度消失问题逐渐显现。针对这一现象,提出了一种创新的训练方法,即通过无监督的权值初始化结合有监督的微调策略[5]。这一方法有效缓解了深度神经网络训练中的梯度消失问题,为深度学习的发展提供了重要的技术支撑,又将深度学习推向了一个新的热潮,吸引了无数学者加入神经网络的研究队列中。2009年斯坦福大学华人李飞飞构造了拥有1400万余张的图像数据集,并将其标注了各类分类标签,用作分类任务,将此数据集命名为ImageNet[6],并且成功的举办著名的大型视觉识别挑战赛,吸引了大量的深度学习学者,为深度学习的发展提供了快车道。2011年Alex[7]提出全新ReLU激活函数,从神经元源头的输入与输出为切入点,增强神经网络稀疏性,有助于缓解网络过拟合问题,并且为解决梯度消失问题提出了新的解决方案。2012年,Krizhevsky等[8]在深度学习领域取得了重要突破,提出了具有里程碑意义的AlexNet卷积神经网络模型。该模型通过引入创新的分组训练策略机制,显著提升了模型的训练效率和性能。在当年的ImageNet大规模视觉识别挑战赛(ILSVRC)中,AlexNet以卓越的表现取得了突破性成绩,并以显著优势夺得了冠军。这一成就不仅证明了深度学习在计算机视觉领域的巨大潜力,也为后续卷积神经网络的研究与应用提供了重要的实践参考和技术启示。AlexNet的成功,标志着深度学习在图像识别任务中的崛起,并推动人工智能技术的快速发展。随后,VGGNet[9]网络的出现,进一步验证了网络深度对模型性能的重要影响。与此同时,GoogLeNet[10]在深化网络结构的基础上,创新性地引入了Inception模块,此模块通过增加网络宽度来提升模型的性能。这一系列的突破性成果,将深度学习理论带到了一个快速发展的新阶段,成为深度学习的重要里程碑。
3陶瓷杯数据收集与预处理
3.1陶瓷杯生产工艺过程与缺陷表现
3.1.1陶瓷杯生产工艺过程
陶瓷杯作为一种功能性和装饰性兼备的产品,是人们的日常生活中最常见的物品之一。从早期手工制陶到现代化的工业生产,陶瓷杯的制作工艺经历了数千年的发展和演变。现代陶瓷工业通过机械化和自动化技术,大幅提高了生产效率,使陶瓷杯的制造从传统的手工工艺转变为规模化、标准化的工业生产。工业生产陶瓷杯大致可分为原材料准备、坯体成型、干燥、施釉、烧制、检验以及包装出厂,如图3-1所示。
(1)原材料准备:将粘土、高岭土、石英和长石等原材料经过破碎、混合、研磨等操作处理,确保原料颗粒的均匀性和细腻度,以提高坯体的成型度和烧制质量。
(2)胚体成型:工业生产中通常不使用手工制作拉胚技术来完成胚体成型,而是使用压制和注浆方式成型杯体,这一工业过程可以使得杯体的尺寸、形状保持高度一致性。
(3)干燥:工业生产中使用隧道式或箱式干燥窑,对温度和湿度进行严格把控,以去除胚体中的多余水分,防止出现开裂现象。
5基于改进YOLOv8的陶瓷表面缺陷检测
5.1 C2f-Faster-EMA模块
C2f是YOLOv8核心创新模块,结合了YOLOv5中C3模块与CSP的思想,对特征提取和特征融合操作进行了优化。在使用C2f模块的同时,对其中的BottleNeck进行轻量化处理,使得此模块融入多尺度特征的同时兼顾参数量减少的优势。使用FasterNet中的FasterNetBlock取代BottleNeck[72],为了提高检测目标的准确性,让模型使用跨空间学习不同尺度的特征信息,由此来提高模型的鲁棒性与准确性。
FasterNetBlock中的部分卷积(PConv)[73],如图5-2所示,将通道划分为两个部分,对第一个部分通道进行常规的卷积,进行常规卷积计算,对另外一部分完整的保留下来,将卷积后的结果与未卷积部分拼接,完成部分卷积操作。通过减少计算冗余,实现对无效区域的跳过机制,减少了无效的重复计算,较高效率的完成轻量化处理。由于只对部分通道进行卷积计算,而其他部分通道都无参与计算直接保留下来,因此会大幅度减少每秒浮点运算次数,对模型的检测速度和训练效率都有一定的提升。
5.2 EMA注意力机制
多尺度注意力机制EMA在视觉检测任务中表现十分优异。其核心在于独特的特征重组方法,通过调整通道维度并分组处理,使得空间语义特征在各组中均衡分布[74]。该机制采用双重策略:首先利用全局信息调整分支权重,随后通过跨维度融合分支输出。这种设计强化了特征提取能力,同时提升了像素间关系的建模效果,为视觉任务提供了更精确的特征描述。
EMA多尺度信息通过结合使用1*1和3*3的卷积核,两条路径使用CA中共享的1*1卷积分支,通过一维全局平均池化,得到水平与垂直方向的空间特征[75]。第三条路径利用3*3卷积捕捉特征。EMA模块不仅支持跨通道信息的编码,还能将空间结构的细节信息融入通道特征,具体结构如图5-4所示,其中Re-wegiht为权重计算、GroupNorm为分组归一化、matmul为矩阵乘法。
跨空间学习通过在不同空间维度上聚合信息,实现多层次的特征融合。具体而言,EMA模块采用双分支并行结构(包含1x1卷积和3x3卷积分支),分别捕获不同感受野的空间特征,并通过特征聚合机制增强模型表征能力。
7总结与展望
7.2工作展望
论文研究主要对陶瓷杯表面缺陷自动检测进行深入研究与实验,提出了改进版YOLOv8模型对陶瓷杯缺陷进行检测,建立了陶瓷杯缺陷自动检测系统。但在数据集多样性、改进模块以及系统开发等方面仍然存在不足之处,需要在这些方面继续深入研究和完善。
(1)数据集在多样性方面与样本不足和类别不平衡方面存在不足。由于客观条件原因,采集到的数据集仅有一类杯体,导致模型只会对此类杯体敏感,而其他杯体的检测精度会有所下降,并且由于数据类别不平衡,造成了精度上的不平衡。对于后续工作,将在数据采集方面做足工作,对各种杯体进行采集,对各个类别采集数据差距控制在一个合理范围内,以此来降低数据集类别不平衡现象。
(2)在模型改进方面仍然存在不足。在后续的研究中,应该继续学习深度学习相关理论基础,对各个模块需要进一步研究,不断完善和改进模块,使得模型的预测精度不断提高。
(3)在推出的陶瓷杯缺陷自动检测系统中,由于时间因素,该系统存在不足。系统的界面美观问题并没有做到很好的完善、功能比较单一、系统的并发性能以及安全性存在不足。在后续的研究中,应着重改进系统的前端界面简洁美观问题,拓展系统功能,适应系统的高并发,以满足系统高并发情况下的可用性。
参考文献(略)