准确的基本事实和具有统计意义的数据。在制造环境中验证深度学习解决方案 时,这些要素构成唯一可靠的基础。
典型项目阶段
深度学习项目通常包括四个项目阶段:规划、数据收集 及基本事实标记、优化以及工厂验收测试(FAT)。与 每个阶段相关的各种任务必须连续完成,而非按照迭代 步骤进行。
在规划阶段,一个协作团队共同负责了解当前流程,设 定检测目标,并确定深度学习解决方案是否可以实现这 些目标。
数据收集及基本事实标记代表第二阶段。在此期间,自 动化团队负责定义图像采集系统,采集图像及人工检测 结果,并为深度学习模型创建初始标记数据集。在使用 人工智能(AI)“教导”系统时,图像集的一致标记至 关重要,因此各团队应当密切关注这一步骤。在此阶段,我们可以创建概念验证原型。
在优化阶段,各团队需要识别基本事实差异,并将其协 调一致,同时根据需要添加额外的图像、修改参数以及 重新训练神经网络。项目团队应当不断将自己的检测结 果与工厂车间目前使用的检测系统(无论是基于规则的 视觉系统,还是人工检测)的检测结果进行比较。
最后,在工厂验收测试(FAT)期间,项目团队需要执行 统计测试和可重复性测试,并创建正式的验证测试,以 进行部署确认。在此阶段,还需要调试额外的生产线, 并执行持续的数据收集,以持续改进神经网络模型。
第1阶段:规划
深度学习技术充分结合了基于规则的视觉系统优势与人工检测提供的准确判断能力(通过人工智能 获取)。具体而言,深度学习软件能够改进现有的质量保证(QA)检查,使以前不可能完成的质 量保证任务实现自动化,减少报废进而控制成本,以及整合实时流程控制。要实现这些目标,制造 公司必须奠定适当的基础。
对于有些客户而言,这涉及找到合适的入手项目。在向公司管理层推荐深度学习项目时,所推荐的 项目必须能够证明项目投资的合理性。与此同时,不应当将项目的目标定得过高,以至于不太可能 取得成功。不切实际的项目只会导致不切实际的结论。制造公司应当确定一个既不过于容易也不过 于困难的项目,该项目将产生可观的回报,并为未来的深度学习系统部署奠定基础。
然后,由工厂管理、自动化、质量保证和系统集成商/机器制造商组成的跨协作团队可以帮助明确 检测系统的目标和要求。尤其重要的是,必须从一开始就要求制造和质量保证团队参与其中,因为 仅由研发团队推动的项目通常无法获得拉动力。
项目目标需要各团队之间相互商定并明确确定,保持一致,并且切合实际。目标示例包括减少遗漏 有缺陷/不可接受的产品(漏报),以提高产品质量。或者,制造公司可能希望取代人工检测方式 或减少不必要的报废(误报),以控制成本。或者,制造公司可能正在寻找一款深度学习解决方 案,以提供闭环流程反馈,比如提供额外的缺陷分类,以推动生产线上游校正。
打破“规则”
制造商无需广泛尝试市场上推出的大量深度学习软件,而需尝试确定基于规则的机器视觉算法产生 过多漏报或误报或者可能根本不起作用的特定场景。例如,在车载电子产品检测应用中,端子点焊 往往会产生各种3D形状及反光表面。这些图像通常包含阴影、反光、彩色区域和表面纹理,包括 完美无暇的元件上也是如此。
这些光学效应通常与烧痕、气孔、裂纹、划痕、过多焊缝、焊缝缺失等实际缺陷具有相同的量级。 由于这些自然变化的存在,传统的机器视觉系统无法可靠地检测这些焊缝,并区分合格元件与不合 格元件。另一方面,深度学习软件能够可靠地区分合格元件与不合格元件,甚至可以识别缺陷产品 的问题类型。凭借这些功能,深度学习软件能够提供替代人工检测和电气测试的可行解决方案。
第2阶段:数据收集及基本事实
就基本事实而言,主要存在以下两 种类型的数据:图像数据(绝对) 和流程数据(相对)。在处理基于 深度学习的检测应用时,必须获取 图像数据,用于训练和优化神经 网络的缺陷识别和通过/未通过确 定。在图像采集方面,非常关键的 因素之一是选择和配置有助于产生 可靠图像的适当照明设置。
同时,流程数据的收集将使专注于 开发深度学习系统的公司能够执行 高级优化。例如,这可能包括收集 有关漏报与报废的单位成本比较、 通过与未通过的频率比较、不同缺 陷类型出现的频率等方面的数据。 此外,各项目团队应当基于基本事 实查看所评估的深度学习系统的性 能,以及现有解决方案(比如: 人工检测方式)基于基本事实的 性能。
持续收集数据
负责开发深度学习项目的团队还需要安排员工以一致的方式标记不同图像上的缺陷,这将使系统模 型能够针对质量数据进行训练。这种训练是一个持续的过程,而非一次性完成,这是因为随着时间 的推移,许多生产线都会发生小变化。这包括产品变化、组件变更、设备移位、工具磨损等各种方 面。此外,大多数高质量的生产流程并不会产生很多不合格元件,因此收集这些图像并在它们出现 时将其添加到训练集合中非常重要。出于这个原因,至关重要的一点是,必须采取简化且一致的流 程用于收集和记录准确的图像数据和结果。所有图像标记必须保持一致,并且无偏见,具有独立的 测量值和清晰的定义。
在训练神经网络用于部署在生产线上时,另一个关键考虑因素是应当避免合成数据(伪缺陷)。元 件上的标记、裂缝、划痕等伪缺陷不能代表实际缺陷。它们实际上会对训练产生负面影响。例如, 负责手动将划痕添加到合格元件上的人员可能会无意中倾向于在元件中间进行此操作。在这种情况 下,检测系统将假定所有缺陷都将出现在中心,并且可能会忽略边界区域周围的实际缺陷。有时, 我们可能需要添加一些人为缺陷图像以启动项目,在这种情况下,一旦获得足够数量的实际缺陷图 像,则应当将人为缺陷图像从训练集合中删除。
图像数据和流程数据都必须持续收集,并且数据标记必须保持更新。例如,当产品规格发生变化、 引入新的产品变体或者将过时的产品变体从生产中移除时,项目团队必须更新数据标记。由于设备 移位、工具磨损、相机振动、照明变化等原因,甚至同一条生产线上也可能发生变化。建立持续的 图像记录和标记过程将有助于项目团队随着时间的推移及时收集信息,以确保出现问题后,项目团 队能够正确应对。
基本事实:工厂人工检测结果
标记图像时,“基本事实”是指确定元件质量、缺陷位置和类型的(名义上)客观状态。虽然这一 事实的确立具有挑战性,但至关重要。由于质量检测几乎总是存在一定程度的主观性,因此一致性 通常比准确度更为重要。如果人工检测员的判断不一致,深度学习系统将无法予以纠正。
想象一下训练集合中的两个元件,每个元件带有相似的微小划痕。如果其中一个元件被称为合格, 而另一个元件被标记为缺陷,深度学习系统如何了解哪种标记是正确的?更糟糕的是,深度学习系 统可能假定该划痕并不重要,并且这两个元件之间的差异是由于图像中的一些其他无关联的特征造 成的。同样地,除了较明显的情况外,这种类型的不一致将使工厂验收测试的结果变得模糊不清。 无论这种尺寸的划痕被视为合格还是不合格,相比之下,以一致的方式对其进行处理更为重要。
我们可以通过多种方法获取基本事实,包括使用工厂人工检测结果。依靠人工检测结果的优点在 于,这些数据很容易获取,并被QA团队接受。对于需要特殊处理(例如倾斜)以进行检测的元 件,人工检测结果可能是唯一的选择,因为不可能存在有效的自动化测量方法。然而,人工检测 结果也存在局限性,包括检测结果可能会随着时间的推移发生变化,或者不同检测员提供不同的 结果。这种不一致通常是制造公司起初需要寻求自动化解决方案的原因。另一个担心的问题则是 偏见,因为虽然人工检测员能够可靠地捕捉到90%的缺陷,但可能会漏掉10%的缺陷,这些缺陷 通常具有一些共同的特性。
人工检测结果最终只能作为项目起点。制造公司必须投资进行数据收集和管理,以确定更准确的 基准。

深度学习正确落地生钱姿势是什么?步骤是什么?
本文含有隐藏内容,请 开通VIP 后查看