质量检测主要有三种形式:人工完成所有产品的检测、人在机器帮助下完成产品的半自动检测以及全部由机器完成的全自动检测。其中,全自动检测会设置多个相机来为每个产品拍摄照片,然后再通过软件实时评估这些照片,由此分拣出有缺陷的产品。
不过这种方法目前还存在技术限制,尤其是在产品无法简单地被分为“好”或“坏”时,原因是现在的图像评估依然基于一些传统方法,如灰度值分析,这种方法有时会增加误剔率,即“好产品”却被错误剔除掉。结果就是往往需要对这些产品进行第二次的人工比对,以确保真正区分出好产品和坏产品,这一耗时耗力的过程会给制药企业增添高达数百万的成本。采用合适的自主学习系统,可以有效避免上述问题的发生。
机器学习的作用
机器学习系统可以记录人类的专业知识并将其反映在技术结构中。机器学习可大致分为“监督学习”和“无监督学习”两种形式,在无监督学习中,无需事先费力地进行分类即可呈现数据集。这种学习系统可以识别模式、群组或类似结构,但不会因学得的内容获得任何“奖励”,因此学习过程很难受到影响,因为它的学习纯粹基于自己的“观察”。而在监督学习中,数据集是分类的,即有效数据的相关信息在学习之前就已存在,这些数据可用于学习过程,为学习系统提供正确学习内容的“奖励”,使学习行为能够被控制。
因此,“监督学习”为视觉检测提供了一种可能的解决方案——由检测专家对图像进行预分类,系统使用这些图像来学习,做出决策。对于难以检测的产品,这种方案的优势尤其明显,因为系统事先“学习”了人工检测专家的评估经验和知识。
机器学习带来的改变
“InspectifAI”系统为自己设定了将高质量神经网络引入视觉检测设备的目标,同时考虑了所有的监管框架条件,此外它是“与设备无关”的,即不依赖于特定的检测设备制造商。不仅如此,这一系统还使用了边缘计算平台作为检测设备和云软件之间连接的“桥梁”。
为了优化视觉检测系统,可以先将边缘设备连接至检测设备,这使得设备能够在云环境中系统地获取和存储图像数据,以及实现神经网络的本地上传和高效运行。相关图像数据经过一次性采集后便会由检测专家在软件的帮助下进行分类。
完成相关图像集的分类后,下一步是进行神经网络的训练,首先图像集会被划分为子集,其次在训练过程中,训练数据集会被用来形成节点权重、层数等。模型在这一过程中会学习图像特征和模式,最终形成神经网络的决策。
独立统计的测试数据集为神经网络展示了未知的图像,并检查了它们的分类和映射保真度,这样人们最终就会得到一个能够根据正确图像特征做出正确决策的模型。为了确保这一点,系统除了设定了训练和测试集的分类参数外,还设定了许多其他参数,它们共同构建了一个高维参数空间。
InspectifAI的数据专家在系统中还应用了多种技术,包括模型训练和深入的模型及数据分析技术。凭借这些技术,人们能够控制模型的“学习”过程,并最终获得符合制药行业监管要求的高质量模型。同时模型训练技术还具有能够保证质量的作用,如果在模型训练中出现了错误分类的图像数据,数据专家就会了解由此产生的模型弱点,并可以通过重新分类进行补救。模型只有在分类质量满足所有要求,并进行版本化后才会上传至边缘设备。
通过由检测专家主动对图像进行分类,并将这些数据记录并结合至技术结构中,人类的知识才能“传授”给检测设备。将人类的知识与机器学习相结合,可以做出更好的检测决策、保证更低的误剔率。
机器学习系统的未来前景
机器学习系统在视觉检测领域具有巨大的潜力,甚至超出了人们的预估。它的一个巨大优势是以神经网络形式“绑定的知识”可以很容易地进行转移,这使得神经网络能够不受机器和场所限制,多次使用,这大幅减少了反复创建模型的工作量。
同时,为特定药品开发的神经网络也可用于其他物理性质类似的产品,两种产品的好/坏定义越相似,效果就越好。只需很少的工作量和图像就可以通过重复训练为现有模型提供额外的知识,由此产生的新模型便可以为新产品做出高质量的可靠决策。
简而言之,机器学习能够为视觉检测工作带来巨大的飞跃,配置工作减少、性能大幅提高以及扩展潜力巨大仅仅只是它在制药行业视觉质量控制方面的几个明显优势,它的更多潜力还有待人们去挖掘。
评论
加载更多