数字孪生为深度学习弥合了数据鸿沟

数字孪生是实际物理过程、系统或设备的数字复制品。最重要的是,数字孪生兄弟可能是DL项目成功的关键,尤其是涉及危险、昂贵或耗时的过程的DL项目。

当今世界,数据为王。世界上价值最高的公司,无论是亚马逊、苹果、Facebook、谷歌、沃尔玛还是Netflix,都有一个共同点:数据是它们最有价值的资产。所有这些公司都使用深度学习(deep learning,DL)将这些数据付诸实施。

不管你从事什么行业,你的数据都是你最宝贵的资产。你需要做你自己的DL来保护你的资产。DL成功的最重要因素是拥有足够的正确数据。这就是数字孪生的由来。

数字孪生是实际物理过程、系统或设备的数字复制品。最重要的是,数字孪生兄弟可能是DL项目成功的关键,尤其是涉及危险、昂贵或耗时的过程的DL项目。

深度学习带来的竞争优势

到目前为止,几乎每一个行业(包括半导体制造业)都认识到了DL创造战略优势的潜力。DL采用神经网络进行高级模式匹配。在人脸识别、语音识别、医学图像分析、生物信息学、材料检测等领域有着广泛的应用。在半导体制造中,DL已经应用于缺陷分类等领域。大多数领先的公司都在争先恐后地在这个充满希望的新竞争环境中取得优势。

随着公司开始探索DL以及它如何帮助他们,许多公司发现了两件事:第一,很容易得到DL原型,第二,很难从“良好原型”的结果获得“生产质量”的结果。随着免费的DL平台、工具和工具包的出现,与传统的应用程序开发相比,DL应用程序的初始开发是非常快速和相对容易的。然而,生产DL应用程序并不比生产常规应用程序容易,而且可能更难。原因在于数据。拥有足够的数据,以及足够的正确数据,通常是不能提供生产质量结果的DL应用程序和彻底改变处理特定问题的方式的DL应用程序之间的区别。

深度学习的数据鸿沟

DL是基于模式匹配的,模式匹配是通过向神经网络提供表示待匹配目标的数据来“编程”的。需要大量的数据训练一个网络来识别目标,并且需要知道它何时不是目标。

DL在快速生成原型和提供概念证明方面非常强大。但DL的真正优势并不是开发速度,而是它释放了数据的力量,使之能够完成其他任何方式都做不到的事情。

任何DL应用程序的成功都取决于培训中使用的数据集的深度和广度。如果训练数据集太小、太窄或太“正常”,那么DL方法不会比标准技术做得更好——事实上,它可能做得更糟。重要的是要训练一个包含代表所有重要状态或表示的数据的网络,足够的数据量让网络学会捕捉问题的正确本质。

对于一些领域来说,比如自主驾驶或半导体制造,困难在于一些最严重的异常情况(谢天谢地)很少发生(图1)。然而,如果你想让一个DL应用程序识别出一个孩子在汽车前面飞奔或者一个致命的光掩模错误,你就必须用这些场景训练网络,这些场景在现实世界中是非常稀少的。数字孪生是产生足够多异常数据以正确训练网络识别这些条件的唯一方法。

图1. 标准差正态分布曲线的图解。在半导体制造业中,与开车一样,“离群”事件非常罕见,但神经网络必须接受同样多的训练,因为最坏情况下的事件会导致芯片故障;使得平均效果不够好。

数字孪生弥补了鸿沟

数字孪生,即实际进程、系统和设备的虚拟表示,是创建正确数量的正确数据以成功训练DL网络的关键工具。使用数字孪生兄弟创建DL培训数据有以下几个原因:

数据属于客户,因此不能将其用于DL培训。

创建DL所需数据资源已被完全投入到客户项目中。

已经开发了DL应用程序,但发现需要特定的数据来调整和训练神经网络,以达到所需的精度水平,但是使用maskshop/fab资源创建数据的成本令人望而却步。

无法找到足够的异常数据来充分训练您的DL网络。

最后一个案例几乎是普遍的。理想情况下,要保持对数据的完全控制,需要三个数字孪生体:在制造流程中原有流程/设备的数字孪生体,为您自己的流程模拟提供输入数据;您自己的流程/设备的数字孪生体;以及在制造流程中跟随您的流程/设备的数字孪生兄弟,以便您可以将输出反馈到下游进行验证。

在2019年的SPIE光掩模技术会议上,D2S提交了一篇文章,展示了使用使用DL技术创建的两个数字孪生体:一个扫描电子显微镜(SEM)数字孪生体,一个曲线反光刻技术(ILT)数字孪生体(图2显示了扫描电子显微镜数字孪生体的输出)。虽然数字孪生的输出通常不足以精确到制造业,但这些数字孪生已经被用于训练DL神经网络和验证。重要的是,这些数字孪生体是由深度学习产生的,而不是通过仿真产生的。这是一个使用DL作为生成其它DL所需数据的工具的示例,它演示了投资DL的复合收益。

图2. 由SEM数字孪生生成的掩模SEM图像和真实SEM图像的两个示例。显示了在同一位置的水平切割线上的图像强度。不仅图像看起来非常相似,而且边缘的信号响应也相似。

一般来说,人工操作人员执行的繁琐/容易出错且很难用传统算法实现自动化的工艺过程,是进行深度学习的良好候选者。无论是通过目视检查还是其它方式,检查特定情况的专业人员都很有可能正确执行任务。但在许多类似情况下,人类会犯错误,变得越来越不可靠。特殊情况下,DL可能不如人类做得好。但它在一些情况下的成功概率却和时间和次数无关。随着执行任务的次数和/或时间的增加,人类会犯更多的错误,但DL的成功概率不会随着时间和数量的增加而降低。

缩小与DL成功的差距

一旦您确定了一个DL项目,就有各种可用的资源可以让您走上成功的道路,同时仍然可以让您对自己的数据保持严格的控制。如果您是新手,并希望为您的试点项目提供全面的支持,您可以加入电子制造深度学习中心(CDLe,www.cdle.ai网站),一个由行业领袖组成的联盟,旨在汇集人才和资源,为独特的问题推广DL的最新技术,并加速DL的采用,以改进产品。

如果您已经开始了您的DL项目,但由于DL数据鸿沟而遇到了问题,D2S可以帮助您构建数字孪生兄弟。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论