引言
物联网的发展需要解决两个基本问题,一个是万物互联的通信技术问题;另一个是联网物体的价值发现问题。而第二个问题是物联网发展的核心,即为什么万物互联,或万物互联能产生什么价值。
智能制造、工业互联网是物联网的最重要组成部分,随着世界经济格局的变化,其越来越受到各国的重视,以中国、美国、德国为代表的世界重要经济体都在该领域加大投入,期望利用先进技术改善传统制造业,提升生产效率和本国的基础制造业竞争力。
美国有先进制造、工业互联网;德国有工业4.0和数字化战略2025;而我国将“中国制造2025”定位于国家战略高度,旨在推动互联网与工业融合创新,通过网络融合发展,促进新技术在传统制造行业进行应用。
未来工业互联网关键技术及应用方向之一,就是智能制造所涉及的各类割裂数据的理解及应用,而要理解数据,就要对数据的来源、流动过程、用途等进行了解并掌握,目前可见,唯一有希望满足这个任务的是标识解析技术。因此,在工业互联网的各参与方中,标识解析技术越来越受到重视。
本文首先介绍了标识解析的基础概念、主流技术,然后针对物联网、工业互联网数据内容理解的需求,从实现设备互联互通互操作角度,提出了标识解析技术在工业互联网领域的标准化思路,最后根据面向数据融合理解的目标,给出了标识解析技术可能的应用架构,并进行了相关分析和介绍。
标识解析技术介绍
标识解析技术简介
标识可以理解为用于识别不同物品、实体、物联网对象的名称标记,可以是由数字、字母、符号、文字等以一定的规则组成的字符串。
目前主流的标识技术有Handle、OID(object identifier,对象标识符)、Ecode(entity code for IoT,物联网统一标识体系)、Epc、UCode等,分别由不同的组织机构提出,其出发点都是面向物品对象、数字对象等进行唯一标记及提供信息查询的功能,进而发展成一种底层的信息架构,某些方面类似于互联网中的DNS。现简述如下。
Handle:由TCP/IP的联合发明人、有“互联网之父”之称的Robert Kahn博士发明,核心系统由美国国家创新研究所(CNRI)开发。Handle在全球设立若干的根节点,根节点之间平等互通,这也是其目前受到各国重视的原因之一;其另外一个特点是提供部分用户自定义的编码能力,用户可以根据实际需求在编码体系的部分字段自定义编码规则。目前Handle技术在国内已经成功应用在产品溯源、数字图书馆等领域。
Ecode:我国自主研制的标识编码技术,其由Ecode编码、数据标识、中间件、解析系统、信息查询和发现服务系统、安全保障系统等部分组成。Ecode目前在国内已经成功应用于农产品质量溯源等领域。
OID:由ISO/IEC、ITU国际标准组织共同提出的标识机制,用于对实体及数字等对象、概念或者“事物”进行全球无歧义、唯一命名。一旦命名,该名称终生有效。OID在医疗卫生领域、信息安全等领域获得较多的应用。
此外,还有其他的标识技术,限于篇幅这里不做详细叙述。随着工业互联网的发展,人们发现标识技术是适用于工业互联网各个领域的基础共性支撑技术,可以解决“信息孤岛”问题,突破不同领域间的信息壁垒,作为工业大数据、设备智能化等目标的基本支撑技术。
对标识技术在工业互联网应用的理解
标识的本质是用于识别对象的技术(包含实体对象、虚拟数字对象等),以便各类信息处理系统、资源管理系统、网络管理系统对目标对象进行相关管理和控制。
工业互联网中的标识解析,除了识别网络内各个实体的作用外,并在此基础上增加了查询实体关联信息的功能。工业互联网标识解析技术的变化在于,一是颗粒度从主机细化到了物品、信息、服务等资源;二是功能可支持对异主、异地、异构的信息实现智能化关联。
在实际中,标识从应用中一般分为两类:一类是有直接可理解含义,如道路标识等:另一类是用来唯一识别一个“对象”,而不关注这个对象的用途如何,用户的业务实现由各类解析系统及基于解析系统的业务应用系统完成。
业务系统在完成定义的功能中,通常把标识的解析信息与其他信息相关联,实现业务需求所需的功能,如关联对象的时间、空间信息后进行产品追溯等。第二类标识技术是本文主要研究的内容。
物体标识技术构成有3个基本元素:标识编码技术、标识载体技术和标识解析技术,介绍如下:
标识编码技术是将事物或概念赋予一定规律性的、易被人或机器识别和处理的数字、符号、文字或任意可以被机器识别的混合信息符号等。编码是人们统一认识、统一观点、交换信息的一种基本技术手段。编码的目的在于提高信息处理的效率,但目前不同标识体系的编码规则不统一,造成“信息孤岛”及信息融合、理解及基于此的新应用的开发困难。
标识载体技术规定了标识数据在“载体”上以何种形式存储和读取。离线载体有条形码、二维码、RFID、NFC等,在线载体则以各种文本或二进制数字信息存在。需要说明的是,在数字空间中通常不需要物理世界的标识载体。
标识解析技术是指将对象标识映射至实际信息服务所需的信息的过程,如地址、物品、空间位置等。例如,通过对某物品的标识进行解析,可获得存储其关联信息的服务器地址。标识解析是在复杂网络环境中,能够准确而高效地获取对象标识对应信息的“信息转变”的技术过程。
面向工业互联网需求标识解析技术的标准化研究思路
标识解析技术本身并不是一个新技术,其最初的应用主要是解决生产者对所生产产品的管理,近些年国家层面的主要推动力量为监管部门,应用在药品、食品的安全追溯领域。但针对标识技术应用的市场自发推动力量不足,这其中核心的原因是标识解析技术所对应的信息价值没有被挖掘出来。
随着物联网、工业互联网的发展,人们逐渐认识到标识技术是物联网、工业互联网基础信息融合理解的支撑技术,是未来物联网、工业互联网大数据应用的最基本支撑技术。
但要发挥标识技术的应用价值有两个关键问题需要解决:标准化问题,各类标识解析技术面向应用的“互联互通”问题,虽然从基础层面业界提出了初步的解决方案,但核心是标识技术与实际需求结合的标准化问题;应用自然语言处理技术的标识技术演进问题,目的是实现在数据“互联互通”基础上的融合理解。
面向标识技术的标准化研究思路
智能制造的本质是以机器设备、原材料、控制系统、信息系统、产品以及人之间的网络互联为基础,通过对工业数据的全面深度感知、实时传输交换、快速计算处理和高级建模分析,实现智能控制、运营优化和生产组织方式变革。
随着智能制造相关基础共性标准和关键技术的研发,面向具体行业应用的标准研制及实验验证显得越来越重要。
一方面,其可以解决国内智能制造企业设备升级换代问题,提高企业智能制造水平,推动互联网与制造业融合,提升制造业数字化、网络化、智能化水平,加强产业链协作,发展基于互联网的协同制造新模式。
另一方面,这是标识技术面向未来工业大数据最实际的应用需求,通过解决行业内部各类环境、应用需求的标识标准化技术,从而通过建立不同行业间数据“中间件”及相关标准化体系,解决行业间的数据汇聚、融合理解问题。而“智能装备之间、智能装备与物之间、智能装备与制造系统之间互联互通及互操作要求”的标准研制是解决以上问题的第一步。
制造企业在数据互联互通、互操作技术方面,需要针对同一个或一类物体在制造企业内部、行业内部、跨企业、跨行业信息应用过程中进行统一表达以及标识寻址。因此,有需要建设一套完整的数据解析及理解体系。但是,当前阶段,还面临许多问题,特别是没有统一的数据表示及理解基础。
首先,一个实体对象在不同行业、垂直领域的用途不同,造成这个实体对象的表达方式不同;其次,不同企业在不同时期建设信息系统的目的及用途不同,也造成了信息表达的差异性;第三,在使用信息时,存在不同的语境、上下文,这也对信息的理解有影响。总之,不同企业信息的存储、表示、应用差别巨大,无法供第三方调用。
因此,应建立和完善制造行业标识解析与数据理解标准,并对关键技术进行试验验证,满足我国高端制造业升级演进的迫切需求。
我国工业和信息化部、国家标准化管理委员会于2015年底公开颁布了《国家智能制造标准体系建设指南(2015年版)》(以下简称《制造标准体系指南》),其对智能制造整体的标注化工业做出了顶层设计,结合该规划,本文提出了面向数据融合的标准化思路,如图1所示。
需要说明的是,本研究思路是在国家《制造标准体系指南》基础上,针对基础共性、行业应用需求思考提出的;此外,如果在通信技术层次上,同时考虑标识技术的应用需求和设备在网络层面的互联互通需求,使网络架构面向数据融合理解需求的方向演进,如进行工业PON技术的研发及相关标准化工作,将会从宏观层面更容易满足未来智能制造、工业互联网对信息应用的需求。
在国家2015版《制造标准体系指南》基础上,首先需在A基础共性部分,进行基础资源面向数据融合理解、标识应用的共性研究,如进行标识、工业互联网设备语义、资源描述等面向具体落地及行业应用需求,进行符合企业及行业实际应用需求的标准化研究;其次,需要进行标准的行业应用研究,如面向行业个性化需求(智能设备、物、控制系统互联互通及互操作)标准需求,在基础共性标准的工作上进行面向行业、企业实际应用需求的标准化研制。
对于各类连接所传递数据的理解需求
工业大数据资源互通、共享和协作生产是工业互联网的主要诉求之一,而实现这个目标的核心是数据的理解,尤其是各类数据在语义层次上的理解。这些理解在具体行业应用中,需要具体的数据字典、数据标识、表示、理解的标准方法。
数据理解是开发新应用、产生新业态的基础。目前不但在企业间,即便在同一企业内部,统一的数据表示及理解基础也存在较大欠缺。
首先,一个实体对象在不同行业、垂直领域的用途不同,造成这个实体对象的表达方式不同;此外,企业内不同时期建设平台的目的及用途不同,也造成了信息表达的差异性;第三,在开发具体的应用时,存在不同的语境、上下文,这也对信息的理解有更高的需求。
工业制造企业内部数据的表达方式基本有两类,一类与互联网上的信息类似,是语言文字类型,但其特点是行业专业性强,经常存在同行业内部不同企业针对同一事物的描述表达差异的情况,更极端的情况是同一企业内部对于同一事物,分公司、分工厂或不同的需求背景下描述也有差异;
第二类就是更加海量的机器数据,即企业生产经营过程中,由机器产生的各类数据。由于这些机器来源于不同制造商,遵从的标准不同,制造时期不同,所以机器所产生的数据格式、表达方式也各不相同。
因此要实现互联网与工业企业的融合创新,需要强大的信息处理及支撑技术。为了实现智能装备、物、控制系统之间互联互通及互操作需求,需要一套统一的信息理解及面向这个需求的信息传递、表达的标准及处理架构。该架构主要解决的问题如下:
实现行业内数据表达的统一。行业、企业采用适用本行业、企业的标识技术独立存在,在体系内,实现本领域的标识数据融合,这部分不改变现在标识的运行机制及系统。
实现不同行业、不同标识的数据汇聚。通过云平台汇聚各类标识技术的数据,进行各类标识数据解析后,根据需求标识之间的转换,实现基于标识的数据互通,支撑初步的数据价值发现。
实现工业互联网领域的人工智能技术应用。根据各类标识对应的实体、应用汇聚相关的文本信息,采用人工智能、机器学习、自然语言处理等技术对信息的内在价值进行深层次挖掘。
此部分从宏观上已经可以开始与互联网信息进行融合,互联网上有大量的关于实体性质、特征、用户描述的成熟语言环境,还具有面向应用的开发及商业环境。此部分的核心技术是自然语言处理技术。基于这些基础工作,可以进行具体的工业大数据应用,如质量管理、趋势分析等。
这个体系的核心工作有两个:第一是对接各类标识独立服务系统、接口、数据交换协议、格式的设计,即标准化工作;第二是在汇聚端的自然语言处理技术的研究及应用,学术界和产业界要解决的是如何开发一套适合工业大数据理解的自然语言处理技术。面向多领域标识数据融合的逻辑设想如图2所示。
面向工业互联网数据融合、人工智能技术应用的关键工作
工业互联网数据融合的思想及目标可以用(cyber-physical system,CPS)的概念描述,其最早出现于2006年美国国家科学基金会(NSF)组织召开关于信息物理系统的研讨会。
随着技术的发展,学术界及产业界越来越发现信息物理系统的描述很可能是未来工业互联网、互联网相互融合的直接体现,其内涵是使传统工业企业封闭的物理系统与互联网在信息层面上进行了融合,在信息融合的基础上造就新的业态,而标识技术正是实现这个目标必不可少的技术。
但要实现这一目标,从标识技术本身看,还要有很多工作要做。在技术研究层面还需有以下工作:
基于不同标识解析体系数据融合的技术研究。
面向物联网语义理解及语义互操作的技术研究。
基于标识进行行业语义定义(标准)及相应语义扩展标准化及技术研究。
基于标识技术支持工业互联网与互联网数据相互融合的数据开放技术研究。
支持基于标识解析技术智能化应用的技术研究,尤其是在信息融合基础上采用自然语言处理技术的应用研究。
公共云服务平台:进行标识技术开展公共服务的基础支撑平台技术研究,研究公共服务平台技术架构及关键技术。
支撑标识技术的网络技术研究:结合电信网络演进,对未来网络支撑物联网标识技术的网络演进关键技术进行研究,包括传递标识关键信息的网络基础设施改造及升级、技术研究路线、增值服务和应用等。
结束语
互联网与工业融合创新,不仅仅是网络的互通,更重要的是网络所传递信息的融合理解及开放应用。工业互联网空间的信息采集、理解是工业互联网、智能制造发展的重要核心推动力。
标识解析体系是未来工业互联网、物联网、智慧城市基础信息设施的重要组成部分,也是支撑网络互联互通和信息共享共用的重要基础设施。部分标识技术已经具备跨平台,初步具备了面向业务可灵活定义等特性。
但在面向物联网信息空间的语义理解方面还有许多工作做,尤其是标准化方面,还需面向制造企业的实际需求,制定开放共享的标准。