通俗地说,“互联网+”就是“互联网+各个传统行业”,充分发挥互联网的优势,完成传统产业的转型与升级。现如今,各行各业都开始进军互联网时代,在这样一个大背景下,传统的自然语言行业当然也不能“免俗”
国务院印发的《关于积极推进“互联网+”行动的指导意见》(以下简称《意见》)首次从国家层面提出了一系列“互联网+”的重点行动。重点行动从“互联网+”创业创新开始,继之以“互联网+”制造、农业、能源、金融、服务、物流、电子商务、交通、生态等一系列重要产业,最后是“互联网+”人工智能。笔者认为,此《意见》勾画了一个以创新为源头,以产业为主体,以智能为技术支撑的“互联网+”发展蓝图。
首先,互联网是高度创新的生产力,其生命在于创新,只有互联网本身具有巨大的创造力和生命力,才能促进其他产业的发展。因此,“互联网+”创业创新是“互联网+”行动的源头。其次,正如《意见》所指出的,“互联网+”是把互联网的创新成果与经济社会各领域的深度融合。因此,“互联网+”制造等产业是行动的主体。尤为值得重视的是,互联网与经济社会各领域的“+”不应当、也不可能是简单地将原有产业的工具换成“互联网”,而应该是二者的深度融合,只有这样才有可能实现《意见》提出的融合发展,形成基于互联网的新业态。而要实现这种深度融合,智能化是必由之路,“互联网+”人工智能提供了支撑这种深度融合的核心技术路线,“互联网+”各产业的深度融合都需要“互联网+”人工智能的支撑。
那么,“互联网+”人工智能如何为“互联网+”各产业的深度融合提供支撑呢?以下,本文仅以《意见》在“互联网+”人工智能中提出的自然语言理解这一人工智能领域的重要技术为例,首先阐述该技术如何进行“互联网+”,之后阐述其如何为互联网与产业进行深度融合提供核心技术支持。
简单地说,自然语言理解(或者更一般地称为自然语言处理)是研究使机器能理解人类语言(像中文、英文等人类语言称为自然语言)的技术。这种技术有非常广泛的应用。例如,如果有一台机器既能理解中文又能理解英文,那么,这台机器就可以为人类充当翻译;如果电视能理解中文,那么,用户就可以不用按钮,而是通过说话来遥控电视。
自从上世纪40年代计算机发明以来,人们就开始了对自然语言理解技术的探索,取得了一系列的进展。尤其是近20年来,随着互联网的发展引发了对这一技术的强劲需求,这一技术在得到长足发展的同时,也在有力地促进互联网核心能力的增强。比如,目前互联网提供的一个基础性能力是信息检索。人们在搜索引擎中输入关键词,就可以获得相关信息。在20年前,互联网刚开始发展的初期,给搜索引擎输入“和服”,返回的结果中很可能包含不少生产、销售“鞋子和服装”的公司的信息。现在这种错误已经比较少了,而促进其质量不断提升的一个核心就是采用了不断改进的自然语言理解技术。“互联网+”自然语言理解已经成为互联网发展的一个共识,并在不断深化。
笔者认为,“互联网+”自然语言理解有两个互相补充的发展方向,一是发展大规模语言数据的分析处理能力,二是发展自然的人-机器交互方式。
基于“互联网+”自然语言理解发展大规模语言数据的分析处理能力,是指基于自然语言理解技术对广泛存在的语言信息进行获取、分析、推理和整合,并提供决策辅助。其需求存在于“互联网+”制造、农业、能源、金融、服务、物流、电子商务、交通、生态等各个行业中。例如,在智能制造中,《意见》中着重提到了制造业服务化转型:鼓励制造企业利用物联网、云计算、大数据等技术,整合产品全生命周期数据,形成面向生产组织全过程的决策服务信息,为产品优化升级提供数据支撑。实际上,在产品全生命周期里确实存在大量的数据,其中关于产品的需求、设计、工艺、加工和销售各环节的数据(来自企业内部、企业外部以及互联网上)很大一部分是以自然语言方式存在的,要基于这些语言数据形成全过程的决策服务,很关键的一点就是要自动分析和理解这些语言数据。利用机器自动进行这些信息的分析,与人工分析相比,具有信息全面、快速响应的特点,可以作为人工决策的有力支撑。这方面的研究目前被称为企业竞争力情报,已经得到各类企业的重视。不单对于制造业,农业、能源、金融、医疗等行业也有着类似的需求。因此,基于“互联网+”自然语言理解发展大规模语言数据的分析处理能力是“互联网+”行动的一个重要技术支撑。
基于“互联网+”自然语言理解发展自然的人-机器交互方式是指基于自然语言理解技术重塑人与机器之间的交互方式,使自然语言成为人-机器之间进行交互的自然接口。目前,技术人员在赋予产品某项功能时,需要采用专门为机器设计的语言编写程序来“告知”机器,普通大众在使用产品某项功能时,需要按要求进行按键选择,“告知”机器执行某个指令。不论是开发还是使用机器,人们在和机器交流时都要使用另外一套专门的交流语言或方式,不同的机器可能要使用不同的语言或方式,为了开发或使用这些机器,人们需要去学习这些不同的语言,这对于人来说,是一个极大的负担,尤其是随着机器日益走进社会生产和生活的各个方面。如果每个机器都有一套不同的交互语言,那将严重影响人们对机器的开发和使用,因此,最好是使用一种统一的交互方式。统一所有交互语言的一个很自然的方式是使用人类的自然语言。由于自然语言是人类天生就能逐步习得的语言,因此,对于人类而言,这是一种最自然、最方便的交流方式,对于人类而言更不容易出错,更能体现每个人的个性。而要达成此目标,就需要采用自然语言理解技术,使机器具有理解人类自然语言的能力,实现基于自然语言的人机交互。
基于“互联网+”自然语言理解发展自然的人-机器交互方式同样对于“互联网+”行动的其他主体方面具有重要的需求。典型的,如《意见》在“互联网+”益民服务中提到:加快互联网与政府公共服务体系的深度融合,推动公共数据资源开放,促进公共服务创新供给和服务资源整合,构建面向公众的一体化在线公共服务体系。实际上,面向普通大众的各种服务,如果交互方式烦杂不自然、不便捷,那么就难以得到普通大众的响应,提供服务就成为一句空话。在“互联网+”电子商务等行业中也是如此。因此,基于“互联网+”自然语言理解发展自然的人-机器交互方式同样是“互联网+”行动的一个重要技术支撑。
总之,“互联网+”自然语言理解作为“互联网+”人工智能的一个具体方面,不论是发展大规模语言数据的分析处理能力,还是发展自然的人-机器交互方式,都是“互联网+”行动中的一个重要组成部分,在推动“互联网+”人工智能中发挥巨大作用的同时,也为“互联网+”各产业的深度融合提供有效的技术支撑。
(原标题:基于“互联网+”自然语言理解是实现人工智能的关键)