4月18日,2019第二届中国信息技术主管大会在北京隆重召开。
北京理工大学计算机学院教授、博士生导师、副院长、软件智能与软件工程研究所所长牛振东在演讲中表示,要利用人工智能、大数据、智能学习、云计算等新技术,通过社会化网络工具,把数字图书馆的用户、资源提供商、以及合作伙伴紧密的连接,构建基于智能数字图书馆的企业信息化协作效率和服务能力。
北京理工大学计算机学院教授、博士生导师、副院长、软件智能与软件工程研究所所长牛振东
以下是演讲内容记录:
各位领导、各位同仁,大家好!我很荣幸有机会来跟大家分享对智能数字图书馆一些看法,包括在这种所谓大数据时代,数字经济时代对我们企业创新会起到什么样的作用。跟大家分享一下长期对这个方向的一些理解。
向大家汇报四个方面内容,一个数字图书馆产生的背景,大家都比较清楚。第二数字图书馆基本特征和在过去20年发展趋势,所谓的大数据或者是人工智能这些新技术对数字图书馆智能化服务的影响,智能图书馆是什么概念,智能数字图书馆对现在能起到什么样支撑价值。
数字图书馆产生背景,大概在上个世纪90年代中期的时候随着所谓的互联网或者信息高速公路的产生,这个时候就出现了一个问题,大量的网络化的网页出现了,对这些所谓的海量数字资源如何进行有效的组织,进行相关的查询、访问和使用,这个时候就变成了一个具有挑战性的问题。当时我印象中是在美国国家自然基金委1993年启动数字图书馆项目,其中一个在斯坦福大学做的,海量数字大学组织与管理,另外三个项目大家比较清楚,包括数字图书馆体系框架等。紧接着在1998年启动了第二期项目,数字图书馆二期,一期研讨相关技术之后,紧接着出现了如何使用这些技术来构建一些所谓的数字图书馆项目,数字地球,加州数字图书馆项目等。我们国家在1996年启动了国家数字图书馆工程,我也很荣幸2001年左右从他那边回来,也是一直有机会来参与见证我们国家数字图书馆的这种发展。
有了互联网之后我们需要构建一些框架或者一些技术来对这些数字资源进行知识化的管理,互联网用户面对海量数据资源的时间,需要对信息资源进行有效的查询。在上个世纪末的时候,也就是在数字数管刚刚兴起的时候,内容为王,紧接着大家说不对,是服务为王,现在又回过了数据为王。为什么大家在不同时期有不同看法,今天又认为数字为王,实际上我们知道在现代所谓的人工智能大数据时代核心的东西,所有的东西被数字化。个体个人的一些运动特征,习惯的特征,包括很多交通各行各业所有数据基本上全部被数字化了,这也是为什么今天大家认为数字经济十分重要,我们国家提工业互联网这个概念的提出,信息时代跨入了知识时代,跨入数字时代,我们面临新的转型,数据和知识在这么一个时代面临价值无比重要。数字图书馆能够持续发展的根本原因。
除了传统数字图书馆概念之外,数字图书馆支撑作用,最基础的支撑,在1995、1994、1996、1997年在美国白皮书和蓝皮书把数字图书馆作为最核心关键技术,基本上排在第一位,作为最主重要支撑技术。2003年在匹斯堡大学举行一次研讨会,做了两期了,下一步要干什么,走向何方。这时候大家在这个会上并没有达成相关的协议,并没有形成共识,而是认为数字图书馆将来比较成熟,技术成熟了,构成了一个共识,未来数字图书馆将在这种知识服务时代,在国家的决策里面继续发挥重要作用,从那时起在美国基本上不大提数字图书馆研究什么什么,但是他的角色和他的地位已经形成了,这就是下面我想给大家分享的,在2003年出现的一张图片。
在这个轴上讲的是区域的概念,本地区域,在横轴上讲的是时间的生命周期概念,包括几个小时几天,几个月,几十年,甚至几个世纪,放了一个更长的历史时期。大家看到这个方块形的有一个对象绿色是本地决策网络,在一个更远的所谓局域化的或者城市的应急局域网络,有一个全球的局域网络。前两天在巴黎圣母院发生了火灾,网上评论很有意思,怎么做这件事,怎么救火,怎么把文物保护起来,快速形成一种响应,形成策略,如何最大限度的来保护文化遗产,实际上有一定的策略。更远一点的所谓的应急的,比如说对一个城市在过去几十年对他的道路、交通、人口等等,是几十年的一个判定,做一个区域化的应急网。更长远的就是一个所谓的综合性的,比如说全球气候变化问题,实际上它是一个更加综合的,是一个长期的过程,一个很经典的例子大家知道全球变暖,最早政府说全球变暖是别人忽悠我们,德国科学家喝啤酒的时候把冰块放进去冒泡,做了一个实验,就发现含有二氧化碳,然后就到南极转冰,发现不同时期冰层二氧化碳含量不一样的,从一个侧面印证了,大家如果去国家气象局能看到关于这篇文章的成果介绍,能看到二氧化碳在不同的年代,不同的时期,人类在冰层里面二氧化碳含量,过去有波动,最近呈直线型的上升。刚才讲这么一个概念,实际上这种决策怎么来的,取决于我们的认知,取决于我们的数据,取决于对事情判断,正是因为如此,所以数字图书馆决策作用支撑的作用在今天这么一个时代,是更重要,谁拥有了数据,谁就拥有了先机。
简单给大家分享一下基本的背景,包括在今天尽管大家不大说了,认为相对成熟了,但是实际上我个人认为除了传统的经典的没有解决的长期保存问题之外,数字图书馆在今天对我们国家,对一个单位,对一个企业,对一个学校是至关重要的一个核心支撑平台。
数字图书馆最主要的特征,呈现的数字化,不是把一个图书馆简单数字化,各类的资源,包括文本、图象、音频、视频,来自互联网的,来自图书的,来自于文化保护的,来自于读者的,所有的信息都会被纳入到数字图书馆里面管理范畴。存储是网络化,正是因为网络化开始的信息资源的存取,就呈现自由化、共享化、网络化。最终极的目标就是24小时7天任何时间任何地点,使用任何语言来分享使用人类任何资源,任何知识。这个时候强调是一种高效的分布式的跨语言的随时随地按需的资源。
前面十年主要关注技术和实际项目建设,经过这么多年的发展之后,数字图书馆实际上它的一个概念,一开始就提它的目标是可变的,并不是固定的。第一就是技术本身的变化,第二人们对信息化,包括信息化对生活的影响,正是因为如此,和别的学科密不可分,融合交互发展。这种动态性对数字图书馆体现两个最根本的特征,知识化、智能化,在今天为什么我们在谈论的时候智慧图书馆,或者这种智能图书馆,这是它根本的原因。
正是因为如此,在服务上表现特征第一知识化,第二个性化,我们知道在信息时代,那个时候就是在最早出现互联网的时候,强调的是信息组织与检索,如何对信息进行有序化,进行归纳,来形成知识,把数据变成知识,2004年在一个报告里提出来基于知识数字图书馆,那时候目标不是简单做信息原数据基本查询,而是做融合的服务。今天所谓的大数据时代,数字经济时代,更多的强调是深度的知识融合和个性化智能化的服务,并且可以为创新学习,为我们的创新社会提供支撑,我觉得在未来或者在今天这么一个时代,智能化和深度的个性化知识服务是数字图书馆发展最重要驱动力,也是一个最重要方向。
下面我想给大家简单分享一下数字图书馆发展,看看它的基本技术体系,包括在智能数字图书馆基本特征,关键的技术。这个图大家都知道,所谓在工业互联网,或者在新的时代,基于大数据的软件信息化体系基本特征,基本上就是这个样子,最上面可能会有一些比较前沿的新兴的一些技术,包括机器人、3D打印、感知、虚拟仿真、大数据等等最基本前沿数据作为一个支撑。同时它在中间这一层强调的是这种智能的融合的架构和协同的管理和一些面向制造的服务,一些辅助决策,同时配以相关的标准。在上面构建所谓“互联网+”,比如说“互联网+”企业+教育,和业务相互融合的智能服务,整体的特征。所谓的智能图书馆,我个人认为它是与网络、人工智能、大数据、信息化技术为支撑,核心目标建设一个信息物理系统网络,融合数字资源加工,发现智能服务,实现各类信息资源融合,发现个性化的服务。我这里面提出来是提供一个智能的科研学习环境,企业的决策支持环境,这是为什么我想在今天跟大家分享这么一个概念。
它的前提是除了传统图书馆对数字图书馆资源管理之外,更重要的是他通过信息源的融合,个性化的服务,为我们的学习提供一个智能的科研学习环境,2001年还在美国的时候,我当时就感觉到经过一定时期发展,数字图书馆将走向主流。实际上现在在国际上最前沿大学里,物理图书馆越来越看不到了。在今天为什么这样,他那个环境已经变成了大家在那儿讨论,在那儿交流,在那儿分享,提供一个科研的环境,仅仅是一个科研环境是不够的,智能的科研环境,原因就是它拥有了海量的大量的数据资源,信息资源,而且被知识化了。对企业来说,也是同样的,我们的企业要走出去,在国际上有竞争力,了解竞争对手,相关产品,你在投入一个新的,寻求战略合作伙伴的时候,做竞争情报的调研分析等等这些问题,恰恰是数字图书馆最具有优势和特色的地方。我觉得在这里面它需要突破感知智能等核心技术的瓶颈,既然是一个环境,就要调人机交互的这种能力,形成人机与环境之间多重的协同和协作。所以它的基本特征我认为就是说要具备这种,辅助决策和丰富的工具集,是一个学习决策的平台,智能只是发现学习工具辅助决策是数字图书馆构成最核心部分。另外一个特征它的持续动态发展,今天谈论的功能在未来可以发挥你的想象,20年后今天所说的东西100%会被实现。它未来得形态会是一个什么样子,最近跟我的几个博士探讨的时候,要给互联网赋予灵魂,给互联网赋予道德。
我讲一个例子,有些公司做一些智能工具,孩子们使用完之后短期内有提高,两三天有下降,因为违背了常识。不能简单强调技术,同时要研究技术对我们放在一个比较长的时间,放在一个真的从人成长的角度,从发展的角度来看,这里面就背后隐藏着大量的伦理,一些新的问题值得们去做研究,这也就是为什么讲它会持续动态发展的根本原因,所以它的交叉将会是一个永恒的特征。
当然它的相关技术就涉及到数据科学、人工智能、认知科学、数字出版、智能教育网络学习、虚拟实验、安全、竞争情报分析、标准化等等,这个大家很直观理解的,在这个地方不再赘述。
下面我想跟大家简单分享一下所谓的智能数字图书馆为什么对企业创新很重要,我个人认为两个问题,一个就是基于网络协同数字生产管理和智能服务平台,是数字图书馆在企业应用里面的一个具体体现。第二个企业要发展也需要考虑如何运用这种新的技术来给企业本身向用户提供智能的服务。
这里面谈两个概念,3.1讲的所谓工业4.0时代一些新技术,软件应用的特征,所有的企业面临这种技术的冲击,对技术支撑的研究,对企业发展至关重要的,如何利用数据中心人工智能技术,大数据技术,构建智能数字图书馆信心和情报协同生产管理,我觉得所有大中型企业,尤其新兴企业值得关注的,企业构建自己的发展情报,协同管理,资源管理的一个平台。同时企业需要在所谓大数据时代,要满足自身创新的知识管理服务的需求。这样的话可以满足不同的这种知识服务的需求,实现基于数字图书馆个性化、知识化和智能化的生命周期管理,同时利用智能的数字图书馆可以提供相关的产品,相关的竞争信息舆情等资讯服务,同时可以提供精准的客户分析,精准的营销,智能的推荐策略。更重要一点数字图书馆可以为员工培训和职业教育提供终生的发展平台,我们知道现在国际上大的企业,英特尔包括国内的,很多企业学习都会有自己的所谓比如说华为大学等等,原因是什么?就是他认为对企业发展,所谓企业大学我想百分之七八十的情况下都会利用网络化学习,利用图书馆对他本身的发展做一个支撑。
新技术对企业的作用,更不用讲了,比如说利用数字图书馆,我可以定制化对资源按需按部门,同样都是做舆情做技能分析,做技能情报,不同的部门不一样,可以按需进行汇集,进行出版,把数字图书馆的用户资源共商,利用网络化工具来构建协作的一个服务的能力。同时依据海量数字资源,所谓数字资源管理为基础研究相关的支撑技术,实现这种辅助的工具,智能化的工具,为企业内部的员工和企业的客户提供有特色的这种智能服务,比如说智能客服等等。
我想简单跟大家分享一下,在这里面数字图书馆发展还存在很多挑战,数字图书馆对辅助共聚合个性化需求在相当长时间内得到持续发展。以用户为中心的智能辅助决策,具有情感因素的学习生活助手,个性化、知识化定植推荐感知相关功能的研制,评价排序,深度索引,情报服务,在这里面都是这种技术本身的变革和人们对智能化的需求是数字图书馆持续发展的原始动力。
在大数据时代研究善于使用智能数字图书馆给企业所提供的,我刚才提到的数字资源的支撑,一种竞争情报的支撑,一种学习的支撑,将会对企业的发展创新起到重要的支撑作用。同时基于这种大数据和移动网络的开放学习和情报服务体系,将会在未来具有巨大的研究价值和巨大的商业价值,在这里面就是我们构建了一个所谓的基于数字图书馆,基于虚拟实验室,我在很多场合分享过的圆圈里面的图,核心是基于数字图书馆和虚拟世界网络化的一个智能数字图书馆或者智能学习平台,有时候又称之为虚拟大学。