谢谢大家,刚才很荣幸地拿到信通院给我们颁发的数据流通测试的奖项,今天我给大家分享一个题目叫数据互联,引领智慧未来。前两天偶然的一个机会拿到了两张图,2016年发布的新兴技术的曲线图,中国数据经济类似于我们这样的数据流通行业往更努力的方向去做。这张图我更想表达的意思是现在很多新兴行业都有这样的山峰,这个山峰可能是资本造成的或者其他方向造成的,有一个快速增长、快速下滑的过程。是不是有可能我们能够把这个山峰削掉,把数据流通行业进入正常快速发展的过程,不需要快速的上下起落。
收集了一些材料,数据经济在国外2008年有很多产生,包括微软的、亚马逊的,中国国内2016年各地就开始产生,贵阳数据交易所在开展。上海为会踏进数据流通这样的行业?上海跟踪整个数据流通蛮长的时间,从2012年我们有很多研究性的课题,2016年4月1日经上海市人民政府批准,上海市经济和信息化委、上海市商务委联合批复成立大数据交易机构。统一的数据流通标准和规则,有利于监管的透明交易环境,提供数据连接的桥梁。基于这样一些考虑,政府对我们的要求,我们在整个业务过程中,经过半年多时间的实践,在整个数据流通过程中会碰到蛮多焦点,比如在供需这种时候,数据会有很多碎片,各家能覆盖的量都会有很大的差异,或者每家都不是能覆盖全的。虽然要的时候是全要,但是真正用的时候也是碎片的。
第二是价格,现在我们已经碰到很多实际的问题,供需之间形成了价格差,价格差怎么能解决。
第三是留存。数据的权利,一般大家默认的供方的权利,数据还是我的,我只是给了你一个使用的权利,不能超出范围去留存或者扩大它的使用。
第四是数据整个流通过程中安全怎么解决,传输的安全、数据本身的安全、系统的安全。
最后是数据的质量。按现有情况来看,到了最后要介入流通或者商业化交易的时候,你的数据能不能保证能够高质量地被我所用,也是一个很重要的问题。基于这样的关注点,上海交易中心一直在倡导从应用需求出发,提供一个快速方便获取有效的合规数据的在线的互联和流通工具。数据有各种各样的数据,但是真正能进到流通的还是从应用出发,后面有些说明,这个过程中可以做到可信、可控、可被监督。
未来做数据流通的事情,上海交易中心做了分布式双向互联的平台,中间除了供需方以外还有质量评估的角色,同时为供方和需方在整个过程中会有数据组织的工作,包括需求的组织,怎么样形成应该要的标签或者数据。同时在需方这,数据有三家的供应,到底应该拿谁的,怎么样能够有一个选择去选择我要的。同时还有在第三方评估的工具能帮助你评估现在获得的数据是好的还是坏的。当然为了做这些事情需要有很多标准,标准化的产品、标准化的配送、标准化的资费、评估和结算的模式。
说到流通数据,大家都已经很清晰,数据从原始产生一直到最后能够被我所用,数据可以是分层级的,从原始产生刚采集下来的数据,这个时候跟用户会直接关联,它会包含很多真实ID等信息。有没有在这个基础上进入脱敏就能够进入流通领域,只是采用了脱敏的方式,这种脱敏回避不开暴力的破解。在这个基础上我们更倡导有没有一种可能,跟个体的真实身份能脱离的信息、数据能够产生使用,我们叫个体的源数据。还有一种完全跟个人无关的,我们开展数据流通的过程中流通品质主要围绕个体源数据和群体源数据这两类。
这是我们交易中心提出的两类数据,这两类数据怎么去描述,能够定义出我们能进入流通,从数据的本质出发,不管什么样的数据最后都会指向一个对象以及有关这个对象的所有情况,数据是描述这个对象的,怎么关联出这个数据。我们采用了exID的技术实现标示信息的隔离。既然数据是描述对象,描述对象是哪些维度,要把这些维度清晰描述出来,在我们国家的法律法规和规章制度里应该有清晰的被禁止的维度不能做。
第三,现在这样的数据是描述这个维度,那这个维度的数据应该多大的颗粒度够用又能够防止这么多的风险。很多在流通过程中的约束要素和时间轴上的要素,当然最重要的还有价格的要素。通过六要素大家可以想一想是不是能够很方便地定义出这个数据能不能流通,合不合规。
第二是我们交易中心特有的,上海交易中心跟一般的有点差异,我们没做数据的留存,交易中心不是提供平台的,提供了相互之间流通的桥梁,通过供需之间大家追求统一的标准来追求数据的互通。
第三,六瑶族的时候简单说过的exID,exID是怎么回事,怎么能通过exID把我客户的手机号码或者我设备信息传递给想要数据的供方,简单描述一下就是通过一个分权的方式,我有一部分他有一部分,通过三方的方式最后分别出一个个体。
我简单的交流就到这里,目前在上海交易中心的官网上我们把我们很多标准和规则公布在我们的官网上,欢迎大家浏览,同时也欢迎大家跟上海交易中国进行合作。我们做整个数据流通或者数据交易,最重要的还是一句话,坚决划清与非法的数据倒卖、与不当得商业使用行为的界限,谢谢。