CNII网讯 3月28日,在工业和信息化部的指导下,为期两天的“2017大数据产业峰会”在北京国际会议中心召开。本次会议由中国信息通信研究院和中国通信标准化协会共同主办,数据中心联盟大数据发展促进委员会承办,旨在宣贯和解读《大数据产业发展规划(2016-2020年)》,支撑大数据国家战略落地,展示大数据产业发展成果,探讨发展面临重大问题,推动产业交流与合作。
永洪科技政府事业部咨询总监王伟在29日的国家大数据综合试验区建设论坛上发表了题为“数据化运营智慧政府”的演讲。以下是内容实录:
很高兴代表永洪科技做一站式数据应用平台搭建的分享。首先,我们会提几个偏困境类的问题。
第一,他们的数据是死的,现在整个云平台的建设,包括政务云、警务云等等相关的内容,平台建设完成了以后我们会发现,我们在上面跑的是很多的、传统的业务系统,像区县级,或者是省市级的,会在上面跑很多的业务系统。真正数据这面的整合,包括数据分析的一些深入应用,大家都没有做得特别好,都是一些基本的报表,或展览展示,上报规则等相关的内容。由于最开始都是以大平台的方式去进行搭建,我们在做各种细节应用的时候,每一个应用上都是空白点,这些空白点如何弥补是我们现在碰到的困境类问题。
第二,我们投入非常大的精力做大平台、云平台,平台真正产生多大的价值,都是靠数据深层次、浅层次的应用,包括数据对核心业务系统的反馈,通过应用和反馈去提升我们整个平台建设的价值。我们投入了大量经费去做,投入和产出比并不是特别匹配。举个例子讲,智慧城市动辄上亿,或几亿、几年的规划做这件事。真正的价值产出是多少,现在没有合适评估。
我们介绍一下碰到的困境,基于这些困境我们去进行更深入的思考,从根本上提出一些解决方案,思考一下我们的智慧城市、我们的政务大数据平台下一步需要做什么东西。
第一,没有限制的,不管是大应用也好,还是小应用也好,我们把基于平台的优势运算资源,优势数据池的资源用起来。通过大数据,或小数据迭代的开发,把真正数据的价值体现出来,让它对核心业务系统有更好的帮助。
第二,真正把业务,包括数据、架构以我们的核心业务需求为出发去走,保障整个应用的价值产出。
第三,针对于应用和价值这方面的设计它可以反哺核心业务系统的工作,去带动业务以闭环迭代的方式往前走,为我们所有的决策提供相应数据支持,从而去改善我们已经建好的底层整个的架构和基础设施的内容。
我们提出一站式数据应用构建平台的概念。这个平台我们提出了几个观点,一是自服务的数据准确、探索式分析、深度分析、统筹管控。自服务的数据准备,类似于微信小程序或者什么的,我们可以快速地基于底层数据模型搭建我们的应用平台,不管是大应用,还是小应用。这些应用可以快速实现,整个使用成本就会降低,门坎会降低。二是探索式分析代表分析的路径和思路一定不是以固化的方式进行,会有迭代式,探索式的内容在里面。三是深度分析,搭建完数据分析体系以后,会匹配数据可能带来的价值,探索数据的关系,这些关系真正应用完了我们有会有想法进行深入一些的,包括数据挖掘,包括相应的内容,整个的平台也需要统一进行管控,同时要跟其他的核心业务系统有数据,包括管理之类的交互内容。
从方法论上讲,我们也提出了相对概括一些的方法论。首先,是以核心业务系统需求为驱动核心,去进行相应的需求调研。这个调研包括我们针对于各个业务系统对于数据的核心需求的点,包括数据底层质量情况怎么样,数据拉通情况怎么样,会进行相应的调研工作。同时再下一步会有层级设计,数据层级设计不光是技术类的,建多层级的数仓、数据中心里去服务核心业务。同时也是业务层面,我们服务的客户在不同位置对于数据的需求和聚合、汇总的要求程度不一样,我们会有一个统筹性的设计工作。
基于整个的设计会进行相应数据整合,包括一些数据清洗、跨业务系统之间的数据标准化、数据拉通的工作。基于数据整合以后,我们会帮助我们的客户建立相应的数据标签体系,这个标签体系有的情况下是比较简单的,比如说通过一些判定条件搭建标签体系,去给它打一个标签。有一些情况下相对来说比较复杂,会把分析,交互式分析应用得比较深度以后,包括加一些比较复杂的算法去判断我们需要考核的指标到底是在哪个范围内,给它打什么样的标签。再进一步,我们的分析体系,就是统计分析体系建立完成以后才有机会看到数据之间的关系,才有机会把业务和数据分析真正结合在一起,才有可能进行比较有针对性的数据挖掘、探索式分析和深入式分析的工作,这是一个比较简化版的方法论。
我们现在拆分一下方法论讲一下具体的内容,我们要进行驾驶舱的设计,这个是多层级的,包括决策层需要的是一些宏观的经济指标,需要的是一些不管是企业,还是政府,这种核心类的,就是深度聚合的数据,在领导驾驶舱里进行显示。管理层看中的是一些中太分析的内容,他们要根据我们现在展示到的趋势、分布等的内容进行相应决策。这种决策下,动态分析指标、探索式的报表会对他们有比较好的帮助。三是执行层面临具体业务人员,他们看中我的数据是什么样的,指标完成情况是什么样的。这样通过设计理念帮我们构建体系华化的分析平台。
再进一步讲,我们有一个设计。基于这个以后我们会帮助我们的客户去做比较深度的导图设计。从我们的经验上看,我们的客户因为是分部门的,对于数据的需求也是不一样的,对于业务的了解也是不一样的,他们自己都是了解自己模块那一部分的内容,真正把这些数据统筹运用起来,就会有类似于脑图统筹和设计的调研数据在里面。这方面的数据可以帮助企业统筹进行数据分析体系规划。进行完细节指标搭建完以后,我们有可能尝试进行关联性分析、探索式分析,乃至于找到数据之间相互影响的点,然后再进行更深入的,包括数据挖掘在内的分析内容。
我们也强调矩阵的概念,我们的分析对象大概是什么样的,我们的使用部门是什么样的,这个矩阵可以帮助我们统筹进行整个体系方案的设计。同时矩阵还有另外的优势点,数据分析体系的搭建是敏捷迭代向前的过程,而不是通过多长时间的调研就可以汇总所有需求,帮助客户解决十年、二十年的所有问题,这不可能。我们做矩阵的时候是由点、及线、及面的方式去分析。比如说审批部门是我们这一期进行体系建设比较重点的项,我们可以从里面选择某一个具体的点,快速帮他们实现需求,大家可以提出很多的反馈意见,包括其他的应用部门看完以后,他们会提出自己的需求,我们再由点及线,最后做到设计分析体系面的建设。
标签体系不单纯是从多维度的方式去进行对于指标的评价,更多的是说我们的业务逻辑,通过我们的业务逻辑去判断,我们哪些指标,用什么样的评价体系去为它进行评价,给它打什么样的标签。包括企业属性、更多维度的财务风险,整个行为评价等等相关的内容。这种多维度的分析是现在我们能够在大数据方面落地的点,我稍微扩充讲一下,大数据在数据分析方面炒概念的点已经过了,我们现在可以落地做一些事。概括来看,大数据分析是三个落地点,第一,海量数据分析。相当于是我们从原来的,由于数据采集能力不足导致的数据抽样率分析的点,我们逐渐以全量数据技术分析。第二,多维度分析。原来银行给我发信用卡,它在评价我,给我发5000还是10000的点上面,他们采集到的数据是不足的,就是我填的一个表,发的一个工资单,很简单的评价,对于银行风控上会有比较大的问题。但是现在我们有足够的途径去掌握到更多的数据,我是否在这边定居,有没有贷款,每个月还款怎么样,是否和我的家人生活在一块等等,可以采集到非常多的数据,这些数据可以帮我们更客观地评价一些指标。第三,数据挖掘。只有统计分析进行到一定地步以后,真正的挖掘才有相应意义。
下面有一个简单的案例说明,公安系统做大数据的时候会有数据利用率低、普遍监控、采集到的数据没有整合、信息模糊的一些问题。我们在这会根据它的需求进行区域化的定义,包括多维度、警种、全区域全警种部门分析,包括信访投诉,案件相关的内容,还进行拆分,包括区域案件、案发时间等内容。对主题进行更细节核心指标的拆分。全部拆分完成了以后,这些主题就真正能达到客户业务对于数据分析的理解和内容。您看到的是简单的柱图、饼图之类的内容,但实际上我们可以帮助警方提高他们的预警防范意识,你可以看到左下角的图有红色的突出显示,这个就是通过个人的行为去进行行为判断,判断完了以后会有提前的预警显示。
对于组织工作关心的就是党员的行为习惯,我们会进行习惯画像。包括这个案例里写到的阅读习惯分析的内容,包括他读了什么样的内容,是读其他的内容比较多,还是看小说比较多,所有这些都可以构成我们对于一个党员基本阅读习惯,以及党性的评价指标之一,这个内容就可以作为我们KPI里比较重要的项去考核。