广州12345政务服务便民热线数据应用平台

数据采集范围包括热线工单数据、市民诉求数据、回访数据、考评数据等,和公共的基础综合性数据,包括人口信息数据、地理空间数据等,以及其它相关需求所使用的数据为导向,基于供需对接具体情况进行数据采集。

广州12345政务服务便民热线数据共享平台立足于政府热线数据处理分析痛点,包括业务标准未规范、提取效率难提升、系统功能有短板、数据安全难保证等,从统一全要素数据资源标准入手,通过引入新一代数据处理技术——数据泵,实现数据分析的广度和深度进一步的提升,极大提高问题识别的速度,问题处理的响应时效,全面提升政务服务效率。

一、主要做法

(一)实现数据加速和数据层、应用层分离。数据采集范围包括热线工单数据、市民诉求数据、回访数据、考评数据等,和公共的基础综合性数据,包括人口信息数据、地理空间数据等,以及其它相关需求所使用的数据为导向,基于供需对接具体情况进行数据采集。需对清洗后的数据进行一系列标准化的处理工作,以便数据整合层的存储和应用层的使用。因不同来源的数据,极有可能类型、属性上是不一致的。能实现数据类型转换,数据离散化,对不同来源、格式、特点的数据集成处理。

(二)技术方案要点、把SQL表达式转换成基于LLVM即时编译技术产生的C高效代码,而不是基于Java的字节码,C代码的执行效率比Java快三倍以上。同时CPU二级缓存和全局内存层之间采用列式内存数据处理方式,加速数据湖的数据流速。跨异构数据源在内存虚拟层拉宽表,并基于内存构建星状雪花状模型,大大加快向数据应用工具供给数据的速度。平台内部有数据质量提升的快捷操作函数,可以同步地快速处理数据质量问题。它不仅是一个Data Lake Engine,它还具有高度的伸缩性。不仅可以为分析侧提供数据服务,也可以将数据服务能力延伸到业务侧,为生产系统提供数据服务。

(三)构建数据表立方体,通过时间、地点、事项等维度,快速关联和拉直结构化、非结构化数据库表,实现自定义数据模型的生成。

(四)建立政府热线大数据共享平台,支持对接穗智管综合指挥调度平台、广州市数据共享平台等市级平台互联互通、数据对接。根据上级有关政策,接入国家、省级平台,包括粤省心平台、国家12315、12328平台。

二、取得成效

数据共享平台已实现广州12345热线数据的全范围接入,已完成了各个单位的数据模型上线,能面向各单位提供数据报告、数据接口和数据查询服务。截止目前,数据接入量6203万条,接入单位34个,上线模型19个,月处理业务数据量为200~300万条,处理分析问题124类,实现市场监督局26个指标问题的分析,真正实现面向不同单位个性化指标的分析模型的落地,使得数据应用更贴近真实业务场景,更高效为业务服务。

1.打破传统工作模式,创立数据业务全新标准。平台为各承办单位提供统一的用户申请、报表查询、在线分析及导出服务,将以往线下来函、电话沟通、来人取数的被动数据供应方式全部转为“线上自提”,系统处理代替人工办理,实现热线数据业务“3个1”即一项业务、一个平台、一套标准;通过增设用户反馈、行为记录等功能,能够快速了解数据运用效果,响应用户需求,推动平台功能自主迭代,逐步形成数据应用和平台管理的闭环。

2.创新平台功能设计,满足多方个性应用要求。区分用户对数据常规化和阶段性的不同需求,创造性提出“模型管理”概念,针对周期性数据提取无需反复设置条件即可直接导出,同时支持自助查询满足临时性数据要求;增加数据展示功能模块,以大屏的方式直观查看本领域热线数据分析情况,满足各单位专项展示需要。此外,根据各级领导实际工作需求,平台还提供了手机版的分析简报,供用户方便快捷掌握相关情况。

3.融入多项信息技术,确保适应未来发展需要。平台采用先进数据泵技术,支持动态跨表关联,检索和数据提取速度较原来提升数十倍,极大提升工作效率;平台纳入在线分析功能,把通用分析技术嵌入平台,将复杂的人工线下分析工作转为线上自动完成;平台提供智能分析功能,系统可根据用户自行查询结果自动生成简要分析报告,供用户使用。

下一步,持续探索数据应用场景,深化热线系统与城市中枢系统对接,推进热线渠道与城市调度渠道融合,实现热线数据与各领域数据联动,有效支撑以民生诉求为导向,以感知网络为依托的“城市调度”“政务服务”和“互联网+监管”等主题场景建设,强化舆情预判、突发事件研判、安全事件预先处置水平,提升城市级综合指挥调度能力。

THEEND

最新评论

更多
暂无评论