大数据治理的全景式框架

遂宁高新科技服务中心
在大数据技术的支撑下,可构建群体化评估体系,整合用户评价大数据。在大数据赋能的数据服务层,对评估的支持具体体现在对海量评价数据的自动处理与分析方面,从而得到详实可靠的评估打分、正/负面情感倾向。

数据基础

(1)方案的数据基础

方案的制定依赖于全面且广泛的数据基础,数据的维度越丰富,制定的方案就越客观可靠。为了能全维度地采集数据,企业或者政府应始终坚持大力发展大数据相关技术和信息智能化建设工作。

基层应树立起对大数据概念、应用价值的全面认知理念,积极响应企业或者政府就促进大数据发展提出的各项指示。着力推进数据开放步伐,打破数据碎片、数据孤岛和数据壁垒,对散落在各个委、办、局、企业、部门的数据进行整合,形成最广泛的数据联合平台。重点采集与经济和民生相关的多维度数据,并设立数据决策机构,针对具体业务和实践状况的数据特性和区域特色,制定更加适宜的发展方案。

(2)实施的数据基础

由于采集的数据一般是从多个业务系统中抽取而来的,难免会出现各类数据问题,例如数据目录不标准、多源数据未能融合、数据质量无法保证、数据安全机制不全等。这些混乱、重复、错误、缺失甚至不一致的数据会严重影响决策系统的有效运行。为了解决这个问题,需要在微观上对这些“脏数据”进行清洗处理,包括对数据进行重新审查和校验删除重复信息、纠正存在的错误,并提供数据一致性。在清洗的过程中,需要根据各个部门提供的资料(如数据字典、样本数据等)分析可能存在的数据质量问题,并制定数据质量检查规则、数据清洗的内容,然后构建清洗的任务,解决可纠正的问题,标记不可纠正的问题,并汇报数据中存在的质量问题。

(3)评估的数据基础

方案执行的效果可以通过广泛地收集公众意见等方式反馈数据感知。这些数据能够及时、有效地对国家治理现代化进程进行监管。将海量碎片化且无序排列的信息变成有用、有序的数据,可以使监管更有针对性。对方案执行的每个阶段进行事中评估,及时了解进展情况,发现问题,纠正偏差,避免出现方向性错误。这需要扩展公众意见反馈渠道,使公众能够通过互联网平台等多种方式向机构、窗口部门建议和提问,使得工作透明化,调动公众参与国民经济建设的积极性。另外,这些多种渠道的数据收集并不是简单的堆积,而是需要根据数据的质量、类型、用途、领域等实施科学、有效的整理和归纳,并对公众反馈的数据严格把关,制定恰当的管理和分析体系,确保对各领域的有效评估,进一步降低治理成本,提高治理效率,从而进一步提升治理的整体效能。

数据服务

(1)方案的数据服务

方案制定过程是一种宏观规划,其充分依赖于以往决策的评价以及现有条件。方案制定过程受多方面因素影响,可能需要整合许多不同类型、不同来源甚至不同模态的数据。因此,在方案的数据服务中,多模态数据的融合与处理是一项关键技术。方案制定过程中各类影响因素之间的关系较为复杂,多种实体之间存在的推理关系可构成知识图谱。因此,方案制定过程也涉及基于知识图谱的推理问题。大数据技术为方案制定过程提供的数据服务主要包括对已有方案的效果预判、根据现有复杂影响因素自动构建知识图谱以及推理生成方案。其中涉及的关键科学问题主要包括多模态数据融合和知识图谱的构建与推理。

(2)实施的数据服务

实施是治理流程中的主体环节,是第一阶段制定的方案的执行过程,也是方案中大数据技术具体赋能治理过程的关键步骤。实施是根据方案执行的一系列步骤,是一个过程。在每个步骤中,如何对方案进行应用,并根据效果实时地对执行方案进行微调,是实施过程中遇到的主要问题。为此,需研究可解释的大数据分析技术。只有对方案中的逻辑思路有深入的了解,才能找到实施过程中出现问题的原因,更好地指导实施过程的执行。例如,大数据、人工智能技术赋能产业实施的过程中,可通过用户画像、兴趣推荐以及行为预测等方式促进各类具体金融、商务应用的实施。只有当大数据技术可解析时,才能使推荐、画像更具可信性,更能应对实施过程中出现的特殊情况。

(3)评估的数据服务

在治理流程中,评估是必不可少的一环。合理的评估机制可以形成良好的反馈环,促进产业良性增长。在大数据技术的支撑下,可构建群体化评估体系,整合用户评价大数据。在大数据赋能的数据服务层,对评估的支持具体体现在对海量评价数据的自动处理与分析方面,从而得到详实可靠的评估打分、正/负面情感倾向。此过程中包含2项关键技术:一是直接针对评估文本的自然语言处理技术,如情感分析技术等;二是针对体现评估效果的数据(如点击率、打分分值)的数据挖掘技术。数据服务层提供自动评估处理服务接口,用户可以接入并对众包的评估数据进行自动处理,快速生成业务、服务的智能评估。

数据生态

(1)方案的数据生态

方案是指从目的、要求、方式、方法、进度等方面部署具体、周密并且有很强的可操作性的计划。对于方案的数据生态来说,一个开放和共享的环境能让方案变得更加透明和可信,能够为方案的良性循环提供一个好的生态环境。在大数据的背景下,借助众包、众智等技术有利于形成透明可信的方案。另外,在方案的设计过程中会产生更多的数据,这样方案和数据生态构成了一个互动与协同的体系。

(2)实施的数据生态

实施是体现大数据价值的重要环节,实施的最终状态是一个互动协同的过程。在大数据、人工智能赋能产业的实施过程中,会不断产生各种各样的数据,如实施的结果数据、用户反馈的数据、商家/政府的数据等。这些数据能够对进一步实施产生影响。因此,实施在数据生态这一层面是互动协同的,而这一过程中得到的数据能够促进大数据产业的进一步发展和实施,实施和数据生态相互作用,共同协调发展。因此,需要循环有效地利用数据,从而促进实施的进行,大数据的有效和合理实施也能促进产生更多有价值的数据。

(3)评估的数据生态

评估是数据治理的最终环节,在数据生态层面,其应该是一个透明可信的过程。透明和可信的评估机制能够形成良好的数据生态。评估首先需要的是当前实施后的结果数据,通过对背景、规则、政策、法制等数据进行有效的整理、归纳以及分析,才能得出透明和可信的评估结果。对这些数据的整理和归纳不仅涉及多模态数据融合、数据拼图、数据对齐等技术,还涉及更复杂的数据,需要利用众包、众智等技术得出有效而公正的评估。另外,评估的结果可以对方案的设计和修正起到有效的作用,进一步对实施构成影响,从而形成一个健全的评估体系。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论