2019年,党的十九届四中全会首次将数据列入新型生产要素。在数字政府建设过程中,政务数据同样可作为面向赋能经济社会的生产要素。由政务系统所生成的各种结构性与非结构性的各类政务数据记录,已经覆盖了环保、气象、住建、公安、人社、教育以及医疗等各个民生领域,但将政务数据作为开发利用的生产要素,则需要考虑加强对数据开发、共享以及利用的管理和控制。因此,如何通过数据安全管控技术来满足数据安全合规监管,是数字政府公共数据开放共享建设中需要重点考虑的问题。
数字政府数据安全问题分析
常规数字政府政务云安全能力、安全建设思路和安全管理制度规范,普遍是以传统的、满足“以系统为核心”的安全管理需求为主,已经不能适应未来数字政府建设的目标。尤其是在构建一体化政务数据中台、基础设施共建共用、信息系统互联互通后,以数据流动为主要特征的数据安全管控需求变得尤为重要。当前的数字政府数据安全问题主要总结如下。
1.政务数据泄露问题
政务数据泄露问题是一个严重的安全挑战。基于目前的发展进程,数字政府的建设可以总结为三个阶段。
早期的阶段是建设政务数据的数字化,就是把纸质的数据变成电子的内容。该阶段考虑的是数据本身的存储和权限管理。
第二个阶段是政务数据内部的协同数字化,目的是实现政务组织内部多个团队之间的协同和跨政务体系的协同,以提升政务面向公众的办事效率,实现一个窗口办理全部流程。该阶段的安全防护更加重视应用安全和权限管理。这些协同是在互联网方面的协同,但相关风险环境并没有发生质的变化。
而当前的数字政府建设重点是实现政务决策的智能化和精细化,利用大数据分析来优化政府决策和公共服务。业务流程的线上化会直接改造个人办事流程;流程的数字化会增加大量数据接口,采集大量数据资源,传输海量敏感数据,存储和治理大量数据资源。同时,数字政府面向的数据要素市场化需要更多面向互联网进行数据开放利用,此时政务数据泄露的风险面是“无限的”。加之政务数据包含了大量敏感的政府文件和个人信息,包括政府机密文件、个人身份证号码以及银行账户信息等,一旦数据泄露,可能导致个人隐私曝光、经济受损,企业核心经营数据和商业秘密外泄等一系列风险。
2.政务数据滥用问题
政务数据滥用是指在数字政府建设中,政务数据被未经授权的人员或组织滥用,并可能导致个人隐私泄露、数据商业化以及舆情操控等问题的发生。在个人层面,政务数据滥用可能导致身份盗窃、诈骗等风险。在商业化价值层面,政务数据作为生产要素后的商业化行为,如果监管不当,可能会侵犯公民的权益和隐私。如果监管不到位,不法分子或组织会基于商业或政治意图,利用政务数据进行不当言论、操控舆情,进行非法监控和追踪等。
3.政务数据安全运营问题
在数字政府背景下,政务数据安全运营需要覆盖政务数据共享和开放场景,在保证数据安全性和合规性的前提下,建立完善的数据共享和开放机制,以促进政务数据市场化。尤其在政务数据二次开发、加工场景方面,为满足政务不同部门数据交互和公众对多样数据碰撞结果的需求,数字政府的数据安全运营应提供数据使用和加工的技术保障机制,涉及对数据共享开放的分类分级、数据加工利用的可用不可见。
数据可信计算沙箱技术概述
数据可信计算沙箱技术是隐私计算技术中的一个技术路线。隐私计算技术是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一系列信息技术,保障数据在流通与融合过程中的“可用不可见”。它是一套融合了密码学、安全硬件、数据科学、人工智能以及计算机工程等众多领域的跨学科技术体系,包含以多方安全计算、联邦学习和可信执行环境为代表的多种技术方案,能够在保障数据安全和个人隐私的前提下,实现数据价值的流通共享。数据可信计算沙箱技术提供了一种基于可信计算技术的安全隔离技术,可以在不暴露数据隐私的情况下,对数据进行计算和分析。它的主要思想是将数据和计算分离,将计算过程放在安全的隔离环境中进行,从而确保数据的安全性和隐私性。
1.技术原理
数据可信计算沙箱技术通过安全隔离技术,构建了一个可信计算的沙箱环境。根据可信执行环境的定义,一个完备的可信执行环境应能保证所执行代码的真实性,可信执行环境运行时状态的完整性,运行时代码、数据的机密性,以及提供远程证明属性。数据可信计算沙箱技术能够为数据要素流通提供环境保障,依托底层大数据计算集群,配合可信调试环境、可信计算沙箱环境、用户体系、角色权限、流程监管、数据集管理和数据安全合规审计等技术机制,结合密钥管理系统提供的统一密钥管理和全生命周期加密等服务,在保障数据安全的同时,实现数据的“可用不可见、可用不可取”,从而构建起基于基础设施、安全技术、数据监管、数据安全计算以及用户管理五个层级的技术架构体系。其中,数据可信计算沙箱技术的核心技术体现在以下三个方面。
数据可信计算平台通过数据隔离技术,主要用于隔离数据和外部环境,确保数据的安全性和隐私性。可信调试环境主要用于管理和调度数据的计算过程,确保计算过程的安全性和可控性。可信计算沙箱主要用于数据的计算和分析,从而产生有价值的结果。在该域中,需要建立可信计算沙箱环境,确保计算过程的安全性和可信度。
在整个数据可信计算沙箱技术架构体系中,数据存储在加密的基础上,还支持互相隔离。这样在面向数字政府赋能数字经济活动、对外和对内提供政务数据的场景中,能够对数据算法提供商、数据分析模型开发者的操作完全受限于调试可信沙箱环境,不能接触明文原始数据,只允许使用授权范围内的调试数据,做到了“算法与数据分离”。
2.技术特点
数据可信计算沙箱技术能够确保政务数据在共享、开发和利用环节的安全性和隐私性,数据的利用范围和级别将得到进一步延伸和扩大,从而为数字政府面向数据要素市场化赋能提供强有力的技术保障手段。数据可信计算沙箱的技术特点主要总结如下。
(1)数据计算的安全性
在数据计算的安全性方面,数据可信计算平台利用数据隔离技术,能够保证存储数据在加密的同时,还支持互相隔离,有效保障用户的数据隐私不受侵犯。有关数据的操作都在可信的沙箱环境中完成,减少了数据被篡改或非法访问的风险。
(2)密钥技术应用
采用独立的密钥管理体系,包含加密密钥生成、分配、备份和恢复。加密的密钥统一由主密钥进行保护。主密钥由密钥管理系统产生并管理,以此确保主密钥安全。为数据可信计算沙箱中的数据合约参与方提供私钥,私钥的获取方式可通过平台分发和参与方自行生成后,注册至数据可信计算沙箱的用户管理层。而私钥由参与方自行保管,从而保障了私钥的安全性。在数据集的上传、计算和结果下载过程中,均有密钥体系参与,该体系提供了端到端的数据加密能力。
(3)数据审核授权管理
通过用户体系及权限管理,能够对数据开展所有权和使用权的界定。数据的所有权应当归属数据提供方或生产方,得到授权的用户方可拥有数据的使用权。通过细粒度数据授权控制、全局态势、数据合约管理以及计算结果管理等,实现数据所有权和使用权分离。当数据被第三方使用时,保障数据拥有者具备知情和拒绝的权利,让参与各方都可以安全、便捷、灵活地进行数据共享和交换,保障数据安全和隐私。
(4)全流程行为溯源
通过对数据可信计算沙箱安全技术层的赋能,能够实现数据全流程行为溯源,对数据在整个生命周期中的各个环节和操作进行跟踪和记录,以便追溯和分析数据的来源、传输、处理和使用的情况。同时,该技术还能够提供数据脱敏、水印的数据安全能力,更加有利于数据提供方面向不同场景开展数据共享。
数据可信计算沙箱技术的应用场景
数据可信计算沙箱技术对于促进数据高效流通使用、赋能实体经济,具有重要的技术应用价值。数字政府通过一体化政务服务平台建设,能够形成统一数据汇聚平台和数据开放发布平台。数据可信计算沙箱技术可在政务数据发布和数据对外服务侧,实现数据在加工过程中的“可用不可见”,既能够满足敏感数据不可见的合规性,又能够满足数据对外的高价值服务。数据可信计算沙箱技术的具体应用场景如下。
1.大数据交易中心场景
政府建设的大数据交易中心场景的核心使命是促进数据要素市场化流通。大数据交易中心作为数据交易双方信赖的平台,通过建立的数字经济数据市场平台,可对外提供数据可信计算沙箱的服务工具。各个数据提供方可以将自己的数据放入数据可信计算沙箱中进行加工和处理,确保了数据交易各方的数据安全性和隐私性。同时,大数据交易中心为数据购买方提供可信的数据服务,促进数据交易和数据共享,更有利于推动数据场景多样化的创新发展。
2.金融风控场景
通过建设数据可信计算沙箱平台,能够在满足数据源合规的同时,开展与社保、医保、工商、人社、银行以及保险公司的合作,共享围绕客户画像的信用评估数据。各部门和机构将自己的客户数据放入可信计算沙箱中进行加工和分析,以评估客户的风险水平和信用价值。沙箱技术保证了数据的隐私和安全,同时提供可信的数据分析结果,促进政务数据与企业数据融合碰撞,帮助金融机构做出准确的风险决策,降低贷款和保险业务的风险。
3.智慧医疗场景
医疗数据属于高敏感的数据类型。在智慧医疗方面,通过数据可信计算沙箱技术,可以开展场景探索,聚合医保、医院以及医疗科研机构的患者健康数据。在敏感数据方面,通过数据可信计算沙箱技术,对数据进行数据脱敏处理,以保护患者的隐私。医疗科研机构可以共享特定的健康数据,如购药记录、疾病诊断和治疗效果等,为研究机构和医疗科技公司提供有价值的数据支持,从而加速智慧医疗服务和医疗科研的发展,提高医疗服务的质量和效率。
4.智慧交通场景
在智慧交通场景中,利用数据可信计算沙箱技术,可以将交通部门、出租车公司以及网约车平台的交通数据进行集成和分析。数据可信计算沙箱技术保证了各方数据的隐私和安全,通过分析交通数据,可以输出实时的交通拥堵状况,开展出行预测和优化交通路线等服务,从而提高城市交通效率,减少拥堵,优化城市规划。
结语
在数字政府的背景下,数据可信计算沙箱技术作为一种保障政务数据安全流通、赋能实体经济关键的技术路线,通过对相关场景应用的不断创新建设和深化发展,围绕业务场景,不断克服挑战并完善技术与实践,加之政府的政策引导和标准制定,能够促进政务数据流通的标准化和产业化,进一步推动数据可信计算沙箱技术的提升和发展。这对于解决数据安全和推动数字政府赋能数据要素市场发展,具有重要意义。
来源:《网络安全和信息化》杂志
作者:全国海关信息中心 刘鲲 王羽赫
(本文不涉密)