本文来自数据猿,作者/威化化。
随着《数据安全法》和《个人信息保护法》的陆续出台,国内对数据分级分类管理、数据安全保护等要求逐渐上升至新台阶。而雏形阶段的Web3.0,其去中心化、链上数据可查等核心属性亦需得到隐私保护。
在此背景之下,以隐私计算为代表的数据流通关键技术迅速发展,为数据要素安全、合规、有序流通交易提供了技术支撑。
作为释放数据价值的新兴技术,隐私计算相关技术虽已得到理论层面的证明,但实际应用落地仍需融合不同技术流派,甚至需要结合区块链、AI等技术,这导致当下技术路线分支众多,隐私计算的商业化落地尚处起步阶段。在实际应用场景中,隐私计算虽能实现“数据可用不可见”,但也存在着诸如“计算孤岛”、“数据投毒”等诸多挑战。
面对行业的诸多问题,具备较强技术实力的隐私计算厂商,则是破局的关键。由浙江大学人工智能研究所和浙江大学金融科技研究院联合孵化的金智塔科技,便是这样一位具备深厚技术积累的“学院派”玩家。
近日,数据猿采访到了金智塔CTO陈超超,探讨隐私计算企业如何考量、选取技术路径,以及如何面对市场共性问题、行业该如何破局等命题。
融合多项技术,打造适配多样应用场景的隐私计算平台
目前,隐私计算行业存在着多方安全计算、联邦学习、可信执行环境、差分隐私等多种技术方向。陈超超认为,不同技术路径各有优劣。以可信执行环境为例,主要通过预设软硬件工作方式,构建出不受平台、第三方影响的可信计算环境。该技术方案虽具备高精度、高安全性等特点,但却高度依赖第三方环境,在场景化方面存在限制。
因此,不同的技术方案适用不同的业务场景。“对安全性要求较高的金融场景,我们推荐多方安全计算方案,而一些对数据安全要求相对较低、数据量大的智能营销类场景,联邦学习方案则更适配此类需求。”陈超超介绍道。
有没有适用性更广的技术方案呢?在技术路径层面,金智塔将多方安全计算、联邦学习、差分隐私等多种技术融合至统一架构,从而更全面地适配应用场景。
此外,金智塔隐私计算平台还融合了数字水印、区块链等多项技术,并具备数据鉴权、追溯、审计等多重能力,帮助客户打通数据孤岛,激发数据价值。
金智塔隐私计算平台实施流程图
据陈超超介绍,金智塔隐私计算平台具备四大特点,即高安全、高性能、高扩展、强互通:
高安全,金智塔采用多种技术对数据使用的全链路进行安全防护,为安全性提供了深度保障;
高性能,金智塔所采用的分层设计理念,可针对不同的业务场景及环境设置进行深入的定制与优化,以此保证性能层面的稳定;
高扩展,金智塔隐私计算平台采用全对称的分布式架构,可随时根据需求增添、减少子节点,以满足不同客户不同业务的需求;
强互通,针对“计算孤岛”问题,金智塔开放了系统层接口,并支持与不同隐私计算平台的互联互通。
此外,对于隐私计算具体应用过程中的问题,金智塔亦以技术创新予以应对。以“数据投毒”为例,攻击者往往会将“脏数据”施以伪装混淆入正常数据中,污染正常的深度学习模型。
对此,陈超超指出,数据投毒其实是众多攻击、防御问题中的一类,这方面金智塔具有一系列检测及防御机制。
“我们一直联合高校等科研机构探索前沿技术,对数据投毒的检测及防御机制便是其中一项。为了解决“数据投毒”问题,我们会对数据源进行鉴别,以此确认数据质量。”陈超超解释道。
“以联邦学习模型为例,如果某个参与方模型同全局模型均值偏差较大,便能以此推算出其是否存在问题。在安全机制加持下,不论是针对数据源的数据投毒,还是针对模型的注入攻击手段,都会有相应技术予以保障。”
除了隐私计算不同技术方案的融合发展,业界也涌现出诸多“AI+隐私计算”的融合方案,以及隐私计算芯片/一体机等软硬件结合的技术方案。陈超超指出,由于背靠浙江大学人工智能研究所,金智塔AI方面能力尤为突出,已然跑在了行业的前列。
金智塔的技术应用具有前沿性,而就像陈超超所解释那番,金智塔前沿性技术创新,同其背后的产学研用路径高度相关。
构建产学研用价值闭环,持续引领隐私计算技术前沿
在陈超超看来,目前隐私计算赛道正处于急速上升阶段,但因其尚属新兴赛道,市场亦尚未成熟,技术、场景等各方面均有着很多不确定性。
如何应对赛道的不确定性,陈超超给出的回答是:将技术研发跑在应用之前。“金智塔团队拥有强大的科研基因,一直在布局超前的技术研究。”
以异构数据的存储与交换为例,金智塔已然拿出了一套完备的技术解决方案,但据陈超超透露,目前客户企业所要求的多为基础性需求,场景端遇到的异构数据存储和计算这类的复杂性需求相对较少。纵使如此,金智塔还是将这类复杂性应用置入标准化产品中,走在客户需求的前面。
金智塔之所以全力探索前沿技术,一方面是为了推出领先市场的隐私计算平台产品,另一方面也是其产学研用一体化发展路径的自然结果。
“并非每一项看似先进、超前的技术都能用于实践中,所以尝试必不可少。我们的研发团队大多有着高校学术背景,在学术界、产业界均拥有丰富的资源,合作开展前沿技术探索更像是水到渠成的事。”陈超超解释道。
陈超超告诉数据猿,目前金智塔已与众多高校达成合作,共同承担国家及省部级科研课题。在与高校的合作过程中,金智塔的资金与产业资源能为高校人才的学术研究提供支持,而高校研究成果亦能推动金智塔的技术产品研发,这就构成了一个正向的产学研用价值闭环。
金智塔通过同浙江大学等高校以及国家研发机构的合作,不仅实现了人才培养及价值循环,亦通过多项政府牵头的科研项目积累了较为深厚的政府资源。
作为国内最早一批自研国产隐私计算平台的厂商,金智塔早在2018年便参与了国家重点研发项目“大数据征信及智能评估技术”,负责互联网征信大数据流通环节的隐私计算支撑平台研发,专攻“安全、实时、高性能征信大数据关键技术研究及平台研制”课题,并实现了数据质量审查、数据分级分类、基于多方安全计算和安全联邦学习的隐私计算等一系列原创研发。
此后数年间,金智塔先后承担了10多项国家、省部级科研项目。作为脱胎于国家重点研发项目的隐私计算公司,金智塔取得了多项突出成就,具体包括:全面布局隐私计算行业和应用专利,并获得40余项发明专利和软著;深度参与国标、行标制定,参编由科技部、工信部中国信通院等权威机构组织的各项标准40余项;多项创新成果发表在NeurIPS、WWW、TDSC、IJCAI等国际顶级会议和期刊上;创新科研成果先后于2020年和2021年被中国人工智能学会李德毅院士、潘云鹤院士等专家鉴定为世界先进或国际领先水平,全项通过国家金融科技测评中心认证,全面符合央行对金融科技的要求;在中国信通院组织的性能、功能、安全评测中,多项指标名列行业第一。
技术领域的研究,终将实现商业落地。据陈超超透露,在这场寻求商业化落地的旅途中,金智塔为自身锚定了三大应用领域,金融、政务和企业。
瞄准金融、政务、企业场景,不断拓展隐私计算的应用边界
数字化时代,数据成为重要的生产要素,尤其是在金融领域,数据更是数字化经营和风险控制的关键。在此过程中,为创造业务价值,金融机构往往会采用多维度数据,并引入大量外部数据对服务对象的商业信誉、安全风险等予以验证。
然而,在数据隐私保护的背景下,金融行业既往的打法暴露出极大的数据安全风险,金融行业现阶段面临着合规环境下“数据孤岛”的挑战。
以信贷场景为例,面对规模较小、资产不足、信息分散的中小微企业,金融机构很难在征信数据不够丰富全面的情况下精准授信,而“重技术、轻资产”的科创型企业亦属难以鉴定行列,金融机构信贷工作自然面临着重重挑战。
据陈超超介绍,为解决科创企业的授信难题,金智塔自主研发了以企业生命周期模型、企业成长力模型、知识产权估价模型为核心的授信模型,专用于金融机构对科创企业的智能授信。
金智塔隐私计算平台智能授信模型
以某商业银行客户为例,基于金智塔隐私计算平台,研发了面向小微、科创企业的科创贷平台,融合政府部门开放数据、行内数据、第三方商业数据,通过隐私计算解决数据孤岛和用户隐私保护难题,从而实现企业智能分类、多维度建模、智能化授信等场景应用。
金智塔隐私计算平台智能授信业务场景图
截至目前,科创贷平台有效解决某区12.8万家小微、科创企业的在线智能授信问题,授信准确率从82%提升到93%以上,帮助企业降低50%以上融资成本,助力政府扶持小微企业、服务实体经济。
除金融行业外,新型数字政府建设同样面临着数据开放和隐私保护之间难以两全的局面,无论是内部跨部门、跨层级、跨地区的数据流动,还是政府内外部的数据共享,均面临着数据安全方面的压力。同时,政府由于其性质的特殊性,掌握着较多高质量数据,政务系统用户基数大、并发量高,对软硬件性能、稳定性均提出了更高的要求。
为此,金智塔通过多方安全计算、联邦学习、同态加密、差分隐私、数字水印、区块链、数据脱敏等技术,为政务客户提供基层数据共享、联合查询、联合建模、联合统计等服务;以数据授权审批保证数据用途安全可控;并提供存证审计功能,实现数据使用可查可溯源。
以金智塔与浙江省某厅级单位合作的项目为例,作为浙江省内首个厅级政务数据隐私计算平台,其实现了对企业经营状态的智能判断,提高了数据的可靠性和审核效率,审核准确率从85%提高到99%,工作效率更是提升超500%,有效助力政府精准施政。
陈超超指出,针对政务场景,金智塔已然建立起数据分类分级、安全管控制度。未来,金智塔会助力更多政务相关场景的大数据建设,在保障数据安全、保护数据隐私的前提下,促进政企数据的融合应用,推动数字经济的创新发展。
除此之外,数字化浪潮为一众企业带来了海量极富价值的数据,但“数据孤岛”却限制了企业内外部数据价值的流通与共享。以零售业为例,目前零售品牌在线下扩张过程中往往会面临城市覆盖面有限、成本高、周期长、调研数据维度不足等问题。为此,金智塔针对性地推出“金智塔智能选址平台”,通过融合企业内部、移动运营商、银联、高德、政府统计等多方数据,实现零售门店的智能选址和销售预测,合法合规的解决了零售企业营销方面的主要问题。
市场的发展,往往是需求和供给双轮驱动的。一方面,隐私计算市场需求快速增长。据毕马威《2021隐私计算行业研究报告》显示,在大数据融合应用和隐私保护的双重需求驱动下,国内隐私计算市场将快速发展,三年后技术服务营收有望触达100亿至200亿元空间,甚至将撬动千亿级数据平台运营收入空间;另一方面,国内涌现出不少像金智塔这样具备较强技术实力和优质服务能力的隐私计算厂商,推动着隐私计算供给侧的持续进化。可以预见,未来几年我国隐私计算产业将迎来一段高速增长的黄金发展时期。