ChatGPT应用爆火 如何在AIGC时代守护数据安全?

数秦科技
GTML-Lab
在AIGC创作进行的如火如荼的同时,也引发了人们对数据隐私及安全问题的担忧。事实上,AIGC的发展离不开对海量数据的训练,数据合规与数据确权是这类平台面临的一大挑战,而目前也没有相关法规对其进行规范。

本文来自数秦科技,部分内容来源于GTML数据可信学习 ,作者GTML-Lab。

思考

AIGC

以ChatGPT为代表的一系列AIGC(Artificial Intelligence Generated Content,人工智能生成内容)相关工具得到了广泛的应用。人们利用这些应用生成文字、图片甚至音视频等,极大地丰富了内容创作的选择。

在AIGC创作进行的如火如荼的同时,也引发了人们对数据隐私及安全问题的担忧。事实上,AIGC的发展离不开对海量数据的训练,数据合规与数据确权是这类平台面临的一大挑战,而目前也没有相关法规对其进行规范。

如何保护用户数据的隐私?如何确保AIGC模型的安全?隐私计算与区块链技术正在提供解决这些问题的可能。

AIGC中的数据安全问题引发大量关注

互联网中的内容创作经历了PGC(Professionally generated Content,专业生成内容)、UGC(User-generated Content,用户生成内容)和AIGC(AI-generated Content,人工智能生成内容)等阶段。作为内容创作的全新方式。

作为AI的最新发展成果,AIGC具有高效性、创造性、多样性、通用性等特点,然而这些特点也依赖于对大量已有数据进行学习和模式识别,带来了数据非法获取、数据泄露及恶意滥用等数据安全问题。

360截图16251112669372.png

首先,AIGC模型可能采用用户数据作为训练数据。例如,ChatGPT不设限爬取、采集重要媒体、电商等平台中的数据、用户行为轨迹等信息,其中可能包含相关的敏感信息;在应用ChatGPT进行双向互动请求过程中,会被要求输入个人敏感信息、业务数据或涉及商业秘密等内容,加剧了数据泄露的风险。这些问题都引起了人们对用户数据隐私的极大关注。

其次,AIGC模型生成的内容难以控制,其中可能包含伪造和欺骗性的内容,会给用户带来不正确的引导,甚至输出歧视性和有偏见的内容,可能会造成不良的社会影响。此外,并非所有的AIGC用户都是善意的,AIGC模型本身可能会受到恶意用户的攻击,从而进一步威胁到AIGC的隐私和安全。

解决之策:技术力量守护AIGC数据安全

如何解决上述AIGC面临的隐私与安全问题?从技术探索的角度可以得到答案:隐私计算与区块链等新兴技术,可以与AIGC相结合。

360截图16251112669372.png

图:现有的隐私计算和区块链等技术能应对AIGC面临的数据安全挑战

如联邦学习可以被用来在移动设备上进行模型微调和推理,以满足保护隐私的要求。联邦学习在训练期间不传输原始数据,而是传输本地模型,这可以为AIGC网络的运行提供隐私和安全的保证。而基于分布式账本技术的区块链可以用来探索一个安全可靠的AIGC服务供应框架,记录资源和服务交易,鼓励节点之间的数据联网服务,记录资源和服务交易,鼓励节点之间的数据共享,并形成一个值得信赖的AIGC生态系统。

同时,区块链技术还能够保护AIGC的知识产权问题。运用区块链技术搭建的知识产权数字平台,有助于形成一个高效可靠、安全透明的全新知识产权保护体系。此前浙江省应用区块链技术,推出了针对数据知识产权保护的登记平台。在该平台,申请人提出经区块链存证或数据保全公证后,对数据知识产权进行登记,颁发登记证书,可用于数据流通交易、收益分配和权益保护。

其中,在首批入驻的9个平台中,其中4个均为全流程可信数据技术与服务提供商数秦科技打造。数秦科技相关负责人表示:“平台通过对依法收集、经过一定算法加工、具有实用价值和智力成果属性的数据相关知识产权进行保护,从而推动数据的创新利用和价值实现。”此外,数据版权保护的完善还能应对社交网络中的AIGC溯源,对推动数据安全应用具备巨大的价值。

360截图16251112669372.png

图:版权保护机制使得AIGC在社交网络中得以被溯源

AIGC未来仍面临大量挑战需冶金进一步思考未来发展

虽然隐私计算及区块链已经成为解决AIGC问题的关键答案,大量的挑战仍需要业界进一步思考:

01

在高风险场景中的应用:如AIGC在医疗、金融、自动驾驶等高风险场景中的应用,目前AIGC更多地服务于容错率较高的领域,对上述关乎用户生命安全的领域中应用很不成熟,要把AIGC的安全性提高到用户可以放心使用的水平,仍有一段很长的路要走。

02

AIGC的时效性:为了确保AIGC准确反映社会现状,其训练数据必须定期更新。这也可以防止AIGC的信息滞后,给使用者带来不必要的麻烦。例如目前GPT-3.5的训练数据截止到2021年9月。如何持续更新AIGC模型,也是确保AIGC内容安全的一个重要挑战。

03

AIGC与各新兴领域的交叉与融合:近年来,元宇宙(Metaverse)和Web3.0等新兴概念接踵而至,如今AIGC的火热又会为这些领域注入新的活力,但也会带来新的挑战。如何保证AIGC在新兴领域的合理运用,也是一个值得思考的问题。

当下的AIGC发展就好比一个潘多拉魔盒:打开魔盒,各种眼花缭乱的新鲜事物呈现在人们的眼前,给人们带来了无限遐想;另一方面,魔盒里光怪陆离的场景又可能在无形间对人类社会带来难以预料的威胁。应对生成式模型的隐私挑战,人类还有很长一段路要走;守护AIGC中的数据安全,也是所有研究者的共同责任。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论