首例虚拟数字人侵权案判决!数字人面临的挑战及发展趋势

李弯弯
如今数字人在人们生活中的应用已经非常普遍,而且随着技术的更加成熟,虚拟数字人的能力越来越强,尤其是近年来备受关注的大语言模型,也逐渐与数字人进行很好的结合,数字人也更能像真人一样进行互动,未来它的应用也将会更加普遍。不过,同时数字人的发展也面临诸多问题,比如文章提到的侵权、隐私等问题,这些都需要逐步去进行规范。

本文来自电子发烧友网,作者/李弯弯。

近年来,越来越多的数字人出现在各大电商平台的直播间,他们超写真的形象不仅让观众很有代入感,而且这些主播还能24小时直播带货、帮助客户解答疑问等。据统计,目前我国各大网络平台上有超过5000万个虚拟数字人的主播账号,相关的市场规模已经达到一百余亿元,周边市场更是超过了千亿元的量级。

然而随着市场规模的不断发展扩大,相关的纠纷也随之而来。全国首例涉“虚拟数字人”侵权案近日二审宣判引发社会关注。业界人士认为,虚拟数字人作为新兴业态,首例虚拟数字人侵权案的判决对我们虚拟数字人产业的后续发展有很好的规范意义。

虚拟数字人发展过程中面临的挑战

数字人技术作为一种前沿的人工智能应用,通过人物形象模拟、声音克隆、语言处理等先进技术创造出高度逼真的数字人形象。有效的为企业提供更高效、便捷和个性化的客户服务,助力企业降本增效、推动产业数智化发展。

调研机构数据显示,2023年中国企业使用数字人首要目的是提升工作效率、质量,占比为57.6%,其次是提升企业数字化程度(47.6%)和提升企业形象(40.9%)。目前,虚拟数字人在影音娱乐、电商带货、虚拟社交等行业领域广泛应用。

上海魔珐公司成立于2018年初,公司全栈自研了智能化工业化虚拟内容制作核心技术、虚拟直播核心技术及AI虚拟人核心技术。2019年10月,该公司通过公开活动发布了数字人Ada并于同年10月、11月通过某网络平台发布了两段视频。2022年7月,杭州某网络公司未经授权发布了两段含有Ada的视频画面。

上海魔珐公司认为,杭州某网络公司在未经授权的情况下传播使用该虚拟数字人,侵害了他们的美术作品、视听作品的信息网络传播权,以及侵害了录像制作者及录像制品中表演者的信息网络传播权。因此将杭州某网络公司起诉至杭州互联网法院。

上海魔珐公司表示,超写实虚拟数字人Ada的制作需要应用人工智能表演动画技术、超写实角色智能建模与绑定技术等,是他们投入大量时间和精力产生的作品,理应受到法律保护。而杭州某网络公司则认为,虚拟数字人形象不属于美术作品,原告不享有相关作品著作权。

杭州互联网法院案件审判长官家辉认为,虚拟数字人的形象是有一定的美感的,它是开发者用虚拟美化的手法,利用线条色彩对形象设计的独创性的表达,因此它构成美术作品,另外承载这个虚拟数字人形象的视频,它是构成视听作品和录像制品的。当然这个相关的权利,也就是包括一些财产性的权利和录像制作者权是归属于原告。

近几年虽然虚拟数字人迅速发展,然而仍然存在很多问题值得关注,除了上述提到的,著作权纠纷问题外,在技术、应用、隐私安全各方面都还有待优化。如,技术成熟度还不足,同时虚拟数字人的制作成本较高,需要投入大量的人力和物力资源。

此外,虚拟数字人技术也会涉及到用户的个人信息和隐私数据,如果数据保护措施不到位,可能会导致用户隐私泄露和安全问题;还有一个就是数字人目前的商业模式还有待优化,从目前的情况来看,数字人应用多集中在直播场所中,竞争激烈,创新不够。总体而言,虚拟数字人还面临很多问题,接下来还需要不断加强技术研发、应用探索。

虚拟数字人的核心技术和发展趋势

虚拟数字人的制作流程涵盖了诸多技术,包括建模设计技术、动捕驱动技术和实时渲染技术。这些技术仍在逐步进化中,存在某些步骤互相融合的趋势。

首先是建模,明确形象设计方向,根据平面形象和三视图,进行模型搭建。人物建模的主流技术仍为静态扫描,但具有高视觉保真度的动态光场三维重建技术成为未来重点发展方向。

接着,通过捕捉技术采集真人演员的动作和面部表情数据,之后将这些数据迁移合成到虚拟数字人身上。动作捕捉方案是目前3D数字人动作生成的核心技术,最高可实现毫米级误差。

将场景、人物、角色、特效以及配音进行后期合成,最后渲染成片。PBR渲染技术的进步以及重光照等新型渲染技术的出现使虚拟数字人皮肤纹理变得真实,突破恐怖谷效应。

不少案例显示,随着人工智能、语音识别、图像识别等技术的不断发展,虚拟数字人的交互能力和形象逼真度正在不断提高。尤其是2023年来,大语言模型席卷全球,业界积极探索将大模型与数字人技术相结合,接入大模型的数字人很好改善了之前数字人存在的表情僵硬、语言呆板、交互能力不强等问题。

大语言模型接入虚拟数字人的技术原理主要是自然语言处理技术。自然语言处理技术是用来理解和处理人类语言的技术,包括语音识别、文本分析、语言生成等。通过自然语言处理技术,虚拟数字人可以识别用户的语言输入,并将其转换为计算机可以理解的形式。

如,基于360自研大模型“智脑”构建的360 AI数字人具有记忆、有人设和性格,能够复刻思维方式和人生经历,可生成内容并与人类实时智能互动。此前在某人工智能展会上,有工作人员告诉电子发烧友网,之前数字人直播基本难以做到现场互动,而通过接通大模型后,数字人就能够实时回答现场用户提出的部分问题,实现更好的交互效果。

而且,大模型与数字人的结合在边缘侧也开始有落地案例,近日电子发烧友采访到某AI边缘计算机厂商,他们已经为一家医院部署了边缘侧的大模型结合数字人的方案,这样的数字人基本能回答患者提出的问题,并生成电子病历,提交给医生,大大提高就诊效率。

写在最后

如今数字人在人们生活中的应用已经非常普遍,而且随着技术的更加成熟,虚拟数字人的能力越来越强,尤其是近年来备受关注的大语言模型,也逐渐与数字人进行很好的结合,数字人也更能像真人一样进行互动,未来它的应用也将会更加普遍。不过,同时数字人的发展也面临诸多问题,比如文章提到的侵权、隐私等问题,这些都需要逐步去进行规范。

THEEND

最新评论(评论仅代表用户观点)

更多
暂无评论