本文来自微信公众号“元力社”,编辑丨珍妮。
目前为止,元宇宙项目一直处于动荡且不稳定的态势。而小语种技术的发展是一个例外。谷歌、NVIDIA和Meta本身在内的公司正在致力于使用人工智能进行语音到语音(S2S)翻译来缩小小语种技术差距。
元宇宙是一个共享虚拟/数字世界,人们可以通过VR/AR头显进行访问参观、与虚拟环境进行互动以及结识其他人。这个空间完全是虚拟的,就像互联网一样,它没有边界。所以,如果说不同语言的人见面,他们将无法相互交谈。
到目前为止,大型科技巨头一直专注于开发翻译更多语言的技术,不仅开发了算法,而且试图将这些原则简单地应用于所有其他语言。这对于大语言使用者来说是一个很好的体验,但是当用户开始将小语言添加到组合中时,翻译准确性会急剧下降。这导致小语种使用者在技术产品的可用性方面存在差异。例如,Siri不会说拉脱维亚语。语言技术发展需要更长的时间才能适用于小语种使用者。
但这种情况将会在元宇宙发生改变。由于采用元宇宙空间的关键要求之一是消除语言障碍,因此相关方(即最有可能建立元宇宙和/或从中受益的各方)便产生了动力来解决这个问题。
出于这个原因,谷歌、Meta和NVIDIA都宣布计划开发支持S2S翻译中的小语种技术。此前,谷歌宣布推出用于文档翻译的翻译中心,以及人工智能驱动的通用语音模型。Meta还宣布了一款通用语音翻译器(UST),它可以处理书面和非书面语。NVIDIA迅速发布了自己的设备语音AI生态系统,以加速自动语音识别模型的发展。
几十年来,小语种一直被科技巨头所忽视。为了满足这些社区的需求,Tilde在十年的大部分时间里一直致力于开发基于人工智能的语音和翻译技术。不仅如此,他们还在WMT竞赛(有点像机器翻译奥运会)中击败了所有其他机器翻译供应商,在“小语言”类别中展示了更高水平的精度。
Tilde表示,谷歌和其他公司首先专注于大语言,然后尝试将这些算法应用于小语言之上。这不能有效地工作。相反,我们所做的是从复杂的语言开始,这需要一种不同的方法来训练AI。在英语中,只有500k-700k可能的单词形式。而在拉脱维亚语中,用户有超过2200万种可能的单词形式。使用这些方法,我们可以成功地将人工智能应用于其他语言,如爱沙尼亚语和芬兰语。Tilde的AI已经被集成到微软的产品中,也成为芬兰总理办公室的官方翻译工具。
在考虑元宇宙时,假设他们的服务条款可以访问这些数据,每个口语都会成为由提供翻译引擎的人处理的数据。那么我们是否想把每一个在元宇宙中的口语都交到那些在数据管理方面声誉不佳的公司手中?
总而言之,元宇宙不可避免的发展似乎正在推动人们对小语言技术的兴趣。虽然我们不知道在VR中未来的生活会怎样,但我们确实知道我们之间的交流肯定会变得更容易一些。