据外媒报道,人工智能(AI)技术生成的音乐会给人以非常奇妙的体验,这其中有两个原因:第一,这是个非常吸引人的全新领域;第二,我们真的不知道它会走向何方。然而,AI技术实际上在音乐和商业上的应用都很有趣。
由诸多硅谷大亨联合建立的AI非营利组织OpenAI,通过平克·弗洛伊德(Pink Floyd)、埃拉·菲茨杰拉德(Ella Fitzgerald)、2Pac等风格的歌曲创作,揭示了AI在音乐领域的全新应用,结果令人惊叹。只是,有时候这些曲目听起来很像许多流行音乐的醉酒卡拉OK版本。
OpenAI最近刚刚发布了音乐生成系统Jukebox,并在博客文章和论文中详细介绍了该系统。该组织网站上称,Jukebox是个神经网络系统,可以生成各种流派和艺术家风格的原始音频。
OpenAI还发布了Jukebox背后的代码,以及一个用于探索生成音乐示例的工具。该组织承诺提供12分钟的阅读时间和10天的收听时间。这是一笔不错的交易。
Jukebox背后的科学非常有趣。为了实现上述目标,研究人员使用原始音频来训练模型,作为回报,模型也会生成原始音频。为了让该系统发挥作用,研究人员首先使用卷积神经网络对原始音频进行编码和压缩。
在那之后,他们使用所谓的变压器来生成新的压缩音频,然后对其进行上采样,将其转换回原始音频。通过这样的做法,神经网络会生成以前不存在的新歌曲。
通过流派、艺术家和歌词作为输入,Jukebox能够输出从零开始创作的新音乐样本。举例来说,如果你选择了经典曲目《Never Gonna Give You Up》,Jukebox就会试图不断地生成更多类似风格的歌曲。
通过Jukebox Sample Explorer,我们可以浏览来自众多艺术家的近8000首生成的曲目,这其中包括器乐和歌词。如果有人已经听厌了自己最喜欢的艺术家的所有歌曲,这对我们来说可能是一座新的“金矿”。
OpenAI团队继续致力于根据不同类型的启动信息,如MIDI文件和STEM文件来生成音频样本。通过这种方式,他们认为自己将能够让音乐家对未来几代人有更大影响力。这可能是一次会永远改变音乐文化的尝试。