AI工具描绘了一首歌的流派并提供有关感知音乐的见解
辩论最终可以得到解决--Lil Nas X的创纪录,排名榜首的“老城路”确实是国家。但它也是一个小摇滚乐。当你一起分析歌词和和弦时,它会直接弹出。
至少,这是根据USC计算机科学博士生Timothy Greer开发的人工智能工具。格里尔的方法通过分析歌曲和和弦在整首歌曲中彼此之间的互动方式,自动预测音乐类型。
该方法根据歌词将“老城路”划分为国家;根据和弦摇滚(基于Nine Inch Nails音乐样本);并根据和弦和歌词组合而成。
这篇题为“在音乐中使用音乐中的单词和和弦的共享矢量表示进行类型分类”的论文将于9月14日的Speech,Music and Mind 2019会议上发表。
非常人性化的经历“Old Town Road是一首有趣的歌曲,”Greer说,他是一位终身音乐家,目前在洛杉矶的乐队(音乐类型:独立摇滚乐队)演奏萨克斯管和键盘。
“歌词沉浸在乡村音乐中,但和弦和乐器听起来并不像乡村音乐。算法突出了音乐的复杂性,无论是音乐的构建方式还是音乐的感知方式,在其他方面都是如此。言语,人们如何处理它。“
音乐研究中的这种努力 - 通过计算理解我们讲述的故事,以及人们如何体验并受其影响 - 是南加州大学信号分析与解释实验室(SAIL)计算媒体智能研究项目的一部分。 (帆)。
“音乐建构和感知是相关的,但它们不是同一个,”格里尔的主管和论文的共同作者Shrikanth Narayanan说。
NaILanan,SAIL主任,Niki和Max Nikias主席兼电子和计算机工程教授,之前曾使用MRI扫描分析了beatboxers和歌剧演唱者的声音模式,使用电影脚本预测了暴力评级,并开发了使用语音评估演讲者情绪的技术。他说他对这项新研究很兴奋,因为它是一种计算分析音乐的新方法,可以揭示出意想不到的模式。
“我们总是说人类的音乐体验没有硬性规则,”纳拉亚南说,他是一位演奏印度弦乐器和小提琴的古典音乐爱好者。“人工智能和机器学习可以提供一个镜头,从中可以看到这种非常人性化的体验。”
一个新的声音
“老城路”现在已经位居榜首,为期18周,因其流派混合特征而备受瞩目。作为今年夏天流行音乐界最激烈争论的话题之一,每个人似乎都有不同的看法 - 是国家,流行,摇滚?还是别的什么?
根据Billboard的一项声明,2019年4月,这首歌被从Billboard Hot Country图表中删除,因为它“没有包含当今乡村音乐的足够元素来绘制当前版本”。
格里尔用他开发的三种模型预测流派来测试这首歌:仅使用和弦嵌入,只使用歌词嵌入并使用和弦和歌词嵌入相结合。他使用歌词和相应的和弦,在5,304首流行歌曲的190,165个音乐片段的数据集上训练系统。
虽然大多数类型预测工具使用歌曲的整个音频文件,这意味着检索和处理高质量的录音,但Greer的方法可以仅使用和弦和歌词对流派进行分类,这些和弦和歌词通常可以通过快速Google搜索在线获得。
“和弦序列和抒情序列之间的这种相互作用可以让我们更好地了解我们如何看待类型,而不是单独使用它们,尽管这两种形式都包含有用的信息,”格里尔说。