视觉语音分离模型,解决“鸡尾酒会效应”
如何在酒会上分辨出特定人物的声音?这对于我们人类来说十分简单,但当许多的声音交叠在一起时,常让AI错手不及。那如果攻破了“鸡尾酒会”难题,人声分离给生活带来了哪些改变?试想一下,在一个嘈杂的鸡尾酒会上,同时存在着许多不同的声源:多个人同时说话的声音、餐具的碰撞声、音乐声等等。如何在酒会上分辨出特定人物的声音?这对于我们人类来说十分简单。但对于计算机来说,要把一个音频信号分割
技术开发
2018年04月23日