所在位置:
首页 >
营销资讯 >
行业动态 > AI啸叫检测领域在全球范围内首个公开发表的研究成果
AI啸叫检测领域在全球范围内首个公开发表的研究成果
时间:2022-04-26 22:33:01 | 来源:行业动态
时间:2022-04-26 22:33:01 来源:行业动态
。
当扬声器和话筒之间的声学耦合产生正反馈时,啸叫便会产生。传统的公共广播系统和助听器设备利用传统的啸叫功能检测和抑制啸叫。然而,实时通信(RTC)中的传统啸叫功能会受到非线性和不确定性的影响,如各种扬声器/麦克风响应、多种非线性音频处理、不稳定的网络传输抖动、声学路径变化和环境影响等。在啸叫检测中,使用特定时间-频率特征的信号处理方法对RTC场景是无效的。
云信音频实验室提出了一种基于卷积递归神经网络(CRNN)的方法,用于RTC应用中的啸叫检测,实现了出色的准确性和低误报率。该篇文章使用不同的移动设备收集和标记啸叫数据集用于模型训练,并选择对数梅尔谱作为输入特征,实现了 89.46% 的检测率和 0.40% 的误报率。 此外,所提出方法的模型大小仅为 121kB,并且已在实时运行的移动设备中实现。
作为行业内首批音视频 AI 实验室之一,网易云信音频实验室不断探索AI 音频前沿技术方向,连续取得业界权威认可。2021年,实验室在AI 音频降噪和 AI 音乐检测的研究成果被第 50 届国际噪声控制工程会议(INTER-NOISE 2021)收录,自建的国内行业中首个 AI 音乐检测模型受到了高度关注。本次AI啸叫检测成果被 ICASSP 2022接收,再次证明了网易云信在音频技术领域的顶尖研究实力。
未来,网易云信音频实验室将持续引领新技术发展方向,并将先进的算法模型应用于产品和场景中,为全球用户打造极致听觉体验。