用 AI 解决噪音环境下的语音识别难题,Yobe 获得 180 万种子轮融资

阅读  ·  发布日期 2018-05-10  ·  金人网络
世界再喧嚣,也能找到你的声音

近日,美国语音技术公司 Yobe 宣布,获得了来自 Clique Capital Partners 的 180 万美元种子轮融资。此前,Yobe 曾于 2016 年获得美国国家科学基金会 SBIR 项目的 79 万美元资金支持。

Yobe 想解决的,是语音领域目前的一个困境,语音助手可以识别出用户在讲什么,准确度也不错,但假设有人和用户同时说话,其识别率就会大大降低,这被称为 “鸡尾酒会问题”。就像在一场宴会上,背景过于嘈杂,语音识别就难以正常工作。

为此,Yobe 建立了一个声音驱动系统,可以在嘈杂环境中,利用 AI 识别用户的生物特征,进而判断并分离特定的声音,自动提高这一特定声音的音量,帮助语音识别引擎更好地工作。

用 AI 解决噪音环境下的语音识别难题,Yobe 获得 180 万种子轮融资

2017 年 6 月,Yobe 公布了一段非常简短的技术介绍视频

在应用上,Yobe 计划将技术授权给芯片或智能硬件制造商,第一步的推广会从声控设备开始。CEO Ken Sutton 认为,特定声音识别技术的应用场景很广,可以用于会议转录,帮助司法或鉴定,制造更好的助听器,以及完善声纹识别技术。

Sutton 表示,目前技术研发已经完成,下一步将简化产品并投入市场。新产品会在一个月内上线,将开发布会进行现场演示。

与 Yobe 想解决的问题类似,今年 4 月,Google 曾在博客上发文称,正试图复制 “人类大脑专注于某个声源,同时可过滤掉其他声音” 的能力。Google 的技术主要集中在视频处理上,让用户在一段视频中选择一个人脸,利用视觉组件观察这个人的嘴,从而创建出其个人语音轨迹。当然,谷歌的技术难度在于分离数段声音,而 Yobe 主要完成的,更类似于 AI 降噪。

锤子的坚果 3 就声称利用了 “AI 通话智能降噪技术”,其供应商大象声科是基于深度学习技术,结合传统降噪方法,来实现噪音环境下的语音提取和信号增强,技术思路与 Yobe 相近。

作为一项利用了 AI 的产品,计算资源占用和性能之间的平衡或许是 Yobe 最需要做好的。而以单一辅助技术作为出发点,在开拓市场之后,Yobe 是给自己寻找一个好买家,还是以此为切入点进入更广的语音领域,也是我们接下来会关注的。