人工智能口语识别,沉默也能交流

导读近日,加州大学伯克利分校的研究人员表示,他们正在

人/陈根

人工智能口语识别,沉默也能交流

人工智能技术的改进和发展对人工智能的应用无疑是非常重要的,除了人工智能在与生活紧密联系的应用外,响应少数群体的需求也将成为人工智能发展的必然方向。

人工智能口语识别,沉默也能交流

最近,加州大学伯克利分校的研究人员说,他们正在使用无声的语言和传感器来收集肌肉活动来训练人工智能。 其中,无声语言通过肌电图(EMG)检测,电极放置在面部和喉咙上。 研究人员说,这个模型的重点是所谓的“无声演讲”,它可以检测人们想说什么,但不发出声音。

研究人员认为,他们的方法可以为那些不能发出声音的人提供大量的应用,并且可以支持人工智能助手或其他响应语音命令的设备进行无声语音检测。

然而,这并不容易想象:首先,在收集数据时,研究人员在实验者脸上贴了八块补丁,每个补丁都是一个“监测肌肉变化”的传感器。

然后,研究人员需要记录一段实验者的声音,并与肌电图相对应-一种可以匹配肌肉变化和言语类型的方法。 然后使用WaveNet解码器生成音频语音预测。 在记录数据的过程中,我们还记录了“对应”的肌电图,但不需要发声,即“无声声“。

与用声乐肌电数据训练的基线相比,书中句子转录的错误率下降了64%~4%,与基线相比错误率下降了95。 此外,为了推动这一领域的进一步研究,研究人员开发了一个近20小时的面部肌电数据数据集。

标题是“沉默数字语音”研究论文,在近期开展的自然语言处理体验(EMNLP)活动中,荣获最佳论文奖。

该小组的论文写道:“数字无声语音有广泛的潜在应用。” 例如,它可以用来制造类似于蓝牙耳机的设备,允许人们在电话中交谈,而不打扰周围的人。 显然,这种设备将在环境噪音太大,无法捕捉可听到的声音或保持沉默的环境中发挥重要作用。

免责声明:本文章由会员“李原”发布如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系