宿迁资讯网移动版

主页 > 科技 >

Siri、小度和小冰 它们重磅泡泡龙是怎么做到和你相谈甚欢的(2)

  最近几年,基于深度神经网络的语音识别技术也进行了持续的迭代,从基础的深度神经网络发展到延时神经网络(TDNN)、双向长短时记忆(BLSTM)以及卷积神经网络(CNN)等;近年来,基于端到端架构(End-to-End)的语音识别系统正在被语音识别的学术界和工业界深入研究,一些系统也已经上线,中科院声学所将其最新研究成果实际应用于中国移动通信集团和中国电信集团的客服热线,智能技术直接服务了数以亿计的客户。

  据了解,中科院声学所长期致力于语音识别核心技术研究。针对实时语音识别的需求,研究人员提出一种基于混合神经网络(延时神经网络+输出投影门循环单元)的低延时声学建模技术,可处理长时信息,网络结构简洁,计算速度快,易于并行化训练。该模型结构已作为一种新型的回馈神经网络结构被国际主流语音识别开源软件Kaldi采纳。在非实时语音识别方面,提出基于BLSTM-E(双向长短时记忆扩展)的深度神经网络结构,提升了现有主流BLSTM的性能,并解决了序列化训练条件下LSTM(长短时记忆网络)对不同长度语音输入的鲁棒性差的问题。(记者 陆成宽)

(责任编辑:admin)