环球体育代理 | 下载中心 | 新闻资讯 | 加入我们 | 联系方式 |
   
环球体育代理
 

关注微信公众号

了解永联最新资讯

 首页 > 产品中心 > 储能系统  
 
工业实践推进科技立异京东科技3篇论文当选ICASSP2021
发布时间:2022-01-17 22:13:44 来源:环球体育代理

  中新经纬客户端2月19日电 ICASSP 2021将于2021年6月6日-11日在加拿大多伦多拉开序幕,凭仗在语音技能范畴的厚实堆集和前沿立异,京东科技集团的3篇论文现已被ICASSP 2021接纳。

  ICASSP全称International Conference on Acoustics, Speech and Signal Processing(世界声学、语音与信号处理会议),是由IEEE主办的全世界最大的,也是最全面的信号处理及其运用方面的尖端学术会议。京东科技集团此次的当选论文,在世界舞台全方位展现了其在供应链、金融、物流、物联网等场景的工业实战经验,和在语音增强、语音组成、多轮对话方面的技能实力。

  因为杂乱环境噪声的存在,语音增强在人机语音交互体系中扮演重要的人物。依据核算机器学习的语音增强算法一般选用机器学习范畴现有的常用模块(如全衔接网络、递归神经网络、卷积神经网络等)构建增强体系。可是,怎么将传统语音信号处理中依据专家常识的最优化滤波器规划理论,有用地运用到依据机器学习的语音增强体系中仍是一个仍未处理的问题。

  京东科技集团当选论文《Neural Kalman Filtering for Speech Enhancement依据神经卡尔曼滤波的语音增强算法研讨》提出了神经卡尔曼滤波的语音增强结构,将神经网络和最优滤波器理论有机结合,并选用监督学习办法练习得到卡尔曼滤波的最优权重。

  研讨人员首要构建了依据递归神经网络的语音时序改动模型。和传统的卡尔曼滤波器比较,该模型摒除了语音改动遵守线性猜测模型的非合理假定,能够针对实际语音的非线性改动进行建模。一方面,依据该时序模型和卡尔曼隐状况向量信息,算法首要得到语音长时包络猜测。另一方面,经过交融当时时间的观测信息,体系进一步求解依据传统信号处理的维纳滤波的语音频谱猜测。体系终究输出是语音长时包络猜测和维纳滤波猜测的线性组合。依据传统卡尔曼滤波器理论,本体系直接得到线性组合权重的最优解,经过规划端到端体系,能够同步更新语音时变网络、和维纳滤波器相关的噪声估量网络的权重。本研讨依据Librispeech语音集、PNL-100Nonspeech-Sounds和MUSAN噪声集的试验成果表明,所提算法在信噪比增益、语音感知质量(PESQ)和语音可懂度(STOI)指标上均取得了比传统依据UNET和CRNN结构的语音增强算法更好的功能。

  虽然现在依据端到端的语音组成技能现已完成了比较天然,韵律相对丰厚的语音组成作用,可是并没有选用华章结构信息而是只选用了当时句的言语学特征进行语音组成。一般,韵律信息是和上下文的华章结构激烈相关的,相同的一句文本在不同的上下文语境下会有彻底不同的韵律体现,因而只用当时语句文本特征进行语音组成的端到端体系在组成一段文本的时分,很难依据上下文信息将一段文本转换为天然的、韵律体现丰厚的语音。

  研讨人员没有选用任何显现的韵律操控信息,而是经过BERT言语模型提取了待组成语句的上下文语句的跨句特征表征,而且将该特征表明作为了现在干流的端到端的语音组成算法的额定输入。论文探讨了两种不同跨句特征的运用办法,第一种是将一切的上下文语句的跨句特征拼接起来用来作为端到端的语音组成体系的一个全体的输入,第二种办法是将一切的上下文语句的跨句特征作为一个序列,然后用待组成文本的每个语音单元和这个序列进行留意力核算,然后能够经过核算得到的留意力进行对上下文语句的跨句特征进行加权求和核算得到每个语音单元对应的跨句特征。第二种跨句特征运用办法,能够让每个发音单元得到一个细粒度的、对当时单元发音有协助的跨句特征。

  试验成果表明,本研讨在端到端的语音组成体系中结合跨句特征之后,能够有用的改善组成阶段文本天然度和体现力。本研讨别离在中文和英文有声读物的数据集上验证了这一试验成果。而且,在比照测验成果中,比较咱们的依据端到端的基线模型,绝大部分测验者愈加喜爱本研讨中结合了跨句向量表征的语音组成算法组成出的音频。

  在多轮对话体系中,用户倾向于简略、口语化的表达,表述中存在着很多信息缺失和指代的现象。这些现象导致了对话机器人难以了解用户的实在目的,大大添加了体系应对的难度。为进步对话体系的水平,Query改写依据用户的前史会话,补全用户的言语,以康复一切省掉和指代的信息。可是,现在存在的Query改写技能均选用监督的学习办法,模型的作用严峻受限于标示数据的规划,对技能在实在事务场景的落地产生了较大的阻止。别的,用户问题在产生改写后,目的是否产生改动并没有遭到已有作业的重视,怎么确保用户问题在改写后的目的一致性仍是一个亟待处理的问题。

  京东科技集团当选论文《Conversational Query Rewriting with Self-supervised Learning 依据自监督学习的对话Query改写》提出了自监督的Query改写办法。当用户问题与前史会话呈现共现词语时,会以特定地概率删去共现词或许选用代词进行替换,最终Query改写模型依据前史会话复原出用户的原始问题。相较于监督学习办法,自监督的学习办法可低成本的获取很多练习数据,充分发挥模型的表征学习才能。

  研讨人员还进一步提出改善模型Teresa, 从两个方面进步改写模型的质量和准确性。一是在Transformer编码层引进要害词检测模块,提取要害词辅导语句生成。首要对前史会话(context)的编码输出构建自留意力求,得到前史会话中词语之间的关联度;然后使用Text Rank算法核算词语的重要性得分;最终词语的重要性得分作为先验信息融入解码器,辅导模型生成含有更多要害信息的问句。二是提出目的一致性模块,在Transformer编码器的输入文本中添加一个特别标签[CLS], 获取文本内容的目的散布,经过束缚目的散布坚持目的一致性。原始会话(Context, Query)与生成的语句(Target)同享Transformer编码器,别离得到改写前后的目的散布,咱们将两者的散布坚持一致,从而确保生成语句的目的一致性。

  京东科技集团作为京东对外供给技能服务的中心板块,一向致力于前沿研讨探究,并继续以科技引领,助力城市和工业完成数智化晋级。到现在,京东科技集团在AAAI、IJCAI、CVPR、KDD、NeurIPS、ICML、ACL、ICASSP等世界AI尖端会议上共宣布相关论文近350+篇,并在多项世界性学术赛事中斩获19项世界第一。信任未来,京东科技集团将继续在语音语义、核算机视觉、机器学习等范畴发力,以科技助力实体经济,实在改动每个人的日子。(中新经纬APP)

    电话 : 0755 29016365
  传真 : 0755 29016399
  Mail : winline@szwinline.com
  地址 : 深圳市南山区百旺信高科技工业园二区七栋
 
Copyright © 环球体育代理_环球体育登陆_环球体育登录 All Right Reserved.
粤ICP备17021453号

粤公网安备 44030502002323号