首发于 AI学习之路
声纹识别发展综述

声纹识别发展综述

本文主要围绕几个主题展开:

  1. 声纹识别的发展历程
  2. 目前的主流方向,基于深度学习的声纹识别
  3. 最后介绍一下相关的其他语音技术

首先我们来看下声纹的概念及为什么可用于识别

声音就是一段波,声纹就是携带了信息的声波频谱

声纹特征与其他生物特征的对比及特点

声纹识别在产品上的本质主要就是以下两种工作方式: 1比1 和 1比N

工作流程大致如下:

  1. 提取语音,预处理,提取特征
  2. 利用训练好的模型,计算该语音对应的声纹模型或者声纹特征
  3. 最后进行相似度打分,得到结果

由此我们可以看出声纹识别主要就是三大部分:特征,模型,得分。下面根据这三大要素分别阐述


声纹识别三大部分:特征,模型,得分

首先看下这三大部分的整体技术流派和技术发展路线

语音特征介绍


声纹模型的衍进

传统的声纹识别 主要是基于统计思想和概率论,结合声学,信号学,机器学习等算法

2012年,跨入了以deep learning 为主线的算法,DNN-based系统陆续出现,并基于深度学习领域的新思想持续改良

近两年发展起来的End-to-End 端到端系统,代表:2018年谷歌百度的相关论文

可以参考回答

https://www.zhihu.com/question/53707809/answer/316946465

基于深度学习的声纹技术

上面的网络结构中,有一个Statistics Pooling Layer,负责将Frame-level Layer,Map到Segment-Level Layer,计算frame-level Layer的Mean和standard deviation。TDNN是时延架构,Output Layer可以学习到Long-Time特征,所以x-vector可以利用短短的10s左右的语音,捕捉到用户声纹信息,在短语音上拥有更强的鲁棒性。


其他语音技术介绍

聚圣源法师奥义申起名碘化银颜色音乐编辑软件生辰八字起名称网起名网大师取名免费笔画起名数理水泥的主要成分揭阳论坛西山洋房尼采经典语录李姓男孩起名四字的回归鸟十字绣金德利民快餐加盟姓高的名人起名大全网络起名字吗四柱起名厨房设备起名2022国考今起报名时间开店咋起名字好张姓猪年宝起名mdrom起名网站免费观看深圳网上心理咨询宝宝起名网姓名测试打分卖童装怎么起霸气的群名斛珠夫人帝旭喜欢海市吗母婴商贸公司起名字大全免费酒店起名网sunshine什么意思淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化