语音识别(ASR)论文优选:粤语语料集Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New D

声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜集一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。

Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New Dataset

本文为香港科技大学在2022.01.07更新的文章,主要对粤语的开源数据集进行总结并开源新的数据集MDCC,具体的链接

https://arxiv.org/pdf/2201.02419.pdf


注:本文主要开源粤语识别数据集​,较为简单。

1 背景

伴随着基于神经网络的语音识别的性能不断提升、开源数据的不断增多,语音社区逐渐​扩大。但语音识别在低资源语言的语料依然匮乏,因此本文设计和提供了粤语语料​MDCC。

2 详细设计

本文先统计目前开源的粤语语料的详细数据,具体如table1​所示。因此本文设计了数据集Multi-Domain Cantonese Corpus (MDCC) 。该数据包括以下场景​: philosophy, politics, education, culture, lifestyle and family。该数据集制作流程:1)获取粤语语音,使用VAD进行切句子;2)使用G

语音识别(ASR)论文优选:车内场景粤语指令数据CI-AVSR: A Cantonese Audio-Visual Speech Dataset for In-car Command Recogni
低调奋进
01-12 2902
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
speech_recognition:中文语音识别
02-06
中文语音识别 1.环境 巨蟒:3.5 Tensorflow:1.5.0 2.训练数据下载 清华大学中文语料库(thchs30) 3.训练 配置conf目录下的conf.ini文件中的设定 在python train.py运行python train.py开始训练 在终端运行python test.py测试 也可以使用PyCharm打开 4.测试效果
粤语(广东话)全译-对广东话最全面、详细的介绍
mohc01mohc
01-16 779
粤语(广东话)全译-对广东话最全面、详细的介绍 2010年06月07日   粤语(广东话)全译-对广东话最全面、详细的介绍   本帖最后由 宝成铁路 于 2007-08-08 13:18:53 修改   粤语又称广东话,是一种声调语言,属汉藏语系汉语语族。在中国南方的广东中西部、广西西部等地区及香港、澳门和东南亚的一些国家地区,还有海外华人社区中广泛使用。它的名称来源于中国古代对...
微软Azure AI服务中的Speech Studio:实现自动语音识别ASR与高效AI字幕生成
最新发布
朴拙科技的博客
04-23 969
Speech Studio是微软Azure AI服务中的一个工具,它提供基于用户界面的工具,用于在应用程序中生成和成Azure AI语音服务的功能。用户可以在Speech Studio中试用语音转文本和文本转语音的功能,而无需注册或编写任何代码。Speech Studio允许用户浏览、试用和查看一些常见用例的示例代码。
方言普通话语音识别语料库样例
01-26
本数据是600人方言普通话语音识别语料库的样例,包括4个发音人(两男两女)录制的少量数据。完整语料库包括600名发音人,发音人覆盖全国不同地区、年龄、性别及文化程度,录音环境覆盖安静、座机、手机、车载、背景音乐及嘈杂声等场景,录音语料覆盖单字、词汇、语句、自然对话及语篇,采样率分8K和44K两种,采用16比特量化,标注粒度包括文字、拼音、韵律及音频标注。 用途:语音识别
语音识别数据-spoken_numbers_pcm
12-29
spoken_numbers_pcm
PaddleSpeech:首个粤语合成模型开源,识讲粤语真喺大晒嘅
m0_63642362的博客
03-14 1332
开源社区首个粤语语音合成模型来啦~快来生成粤语音频,欺负某小破站没有粤语审核吧~
语料库,自己整理的,有需要的吗
08-06
语料库,自己整理的,对txt文件进行去停用词、分词。(停用词是指对文本含义几乎没有影响的词,这些词存入到.txt,分词调用的结巴分词库)
语音识别(ASR)论文优选:端到端ASR综述Recent Advances in End-to-End Automatic Speech Recognition
低调奋进
11-04 3645
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
语音识别(ASR)论文优选:挑战ASR规模极限Scaling ASR Improves Zero and Few Shot Learning
低调奋进
11-15 1965
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
粤语+-+普通话互译发音工具
03-28
粤语+-+普通话互译发音工具 粤语+-+普通话互译发音工具
SER-datasets:语音识别中用于情感识别的数据
04-28
口语情感识别数据:语音中情感识别/检测目的的数据合。 该表按时间顺序排列,并包含每个数据内容的描述以及所包含的情感。 数据 年 内容 情绪化 格式 尺寸 语 纸 使用权 执照 2021年 40小时,由70多位...
open-speech-corpora:A适用于ASR,TTS和其他语音技术的可访问语音语料库列表
05-06
:gem_stone: 公开语料库用于语音技术研究和开发的开放语音语料库列表。 此列表具有免费(即没有$费用)和真正开放的语料库(例如,根据或发布)的偏好。 并非所有这些语料库都可以满足那些标准,但是以下所有语料库...
zamia-speech:用于无云自动语音识别的开放工具和数据
05-02
用于从voxforge.org语音数据和许多来源计算音频和语言模型的Python脚本。 可以构建的模型包括: Kaldi nnet3链音频模型 ARPA格式的KenLM语言模型 sequitur g2p型号 wav2letter ++模型 重要说明:请注意,这些脚本绝...
11.rar_speech corpus_语料库分析_语音库_语音识别
07-15
关于语音识别语料库的建立与整理,以及分析统计
语音识别(ASR)论文优选:可商用的开源30000小时ASR英文训练语料The People‘s Speech: A Large-Scale Diverse English Speech Recogn
低调奋进
11-19 2034
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
语音信号处理论文优选:神农Shennong: a Python toolbox for audio speech features extraction​
低调奋进
12-13 3314
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
语音合成论文优选:DelightfulTTS: The Microsoft Speech Synthesis System for Blizzard Challenge 2021
低调奋进
11-10 2902
声明:平时看些文章做些笔记分享出来,文章中难免存在错误的地方,还望大家海涵。搜一些资料,方便查阅学习:http://yqli.tech/page/speech.html。语音合成领域论文列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。如有转载,请
深度学习的的应用领域包括: a 图片识别 b 目标检测 c 机器翻译 d 聊天机器人
09-15
深度学习是一种机器学习的方法,通过构建神经网络模型,可以对大量复杂数据进行处理和学习。深度学习已经在很多领域得到了广泛应用。 首先,图片识别是深度学习最常见的应用之一。通过深度学习算法,可以对图片进行识别和分类,比如人脸识别、物体识别等。这项技术已经应用于电商中的商品图片识别、安全领域的人脸识别等场景。 其次,目标检测也是深度学习的重要应用之一。目标检测可以确定图片或视频中特定物体的位置和边界框,广泛应用于自动驾驶、安防监控等领域。 另外,机器翻译也是深度学习技术的热门应用之一。传统的机器翻译方法往往依赖于规则和统计模型,而深度学习可以通过大量的语料库数据进行训练,实现更准确和流畅的翻译。 最后,聊天机器人也是深度学习的重要应用之一。通过深度学习,可以构建智能对话系统,实现智能问答和自然语言处理。聊天机器人已经被广泛应用于客服、智能助手等领域。 总之,深度学习的应用领域非常广泛,包括图片识别、目标检测、机器翻译和聊天机器人等。随着技术的不断发展和创新,深度学习在更多领域的应用将得到进一步扩展和深化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • C++学习小疑问:类的名称能否和命名空间的名称相同? 7040
  • 网络牛网:苏剑林和他的科学空间 6704
  • 语音开源项目优选:免费配音网站15.ai 6155
  • ElegantLatex:优美的 LATEX 模板 (对文章,书籍进行排版) 5246
  • 语音识别(ASR)论文优选:WeNet 4025

分类专栏

  • NLP 3篇
  • 语音识别综述 19篇
  • 语音合成综述 44篇
  • 语音识别论文 23篇
  • 随想 3篇
  • 语音开源项目 9篇
  • 声纹识别 1篇
  • 机器学习 3篇
  • 语音信号处理论文 4篇
  • 语音 1篇
  • TaintDroid 5篇
  • 语音合成论文 104篇
  • 编程 1篇

最新评论

  • 语音识别(ASR)论文优选:粤语语料集Automatic Speech Recognition Datasets in Cantonese Language: A Survey and a New D

    维生素續C: 你好,请问如何获取数据集

  • LLM文章阅读:Baichuan 2 干货

    qq_37131779: 报告没有提及使用的是Megatron-LM + deepspeed,来源是哪里?

  • 语音开源项目优选:免费配音网站15.ai

    艾克丶艾达: 朋友,这个网站上个月我还能上,突然就上不去了,打开只能选择跳转推特还是Patreon,知道是什么情况吗

  • 语音合成(speech synthesis)方向一:双重学习Dual Learning

    小乐777: 真的是太棒了表情包

  • 语音合成(TTS)论文优选:A Mask-based Model for Mandarin Chinese Polyphone Disambiguation

    pongzjp: 你好,博主,有个疑问,在训练的时候,我们是知道哪些字是多音字,所以用到了Mask矩阵,在测试的时候,还需要用到Mask吗

大家在看

  • 10.8k Star! 推荐一款智慧园区出入口综合管理平台 422

最新文章

  • 快上车,LLM专列:想要的资源统统给你准备好了
  • LLM文章阅读:Baichuan 2 干货
  • Is ChatGPT a general-purpose natural language processing task solver?
2023年5篇
2022年29篇
2021年114篇
2020年46篇
2016年6篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

我叫永强

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

聚圣源上海女排名单梓起名子大师免费起名网fc游戏下载公司房产起名起名为什么不能带一望尘莫及是什么意思2019猪年的宝宝起名徐州交通违章查询武侠大宗师康熙字典在线起名查字qq空间技巧凤凰卫视中文台猪小儿起乳名春色满园关不住最早的纸币叫什么员工生日祝福语属猴起什么名字よつのは起名字大全免费取名2019龙腾世纪2下载青春最好时百度云远东控股集团郸城县人民政府理想之城剧情介绍去广告包卜篮球个人企业公司起名振字辈男孩起名字起名字应该遵循的原则淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化