【方法】科大讯飞在线语音合成API使用-文字转语音音频

22 篇文章 14 订阅
订阅专栏

2020.3.16更新
一年过去,讯飞居然改了python的使用代码,变复杂了一点,而且不能直出wav格式的音频,只有pcm的源文件;另外不需要设置白名单了。

下面的使用流程不变,官方提供的示例代码也可以直接出demo音频,在这里我修改了批处理代码,也就是在示例代码的最后一行添加几句

开始使用服务

我们首先打开科大讯飞在线语音合成的 官网,记得首先右上角注册账号并登陆,界面如下图所示:
在这里插入图片描述
官方提供了很多接口,比如windows,linux等等,但我觉得最方便的是Web API接口,因为它提供了python支持,这对接下来的批量处理提供了便捷,在点击Web API接口抢鲜体验后,会进入控制台创建应用界面,如下图所示:
在这里插入图片描述
随便填完上述信息后,就创建好了,然后在应用里添加在线语音合成的服务,添加好后如下图所示:
在这里插入图片描述
上图中红框标处的位置是代码中需要用到的!

有能力的同学自己查看 API官方文档,没有的话呢,就请继续往下看

1、首先是IP白名单,也就是在这里填入你自己的IP地址,不添加白名单,就无法使用服务。

2、APPID 和 APIKey 后面会说到

下载并修改代码

点击 链接下载python_demo包

修改代码中红框标出的位置,用你自己的APPID 和 APIKey
在这里插入图片描述
而合成的文本内容默认是“内容”这两个字,你也可以随意修改
在这里插入图片描述
然后就大功告成了!

批量化处理

首先要自行安装ffmpeg,官方下载windows包,解压后添加路径到环境变量。

使用方法: 在py文件路径放text.txt文件,执行后就会出wav格式音频。

if __name__ == "__main__":
    # 测试时候在此处正确填写相关信息即可运行
    with open(r'text.txt', 'rt') as f:
        lines = (line.strip() for line in f)
        for line in lines:          
            wsParam = Ws_Param(APPID='5d###07', APIKey='86e445###############3da927',
                            APISecret='faba8################5502eda54f',
                            Text=line)
            websocket.enableTrace(False)
            wsUrl = wsParam.create_url()
            ws = websocket.WebSocketApp(wsUrl, on_message=on_message, on_error=on_error, on_close=on_close)
            ws.on_open = on_open
            ws.run_forever(sslopt={"cert_reqs": ssl.CERT_NONE})
            command = 'ffmpeg ' + '-y -f s16le -ar 16000 -i ' + 'demo.pcm ' + line + '.wav'
            os.system(command)
讯飞离线语音识别——语音文字
03-13
基于android的离线语音识别,实现没有网络的情况下把语音换成文字信息。 对程序内容进行了简化,内容简单明了,容易看懂。 包含了离线语音需要的所有离线包
科大讯飞离线语言识别库下载安装
Q_v_R的博客
08-17 1173
今天记录一下语言识别。
科大讯飞语音识别(离线+在线)完整工程源代码可运行
01-26
科大讯飞官方Demo中提取的语音识别部分代码加以修改,可实现在线与离线的语音识别,下载后需要填写自己的APPID以及修改成与ID相匹配的讯飞SDK,实测可运行。
开源项目&免费接口:文本语音|API接口
最新发布
03-21 455
1.高效的文字转语音技术我们的AI能力引擎采用先进的自然语言处理技术,能够快速准确地将文本内容换为流畅自然的语音输出。2.丰富的语音合成选项平台提供多种语音选项,包括不同性别、年龄和语言的语音,满足用户多样化的需求。
科大讯飞实时语音文字vuejs版本
07-26
科大讯飞实时语音文字webapi版本,此资源为vue版本。
科大讯飞语音离线命令识别
weixin_45833112的博客
03-31 3878
注册讯飞账号,做相关的认证,只有认证通过才能下载部分免费的资源。官网地址:https://console.xfyun.cn/创建我的应用后再在离线命令识别 2、新建 IatActivity 声明必要的类成员 3、初始化监听 4、语音命令识别的周期监听 5、离线命令UI监听 6、获取离线资源 7、参数设置 8、弹窗提示 9、语音权限提示窗口 10、动态申请权限 11、在onCreate() 方法中初始 12、按钮点击 处理识别命令测试 13、界面a
科大讯飞语音合成TTS在线接口forPHP
01-08
代码中换上自己的账号和秘钥,需要文字转语音的内容通过get的方式传递。
科大讯飞webAPI文字转语音
hellow_world_的博客
04-07 1290
transcode.worker.js代码(科大讯飞demo里面的,但是稍作修改。关键点就是webWorker。index.vue代码。
语音合成接口整理_各平台语音合成接口
天马3798
10-11 3639
目前语音合成接口比较成熟,可以使用的平台也比较多,使用方式和价格也打不相同。 一、腾讯云 功能: 1.基础语音合成API(短文本合成API) 2.长文本语音合成API 3.实时语音合成API 在线文档:https://cloud.tencent.com/product/tts 价格方案:先看免费,收费情况点击去官网 语音合成免费额度为800万字符,仅支持通用与实时语音合成接口。免费资源包自您领取成功后起三个月内有效,一个账号只能领取一次。 二、百度云 功能: 基础语音
科大讯飞WebApi文字转语音,记录一下
weixin_42082416的博客
07-24 844
下边这个方法是官方的demo中调用讯飞webapi的,我这多加了一个存储路径的参数,在语音存储的时候,存储在自己指定路径下。(截图中代码有重合,编写的时候去掉重合的代码即可)3.因为之前我试过微软speech SDK,在服务器上配置SDK环境的时候,感觉麻烦,所以这次果断选择的WebApi。5.后又选择在线语音合成WebApi,注册成功后会生成APPID、APISecret、APIKey。7.将代码移到项目中去(文字字数多的,将其分成多段调用讯飞WebApi,最终将多段语音合成一条)
基于ROS2和科大讯飞文字转语音TTS入门教程
DL_62532的专栏
10-25 2260
利用ROS2,实现listener和talker,当talker发送以‘topic’为主题的消息时,listener接收并处理消息内容,并调用科大讯飞的TTS模块,将某些文字换成语音文件。在上一步中,可以直接通过选项安装vscode,也可以直接在ubuntu软件商店里安装,区别是软件商店里的版本更新。节点名称:my_publish (创建项目后某人创建的节点源码,后来才知道,可以不写这个,可以自行创建节点代码。本文使用的操作系统为vm虚拟机,安装的ubuntu22.04,请大家自行百度安装。
文本语音(科大讯飞在线版)
05-21
这个玩意儿大概研究了一天多点,科大讯飞开放平台的在线文本合成语音,离线版的需要购买所以就看了看在线的 界面很简单,选择发音人,也可以默认,点击文本语音,成功后出现提示。。
Unity-科大讯飞在线语音语音文字.unitypackage
10-11
科大讯飞在线语音语音文字
使用科大讯飞语音SDK实现文字在线合成语音
09-03
主要介绍了使用科大讯飞语音SDK实现文字在线合成语音 的相关资料,需要的朋友可以参考下
UE5Windows科大讯飞文字转语音源码插件
09-21
您可以选择多个不同的发言人,合成的语音会存储在本地文件中,可以设置不同的发音人,才支持中文,英文,阿拉伯数字,支持Win64平台,封装成蓝图可视化,方便蓝图调用,通过WebSockets接入科大讯飞的服务器,可自行...
方法】HTML网页调用本地Python程序
热门推荐
crazyang的博客
05-07 17万+
代码已上传github 首先声明,在HTML中调用本地Python程序是十分不推荐的,一是因为网页调用本地程序的权限正在被取消,二是因为真不如JS写直接,三是只能在自己本地调用。 但如果你要用,像我一样,需要在课堂上进行一个Python代码的展示,并且想要一个好看的UI界面的话,可以这样来做,做起来还是很容易的,但这样的展示仅限于需要弹框的,比如我的人脸检测是弹窗式,如果需要内嵌在网页内...
【Python】字符串换为ASCII码
crazyang的博客
04-26 6万+
在这里先解释一下ASCII,Unicode 和 UTF-8这三者的关系 最早出现的是ASCII,一共包含128个字符(一个字节可以表示256种状态,但第一位所有默认为0,所以只有128种)。在接下来计算机的发展过程中,128种远远不能满足增加的需求(各种国家语言等),所以引入了Unicode,但Unicode只规定了符号的二进制代码,并没有规定存储方式。因此引入了UTF-8,UTF-8是一种 Un...
【代码】Python播放MP3音频文件
crazyang的博客
02-11 5万+
按推荐顺序排列 ①使用playsound库 from playsound import playsound playsound('xx.mp3') ②使用pygame库 from pygame import mixer import time mixer.init() mixer.music.load('xx.mp3') mixer.music.play() time.sleep(5) m...
【代码】优化算法BGD、SGD、Momentum、Adam算法python实现
crazyang的博客
11-29 4万+
最近研究了一下梯度下降的几个算法,网上python的源码少且不清晰,我自己全部实现了一遍,我觉得还是相当清晰明了的,话不多说,且看下文: 文章目录梯度下降批量梯度下降BGD随机梯度下降SGD带动量的随机梯度下降Momentum-SGDAdam 梯度下降 对于目标函数 J(θ)J(\theta)J(θ) ,找到目标函数的梯度方向 ∇θ(J(θ))\nabla_\theta(J (\theta)...
unity读取文本文字使用科大讯飞api合成语音
11-29
使用Unity读取文本文字并利用科大讯飞API合成语音是实现语音合成功能的一种方法。首先,需要在科大讯飞官网注册账号并获取相应的API Key和API Secret。 在Unity中,我们可以利用Web请求来调用科大讯飞语音合成接口,将需要合成的文本作为参数传递给API。首先,需要将文本化为URL编码格式,以便于在URL中进行传递。使用Unity的WebRequest类来发送HTTP POST请求,同时将API Key、API Secret以及文本参数作为请求的参数之一发送给科大讯飞的合成接口。 当接收到来自科大讯飞API返回的语音数据后,将其以流的形式读取并保存为音频文件。Unity中可以使用AudioClip类来播放音频文件,可以通过调用其方法实现音频的播放和停止。 在实现语音合成功能时,还可以进行一些设置,如选择合成的发音人、语速、音量等参数,这些参数可以根据需求进行调整。此外,还可以选择合成的音频格式,并可以通过设置回调函数来处理合成结果。 总之,利用Unity读取文本文字并调用科大讯飞API合成语音可以实现文本语音的功能。通过Web请求和相应的处理,我们可以将文本化为合成的语音数据,并在Unity中播放出来,为游戏或应用增添语音合成的功能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
写文章

热门文章

  • 【方法】HTML网页调用本地Python程序 179692
  • 【方法】Matlab求解方程,带参数,方程组,不等式(2021更新) 136761
  • 【方法】树莓派小车自动循迹(摄像头) 81621
  • 【Python】字符串转换为ASCII码 69025
  • 【方法】在Visual Studio中使用Qt 58969

分类专栏

  • AI 10篇
  • pytorch 1篇
  • Latex 7篇
  • 数学 5篇
  • 【工具】使用方法积累 4篇
  • 树莓派使用教程 8篇
  • 学习OpenCV 4篇
  • Python 22篇

最新评论

  • 【警告】python list.remove() 函数删除方式存在遗漏

    ChikamiC: 学到了!有一个小问题,list.remove(list[0])的运行结果似乎和list.clear()一致?这两种方法有什么差异吗?

  • 【方法】HTML网页调用本地Python程序

    守法公民黄姜姜: 请问你解决了吗,我也想知道这个问题,谢谢你!

  • Latex 排版子图 subfigure, subfig, sub­cap­tion

    weixin_47545850: 请问子标题不随子图居中怎么解决

  • 【方法】HTML网页调用本地Python程序

    dybzcx: 不错,明天试下linux系统行不行

  • 【方法】树莓派小车自动循迹(摄像头)

    努力coding的笨鸟: 大佬,请问能提供一个处理直角转弯的思路吗

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • tqdm使用指南
  • 论文解读 LOLNeRF: Learn from One Look
  • 【每天一点Pytorch】用 gather 分 batch 取 tensor 维度
2023年1篇
2022年5篇
2021年5篇
2020年8篇
2019年33篇
2018年26篇

目录

目录

评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

yzy_1996

买杯咖啡,再接再厉

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或 充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

聚圣源给宝宝免费起名软件好周易免费起名子打分国际范的婚庆有限公司起名写春节的作文杨家大姓起名前程无忧人才网八卦起名慕的女孩起名mastercam电视剧婉君济南二手房装修唐诗宋词 公司起名日上免税店官网apppsp超级机器人大战z灵剑尊在线观看全集免费播放雳剑淘宝抢购软件香喜谷游戏名字起名字宝宝起宝宝小名猪年宝宝名字起名神婿叶凡什么然大物测小孩起名多少分地暖的优缺点守卫剑阁2.6神器版A区欧洲freeXXXX性女宝宝起名字韩姓女生起名大全51起名网淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化