interphonic是一款好用的科大讯飞语音合成系统,基于先进的语音转换技术,丰富的语音库文件,如童声、男声、女声和老年人身等,可完成中英混读和粤英混读等混音,需要的朋友可以来本站下载!
interphonic安装教程
1、D盘新建文件夹A,并在A中建立两个子文件夹1和2做为软件的安装目录。
2、点击科大5.0运行库Runtime Demo文件夹中的Runtime(Demo)_Chinese (PRC).msi 进行安装。
3、安装到D盘所建的A文件夹中1文件夹目录下。
4、安装语音库选一个语音库,如双击XIAOYU文件夹里的setup.exe,自动安装。
5、点击InterPhonic5.0运行库ToolKit文件夹中的ToolKit_Chinese (PRC).msi进行安装。
6、安装到D盘所建的A文件夹中2文件夹目录下。
7、点选择绑定文件位置为A文件夹中1文件夹目录下的bin文件夹内的ttsknl.dll文件。
8、先别急着打开软件。将1文件夹目录下的bin文件夹中的iFlyTTSGUI.exe程序创建桌面快捷方式,再双击它打开程序。
9、这时出现会弹出一个配置合成引引擎窗口,选中BIN中的ttsknl.dll,最后点列出引擎就可以使用了。
软件特色
1. 高质量语音——将输入文本实时转换为流畅、清晰、自然和具有表现力的语音数据;
2. 多语种服务——整合了多语种语音合成引擎,可提供中文、中英文混读、英文、广东话的语音合成服务;
3. 高精度文本分析技术——保证了对文本中未登录词(如地名)、多音字、特殊符号(如标点、数字)、韵律短语等智能分析和处理;
4. 多字符集支持——支持输入GB2312、GBK、Big5、Unicode和UTF-8等多种字符集,普通文本和带有CSSML标注等多种格式的文本信息;
5. 多种数据输出格式——支持输出多种采用率的线性Wav,A/U率Wav和Vox等格式的语音数据;
6. 灵活的接口——提供了标准接口、简单接口、COM接口、SAPI接口,便于在多种环境下进行系统的集成;
7. 语音调整功能——开发接口提供了音量、语速、音高等多种合成参数的动态调整功能;
8. 配置和管理工具——合成引擎提供了统一进行配置和管理的工具,完成了全局参数配置、用户词典、用户规则、定制资源包管理等功能;
9. 效果优化——合成引擎提供了以定制资源包和CSSML为代表的多种针对实际应用环境进行合成效果优化的方法;
10.一致的访问方式——能以Client/Server方式访问远程的语音合成服务,并且提供与本地调用相同的开发接口,实现了完全透明的访问;
11.动态负载均衡——提供了动态负载均衡模块,以对用户透明的方式动态调配多台语音合成服务器的资源;
12.背景音和预录音——合成系统还提供了背景音和预录音的功能 ,满足用户不同场合的应用和个性化需求。
interphonic新功能
一、全面完善的功能特性
◆合理的架构
采用基于TCP/IP的高效网络语音合成服务和集中式的资源管理机制,形成客户端-资源管理器-服务器有机结合的体系架构,构建可灵活伸缩的方案,其高可用性历经众多重点行业大规模关键业务的应用检验,确保提供值得信赖的7×24小时不间断自动化语音服务
◆灵活高效的开发接口
InterPhonic SDK针对不同开发工具,不同集成要求和方案,提供多种形式的开发接口,包括:标准开发接口(DLL)、简单开发接口、COM组件、SAPI开发接口及Java开发接口,开发者可以根据实际需要灵活选择。提供丰富的开发例程和文档,帮助加速语音应用开发过程
◆丰富的参数设置与调节功能
丰富完善的参数设置与调节功能和工具,帮助用户对语音合成效果进行灵活高效的控制与管理。提供对全局参数(如音量、语速、音高等)、用户词典、用户规则、定制资源包统一进行配置和管理的工具;数字、标点符号、英文发音方式的设定;中英文加词功能,可以指定每个字词的拼音或音标等等;提供统一的简单易用图形化用户界面进行操作设定,并可通过API参数进行动态设置和调整,还支持以CSSML(中文语音合成标记语言)进行标记、描述和控制
◆高效便捷的增强工具集
InterPhonic的增强工具集套件包括了使用便捷的高效组件,如离线语音应用工具、CSSML可视化编辑工具、DOC/XLS文本格式转换工具等
◆智能Email预处理功能
能够解析普通文本格式、MIME格式和html格式的Email,合成邮件主题、发件人、收件人、信件内容和文本附件,根据语境自动判断读法
◆实用的URI合成功能
增加了URI合成功能。自动获取用户指定的网络URI文本,方便使用网络上的信息资源
◆字符集、语音数据格式支持
全面支持GB2312、GBK、BIG5、GB18030、UTF-8和UNICODE编码字符集,自动识别UNICODE文本;支持直接输出多种采样率的语音数据格式(包括6K/8K/11K/16K)的线性Wav、A/U率Wav和Vox等多种格式的语音数据
◆平台支持
与业内知名的相关平台和设备商均有过成功的集成案例。通过与众多平台和设备提供商、系统集成商及软件开发商的紧密合作,能够保证向用户提供围绕语音应用全程的专业服务
二、细致周到的优化方案
◆优化定制,高效的应用效果方案
提供以定制资源包(加载于合成引擎之上,有效提升既定应用领域语音效果的资源集合)、CSSML、虚拟不定长和语音合成模板等工具为代表的主流应用环境进行效果优化的高效解决方案,显著提升实际应用效果。科大讯飞专业服务体系提供高效的定制与优化方案,提升客户体验,帮助客户获得语音自助服务的持续成功。
◆CSSML,效果提升更自如
CSSML(Chinese Speech Synthesis Markup Language)是由科大讯飞提出并牵头制订的中文语音数据描述规范。该标准得到了国家863专家组、国家信标委和国家技术监督局的大力关注与支持,2005年正式通过国家标准化组织的评审,成为中文语音合成技术标准与规范的重要内容。CSSML针对中文语音应用设计和扩展,可以对多种特性进行灵活标注与控制,并与SSML兼容。
◆预录语音,衔接流畅应用简便
InterPhonic提供业界创新的预录音统一管理功能,将预录音作为语音合成系统的资源,并通过提示音智能匹配和合成模板等方式使预录音与合成音匹配更加容易、衔接更加流畅,同时避免频繁处理提示音播放与语音合成的切换与过渡问题,简化应用流程的复杂程度,进一步提高服务效果与质量。
◆背景音乐,快捷提升用户体检
InterPhonic提供业界首创的背景音功能,通过系统提供的简单易用工具,可以便捷高效的添加背景音乐,调整背景音乐和合成语音的音量对比,并可直接试听实际效果,使语音服务更加亲切自然
常见问题
一、为什么InterPhonic系统在Windows 2000 Server和Advance Server上无法运行?
Windows 2000 Server在安装时,如果安装Windows Media组件,其中的一个服务Windows Media Unicast Server占用的端口号和TTS系统的Server Express软件使用的端口号是一样的,同时使用时会造成冲突,造成Server Express无法运行。这时只要把Windows Media Unicast Server服务停止掉,即可正常使用我们的语音合成系统
二、TTS系统的开发接口中的初始化和逆初始化函数使用的错误?
TTS语音合成系统的开发接口在使用进行语音合成时,首先需要调用TTSInitialize进行语音合成系统的全局初始化,作用是把语音合成系统使用的一些全局数据装载到系统内存中,退出时需要进行全局逆初始化语音合成系统(TTSUninitialize),从系统内存中移出语音合成系统。在一个应用程序中初始化和逆初始化函数允许调用一次,可以在程序开始进行时进行初始化,在程序退出时进行逆初始化过程。如果在程序中进行多次初始化和逆初始化,那么程序在运行时,会出现某一个连接正在合成,而另外一个连接进行逆初始化过程,会使程序崩溃
三、KD2000 Rev1.1/1.5系统和InterPhonic的iflyTTS接口的区别?
1.InterPhonic的iFlyTTS接口增加了分句时对回车符的处理、最大分句长度、当前可用音库列表、读出所有的标点符号、停顿风格、数字字符串的读法等很多控制合成参数的设置,功能更强大
2.对于合成系统输出的声音数据格式设置,由于KD2000 Rev1.1/1.5系统同时只能安装一种采样率的音库,因此它只能正确输出此种采样率下的声音数据文件,输出其它采样率下的声音数据文件会不正确。而InterPhonic系统可以同时安装一个发音人4种采样率的音库,它可以自动在各种采样率的音库之间切换,因此可以输出文档种所列的所有格式的声音数据文件
3.在合成参数的音库设置上,KD2000 Rev1.1/1.5系统有两个发音人,音库设置即在两个发音人之间进行选择,而现在的InterPhonic系统只存在一个发音人,音库设置返回的是发音人各采样率的音库编号,由于InterPhonic系统可以自动在各种采样率的音库之间进行切换,合成时此参数可以不需要进行设置。 两个系统的在以上参数设置时意义有了很大变化,使用时需要特别注意它们的区别
四、向TTS Server发30路请求,合成速度特别慢,另外连接时间长了会导致TTS Server已经死掉,只发一路请求都连接不上,必须重新启动才可以?
在TTS系统多路条件下运行时,因为合成的声音数据量也较大,在网络传输时对网络带宽要求比较高,需要100M的以太网,如果用户所使用的网络是10M网,一方面合成的性能达不到我们的文档所描述的指标,另一方面会造成TTS系统出错
五、TTS在多个线程下合成时声音数据相混杂的问题?
系统在多线程使用时,某个线程调用Connect函数后,生成的实例句柄不能被多个线程同时使用,只能被这个线程使用(当一个线程使用完后,这个句柄才能被其它线程使用),因此在合成时,这个线程对某个文本的合成是从头到尾进行合成。其它线程调用Connect函数后,生成它自己的实例句柄,从头到尾地去合成一个文本。不能多个线程分割合成一个大文本
软件评论 您的评论需要经过审核才能显示
网友评论