炎黄之声TTS(Sinosonic)
平台简介
TTS的全称为“Text To Speech”,即“从文本到语音”。它可以把文字智能地转化为自然语音流,音质清晰悦耳,语调连贯流畅。
“炎黄之声”(SINOSONIC)作为世界级的语音合成平台,依托于人机对话研究室二十年的研究成果,运用了最先进的语音算法和模型,其核心技术包括:基于神经网络的韵律模型、基于HMM的语音切分和选取模型、基于HMM的多语种文本分析和语义分析、中英文语料库设计和标注、语音分析工具的研制等。
荣誉
“炎黄之声”(SINOSONIC)语音合成技术,获得了国家863、七五攻关、八五攻关、九五攻关、国家自然科学基金、军事预研及清华大学211、985的大力支持:
- 成为国内首创以时域合成方法实现汉语TTS系统。
- “基于波形编辑的汉语文字-语音转换方法及系统”获国家发明专利。
- 2001年获柏林最高国际语音技术年会一等奖。
- 获第六届全国人机语言会议论文一等奖。
- 汉语文语转换TH-speech获电子部科技进步二等奖,获国家发明专利,并被选入863十周年成果展。
- 中国移动梦网统一消息平台采用“炎黄之声”(SINOSONIC)产品。
典型产品
- 语音合成开发包SDK
产品为软件形式,为用户提供完备、标准的接口函数,使用户能够灵活方便地进行二次开发。
- 语音合成系统
产品为软件形式,在SDK开发包基础上,建立客户端代理模式,提供标准的网络接口协议,支持不同操作系统、不同应用的客户端提出的实时、并发的语音合成请求,降低用户开发难度。
- 语音合成服务器
产品以硬件形式提供,采用高性能、高配置、稳定的硬件,内嵌语音合成系统软件和ISC智能语音控制器,使软硬件资源利最佳结合,资源最大利用,输出的语音效果最为理想。
- 智能语音控制器
产品为软件形式,为了满足大容量的企业级高端用户或电信级用户需要,推出的智能监控和负载均衡产品,它能够与语音合成系统和语音合成服务器完美结合,智能处理大量并发请求。
- 离线合成系统
产品为软件形式,内嵌SDK开发包,应用于信息经常变化,却又不要求实时合成语音的企事业单位,可单个、批量或自动地将文件生成语音。本产品可替代原有的录音员录入模式,与IVR、CALLCENTER、定时提醒等系统无缝接合应用。
- 虚拟话务员
产品以硬件形式提供,虚拟话务员能够替代人工话务员进行播音,适用于播放信息、播出时间、频率经常变化的语音播放需要。产品外形小巧美观,输出的语音合成音质和发音效果自然、流畅。
- 新华音霸
产品为软件形式,PC机阅读软件,可阅读各种电子文档,应用于电子图书阅读、文稿校对、语音秘书等,可内嵌入WORD、PDF、IE等软件。
性能指标
| 项目 |
指标 |
| 操作系统 |
支持Windows、Unix、Linux等多操作系统 |
| 语种 |
中文普通话、英文 |
| 字符集 |
纯文本、汉语字符集、GBK、BIG5 |
| 音库范围 |
自动识别中、英文,支持中、英文混读 |
| 语速 |
中、英文分别调整
中文语速每秒2-8音节,10级。缺省4音节/秒 |
| 音频输出格式 |
支持16bit/8bit PCM,aLaw/uLaw,ADPCM,Microsoft Wave,Dialogic Vox等18种声音数据格式 |
| 句子可懂度 |
97% |
| 自然度 |
4.5 |
| 合成效率 |
双CPU1.8G 120线,480字/秒 |
| 系统稳定性 |
电信级7*24*12(即3个月高压测试无故障) |
| 版本 |
V1.0、V2.0、V2.1、V3.0 、V3.2、V4.0、V4.1 |