首页>> 其他>>新闻详情

富士通展出中文语音合成系统

2008-12-01 10:41  《4PS呼叫中心国际标准研究中心》  咨询电话:17317241681(微信同号)  51callcenter


  富士通公司在北京的2008富士通中国论坛上,展示了中文语音合成系统。该系统有短信播报、来电播报、语言提醒等功能,可以为车载导航系统提供更为安全和人性化的信息输出方式,还可以用来辅助视力有障碍人群、认知能力有障碍的残疾人等更方便地获取日常信息。

  语音合成(也称文语转换Text to Speech技术),涉及声学、语言学、数学信号处理技术等多个学科技术,是信息处理领域的一项前沿技术,广泛用于呼叫中心、汽车导航、语音网页等各种信息实时输出服务,可以实现把计算机中任意出现的文字转换成自然流畅的语音输出。传统的声音回放设备(系统)在内容、存储、传输或者方便性、及时性等方面都存在很大的限制,而富士通通过计算机语音合成技术则可以在任何时候将任意文本转换成具有高自然度的语音。

  汉语是有调语言,音长和基频是一个音节的重要韵律参数,对于合成语音的自然度具有决定性意义。富士通语音合成系统采用基于决策树的音长预测模型和基于多变量分析和聚类分析得到的基频调型模板,能够充分刻画汉语韵律节奏的特色,从而能够输出具有高自然度韵律节奏的合成语音。在自然语言文本中,数字和特殊符号作为自然语言系统中的基本符号广泛且大量存在。富士通语音合成系统中提供一种能够精准地处理文本中复杂形式的数字和特殊符号的文字符号化处理模块。

  以预先录取常用句型的车载导航系统语音合成举例,富士通通过预先录取车载导航系统一些常用句型的语音,对于这些常用句型的输入文本,语音合成系统直接从预录音库中提取其中没有变化部分,对于不一致部分如地名等采用合成技术生成语音,然后进行韵律参数拟合获取基本自然的语音。对于一般文本,则采用通用合成引擎输出语音。(特约记者:贾子昂)
共0条评论网友评论
  • 全部评论
共0条记录(共页)
向您推荐

新闻 按行业分类

厂商 按产品分类


        
总机:021-51601170 直线:021-58307717,17317241681(微信同号) 电子邮件:cct@51callcenter.com  泸ICP备10026114号-4  行业交流俱乐部QQ:2919157212
地址:上海市浦东新区牡丹路60号东辰大厦810室  邮编:201204 上海趋天网络技术服务有限公司 版权所有(2002-2018)