语音合成即TTS技术,又称文语转换技术,能将任意文本信息实时转化为标准流畅的语音朗读。它涉及声学、语言学、数字信号处理、计算机科学等多个学科,是中文信息处理领域的一项前沿技术,解决的主要问题就是如何将文字信息转化为可听的声音信息,即让机器像人一样开口说话。
作为TTS的发展是随着语音技术的成熟和应用的发展,近年来语音技术应用逐渐渗透到CTI领域,为呼叫中心业务注入了新的活力。
信息的爆炸性增长和市场对多样化、实时信息需求的发展,使得采用传统录音回放技术的呼叫中心系统和电话声讯服务已无法满足人们对信息获取的要求,日益成熟的语音技术以其自然、平易、亲切等特点成为信息获取和沟通的较佳方式,也是构建多媒体与网络呼叫中心的必需技术。
目前,在CTI应用领域,语音技术的应用需求更加迫切,这里的语音应用不仅对语音合成的质量有较高要求,同时更注重大规模的实时应用。TTS技术使呼叫中心在各行各业中的应用更好。
IVR系统是呼叫中心的重要功能,通过IVR系统,用户可以利用音频按键输入信息,从系统中听取预先录制的数字或合成的语音信息。具有TTS功能的IVR可以加快服务速度,节约服务成本。
在呼叫中心系统中的IVR可以通过调用TTS ,将检索出来的文本信息转化为语音数据,播报给用户,实现自助式的信息服务。
而在坐席系统中我们还可以运用TTS功能将座席的查询结果转化成语音信息播放给用户听,座席代表无需将这些内容口述给用户,从而大大减少人工座席的平均处理时长。
提高人工坐席资源的利用率。对于时效性要求很高的公共信息,如股评、新闻等,可以采用TTS系统以离线合成的方式将这些信息在最短的时间内转化成为语音文件保存在呼叫中心系统的语音文件服务器上。这样用户只需拨打电话就可以听到最新的信息。
呼叫中心TTS与录音回放相比具备哪些优势?
在语音合成技术应用之前,录音回放一直是呼叫中心自动语音服务中所采用的主要手段,但是随着多媒体信息需求的增大,语音服务系统中近年来应用TSS技术得到了迅速发展。
(1) 就工作量而言,录音需要大量的人力,在信息量以几何级数增长的今天,录音往往无法满足信息的供给,而语音合成将绝大多数工作由机器代替,人们只需提供现成的文本信息即可输出声音信息。
(2) 对于动态的信息,尤其是对实时性要求很高的信息,如股票行情等,如果让录音员录音则至少在半小时后才能对外提供,而语音合成可以实现实时的转换,每分钟可刷新一次。
(3) 由于信息的高速增长,录音数据存放和查询也存在问题。将信息以文本形式存储在计算机中可节约大量系统资源再结合计算机技术对数据库中的信息进行搜索和整理将输出的结果用语音合成转换成声音,这样就可以解决信息服务中海量信息的存储和查询的问题。
(4) 录音的信息维护、修改的工作量比较大。而文本信息的维护和修改相对要容易得多,通过语音合成技术只需对文本信息进行修改就可以完成信息内容的更改和维护工作。
目前TTS技术已经十分成熟,现在的研究主要集中在生成的汉语语音的清晰度和自然度上,而且通过一些参数做到语气语调的调整,使得语音更接近真人播音。