首页>> 公司信息>>新闻详情

科大讯飞电话语音识别InterReco 2.0

2008-08-11 10:28 《4PS呼叫中心国际标准研究中心》 咨询电话:17317241681(微信同号)


  一、产品概述
  
  电话语音识别引擎InterReco2.0可以为自助式电话语音系统提供完善的语音识别技术解决方案。集成InterReco2.0的自助式语音系统能够为客户提供全天候的优质语音服务,从而确保以较低的投入显著提高客户满意度。
  
  科大讯飞电话语音识别产品整合了科大讯飞研究院、清华讯飞语音实验室及科大讯飞语音实验室在语音识别技术上多年的积累,专门针对中文语音识别的技术特点进行了全面优化。对于中文语音识别应用中经常面临的方言口音、复杂信道和背景噪声等问题,依据从实际业务系统中收集的涵盖不同方言和不同环境噪声的海量语音数据,采用最新的区分性训练方法进行语音建模,从而使InterReco2.0在复杂应用环境下可以拥有良好的一致性效果表现,核心技术效果达到国际领先。InterReco2.0产品架构上延用了科大讯飞在语音合成中久经锤炼的高稳定分布式语音平台,可以满足电信级应用的高可靠性要求。
  
  二、产品功能:
  
  InterReco2.0在复杂环境的识别效果均有不俗表现,产品考虑了呼叫中心、增值服务中的不同应用特点,易于开发集成及进行业务开发,主要功能有如下:
  
  ·大词汇量、独立于说话人的健壮识别功能
  
  识别系统能对多种语言进行大词汇量的识别,在中文识别方面使用了讯飞TTS引擎使用的词典和文本分析技术,能够对语法内容进行分词处理,保证多音字的识别效果。
  
  ·端点检测与打断(End Pointer && Barge-In)
  
  端点检测是对输入的音频流确定语句的起始和终止的处理过程。当找到语句的起始和终止点后,语句区向前后分别延伸预定的长度。一旦检测到语句的起始点,语音开始流向识别引擎,直到检测到语句的终止点。通过这种方式,识别引擎在用户在讲话的同时,已经开始处理讲话的内容,而又不需要处理语音的起止处多余的静音,从而节约CPU时间和网络带宽。
  
  打断功能使用户可以打断提示、作出响应,无需等到提示音结束播放。打断功能使得用户和系统间的交流更加快捷、自然,特别是系统的熟练用户。
  
  ·多识别结果和置信度(N-Best && CM)
  
  对于有些应用程序,可能需要识别引擎产生可能的识别结果集,而不是一个最好的结果。系统提供了可能的识别结果列表,并按可能性从高到低排列。
  
  语音识别引擎在返回识别结果时会携带该识别结果的置信度,对多个识别结果给出其可能性的指标,准确的置信度输出可以为识别结果的分析和后续处理提供依据,改善在用户语音不清晰、语义不明确时的效果体验。
  
  ·语音录入(Voice Enrollment)
  
  允许用户通过本人语音来向动态语法增加命令或词表。这种方式不但能够有效利用用户个性化的语音,提高系统的识别准确率;而且能够提高用户输入词表的方便性和灵活性。例如,在语音通讯录的应用中,用户可以通过语音的方式来添加通讯录,从而使用户可以随时随地修改自己的通讯录。
  
  ·动态语法
  
  动态语法是由应用程序在运行时动态创建和修改的语法。这在应用程序词汇必须在运行时才能完全确定的情况下是必不可少的。
  
  ·呼叫日志(Call Logging)
  
  语音识别的调用日志在系统中有着非常重要的作用,该日志记录了输入的音频、加载的语法、识别过程的中间结果、识别模块调用过程、识别使用的各种参数、识别结果以及当时的系统环境信息。这些数据是效果分析的依据,详尽的Call-Log是效果优化的基础。
  
  ·说话人自适应
  
  当用户多次使用同一识别系统时,识别引擎能够逐步适应其口音,使该使用者的识别效果逐步提高。同时,如果预先给定特定说话人的数据,系统可以针对特定说话人进行自适应训练以获得更加适合其发音特征的语音模型,使该说话人在使用系统时,识别效果更好。
  
  ·多槽识别
  
  语音识别的槽(Slot)代表一个关键字,即在一次识别中可以识别多个关键字,这种识别模式可以提高语音识别的使用效率和用户体验。
  
  ·模型自适应
  
  针对每个应用专门优化通用模型从而更加适合应用:包括方言和口音的说话人特征,无线设备、VoIP设备等通道特征,词汇和环境噪声等应用特征。
  
  InterReco2.0除了在核心技术指标上一系列优异的表现外,针对语音识别集成开发和业务实现难的问题,InterReco2.0还提供了一整套易用的开发接口和工具,使语音识别应用的合作伙伴可以基于该引擎方便的开发应用系统,并通过所提供的工具及时发现开发中出现的问题。此外InterReco2.0在业务实现阶段,提供了简单易用的语法设计和实现方式,用户甚至写汉字就可以实现语音识别语法的编写,系统还提供了语法向导,其中已经内置了常用业务语法,使用户可以更简单的使用语音识别系统。相信随着科大讯飞发布国际领先的电信级中文语音识别产品,通过和合作伙伴的共同努力,语音识别将为合作伙伴带来更大的增值空间,中文语音识别产业将获得更快的发展。
  
共0条评论网友评论
  • 全部评论
共0条记录(共页)
向您推荐

新闻 按行业分类

厂商 按产品分类


        
总机:021-51601170 直线:021-58307717,17317241681(微信同号) 电子邮件:cct@51callcenter.com  泸ICP备10026114号-4  行业交流俱乐部QQ:2919157212
地址:上海市浦东新区牡丹路60号东辰大厦810室  邮编:201204 上海趋天网络技术服务有限公司 版权所有(2002-2018)