首页>> 高端访谈>>新闻详情

科大讯飞--呼叫中心“语时代”

2013-05-02 10:13  《4PS呼叫中心国际标准研究中心》  咨询电话:17317241681(微信同号)  


    《2013年度(第六届)中国联络中心与BPO产业大会》ACCC大会于2013年4月18-19日在上海国际会议中心隆重举行。峰会由呼叫中心与BPO行业资讯网(51Callcenter)主办,中国呼叫中心与BPO产业联盟(CNCBA)、4PS联络中心国际标准组织指导,有来自于金融、通信、物流、电子商务、制造业、跨国企业等行业管理层;及联络中心、客户服务、云计算、服务外包、CRM、社会化媒体、企业通信等行业厂商等3000余位海内外嘉宾参加了该活动。

    4PS标准/CNCBA主席/国家工信部全国服务外包技能考试指导委员会副理事长颜晓滨、工信部通信科技委员会委员/中国通信协会理事李振坤等,及来自协会及行业的高管及专家在联络中心、客户服务、云计算、服务外包、CRM、社会化媒体、企业通信等主题方面做了几十场精彩纷呈的演讲和分享。

    科大讯飞网络语音部解飞做了主题为《呼叫中心“语时代”》的演讲。如下为大会现场演讲实录,如需完整观看所有内容,请登录-- http://www.51callcenter.com/2013/  。


    解飞:谢谢主持人,谢谢各位专家,各位嘉宾。我们今天在这里分享的是关于语音技术方面。语音技术是人跟人之间交互最便捷、最自然的方式,像传统的嵌入式设备最早可以发短信、发小心,使用九宫格按键发的触摸方式改变了我们的交互界面。后来通过语音的交互,一定是一种最便捷、最自然的用户体验的方式。我们讲语时代已经到来,为什么这样讲呢?应该讲他具备了两个条件,第一个,语音相关的技术已经得到了极大的进展和突破,其中解决人和人之间用语音方式或人与机器之间做语音交互的问题,就是语音识别正确率,语音识别的正确率现在通用领域已经达到了90%以上,因此已经能达到真正的使用门槛。此外随着Wifi等网络的普及,可以使云系统可以把庞大资源放在云的服务端。在我们使用的终端手机各种嵌入式的设备上,只需要把语音进行收集传到后端,再在后端进行回复,就可以完成交互。现在我们面临的时代,语音交互和爆发已经达到了一个基本的使用条件和门槛。所以苹果在2011年10月份发布了Siri,Siri是4S一个最大的卖点,而且从现在拿到的数据看,4S用户每个月都会打电话使用Siri的语音功能。在语音交互的嵌入式设备体验已经做得非常好,从2011年Google公布数据说25%搜索来自于语音搜索。微软也是一样,比尔.盖茨从08年就在他的演讲中说过,他最看好的三大技术,语音是其中一种方式。中文语音上我们也有了比较多的积累,我们在中文语音是走在全球前列。2011年10月份科大讯飞在业界第一次发布了语音云平台,为我们个行业车载啊、手机啊、智能家电、终端设备提供按需可取、随处可以访问的云的能力。去年3月份我们在北京第二次发布了第二代语音云,在第一代基础上承载了语义理解功能。在第一代语音云发布的时候,一起发布了一个讯飞语音输入法,目前这个输入法已经有超过三千万的用户。应该说是属于嵌入式设备排名前三的输入木。去年第二代发布了讯飞雨点,像业内互联网大佬搜狗语音助理、百度语音助理,也都纷纷面世,基于语音平台的客户端应用目前已经超过了6千多个。

科大讯飞网络语音部 解飞

    在用户发展方面,去年一年用户数从一千万增长到将近一亿的用户,今年4月份语音云用户已经突破了1.4亿。

    下面为了说明一下,我们跟中国移动合作了一个产品,叫做灵犀,有些嘉宾可能使用过,灵犀在我的手机客户端就有这样一个软件,打开灵犀麦克风,“帮我查一下科大讯飞的股票”,“为您找到科大讯飞的股票,科大讯飞当前的股价是36.62元,下跌0.18元,跌幅0.49%”。这边就可以找到他已经看到科大讯飞的股票,现在是一个比较好的买入时机。“上海的天气情况怎么样”?因为这个前台做收音放音,今天可能使用网络的人比较多,网速不是特别好。“附近有没有肯德基或者麦当劳”?我们也可以试一下本地访问功能。“打电话给秦伟”,“马上为您呼叫,秦伟,18……”打电话、发消息简单的通讯录音的识别也可以做。

    在呼叫中心语音技术有哪些可以应有呢?我们现在拨是安徽联通的客服热线,“您好欢迎致电中国联通客户服务热线,自助服务请按一,”“中午好,我是客服助理,能帮您办理话费查询、套餐查询等,请问有什么可以帮您,如需了解更多,请按帮助”。“我家的宽带上不了网了”。“好的,宽带故障,请问您宽带故障提示代码是什么”,“678错误”,“好的,下面为您介绍宽带故障678,请您检查接入点”。

    我们再回到PPT。下面看一下两段Video。

    除了在呼叫中心的应用,我们也跟一些车载行业做了一些语音应用。前年跟上汽的合作中就提供了IVOKA系统,可能有些嘉宾的车子已经得到了应用。车载系统里内嵌了一个3G的卡片,虽然车主是对着车上的终端设备在说,但后台的交互都已经开始做语音识别。跟灵犀一样,在网络环境差的时候可能会受到一些影响。

    除了车载以外,国内五大电视机厂商也跟讯飞合作,提供电视上的智能助理产品,尤其现在的互联网电视,后台提供的资源内容非常多,通过这种传统的遥控器解决输入问题是很难的,用键盘输入一直是非常难的问题。但现在我们在遥控器里加了一个小的麦克风,只要收看的节目都可以找得到。

    除此之外,语音技术可以在教育领域得到一些应用。我这里有一个小的Video可以看一下。(播放视频)这里面到三个技术,语音合成,所有老师的板书和学生文字都可以通过软件做播报,得到最标准的中英文发音,第二就是评测技术,讲出来的单词和句子可以通过系统告诉你哪句读得不好,第三就是语音识别技术,小孩在背诵课文时后台会把文字播报出来,哪个地方错误也能得到提示。

    讲到合成技术,这是讯飞的看家本领,也是目前呼叫中心用得最多的语音技术,也就是语音合成。语音禾城上全球最大的评测叫暴风雪评测杯,我们连续7年获得大赛第一名。去年在英文的合成效果,大家可以听一下。值得一提的是这套系统是当时所有参会比赛系统里唯一一个超过4.2分的。什么是4.2分的概念呢?我们系统评测的时候按照五分制,最标准的播音员水平是五分,普通人讲话水平是4分,他是唯一一个超过普通人讲话的英文合成效果。陈至立到讯飞时听到我们的语音合成,说这个是很有价值的意义的,因为英文播报的效果比很多西部学校里高中英语老师的水平高得多。除了中英文,现在也在考虑多语种的解决方案,我们现在提供15种的包含藏语、维族的语音合成解决方案。

    语音识别上面,随着大数据和云计算的技术突破,识别正确率在逐渐提升,达到可用水平。最早的时候业内有一些专家可能也了解到有很多厂商从90年代就开始推云识别技术,但那时候云识别可以说是很傻的云识别,我们要定义识别的内容,直到08年以后这个技术有很的突破,去年工信部软件处理中心测试比赛,我们分几个方向测试语音识别正确率,一个是日常输入,一个是搜索导航PUI检索上,另外就是传统的语音,讯飞都达到了90%的使用水平。

    除了语音识别方面的核心进渣,值得一提的就是语义理解技术的进一步发展。把语音转成文字这是第一步,也是最基础的工作,如果语音转文字不正确后面就谈不到语义理解。语音转文字正确以后,怎样理解用户用途,这就是语义理解的意义。现在还没有达到语音识别那么成熟,在20几个语音下,我们平均性能到85%的正确率。随着讯飞语音不断的积累更大量的用户数据,这个85%的正确率也在稳步往上提升,有望到明年底期望达到90%以上。

    语音理解以后虽然还处于进展中,但是已经有了很多实际应用案例。我们已经有全国16家升级运营商使用语义理解,包括短信营业厅判断用户发出的文字是什么意思,包括网上营业厅通过机器人、客服形式对客户进行对话,这里面得到了用户比较好的使用效果的评价。

    在呼叫中心有哪些解决方案可以提供呢?我们分为两个大的方面,第一是面向呼叫中心前台,主要包含语音合成解决方案、语音导航解决方案、声纹识别,导航是实现语音交互,声纹是对客户身份进行确认保障,后台提供解决方案就是语音分析,因为语音分析最近两三年在呼叫中心行业是很热的一个点,在这个行面我们分享一下我们有哪些经验。

    传统的合成应用可能是比较多的。我举一个例子,听一下语音合成在简单的客服播报工号的效果。这个是常常从您好到播完是4秒钟,而我们用识别,并且调了参数,然语速变得比正常语速变得更快,因为工号播报是没有信息量的,也很少有用户非常在意,我们做了一个试点,提升平均通话时长2秒钟,一年下来节约费用就是86万元。同时有些专家可能认为我使用板卡播报更稳定,使用你系统播报是不是有些问题?但事实上我们做了安徽的一个播报,他的播报效果应该是很大的,非常大的量,现在我们在1月份两个中心每天2700万次,服务可用性是达到99.999%,而且合成响应时间是小于0.3秒。同时在用户体验上,我们用核心指标就是满意度,效率提升了17%,应该说语音合成很成熟的技术应用在呼叫中心来说是效果非常好的一种应用。

    2010年以后很多银行甚至运营商都做很多的试点,我们希望通过这样的自助语音识别系统改变传统的按键式的交互方式,把后台更多业务通过自助系统展现出来。可能有三个大的改造点和应用方向,第一打造全语音的门户,把我们在后台IVR菜单下两三百个业务都推送到客户面前,实现菜单扁平化。第二就是自助服务改造,比如以前用户需要输入货币名称、股票代码,有时很难记得清楚,银行可以直接说出货币名称、城市名称。第三就是辅助人工信息播报,因为大量查询类业务我们都可以通过语音合成选中知识库之后听,而没有必要进行简单重复的播报。

    现在语音导航应用,我们从09年在工行做,后面在中信银行、深发展做了一些,使用效果还是非常不错的。我有几个数字,第一就是语音导航系统的自助使用率提升大约20%以上,这里有一个对比的图。前面这个是我们某银行上线前使用IVR的图,这个图里80%用户在IVR系统里做的交易和操作只集中在这四类上,这是非常可惜的,因为我们设计人员做了很复杂的流程、引导、IVR的设计,但却没有很多用户用他。这是我们第三个月的业务统计,可以看到85%的设计集中在20几个业务上,这种长尾现象非常像人工的业务的服务趋势。第二个数据就是33%,通过语音导航系统的比例相对按键转人工比例下降了33%。第三个数据就是0,系统上线18个月,零投诉。一些管理者有一些误区,认为语音导航跟按键是一个替代关系,其实不是这样,我们经验看,语音导航是跟按键是一个补充关系,因为语音的方式并不是所有用户都能够接受的,一定还是需要有按键这种方式来做补充,两个是互相融合的一种关系。

    语音导航方面我们做的后台数据分析,发现98%的用户在接到语音导航提示之后,他讲的是普通话和方言,因为这是全国系统里做的分析,还有2%讲的方言,我们写了一个词,什么叫纯方言,什么叫方言普通话,我们可以听一下什么是方言普通话,这个就是纯方言,搜集数据的小姑娘也很纠结,听不懂。方言普通话的效果我们已经达到90%。

    导航应用在上海世博会、工行、中信银行已经使用了很多。我们系统为962010分摊了10%的人工,那是语音导航在国内应用的第一炮,对这个比例我们还是非常满意。但现在在老运营商里做的导航系统已经分摊人工30%。
    导航系统跟越来越多的客户端的方式,是可以融合在一起的。我们也在某些运营商做了实验,我们同时提供导航、客户端的解决方案,可以看到两边在后台语音合成技术和识别效果甚至包括一些UI设计上都是可以直接适用的,而且这种客户端应用可能未来更符合用户体验。

    再就是声纹识别技术,是一种生物识别技术,但也有一个跟其他生物识别非常不一样的特点,虹膜识别、掌形识别都是需要接触式的,只有声纹可以远程,通过电话,使用终端设备只需要一个麦克风就可以完成。第二就是用户体验上,声纹可以运行在呼叫中心后台的服务器端,把语音传到声纹服务器上,而用户本人并不知道他在进行确认。第三就是性价比,不需要任何软件。再就是他跟人说话的语音、语言和文本没有任何关系,也就是说这个人可以是中文,也可以是英文,我们都可以对声纹进行确认匹配。也可以结合一些特使应用场景,我们把声纹技术跟语音识别技术结合起来使用固定词语才能达到声纹识别,这样以免录音欺诈的现象。

    另外就是运营支撑中的智能语音分析应用。有一些用户投诉的时候我们可能调流水,找出包含的内容进行质检和分析,但是现在我们通过语音识别技术、语音分析技术可以把座席跟用户交互的语音录音全部转成文字信息,再转成结构化的可检索信息保存在数据库里。我们可以通过建一些模型,比如包含对服务质量的模型、对营销的模型,对经营情报的模型我们集中起来,对他进行数据复杂和挖掘利用。

    应用实践。一个就是质检上,我们可以把质检里的内容通过自动方式发现出来,可能形成这样一个页面,这是文本跟录音对照的页面,然后把系统自动听取出来的质检定位录音片段,提供给质检员进行确认。我在做项目的时候,人的质检正确率大约95%,系统现在可能好的也达不到人的效果。但是其实已经给我们带来比较明显的价值,首先就是抽样方式上传统的抽样是均衡抽样,命中率比较低,可能每个座席必须听两到四个,但是通过系统抽,通过我们预设模型进行抽取,分布更符合分布原则,对于质量评估效果会更准确。第二就是对质检量的覆盖。上系统之后我们没有做100%的质检,我们做的是30%。第三就是对质检员本身,之前一个质检员听录音的时候比较好的可能一天听80单,差的60单,我自己听过,感觉特别枯燥,然后听不清楚还要重新来,通过这种系统可以能从文字方面先做理解,直接点文字进入录音片断,这个效率提升非常明显,从70几条听到130几条,几乎是一倍的效果。我们上线的时候,去年7月份每天违规件一个月下来是1245件,在第一季度已经下降到90件一个月,就是质检的违规项在我涵盖的这些项里,下降还是很厉害的,第二就是对于服务态度恶劣的问题,出现辱骂字样的案间从9件下降到每个月2件,这个下降也是很明显的,因为确实他的威慑力度还是很大的。

    再就是除了质检以外,可以做一些运营管理,可以帮我们做一些自助话务结构分析,通话时长,甚至可以区别出座席、客户的时长,还有重复来电分析,现在我们可以结合来电原因定位到具体的用户的信息上,可以做一些自动的来电原因分析,还有品牌信息、员工信息的关联信息分析工具。

    再就是营销挖掘方面,我们对手机报和彩铃业务两个做了营销挖掘,可以看到10月份对于手机报的业务其实成功率是提升了41%,手彩铃也是提升非常高,提升了168%。

    最后讲一个小的总结。在互联网时代,鼠标和键盘一定是我们作为输入交互的最主要渠道,进入移动互联网时代智能语音交互方式随着设备越来越小,触摸屏的普及,可能会成为一个新的方向。尤其是现在互联网非常普及,通过IVR、通过网页、通过短信这种多渠道的方式,已经到来。再就是自然语言交互上,是一个明显的趋势。我们也希望提供语音与语言融合的应用趋势,大家一起迎接呼叫中心的语时代。谢谢各位。


   


    本新闻为51Callcenter原创稿件,转载请注明出自51Callcenter。谢谢!

 

 

 


 

共0条评论网友评论
  • 全部评论
共0条记录(共页)
向您推荐

新闻 按行业分类

厂商 按产品分类


        
总机:021-51601170 直线:021-58307717,17317241681(微信同号) 电子邮件:cct@51callcenter.com  泸ICP备10026114号-4  行业交流俱乐部QQ:2919157212
地址:上海市浦东新区牡丹路60号东辰大厦810室  邮编:201204 上海趋天网络技术服务有限公司 版权所有(2002-2018)