首页>> 高端访谈>>新闻详情

科大讯飞网络语音业务咨询总监马家邻--“话时代”的智能客服

2015-05-26 08:38  《4PS呼叫中心国际标准研究中心》  咨询电话:17317241681(微信同号)  


    《2015年度(第八届)中国联络中心与BPO产业大会》ACCC大会于2015年5月14-15日在上海国际会议中心隆重举行。峰会由呼叫中心与BPO行业资讯网(51Callcenter)主办,中国呼叫中心与BPO产业联盟(CNCBA)、4PS联络中心国际标准组织指导,有来自于金融、电商、通信、物流、IT、制造业、跨国企业等行业管理层、及联络中心、客户服务、云计算、服务外包、CRM、社会化媒体、企业通信等行业4200位管理者参加了该活动。

    4PS标准/CNCBA主席/国家工信部全国服务外包技能考试指导委员会副理事长颜晓滨、及来自全国各地的行业协会及行业高管、专家做了几十场精彩纷呈的演讲和分享。

    科大讯飞网络语音业务咨询总监马家邻做了主题为“话时代”的智能客服的演讲。

科大讯飞网络语音业务咨询总监  马家邻

    马家领科大讯飞:今天我演讲的主题是“话时代”的智能客服-从“能听会说”到“能理解会思考”。中国呼叫中心市场保持快速增长,总坐席数超过120万,预计未来三年平均年增长率超过15%。像刚才颜主席说的哪怕一个做坚果第二的公司的呼叫中心都已经达到了300人的规模。

    我们的呼叫中心接入终端智能化,服务多渠道,服务营销一体化发展趋势明显,智能自助服务需求迫切。我们可以看到,人工占比非常重,人力成本越来越高。特别是呼叫中心,很多家的呼叫中心管理有一个问题就是招人难,招进来之后留人难。工作压力大,有一些在这个里面值夜班,很辛苦。我们更希望把人工做的一些事情转到我们的机器进行智能化的服务,这样来节省我们的人工成本,降低我们的运营成本。作为企业和用户沟通的重要桥梁,客户服务体系在互联网大潮中越来越重要,与此同时,如何提高服务质量的同时降低我们的人工服务成本,这是我们所迫切需要关注的。智能语言技术作为最自然最流畅的交流方式,致力于实现人机交流无障碍,人人沟通无障碍。从以机器为中心的人机交互转为以人为中心的自然交互,科大讯飞在这里引领了自然交互的创新。2010年10月份发布全球首个移动互联网智能语音交互平台-讯飞语音云,2011年9月份“语音及语言信息处理国家工程实验室”揭牌。2012年3月我们新一代语言云平台发布首个实用中文语义理解系统。同年8月成立了中国语音产业联盟,讯飞当选为理事长单位。2012年12月与中国移动联合推出智能语音助手产品,这个产品的定位是给用户提供一个实用的助手,比如阅读、查天气等便民引用,包括跟移动深层业务合作的应用。2013年11月份发布语音新品解决方案,比如与歌华有线的合作,总的用户量超过了25万,而且这25万里面活跃用户数超过了80%。2014年讯飞的语音输入法激活用户数也超过了1.6亿,智能语音助手跟移动合作的产品,超过了1.7亿,语音云总用户超过了7亿。接入应用数超过了6万。

    讯飞语音技术的进展是多种类的,在我们呼叫中心用哪些语音技术来提高我们的服务质量,并且降低我们的运营成本,这里面有一个语音合成的技术应用。这是一个国际合成大赛暴风雪杯的一个比赛情况,满分是5分,这个是自然语音达到的是4.7左右,就是我们普通人普通话说的比较好的话达到4.7,我这个水平也就是4.3左右。讯飞系统在所有的参赛系统,参赛的单位由美国的微软、IBM以及其他一些全球顶尖的语言研究公司,讯飞是唯一一个在自然度上超过4.2,也就是讲接近于甚至超过部分普通人自然发音的水平。这个比赛我们联续参加了9年获得了九连冠的好成绩。我们致力于将语音技术应用在实际环境中,大家最近也听到过高德导航,林志玲的声音,包括郭德刚的声音,包括用它来播小说。这就是我们一个合成的效果,声音也听的比较熟悉。我们根据它的发音制订了一个音库,输入一段文本或是一个小说,用它的声音读出来,让大家听起来,特别一些场景下听的更舒服。这是我们更高表现力的合成。

    有一个应用落地是跟中国移动的一个“和阅读”,用户听的时长从42分钟提升到的87分钟。在这个里面,国际有声阅读市场达到了7.5亿的价值,预计2016年将达到22.6亿。这也是我们语音合成的应用。语音合成是一个从文本到语音,反过来,语音到文本就是我们的语音识别。客服中心呼叫中心最不缺的就是语音,语音是我们最大的宝库。语音识别也是讯飞在不断的做迭代,而不是说做到国际领先就踏步不前。讯飞2010年首个达到实用的中文听写技术,2011年率先推出个性化语音识别。2012年业界首个DNN中文听写技术,2013年是首次在终端实现本地语音听写。2014年业界领先的高抗噪和方言语音的听写。我们在抗噪环境下做一个降噪,去混响滤波。比如我们讯飞合作的电视是集成在麦克风上的,现在我们想采用一种让人更懒的方式-就是远场识别,我就躺在沙发上说我要听歌,要看中央一套,它是3到5米的背景噪音干扰性非常大,这是我们抗噪的应用。抗噪实际应用案例是2013年奔驰汽车在全球范围内选了三家做语音的顶级厂商做了一个PK,这个PK是在这么几种场景下,一种是车速在0码所有的窗户全开接受外部的噪音,还有车速达到100码或是140码的情况下,我们知道,120到140码,它的噪音在驾驶舱内比较大,讯飞在这些场景下都可以保持识别率达到90%以上。这样在我们实际应用过程中达到了实际应用的价值。我们讯飞跟奔驰签订了一个长期的合作,现在跟宝马、大众,国内的奇瑞、江淮都在进行合作。

    另外一个我们呼叫中心关注的问题就是方言,因为我们的客户很大一部分绝大部分用户都不说普通话,还有一部分是普通话不好。这里面我们就做了一个方言识别,种类像粤语、四川话、河南话、上海话,包括藏语、维语。这是我们的识别,识别之后,我们语音、声纹的应用,公安部跟讯飞联合成立了一个联合实验室,这也是公安部唯一一个不在北京的实验室,已经获得了很多的成果。声纹在民用方面我们也有一些深入应用。后面我会讲到。

    另外一个技术就是人脸识别,人脸识别是香港大学汤晓鸥教授牵头做的一个,机器模拟跟人认知还是有差距的,而通过这个已经超过了人的认知,识别率超过了99%。另外就是我们的语音翻译,它的一个学术情况在日常的交流领域、旅游领域、中学教育领域等垂直领域有较深入的应用。忠诚度和流利度满分是5分,如果是4分就是一个优良的效果。这是在民语局跟我们合作的一个项目。IWSLT国籍口语机器翻译大赛是04年发起的,我们14年第一次参加,第一次参加之后,在中译英和英译中比赛中就取得了第一名。语音和文本翻译都有很好的成绩。我们落地的一个项目也是在一些领域内,比如说已经开始出国访问的用户做一些场景下,比如点餐、购物等等这些环境下采用我们语音翻译进行交流。

    我们的语音技术还能让我们的智能客服更加的智能,主要有这么几块。一个是语音导航,这个主要是应用在我们呼叫中心的电话系统。传统方式更多采用的方式是按键,0到9个数字所代表的业务和涵盖的业务肯定不足以满足我们的业务。讯飞语音导航,把所有的菜单扁平化,实现了用户的自由说功能。一些客户按键过程当中按着按着就烦了,甚至提示音都不听,直接按个3直接到人工。人工成本很高,如果自助系统里面直接解决就可以降低我们的运营成本。第一个达到语音门户,打个比方我查一个我的话费,用户说的是很开放的一种表达方式,我们系统后台会做一个交互,请问您查询当前话费还是历史话费,这样用户再确定一次我查询当前话费。这个流程设计中是这样的一个原则,就是交易数每个业务下面一层层往下深入,深入到不能深入的时候,比如5元流量包,语音导航当中打破了所有的层级菜单,可以达到任意一个节点,比如跳到另外一个业务下一步修改密码,就可以直接跳过去,这样你交互次数,交互时间减少,客户感知也非常好。我们的运营中心的成本也会降低。另外人工导航、缓解人工压力,比如我打银行的电话,高峰期经常打不进去,怎么办,我就只有等,有的时候等的时间比较长,在这个时候,如果给用户一个另外一种选择,可以尝试进入到我们智能语音自助系统进行自助语音服务,有的客户愿意尝试,觉得还不错,我很多的需求都能解决,下一次就不会再打人工而直接进入语音系统。另外我们开展的一项工作叫夜班完全代替人工,夜间可能很多人会值夜班,有一些点已经取消了夜班只留一两个人员,其他的全部交给我们语音导航完成。

    还有一个多渠道的机器人,客户现在特别是年轻客户,微信、微博、QQ、短信、网站等等很多通道都能够找到我们的服务,呼叫中心这里面有时候形成一个信息孤岛,因为每个通道,我们的想法是好的,这几个通道在各自积累知识库的过程当中做到同步,但是实际运营当中非常难,因为它毕竟不是一个知识库。在这种情况下,我们现在时间一长,可能说用户在不同的渠道问同一个问题得到不同的答案,这是我们所不愿意看到的。如果你来的是文本我讯飞语音理解对你文本进行理解,如果你是语音我识别成文本再进行你的需求的识别。最终我们对接的就是我们所有的比如后端的系统来给客户提供统一的答案,统一的知识库,统一的接入,所有的渠道都是一个出口。不管你有多少入口我只有一个出口,这样就保证我们的一致性,你这个数据库我们只有一个情况下维护起来,包括后端再扩容的情况下,会更节省我们的人工节省我们的成本,多的知识库维护总是需要很多的人工的。在不断的完善过程当中,这些知识都可以共享,作为后台的运营管理平台,作为客户的运营管理、统计报表,数据监控报告,这是我们多渠道机器人。

    下一个就是我们刚才两个是面向与前端的,包括我们合成也好,导航也好,还是多渠道智能机器人都是面向客户直接可以体现到的。在我们后台还有一个分析管理系统,这是专门跟我们内部运营管理用的。语音分析,在我们呼叫中心里面最不缺的就是语音文件,语音文件日积月累,随着时间的积累体积还是很大的,我们存储空间有限,不得已而删掉,有的会刻盘,有一个公司我看到他们刻了很多的盘,但是又不用。我们怎么分析呢,首先语音文件我们很难做直接的分析,这个过程当中我们要一个结构化的过程,把它的信息打乱掉,比如这个语音我们把它翻译成文本,这个文本就是我们分析的结构化文件,每个关键词在这个语音当中所处的位置也是一个信息,包括客户的语速情况、情绪情况,使这种文件结构化处理之后,特别中间有一个场景分割的技术,通过这个场景分割,用户和坐席,把他们的说话全部打散重新组合,客户和坐席都不说话就是静音也可以进行分析。针对坐席我们可以进行一个服务质量检测,进行质检,关键词是不是有一些不合适的用语,或是中间服务是不是有一些策略进行一些质量检测。针对客户,客户本身对我们用户的评价,用户这里面有没有我们营销的机会,或是用户对我们的业务和产品反馈情况,以及我们关注的焦点是什么,对于用户这部分通话里面,我们进行挖掘分析现在客服中心,呼叫中心都不愿意做成本中心,客服中心就是晴雨表,我们怎么样面向市场的东西面向价值,大家都在思考这个问题,我们现在也在思考。通过我们讯飞语音分析,辅助我们呼叫中心做这样的一步,传统的模式我们看,可能是制定营销政策、策略实施,营销活动完成,统计数据,然后往上面报了之后再制定设施。这就是我在自说自话,不知道客户有什么样的反馈。在语音分析里面,让这种营销成为一种可能,语音分析来说我们对客服录音进行处理,处理之后,用户关注的焦点知道之后,针对性的制定有效策略,策略实施过程当中时时关注客户的兴趣和反馈情况,来调整我们的策略。这样的迭代,就是我一个营销策略是跟客户不停的互动,这个里面主要是及时根据用户的情况来进行调整分析。这是我们语音分析打造营销流程的应用。还有很多应用比如我们平时的各种模型的建设,流量的监控、专题模型,现在的4G手机等等都可以做一些专题。

    我们的声纹识别在公安领域用的比较多,如果是呼叫中心或是民用里面,比如声纹自由说、动态数字密码、开放文本密码或是固定的文本密码。第一个声纹自由说,我们通过IVR服务来进行声纹碰撞识别出来古代文本密码,比如白日依山尽就是以这个作为密码。人脸识别的应用,比如这两个图,是同一个人吗?当然还是可以看到很多的特征,这就是人脸识别应用、人脸识别检测、面部关键点的检测,人脸比对。这个里面刚才为什么把提到人联合声纹放在一起,因为我们做一些支付也好,银行的一些业务,我们人脸和声纹可以双引擎是不是更安全。用户单独对语音进行攻击通过声纹是有的,有时候对人脸进行攻击的可能性也是有的,但是同时攻击你的人脸和声音的可能性就很小了,这两种技术的融合是不是更能确定一下是不是你本人了。比如你用一张照片对着这个冒认的话,我们后台有一个3D检测技术,这个是不是3D的,还有人是用视频的方式冒认,我们现在有一个技术叫活体检测、唇音同步,我给你的密码是动态的,你不知道我给你的密码是什么,你说话的口形不一样,我也可以知道是不是冒认的。现在支付领域,包括客户的认证领域有一个非常大的应用,特别是我们在后台,比如呼叫中心用户打电话来,输入你的身分证号码,输入你的密码,问一些信息,如果这个里面采用双引擎让客户感知更好。这个里面我们提到的产品的应用和解决方案,在讯飞我们呼叫中心可以整合成一个能力平台,这样的能力平台包含了合成、识别、理解和我们的生物识别。在上面避免了多个烟囱的现象,多个渠道应有在我们这个平台上展示。

    下面是我们的讯飞超脑计划。简单来说,就是让系统像人一样自动学习知识,我们的目标就是让机器能够在2018年考上一本考大学。这个项目是我们的副总裁,也是科大讯飞的研究院院长胡郁博士任首席专家,集结我国该领域70%以上的研究机构团队,共三十多家单位,分九个子课题,共同进行这个方面的突破。现阶段我们做的预期的成果能够联想,自动学习,自然交互。这个里面如果把我们讯飞的超脑成果和智能客服结合在一起,我们会发展成什么样呢?智能客服的入口将无处不在,将也会能听能说,能理解会思考!谢谢大家!

    如下为大会现场演讲实录,如需完整观看所有内容,请登录--http://www.51callcenter.com/2015/

 

 
    本新闻为51Callcenter原创稿件,转载请注明出自51Callcenter。谢谢!

 

 

 

共0条评论网友评论
  • 全部评论
共0条记录(共页)
向您推荐

新闻 按行业分类

厂商 按产品分类


        
总机:021-51601170 直线:021-58307717,17317241681(微信同号) 电子邮件:cct@51callcenter.com  泸ICP备10026114号-4  行业交流俱乐部QQ:2919157212
地址:上海市浦东新区牡丹路60号东辰大厦810室  邮编:201204 上海趋天网络技术服务有限公司 版权所有(2002-2018)