首页>> 其他>>新闻详情

科大讯飞黄达志--移动互联网“语时代”的行业siri

2012-04-18 10:12  《4PS呼叫中心国际标准研究中心》  咨询电话:17317241681(微信同号)  


    《2012年度中国联络中心与BPO产业大会》于2012年4月12-13日在曾召开APEC领导人会议的上海国际会议中心隆重举行。峰会由呼叫中心与BPO行业资讯网(51Callcenter)主办,中国呼叫中心与BPO产业联盟(CNCBA)、4PS联络中心国际标准组织指导,4000余位海内外嘉宾参加了该会。4PS标准全球发起人/CNCBA主席颜晓滨、人力资源和社会保障部科学研究院副院长/中国劳动学会劳动标准委员会会长王竞等来自政府及企业的50位中外嘉宾就“呼叫中心标准/联络中心标准”等主题进行了50场演讲。


    科大讯飞网络语音业务总监黄达志做了主题为“移动互联网的“语时代”的行业siri”的演讲。如下为活动现场演讲实录,如需完整观看所有内容,请登陆:www.51callcenter.com/2012

 

    黄达志:各位来宾大家好,我是来自科大讯飞的黄达志,今天跟大家介绍的是语音技术在我们的联络中心当中的应用。可能在座有一些熟悉科大讯飞熟悉我的人知道,就是从99年进入呼叫中心这个行业到现在,大概有十几年的时间了。最近这一两年很多朋友都在跟我说你们的好日子现在终于可以看到了,确实是,我们看到现在真的是扑面而来的语时代。什么意思呢,在互联网的背景下语音越来越重要,越来越深入到我们的生活的各个方面。比如我们看到苹果的IPHONE4S里面把语音真正推到了风口浪尖。在之前微软的收购花几亿美金买了CALLME,现在也把这个服务搬到了微软的W7和下一代的智能手机上。

 


   谷歌我们都比较清楚在06年开始涉及到语音搜索,现在也开始在移动领域。大概在10年的时候谷歌给的数据,在北美已经有1/4的用户他们的搜索是通过语音搜索产生的。甚至还有1/4的用户手机的操作是用语音的控制方式来完成的。所以语音变得越来越重要。在刚刚去年的结束的全球电视销售展上,语音的功能已经渗透到所有的设备里面,甚至有一些厂商也开玩笑说,没有语音的功能都不好意思跟别人打招呼。包括下一代的智能电视都会加入一些语音交互的功能。


    国内市场怎么样呢,在今年年中6、7月份大家就可以看到大量的国产电视有一些语音交互的功能,我们不像原来那样繁琐的使用遥控器,后台的内容越来越多,遥控器操作会非常的麻烦。现在不管是长虹、海信、康佳、TCL等等已经跟讯飞进行紧密的合作,推出他们具有语音交互的电视。这都代表了移动互联网环境下的“语时代”的到来。为了推广国内的  语音互动,我们前几年就基于我们的语音技术,基于我们之前在大规模的语音计算上的积累,已经推出了我们移动互联网的语音平台。在2010年的10月份我们发布了我们第一代的语音平台,也是引起了很多业界的关注。因为它可以给我们的手机,甚至给汽车、智能家电提供了高质量的网络语言服务。


    我们看一下现在我们基于互联网的面向移动互联网的语音平台已经发布了什么样的作用和价值呢?基于讯飞的语音业务已经有3700个,其实涵盖了各种各样的应用,有的我们是微博控,在语音状态下觉得输入不方便,现在新浪微博、搜狐、腾讯以后都会有语音输入的功能。我们在驾乘者越来越多的情况使用的导航越来越多。现在我们手机的导航软件,从我们熟悉一些导航软件都有我们讯飞提供的软件,用语音就可以了,而不是通过手写或是键盘的方法来搜索我们的目的地。还有我们跟携程合作,在携程无限里面提供语音的功能。甚至在汽车里面,我们可以来看一个视频了解一下现在的语音已经可以得到了一个什么样的应用。这是上汽荣威的汽车,如果大家去上汽的专卖店会发现它只宣传一个卖点就是语音驾乘,这里面就是用的我们的技术。在广州市场上引发了非常大的反响,我们今后的驾车更多的使用这种的语音交互,这使我们更加的安全和乐趣。


    在这样的背景下,我们通过这样的发展有什么变化,在前年刚刚推出,从前年的年底第一个半年是从0到100万,那时候语音技术刚刚开始,有很多人觉得语音比他们想象的好,但是还没有达到比较完美的时代。再通过第二个半年从100到到达了一千万,而在今年的一个季度里面我们从一千万到了四千万,这个四千万的数据是三月底的时候,而现在我们有了四前四百万的用户。所以真的智能语音交互的应用已经呈现出一个非常明显的爆发的趋势。


    我们可能对于在座的各位,我们的各位朋友各位来宾来说更关心的是说联络中心里面,我们所从事的这个行业领域里面语音技术或是语音应用的趋势能够给我们带来什么样的变化?好,我们这里面想跟大家交流的重点就是说,个性化和人性化的新一代自助服务,因为有语言技术的发展,而且有越来越多的用户接受了了解而慢慢变得熟悉,甚至爱好使用语音技术的交互。我们可能在联络中心里面也可以考虑运用这种新的语音和语言技术给我们自助服务里面带来新的一些革命。这里面我们自助的服务其实渠道越来越多,我们有IVR,有短信、掌上客户端,还有网络营业厅甚至是IM的渠道。传统的服务我们知道很麻烦,后台的服务和内容越来越多,其实这给我们的人工服务也带来很大的压力。我们希望,用户是非常希望能够获得更加高效便捷自然的服务,这也是我们希望提出的我们是不是有可能打造行业SIRI,它是一个个人的语音助理,给个人的搜索个人服务带来一些革命。在联络中心里面我们是不是可以利用语音技术对我们的传统技术服务进行改造,用户通过最便捷自然的语音语言的方式就可以跟我们的自助服务的系统进行交互,去获得他想要的信息,帮助我们的企业来改进我们的用户体验。去减轻我们的人工压力给我们降低运营成本。

 

 

   科大讯飞网络语音业务总监黄达志

 


    这个里面会涉及到一些关键的技术,其实这个梦想我们已经期待了很久,但是现在我们到底能做到怎么样,这里面涉及的关键技术,一个是语音识别的技术,就是说我们要打造一个好用的,然后用户乐意用的自助服务系统,最基本的要求就是能听,会说,能理解,听的懂我们的说话,用我们所需要的语言进行沟通,同时它有思考理解的能力。所以语音识别,语音合同和语音理解在里面都是不可或缺的。但是我们看一下它技术水平达到什么样的程度,其实最近这几年还是发生了非常大的变化,有了很多新的进展。我们现在通过在国内的联络中心已经有了大规模的应用,甚至通过在教育领域等等这些行业,最近这几年在语音识别的效果上已经有了很大的进展。比如像我们知道我们要做自助服务里面更加自由的交互,我们需要不仅仅是原来的断续的语音识别,而是联续的语音识别。在主要的应用场景下已经可以达到比较高的性能。不管是用户比较开放的说法,还是说相对比较集中的目的比较明确的搜索导航,甚至是我们数字和数字之间的识别,都可以达到一个相对比较实用的程度。


    在这个里面我们可以大家可以示范我们一个例子,就是讯飞输入法,这是我们推出的第一个在语音上的应用,它是在手机上,我们说任何的内容把它可以转换成文字。讯飞语音输入法,就是在安卓的电子市场上可以免费下载。2011年它获得了移动大会的第一名,更多的是它来自用户的认可,我们可以看一下各大应用商店,在输入法的类别里面,讯飞输入法基本上都排在前三名之内,而且一定都是用户评价最好的所有的评价都是4星半以上。我们的这个水平已经达到了人们所预期的水平。我们再看一下能听会说里面的说,机器像人一样说话我们叫语音合成技术的发展。熟悉讯飞的朋友都知道,这是我们的看家本领,做的很早,一直以来我们在中文和英文里面,甚至一些国际语种我们都做的最好,我们是当之无愧的全球的第一名。我们在所有参与的国家和国际的评测里面我们都是第一,在最近联续六年中,我们从第一届到刚刚开始结束的2011年我们都是英文合成大赛的第一名。这个比赛里面囊括了所有的全球研究机构和跨国企业,我们唯一是参赛系统里面超过普通人受说话的水平。我们看一下我们在中文和英文的效果。这些都是机器合成出来的,如果大家到我们网站上输入任何的内容都可以达到这样的效果,我们再看一下英文的。在全国目前有将近5000万的师生在使用讯飞教育的产品,专家评测我们的英文效果比老师的朗读更加的标准。


    我们再看一下怎么样让机器理解我们的说法,这是我们非常关键,也是我们期待很久的,这方面我们有什么进展呢。基于我们长期积累的语言积累的模块,在语音交互理解上我们有了非常完善的系统框架。比如在现在的语音云上,我们正在向语音云过渡,面向移动互联网的云计算平台,不仅仅有语音识别的能力,同时他也会理解。比如用户如果说的这样的一句话,请问有没有下周一晚上去合肥的航班,我们就可以通过这个列表知道客户的意图,这样我们的程序就可以给客户提供更加快捷更加好的服务了。讯飞的语音理解,实际上我们在很多的行业得到了一些初步的利用,比如在公安系统里面我们是全国的公安系统在情报系统里面也是一个比较大的语言理解和挖掘的环境。我们在这里面是全国五个系统里面排名最好的四个系统。在运营商的电子渠道的应用里面,比如短信营业厅当中,我们在很多省都有成功的应用。去年中国移动总部在电子渠道这样的内部的评测当中,讯飞的承接的系统,在所有的系统当中我们的准确率排名第一名,而且远比其他的系统好很多。这不仅仅是支持我们原来得用特定的编码获得一些信息和服务,而是通过人和人之间的交流通过自然语言表现的一些内容。

 


    我们讲刚才核心技术的一些进步,关键技术通过这几年的发展已经进入到可使用的阶段,我们前面讲的,现在仅仅基于讯飞语音云的利用就包含了3700个,而且还在快速的增长,同时我们得到的观点是于是,用户使用的习惯正在形成。我们考虑语音运用的时候往往困惑两点,一个是运用技术是不是达到我们的水平,第二点就是客户是不是可以接受。现在看起来,在这方面的我们发展很快。七十从我们最近的一次语音云的发布会,刚刚在3月22号在北京结束的发布会,从发布会的现场的人数,从嘉宾的提问,到后面大家对这个热烈的评价都可以看出来,语音开始广泛运用到大家的生活当中。在3月份结束的发布会当中,我们预计是来了一千人,后来国家会议中心给我们增加了很多的椅子,像柳传志、李开复都给了我们很高的评价。李开复在了解了讯飞的语音识别之后,他们希望到现场跟大家进行一些交流。最近一次语音云的发布会上,我们也发布了一个新的示范应用,我们叫讯飞语点,它可以实现语音聊天,也有20多项语音功能,大家对它非常感兴趣,我们也可以看到,最近各大应用商店在讯飞语点的下载呈现了一个非常快的势头。大家也可以在安卓电子商场上免费下载,我们可以去体验。


    它有什么功能呢,其实它有很多的功能我们可以挖掘,这里面时间关系给大家简短的演示一个,这是我们在发布会现场。这个是识别出来的,而且短信内容也识别出来了。它这里面说的是提醒我今天晚上订一个好一点的吃饭的地方,然后语点就识别出来了。提醒完之后还找一个吃饭的地方,然后直接说在北京亚运村附近推进一些好一点的火锅店,这个也找出来了,后来还问了一个说汉堡包多少前一个英语怎么说,这个语点也帮他翻译成了英文。更相信的功能大家可以去下载我们的语电视机体会一下,这里面的功能非常的丰富,有很多也比较的有趣,希望大家能够发掘出更多的亮点。


    现在我们简单看一下,我们基于刚才讲的这些语音技术语言技术的进展,我们已有的一些积累,在联络中心里面我们现在已经形成了哪些好的应用。在热线里面自助语言技术大规模的得到了一些试点,比如在2010年的上海世博会官方热线96210里面,在中信银行的电话银行里面都有应用。在10年的世博会里面我们语音识别系统帮联络中心承担了10%的工作量。工商银行的电话银行在去年进行了改造,用了我们的语音识别,客户不用一层层的按键,就可以很快的找到自己办理的业务。从一些对比可以看出来,原来按键的分布,虽然我们提供了非常多的业务功能,在工行有300多个业务节点,而客户只集中在4项业务量上。所以现在90%的业务量分布在30多的业务上,原来的业务客户都有需求,只是按键太麻烦都转向了人工,而现在我们的语音识别系统都可以社别出来。我们现在在运营商里面已经有了16个省的运营商的应用。同时在运营支撑里面,我们用语音技术把它转成便于挖掘和分析的一些索引,同时从里面挖掘有价值的信心,对我们的客服和营销提供支撑。我们也提供了像山西移动、贵州移动这样的应用,以后会有更多的需求。


    这里面最后给到底简单的介绍一下讯飞,讯飞是99年成立的,现在也是十几年的时间,在中国语音技术里面我们是唯一的上市公司,现在市值是90多亿人民币,讯飞目前整个的公司有1700、1800的正式员工,70%是技术人员,都是围绕在语音技术这个方向上。目前我们也是语音和语言处理的国家工程实验室,国家也在制定中国国家语音方面的一些标准。对于刚才讲的联络中心的应用讲的非常的简单,我们在后面可以一起进行交流,最后用非常简短的一个视频我们看一下。(看视频)。这是我们讲的语音分析,可以帮我们挖掘有价值的信息,实现更精细化的分析,给我们的营销、运用和我们的客服提供更好的支撑。语音导航,是用语音识别驱动的自助服务,用户不用按键就可以直接输入。我们在旁边也有展台,希望台下跟大家做更详细的交流,谢谢大家。

 

 

   本新闻为51Callcenter原创稿件,转载请注明出自51Callcenter。谢谢!

 

 

 

共0条评论网友评论
  • 全部评论
共0条记录(共页)
向您推荐

新闻 按行业分类

厂商 按产品分类


        
总机:021-51601170 直线:021-58307717,17317241681(微信同号) 电子邮件:cct@51callcenter.com  泸ICP备10026114号-4  行业交流俱乐部QQ:2919157212
地址:上海市浦东新区牡丹路60号东辰大厦810室  邮编:201204 上海趋天网络技术服务有限公司 版权所有(2002-2018)