首页>> 其他>>新闻详情

一个人工智能训练师的自述

2023-07-20 22:01  《4PS呼叫中心国际标准研究中心》  咨询电话:17317241681(微信同号)  作者:胡倩倩 南方电网广西电网公司客户服务中心


以“速度”为主要社会特质的“速度社会”,已成为社会情境和普遍的全球趋势。快节奏的生活,已然成为当下人的生活方式。在这个数字化、信息化的时代,各式各样的智能化服务,慢慢地融入到人们的生活当中,大家熟悉的天猫精灵、小度智能屏、小爱同学等智能产品背后,都是智能化服务的体现。人们在遇到问题的时候,无一例外,都想要快速、方便、有效地去解决。所以,智能客服应运而生。

智能客服系统是在大规模知识处理基础上发展起来的一项面向行业应用的,适用大规模知识处理、自然语言理解、知识管理、自动问答系统、推理等等技术行业。

南方电网广西电网公司客户服务中心(以下简称“客服中心”),经过近几年的发展建设与运营管理,各渠道已具备一定自助/智能服务能力,逐步向“多元化、智能化”发展。并投入大量人力物力,致力发展人工智能客服,已达到给客户提供最大便捷服务的目的。但是智能客服(以下简称智能机器人),真的那么智能,能够无师自通,自我学习吗?不,当然不能,所以就有了我的出现。

我是一名人工智能训练师。

两年前,我怎么也不会想到,我的工作会和人工智能扯上关系。一个偶然的机会,我通过竞聘,获得了这个对我来说新得不能再新的工作的机会,在此之前,公司只有人工客服业务。

从未接触过人工智能的我,惊讶于智能机器人的能力,反应快,秒级响应客户诉求,同时服务200位客户,可以提供7*24小时服务,孜孜不倦不知疲惫,解决人工服务忙时回复难、回复慢、无人回复等问题,回复率可达200%!我知道,这是未来服务发展的趋势,所以我毅然决然地投入到智能机器人训练的行业中去。

首先要感谢公司给我这样的机会去参加客服职业技能大赛,通过学习,让我学到了很多训练的方法,老师也对我平时一些训练中遇到的问题进行了针对性的解答,受益匪浅。不过最重要的,大赛提供了一个可以跟其他同行业优秀人才相互交流的平台。可以跟大家互相交流系统、运营、训练方面的问题,我感到非常荣幸。下面谈一谈我的心得体会。

这是一份枯燥又具有挑战性的工作。是的,非常枯燥,虽然直接面对的是新兴的人工智能技术,但是从很多方面看,这都是一份机械和枯燥的工作。训练师从上班开始面对的只有一个东西——数据,要用大量的数据去教一个仿如白纸那般的机器人,让智能机器人更“懂”人,通“人性”,从而更好地为人提供服务。这项工作很考验耐心,需要把大量的数据进行整合,去除无效且无意义的数据,把数据量转化成有效的东西,这是一个很枯燥的过程。

目前人工智能的学习可分为全监督学习、半监督学习、无监督学习、强化学习和迁移学习五种阶段。

1.全监督学习

即通过已有的训练样本,对智能产品进行训练,从而得到一个最优模型,再利用这个模型将所有新的数据样本映射为相应的输出结果,对输出结果进行简单的判断,从而实现分类的目的。简单来说,就是对智能机器人的每样问题进行一一修正,即进行人工标注,并且需要全量标注。

2.半监督学习

是在监督学习的基础上,对部分数据进行调整和优化,并将部分数据调整优化的结果交给机器人,让它进行未教学数据的学习。简单来说,就像是老师给学生上课,讲解理论知识,再结合理论进行例题的讲解,下课后给学生布置作业,以此来检验学习效果。

3.无监督学习

即事先没有任何训练数据样本,需要直接根据数据进行建模。简单来说,就像是学生上自习,老师在没有任何讲解的前提下直接给学生布置作业,让学生自己学习新的知识。

4.强化学习

即在没有任何标签的情况下,先尝试做出一些行为得到一个结果,通过这个结果是对还是错的反馈,调整之前的行为,在不断地调整中,机器通过算法能够学习到在什么情况下选择什么样的行为可以得到最好的结果。

5.迁移学习

是把已经训练好的模型参数迁移到新的模型来帮助新模型训练。

首先一切的开始,要先明确企业所需要的机器人的类型,设计智能机器人的应答风格。智能机器人目前只能够回答简单,重复的问题,随着智能机器人的普及,越来越多的公司,都开始使用智能机器人,但是很多客户往往还是停留在老思想,不愿意让机器人服务,认为机器人冷冰冰,不够人性化,所以智能机器人的人物设定尤为重要。智能机器人定位,主要是设定智能机器人“人格化”特征的建立,首先定位智能机器人的形象,是专业的、可爱的、贴心的、还是温暖的,这就需要在建立初期设定好、制定各项应答话术。试想一下,意思相同的一段话术,是一板一眼地直接发送给客户,还是转换成轻松,贴心的语句发送给客户更能让客户接受呢?

其次需要根据智能机器人的业务要求,设计与构建智能知识库,智能机器人应用的问答库独立于智能知识库系统,问答知识管理应遵循“即时更新、适应场景、面向客户、通俗易懂”的原则,站在客户的角度进行话术编写,也就是我们在客服中心经常会听到的知识客户化。

一般而言,客户化是指通过多方面处理,使客户对现有产品或服务方式更容易接受而使用的优化过程及方法,知识的客户化具体通过对企业现有知识在描述语言、呈现形式、获取方式、编辑模式等方面进行制度化加工,使客户在使用知识过程中拥有更好体验的优化方法。只有以客户为出发点,才能更好地管理在线机器人、形成在线机器人对外发布的知识内容。而这一系列动作,都是循序渐进的过程:

1.在建设初期,做好需求调研。

(1)确定服务范围:智能机器人服务能力、服务场景及服务流转。简单来说,也就是明确智能机器人能够做什么、能够服务哪些业务场景。

(2)明确服务边界,对于一些敏感词、业务风险等级书、业务场景边界等。需要明确在什么情况下,需要转接人工处理,确保不会因为客户不满,而引发客户投诉等问题。

2.设定目标值。

目标是一切行动的基础,做业务梳理,实际上是通过分析,给智能机器人系统确定一个清晰的目标过程。通过业务梳理,确定智能客服系统的业务场景,有助于在遇到问题时,根据业务梳理的定义来确定问题是否需要解决、解决的优先级和解决的方法。

3.语料的获取及处理。

语料是未经过加工,真实的服务聊天对话记录,针对不同类型的语料,需要进行加工处理。在实际问答过程中,客户的提问方式千奇百怪。比如简简单单一个缴费的问题,客户会问“欠费了什么交费”“在哪交费”等等,这就需要训练师将这类型问题标准化,然后编写一些相似问题进行训练。

先采用无监督学习方式,直接让机器人通过对应的算法进行初步分析,先给机器人导入大量人工客服与客户的对话日志,在不经过人工干预的情况下,让机器人自发进行分析与研究。针对学习过程中的难点,由人工进行标注,再让机器人对已标注数据进行学习并扩展认知未标注数据。搜集完数据后,需要将数据导入系统中,分解、聚类,再进行数据标注。数据标注是教智能机器人学习语句的过程,智能机器人是否能够成长,这一步至关重要。

那么问题起来了,语料是不是越多越好呢?重复句需不需要去重呢?

其实完全无用的语料可以删除,比如单纯数字,及系统自动产生的无意义字符串;其次是太长或者太短的语料,这些内容蕴含的信息量可能过多或者过少,容易对智能机器人问答的定位能力造成干扰;以及一句话包含两个意思的语料,如“帮我看一下我的余额还有多少,我想缴费”“我停电了,我想缴费”等等,包含两个意思的语料,需要分开匹配,不然容易造成智能机器人识别重叠而影响识别准确率;过多重复,类似的语料可以删除,如“帮查一下电费”“查一下电费”等,机器人有自我学习能力,类似这样的语料只需保留一个即可。

有标注就要有检查,为确保每个标注人员的标注质量,每月需抽取标注人员标注量进行质检,对存在的个性问题需及时向该坐席员进行传递,并跟进整改;对存在的共性问题形成分头标注的校准样本,集中进行培训。

为统一各标注人员标注尺度,确保机器人对问题识别的一致性,每月组织开展标注校准工作,不断统一标注人员的训练标准。智能训练师每次抽取不少于100条已标注样本,组织智能在线班参与标注的坐席在时限内,采取“背靠背”的形式对同一份语料样本进行标注,并将标注结果反映至人工智能训练师进行汇总。制定出标注规则表,由标注人员统一按照规则表进行标注。

4.对话流设计。

数据标注完成后是对话流设计,当客户问出一个问题时,机器人需要准确识别其场景或意图,然后从知识库中搜索核实的回答,如果数据标注是让机器人学习知识,那么对话流设计就是让机器人学会运用知识。

5.日常维护。

对话流设计成功后,是日常维护的工作,当客户问到数据库里未收录的问题、问话时采用过多的修辞、方言口音过重时,机器人无法回答的情况下,就需要人工智能训练师手动找到问题,进行调整。

人工智能现在还处在一个比较初级的阶段,客户会觉得一个这么简单的问题,机器人为什么回答不上来,实际上如果模型不行或者初始语料不够,以及考虑到算法在实际应用过程中限制,机器人就是不会回答。所以,训练是一个漫长的过程,需要不断地优化,提升。

为了解智能机器人应答情况,确保机器人应答服务质量,根据会话量抽取一定比例进行会话质量复核分析,出现错误回复时会进行联系客户解答客户问题,以确保客户问题能够得到解决。对于发现的问题,进行分析,标注问题、系统问题、还是算法问题导致客户问题无法解决,需后续跟进整改处理,确保下次遇到相同情况时,不会再出现问题。

其实机器人的训练,都是一个从0-1,从无到有的过程,就像人从出生开始,接触的第一个老师是自己的父母,上学之后就是老师,出社会之后是公司,社交圈等等,没有一步登天的办法,所有人都需要一个学习的过程,机器人也是一样。在接触到这个行业之后,看着机器人一天天地成长,看着自己的“学生”学到更多的知识,慢慢地变得更聪明,得到认可,得到表扬的时候,那种感觉,真的是无比地自豪,非常有成就感。未来人工智能技术会越来越好,人们的生活会越来越便利。




共0条评论网友评论
  • 全部评论
共0条记录(共页)
向您推荐

新闻 按行业分类

厂商 按产品分类


        
总机:021-51601170 直线:021-58307717,17317241681(微信同号) 电子邮件:cct@51callcenter.com  泸ICP备10026114号-4  行业交流俱乐部QQ:2919157212
地址:上海市浦东新区牡丹路60号东辰大厦810室  邮编:201204 上海趋天网络技术服务有限公司 版权所有(2002-2018)