竞价排名是主流盈利模式
虽然电信114前后向可服务的用户类型很多,但是目前业界更加看好后向客户中的第二类客户,即:将114作为企业的一个营销渠道。这主要是因为,近年越来越多的企业开始注重精准信息的分众传递,即根据目标客户群的年龄、职业、地域特征,选择信息投放范围和信息投放方式,以期把营销做得快速、准确、有力度。如:专业楼宇广告联播为主的“分众传媒”就是其中的典型代表。
所以中国电信在优先报号、品牌查询、查询转接、短信报号、话务呼转等114服务业务中,将会植入互联网的“竞价排名”机制,续写语音版的“竞价排名”盈利模式。
中国电信114号码百事通的核心技术是什么?——114搜索必备的三点技术支撑
从应用来看中国电信114是一个Call Center的模式,从支撑平台来看其后台运营着一个庞大的搜索系统。2006年12月,北京拓尔思(TRS)信息技术有限公司正式和中国电信集团签约,成为中国电信114号码百事通统一搜索引擎系统工程的服务商,TRS应用其最新推出的TRS全文数据库系统V6为号码百事通业务提供核心搜索引擎技术,建设号码百事通全国统一搜索引擎平台和全国中心信息库。
据TRS该项目负责人透露,114号码百事通之所以选择TRS全文数据库系统构建其核心搜索,原因有三:
海量数据集群检索能力
“如果跨地域、跨业务、跨平台的信息共享不到位,114就无法发挥规模效应”中国电信114技术选型前就已经充分认识到了这个问题。而要实现跨地域、跨业务、跨平台的信息共享,就需要整合海量的信息,需要为上万个坐席提供海量信息的并发检索能力,这就需要业界高端的集群检索技术来实现!
而2006年,TRS推出国内第一个具备集群搜索能力的搜索产品——TRS全文数据库系统V6,满足了电信114的技术需求。
TRS公司技术总监肖诗斌先生对TRS的集群检索技术进行了介绍:
集群(Cluster)检索应用源自当前信息规模的爆炸式膨胀和信息资源共享的普遍需求,特别是对占信息资源总量80%以上的非结构化数据而言,检索要应对两方面的挑战,第一:当数据规模达到T级时,单台服务器已经远远不能满足数据存储和管理需要,因此需要部署多台服务器进行分布式存储,但必须实现统一检索;第二:在多用户高并发访问的情况下,海量数据规模使检索性能急剧降低,必须采用多台服务器分担检索响应,保证检索效率。调研结果显示,当前海量数据环境下的检索服务效率,已经成为信息资源集中的单位提供高质量信息服务的瓶颈。
但TRS技术可以通过TRS 集群服务器(TRS Cluster Server)管理和调度几百台TRS Database Server V6服务器,从而实现了海量数据分布存储和高并发访问负载均衡,并支持两种手段的组合运用,可保证用户系统在海量数据和高并发环境下的分布式检索的高性能。同时,通过集群也能轻松实现消除单点故障的高可用系统,满足用户的可靠性要求。
具备垂直搜索的特性
电信114号码百事通拟为用户提供准确、及时、深入的衣、食、住、行、乐等相关的综合信息服务,是多个垂直搜索的综合体!因此要想保证坐席的搜索效率和准确度,非结构化信息结构化、结构化和非结构化信息统一搜索是其中的关键!
用户在使用Google等互联网搜索引擎时,经常可以发现搜索引擎显示的搜索数目并不准确:搜索引擎显示搜索到几十万条信息,实际通过翻页可以看到展示出来的信息也就几百条,而且有些明明符合条件的信息却可能就是搜不出来。这种结果是与互联网搜索引擎面对网页数据特性所采取的PageRank、TOP N、结果预估等算法或策略相关,这些是符合互联网用户搜索特点的。
而在114号码百事通的搜索环境下,搜索不能有任何的纰漏,例如:打电话询问“北京朝阳区哪些商场的皮鞋打折?”坐席需快速锁定具有“北京朝阳区”、“打折”等属性的信息,并输入“皮鞋”进行搜索,最后根据信息相关度和竞价排名顺序准确的提供给用户,而不是像google、baidu那样采用预估策略给出搜索结果。
这就要求搜索平台既具备关系数据库属性字段的管理和搜索能力,又具备文本信息的全文搜索功能。
深度挖掘能力构建特色搜索
针对某一特定领域、某一特定人群或某一特定需求提供的信息和相关服务,更能够获得目标用户的青睐。各地电信公司将围绕该平台挖掘信息,提供特色搜索。
早在2000年TRS的文本挖掘技术就在新华社多媒体数据库中被采用,经过几年的锤炼,TRS文本挖掘技术已经发展为包括自动分类、自动聚类、自动排重等在内的10大功能选件,并在中央人民政府网站、公安部等大型垂直搜索项目中获得成功应用。