Google精准营销:每个人都知道你是一条狗
□文 张磊
Google为何牵手金山
5月8日,金山软件与全球最大的搜索引擎公司Google在北京联合召开新闻发布会,宣布双方的联合品牌《谷歌金山词霸》正式发布。Google精准营销战略地图的大幕由此又掀开了一角。
《谷歌金山词霸合作版》(下称《词霸》)是Google与金山面向互联网翻译市场联合开发、适用于个人用户的免费翻译软件。软件支持中、日、英三语查询,有取词、查词、查句、全文翻译、网页翻译等功能,以免费、互联网化、创新的机器翻译技术为三大核心特点,涵盖了当前翻译软件的绝大部分功能,包括12年来金山首度提供的全文翻译、整句翻译、网页翻译等功能。此版本的词霸产品,也借助Google领先的互联网优势以及机器翻译支持,实现了对最新语汇、俚语的更好支持以及全文翻译的功能,依靠对互联网海量的不同语言文献进行比对、匹配,方便快捷地提供精确的结果。
网络与对译辞典,看似关联不大,其实不然。如当使用者希望获得“互联网营销”一词的英文说法,则无论是以往版本的词霸产品或是爱词霸网站(www.iciba.com),均不能找到与之匹配的英文译词,但在《谷歌金山词霸合作版》中,可查到Internet Marketing、Web Marketing等多个解释,此已显示谷歌“网络支持”的作用。
互联网产品发布向来有谈赢利模式的习惯,Google全球副总裁、中国区总裁李开复说,《词霸》有两种赢利模式,一是广告,二是增值服务。
增值服务一般是指在普通用户服务的基础上提供某种特殊服务,这种服务很多时候是收费的。比如《词霸》可以通过向某些专业用户提供专业词库的方式获取增值服务收入。阿里巴巴和腾讯的赢利法宝“诚信通”、“QQ秀”均可归入此类,已是互联网产品赢利的“老办法”。广告则更是几乎全部商业网站共用的赢利模式——相传我国西周就有了。
但越是简单的办法,往往越不易用好。广告很简单,为《谷歌金山词霸合作版》这样的产品匹配广告就很复杂。例如,当一个用户搜索“互联网营销”一词,则他可能是希望委托产品营销的广告主、可能是研究营销手段的营销人、可能是即将参加托福或者雅思考试的学生等等,这三种人便可能分别有网上媒体广告、营销图书资料、英文培训三种可与之匹配的消费需求,即三种广告匹配方式。
实际的广告匹配选择更为复杂,到底如何匹配,需要有一套成熟的用户分析系统和模型,关系很多搜索引擎相关技术及语言学问题,举例来说:当某用户在词霸中搜索“互联网营销”一词,如果采用人工判断的方式,很容易看出“互联网营销”一词与“网上推广”之间存在着很大关联,从而为其匹配提供网上推广服务的广告。但对程序来说,先不谈判断“互联网营销”和“网上推广”之间的关联关系,仅仅识别“互联网”和“营销”两个词连在一起可成为一个更具含义的新词,便十分困难。
理论上,如果希望程序能够对这些识别,需要将“互联网”词后可相连使用的全部词输入程序,再将与“互联网营销”一词相关的全部词也输入程序。如此做法,仅仅完成“互联网”一词的程序识别,便需难以计数的语言学分析、词语枚举及录入工作。如果推而广之到整个博大的汉语言,那这种分析工作的推进速度可能还不及新词的出现速度,即随着时间的推移,完成目标的可能越来越小,除非亿万国人共同进行这项工作。
没错,Google正是通过中文搜索引擎服务,使亿万国人共同帮助其进行了上述词语关联的分析和录入工作。
通过我们使用Google搜索引擎进行搜索时输入的关键词记录,Google很容易获得由“互联网”、“营销”、“互联网营销”、“网上推广”等无数中文词组成的词表。这已经解决了刚刚所说的第一步,即将“互联网营销”识别为一词的问题。那么该公司怎么知道“互联网营销”一词与“网上推广”一词的存在关联呢?
我们知道,搜索引擎在提供搜索用户搜索结果前,首先要抓取大量文章并对文章进行分析。这里不细说抓取技术,单谈文章分析。如当搜索引擎抓取的某文章中有这样的句子:“我们公司很看好互联网营销的形式,准备投入一笔资金进行产品的网上推广。”首先,程序可自动分析这个句子中存在哪些词是其词表中包括的,这可有效过滤掉“我们”和“的”等相对不具备表现力的词语,然后程序也可知道“互联网营销”和“网上推广”两词在上下句中被提到,两词有一定可能具备关联关系。当Google抓取的数万篇文章中,两词都在上下句中分别出现,则程序可基本确定两次具备关联关系。那么这种关联关系是同意还是反意呢?这对广告匹配无疑会有很大影响,这也可通过程序解决。如果上下句中大量出现“不”、“没”等表示否定的词语,则可表示两词的关联可能是反意,否则则是近意。如上句变成“我们公司不太看好互联网营销的形式,准备投入一笔资金进行产品的网上推广”,则搜索引擎可能将“互联网营销”和“网上推广”做一词反意的记录。当然,上述只是原理的简单说明,实际的分析工作需在语言学家给出的基于词性和词类的规则下进行,要复杂得多。
综上,Google提供搜索引擎服务过程中积累了大量中文词表,并在文章分析过程中积累了词语间的关联关系,从而为在《词霸》“互联网营销”一词的搜索结果匹配“网上推广”相关的广告。这与搜索引擎广泛使用的关键词竞价广告模式和原理相近。
有时我们不得不钦佩Google对新市场的预判能力,它为中文用户提供搜索引擎服务,比百度还要早约一年。正是多年来中文搜索服务积累的经验,帮助Google在文章分词等领域具备领先的技术能力,这对其在精准营销领域的业务拓展提供了极佳的技术支撑。
广告匹配的问题看似已经解决,但前文说过,“互联网营销”一词的搜索者,可能有网上媒体广告的消费需求,也可能有营销资料、英文培训的消费需求。程序虽然可以基于关键词关系的判断了解三种需求与“互联网营销”一词具备关联,但到底将哪种广告提供搜索者呢?想得出这样的判断,一次搜索的信息记录是不够的,即如果程序仅知用户搜索了“互联网营销”一词,无法判断应匹配前述三种广告中的哪一种,这就需要对用户搜索行为进行连贯记录。如用户连续搜索多个营销领域的专业词汇,则可知其是从事营销研究的专业人士,从而判断其具有购买营销图书资料的消费需求。其他同理。
对于通过浏览器进行网上搜索的用户,上述连续记录的实现较为困难,很少搜索者是搜索引擎的注册用户,搜索引擎只有通过某些浏览器技术或IP分析技术来尽力解决,这对Google来说有较大困难,因为人们最广泛使用的浏览器“IE”是Google当前的强大竞争对手微软出品的。但这种用户搜索信息的连续记录对《词霸》来说则全无问题,原因很简单,它是Google与金山共同开发的。当然,这种连续记录用户搜索信息的行为可能会涉及隐私问题,Google是否在《词霸》中使用了相关技术我们不得而知。
本文导航
- 谷歌精准营销:每个人都知道你是一条狗
- 一件正确的事情
|