009. 试读:从通用搜索到淘宝搜索(第4章,第1节)

淘宝搜索,目前最重要的部分是淘宝商品(宝贝)搜索,所以下面阐述的实际是指淘宝商品搜索。此外,还有店铺搜索、同店购等搜索产品,因为复杂度相对较低,所以不展开说。由于搜索是一个挺专业的产品,所以要讲搜索的产品故事,我们先得讲一下它的一些主要特点。

淘宝搜索的首要目标就是让用户尽可能快地找到适合自己需求的商品,这也是一种典型的导购产品。与传统搜索相比,淘宝搜索在很多方面,有相同点,例如用户均需要输入关键词然后返回若干条搜索结果、搜索框输入时候的下拉提示以及相关搜索等,但也有不少区别,这里先说说产品层面的突出不同。

►    导航。导航即类目属性体系,是淘宝搜索特有的,其根本在于商品类似线下货架一样的分类陈列,第15节会展开讲。通用搜索,比如百度的搜索结果页是没有这个区域的。

►    多维度排序。例如,可以按照销量、价格、人气分别排序,这是通用搜索没有的。

►    突出图片。这是由用户需求决定的,因为大多数行业(尤其是服饰类)的商品,用户的第一感受是外观,而通用搜索通常突出标题和文本摘要。

►    商品信息和筛选。淘宝搜索有较多的筛选功能,这些筛选与商品的各种详细信息(价格、所在地、销量等)的披露组合在一起,降低了用户决策和购买的门槛,相对于线下购物,是一种进步,也部分弥补了看不到实物的劣势。

……

这些区别更多的是由我们的用户需求和处理的信息不同造成的,大致上传统搜索偏向广度,而淘宝搜索偏重于深度。

更关键的区别,是下面提到的一些淘宝搜索独有的元素,这些东西大多不是具体产品或技术上的特色,更多是淘宝搜索在独特的环境下所需要特殊考虑的方面,也是淘宝搜索做起来真正复杂和挑战之处:

►    公平与效率、卖家和买家的平衡。卖家要公平竞争,买家要购物效率,第12节细说。

►    大卖家和中小卖家的平衡。一个可持续的生态系统,两者一定是平衡的,所以搜索有一个指标是基尼系数,仿照经济学领域的概念,来衡量搜索流量分配的合理性和健康性。

►    短期和长期利益的平衡。很多做法对提高短期的数据指标会有明显好处,但长期来看可能会损害淘宝搜索的公平性,使买家黏性降低,卖家感到无所适从。

►    手握卖家的生杀大权。相比传统搜索,卖家对淘宝搜索的依赖更强,他们应该获得稳定的经营环境。流量变化的大起大落可能是灾难性的,后面会多次谈到这一点。

……

总之,上述几个方面是传统搜索不需要过多考虑的,而淘宝搜索必须要处理好。所以,它并不是简单满足某方面的需求,或提升数据指标就完成任务,而是充满了挑战。因此,淘宝搜索的工作充满了韵味,需要更多专注、思考、决心和毅力。要做好淘宝搜索的工作,不仅需要互联网的用户视角和搜索技术与算法,还需要了解淘宝、天猫市场中的商业规律和特点,需要懂消费者、懂卖家,需要有经济学、社会学等多方面的视角。

淘宝搜索的发展主要分为三个阶段。

第一阶段,list时期。

淘宝建立之初,实际上是没有搜索的。一直到2008年,所谓的“淘宝搜索”实际上还只是一个拥有关键词查询的list,说白了就是一个目录检索工具,就有点类似网址站,用户通过一级一级地点击类目,找到想要的宝贝。随着商品量的增多,数据库检索的方式逐渐在性能和功能层面都受到了很大限制。

list最初是无关键词的,主要是靠“点、点、点”;而search是有关键词的。当然,现在有无关键词也互相渗透了,list也可以搜关键词,search也可以点导航什么的。所以现在两者主要是入口的区分,到了2012年,list仍有不少访问量,前端是淘宝集市自己在管,后期探索方向是“面向消费者的导航产品”。

第二阶段,isearch时期。

在这样的情况下,早期技术同学就想专门做一个搜索引擎,来查找淘宝的商品,正巧B2B那边已经有搜索团队做了一个isearch搜索引擎,所以当时就直接把isearch复用到了淘宝。

isearch最早是B2B自主开发的分布式检索引擎,具有独立的知识产权,它的第一个版本是2002年在阿里当时的CTO——吴炯——主持下开发的。

随着isearch搜索引擎的引入,淘宝搜索加入了关键词搜索(search)功能,但这个时候淘宝的search与list仍然合并在一起。

第三阶段,淘宝搜索时期。

随着淘宝的快速发展,为了更好地支持整个公司的搜索业务,包括淘宝集市、商城等,2008年成立了搜索中心。

2009年七八月间推出了主要针对有关键词场景的新版搜索,即s.taobao.com,并在2010年2月份的时候,将关键词搜索流量全部切到新版搜索。2012年的情况是,search、list以及天猫搜索的后台都由搜索部门统一支持(算法略有不同),而前端分别由搜索、淘宝和天猫团队各自负责。