搜索技术并不复杂,在淘宝搜索技术中,搜索索引库会实时(隔几分钟)更新卖家的商品列表,包括商品的上架、下架、删除、修改信息,把信息更新到索引库中。当用户输入要搜索物品的关键字查询时,系统会对查询词进行分析,找到所有相关的结果并进行排序,最后返回给用户。
这中间,最关键的模块就是商品排序的算法,它直接决定了哪个商家的商品排在前面。
淘宝搜索的过去
在2010年7月8日改版前,淘宝搜索排序规则很简单,只依据4个因素:相关性、橱窗推荐位、消保标识、商品下架时间。
首先,搜索查询关键词和商品的标题、类目是相关的;然后,按商品在卖家橱窗推荐位的优先排序;最后、按卖家具有消保标志的优先排序,在满足上述3个因素前提下的商品,严格按照商品下架时间排序。
这个排序规则看似不公平,其实不然。首先,数据不公平。15%的卖家占据了80%的搜索流量,导致重复铺货、开店现象严重。其次,对消费者不公平。其中、按“下架时间”对消费者来说,基本没有价值。最后,流量严重浪费,经常有店铺每天上千人访问却没有交易,消费者挑选商品越来越困难。
很多卖家花心思在如何获取更多的搜索流量(不排除用作弊的方法),而忽视对消费者的服务,致使消费者体验越来越差。假设淘宝有1000万卖家,淘宝搜索每天有50个点击量,每个卖家一单也成交不了,而消费的悲剧在于,购买一件东西需要花更长的时间。
今年7月,淘宝做了搜索排序规则的变化,提升消费者体验,淘宝内部的项目代号是“阿基米德”。
搜索规则的现在
古希腊哲学家阿基米德有一句名言:给我一个支点,我能撬动整个地球。
淘宝也希望通过搜索规则的改变,提升消费者体验,引导卖家行为,让服务质量好的卖家快速成长。“阿基米德”的变化,就在于把卖家服务质量分作为重要因素加入排序中。
现在搜索排序的逻辑是:在消保优先、相关性、橱窗推荐的三大前提下,在一定下架时间范围内,按店铺服务质量分权重排序。也就是说,你看到的结果,已不是严格按照下架时间排序了,而是在一定下架时间范围内,谁的店铺服务质量分高,谁就排在前面。
店铺质量分又如何计算?一部分是卖家店铺整体相关的,另一部分是卖某个具体商品相关的。主要因素包括:作弊程度、违规扣分程度、退款率、投诉率、发货速度,买家评估分数等等,大小因数包含几十个,只是每个因素权重会有不一样。
这个算法也在不断调整和优化。比如,卖家反应的旺旺响应时间的不合理性和退款率的不合理性,都在最近的算法中有了修改。从监控的整体数据上看,排序改版后,无论是整体卖家服务质量,还是搜索成交转换率等都有明显提升。
紧接着淘宝还推出两个工具,一是让卖家直接举报搜索结果中作弊的商品和卖家,另外一个是让卖家自己查到店铺中那些商品因什么原因被降权,及修改建议是什么。
未来的方向
淘宝刚刚走过七年,这正好是人从出生到上小学的时间,淘宝搜索也是如此,接下来半年,淘宝搜索将继续加强如下方面。
继续优化排序算法,在现在原则和框架下,根据卖家的反馈建议及线上数据分析,尝试不同的因素和权重,优化现有算法;加强对作弊卖家和商品的识别,都会加大处罚作弊的范围;加强和卖家的沟通,这次搜索变化让一些卖家措手不及,其原因之一也是沟通不够,以后将建立多方渠道加强沟通,并将在《卖家》上,与大家共同探讨,搜索产品的创新,新近推出的搜索新功能包括:同店购、同款合并、定制化搜索、产品搜索等,特别是产品搜索,今后将发挥更大作用。
最后,提醒卖家再上传宝贝是,再挂对类目、产品节点、填写正确的属性等方面引起重视,这样你的宝贝才可在产品搜索中获得更多的流量。
先顶一个吧。。
评论内容:发表评论不能请不要超过250字;发表评论请自觉遵守互联网相关政策法规。