【权重基本原理】——一文读懂什么是权重
作者:媒体转发 时间:2019-03-22 01:24

电商行业工作多年,泡在派代多年,一直期待有一套理论能够系统地归纳电商运营的本质,总结现象背后的原理,然后解释电商运营工作中的各种现象。从日常中提炼出智慧,再用智慧指导日常的运营工作,最终形成知识的深度凝结、深度沉淀。写下此文以抛砖引玉,希望能够冷静地建立并检验有关电商运营的理论体系,正所谓论辩出真知,不足之处欢迎猛烈拍砖。
——————————————————————————————————————
什么是权重?
作为电商运营,对权重一词一定不陌生,我们常常听说刷单会降权、改标题会降权、改主图会降权等等,那到底什么是权重呢?
先看下百科的解释:权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。
我们常说的权重其实是搜索排序的决策因子。做电商,客服、发货、售后等工作相对都好解决,让大家觉得困难的在于获取流量,倘若有无穷无尽的流量,那么只需坐地数钱就好,想想都美滋滋。要想在平台内获取大量流量,就需要一个好的排名,而好的排名则离不开较高的权重。
派代网会怎么搞?
我们先来思考一个问题——我们正在浏览的派代网,他是如何解决帖子的排序问题的?
作为电商人的聚集地,如今派代总帖子数已超过36万篇,并以每日百篇的速度持续高速增长。派代是用什么方法筛选优质的帖子呢?哪些排在前面,哪些排在后面,哪些会被优先推送到派友面前?这背后遵循的逻辑是什么呢?
这30多万帖子,全靠派代网员工挨个读一遍然后手动排序肯定是不现实的,这需要极大的人力物力成本。普遍做法是通过算法模型,给每个帖子进行加权计算,并按照权重值进行降序排列,将权重值最高的、“最好”的帖子优先展现在用户面前。
而要进行权重计算则离不开最基础的原料——数据,那么数据从何而来呢?我们以派代网为例:
收集数据——权重的基础原料
用户打开派代网,看到帖子列表,从中选择感兴趣的话题点击进入,进行浏览阅读,觉得有价值的会收藏,有共鸣的会在评论区打call,有疑问会在评论区讨论,觉得作者写得不错没看过瘾的,还会点开作者的头像看看有没有更多的系列文章。以上是用户在论坛内的主要行动轨迹。
正是基于以上的行为,论坛会在后台统计每个用户的动作,进而形成多个数据纬度,例如展现量、点击量、停留时长、收藏数、评论数、访问深度等。
在用户点击鼠标浏览的同时,论坛将用户的行为记录为计算机语言——数据,从计算机的视角出发,在它眼中看到的用户的浏览行为是这样的:
用户打开派代网,看到帖子列表——后台形成展现量数据
从中选择感兴趣的话题点击进入——后台形成点击量数据
进行浏览阅读——后台形成停留时长数据
觉得有价值的会收藏——后台形成收藏数数据
有共鸣的会在评论区打call,有疑问会在评论区讨论——后台形成评论数数据
觉得作者写得不错没看过瘾的,还会点开作者的头像看看有没有更多的系列文章——后台形成访问深度数据
通过给这些数据进行加权计算,最终得到一个综合权重分,通过综合权重分的高低判断哪些帖子是优质的,进而给优质的帖子更多的曝光机会。
至于说帖子的内容究竟怎么样,是生动有趣还是味如嚼蜡,计算机并没有判断的能力,他像一个小孩子站在我们面前,我们看着帖子,他则观察我们的态度:我们是津津有味地看还是一目十行敷衍了事地看?他虽看不懂文章却能通过我们的态度来评判帖子的好坏。
算法是如何加权的呢?
有了数据如何加权计算呢?我们来看一个简单的例子。
某中学三年级有100名学生,某次期末的考试结果如下。通常的排名方式是按照各科成绩直接相加得出总成绩,再对总成绩进行降序排列(从大到小排列),总分排名的结果是学号49号的若雨同学排名年级第一,总分降序排名如图:



