被误解的数据驱动!没有这一步,你的数据决策就是白忙活一场
作者:网友投稿 时间:2019-07-19 16:18

大数据文摘出品
来源:Hackernoon
编译:邢畅、林安安、钱天培
网购时看评分,逛商场时比标价,选餐厅前查排队时间……
是不是觉得自己也是“数据驱动”的时尚进步青年呢?
很遗憾,你的决策中很可能缺少了最重要的一步——没有这一步骤,即便你有数据,也往往只能被自己的主观“偏见”牵着鼻子走。
你要想通过数据驱动做出决策,那么就必须完全依赖数据。这听起来似乎很简单,但实际上却很难做到,很重要的一个原因是决策者没有提前设定决策标准。
“提前设定决策标准”正是众多数据决策者经常忽略的、却也是至关重要的一个步骤。
被误解的数据驱动
让我们来设想一个场景,你决定在网上购买东西,这个决定的前提是你信任网上的卖家。接着你开始上网搜索,你看到一个卖家的评分是4.2分(总分5分),如果你无法通过4.2分判断这个卖家是否可靠,那么你就很难做出决定。但如果你知道4.2分已经超过了平均水平,那么也许你就会决定下单。
这个例子告诉我们,如果没有决策基础,那么我们只能在数据中瞎摸索,由此做出的决定最多只能说是受数据启发,并不是由数据驱动。
数据启发
我们的生活里充满着数据,就像鲸鱼身边充斥着浮游生物一样。但由于没有决策基础,我们只能这边看看那边看看,最终可能懒得再看了,随便下个决定算了!

大部分决策者在接触数据之前就已经做出决定了,所以当他们接触数据时,马上就能从中挑出自己想要的数据。事实证明,人类会选择性地与数据交互,以对自己做出的选择进行判断,但人们往往会忽视这种选择性,这在心理学上称为:确认偏误,即遇到一个命题时,人会倾向于寻找支持这个命题的证据,而忽视否定这个命题的证据。

由于选择性地挑选那些对自己有利的数据,所以往往人们就会觉得自己的决定是正确的。
使问题和答案相符
满分5分,那么4.2分算好吗?这取决于你的无意识偏见。
当一个有经验的网购买家人看到4.2分时,他会很开心的说:“已经超过4.0的均分了,很棒了!”他们甚至可以进行一个严谨的分析,来说明这个4.2分在统计学上是显著高于4.0的(看呐,这就是大家一直想要的p值!)与此同时,那些缺乏经验的买家会说:“4.5分都不到,我要换一家。”或“4.2分比1分高多了,挺好的,就它家了。”
1. 决策者没有决策基础,再牛逼的数据科学家也无能为力
有时候,数学的复杂性会使简单的问题变得棘手。人们常常用一大堆函数去分析一个其实很简单的东西。
一群数据科学家和工程师可能花了几个月的时间,经过仔细的数学建模和精密计算后,才得出4.2分这个数字。
2. 那么,决策者会怎么做呢?
由于确认偏误,决策者很可能会戴着有色眼镜来解读这一数据。他会选择性的挑选有利于自己决定的数据,也根本不在乎这个数据是否准确。就这样,科学家们几个月的努力全白费了——其实还不如随便编个数呢!

决策者若没有决策基础,再强大的数据科学团队也解决不了问题。这种情况下,我建议数据科学家们使用最简单的数学方法分析就好了,省钱又省力,简直完美。
消除确认偏误
决策者在分析数据之前需要做大量功课来消除确认偏误,一个有效的解决方法是提前设定决策边界,确保这个边界不被突破。决策者需要明白制定决策和制定决策标准是相互独立的。。
孰能生巧
最近我和朋友去买衣服,她看中了一件漂亮的裙子。她扯了扯裙子后面的价签,问我:“嘿,朋友,这裙子多少钱?如果少于80美元,我就买。”



