关于数据驱动的重新思考
作者:Cassie Kozyrkov
编译:ronghuaiyang
转载自: AI公园
这篇文章介绍了大多数人缺乏的心理习惯,以及为什么你不能指望没有数据就能有效地指导你的行为。
企业正在大量雇佣数据科学家,以做出严格、科学、公正、数据驱动的决策。
现在,坏消息来了:这些决定通常不是。
要想做出数据驱动的决策,就必须是数据(而不是其他东西)驱动它。看起来很简单,但在实践中却很少见,因为决策者缺乏关键的心理习惯。
数据驱动不存在了
想象一下,你正在考虑在网上买东西,而不是跑很远去店里买东西。你把你的决定归结为你是否信任网上的卖家。进行快速的搜索会得到一些相关的数据:你会看到卖家的平均评分是4.2,总分是5分。
如果没有决策基础,你的决策最多只会受到数据的启发,而不是数据的驱动
你不能用这个4.2分来驱动你的决定。一旦我们看到了答案,我们就可以自由地选择最方便的问题。如果我们做的第一件事是在数据中摸索,那么我们的决策充其量也就是我喜欢称之为“数据启发”的决策。
数据启发
这就是我们,就像鲸鱼遇到浮游生物一样,在一些地方游来游去,然后到达情感的临界点,然后……做出决定。有一些数据接近我们的决定,但这些数据并不能推动它。这个决定完全来自其他地方。
决策者在数据出现之前就已经下定决心了,所以决策一直都在那里。事实证明,人类会选择性地与数据互动,以确认我们内心深处已经做出的选择。我们会在最方便的地方来观察证据,但我们并不总是知道自己在做什么。心理学家对此有一个可爱的名字:确认偏差。
许多人只是利用数据来让他们对已经做出的决定感觉更好。
用问题去拟合答案
5分得到4.2分好不好呢?这取决于你无意识的偏见。一个真正想在网上购物的决策者会眯着眼睛看4.2,然后高兴地唱出这个数字有多高。“已经超过4.0了!”他们甚至可以给出一个严格的分析,说明它在统计上是如何显著高于4.0的。(确定!它是你一直想要的p-value。)与此同时,如果有人真的不想买这个东西,他会找到另一种方式来回答这个问题:“我为什么要满足于一个评级低于4.5星的卖家?”或者“但看看那些一星评论。”我不喜欢有这么多。“听起来是不是很熟悉?
分割数据的方法越多,你的分析就越容易滋生确认偏差。
数学的复杂性并不能提供解决方案,它只会使问题更难被发现。结果,在我们刚刚看到的这个简单示例中显而易见的东西被隐藏在一堆漂亮的Gaussians分布中。不要假设你友好的邻居数据科学家也看到了它。分割数据的方法越多,你的分析就越容易滋生确认偏差。
结果呢?决策者最终会使用数据来让自己对无论如何要做的事情感觉更好。
昂贵的习惯
当分析复杂或数据难以处理时,一些悲剧就会出现。有时候,一群数据科学家和工程师花了几个月的时间才把一切归结为4.2这个数字。在一段艰苦的旅程结束时,数据科学团队成功地给出了结果:4.2分,5分为满分!计算得很细致。这个团队夜以继日地工作,周末按时完成任务。
利益相关者如何处理它?是的,和我们之前的4.2一样:通过他们的确认偏差眼镜来观察,对真实世界的行为没有影响。它是否准确并不重要——如果所有那些糟糕的数据科学家只是编造了一些数字,那就没有什么不同了。
当决策者缺乏基本技能时,世界上没有数学可以解决这个问题。你的数据科学团队不会对数据驱动的决策做出贡献。
使用这样的数据来对我们无论如何要采取的行动感觉更好是一种昂贵(和浪费)的爱好。数据科学家朋友们,如果你的组织遭受这种决策者的困扰,那么我建议坚持使用最轻量级和最简单的分析来节省时间和金钱。在决策者得到更好的训练之前,你的那些数学只能散发热量。
消除确认偏差
问题: 你可以在找到数据的定位之后再自由改变目标。
解决方案: 提前设定目标,抵制诱惑,以后再行动。
换句话说,在任何人分析数据之前,决策者需要做一些准备。
设置自己的决策标准是一门科学(我们将深入介绍它在未来的文章中,我们研究的问题只是冰山一角),但与此同时,在数据科学项目中,快速修复的能力是伴随你决策界限能力的一个重要的一点。
熟能生巧
最近,我和朋友Emma去布鲁克林买衣服。为了炫耀一件漂亮的衣服,她扯了扯衣服后面的价签。“嘿,多少钱?”她问我。“如果少于80美元,我就买。”
这就是决策智能!她不是先看价格,然后说服自己做出决定,而是用数据来驱动它。通过熟练的反射,她衡量了自己有多喜欢这件衣服和自己的预算,然后设定了决策的界限,只有在这之后,她才允许自己看到数据(价格)。她习惯以正确的顺序使用数据,这也是你可以锻炼的地方。
人们并不总是需要数据驱动,Emma知道这一点。她不必那样做不重要的决定,但她也知道熟能生巧。在琐碎的决定上养成习惯要比在重要的决定来临时挣扎容易得多。
谈判课
这种想法并不新鲜。很多不同的课程都会教谈判,尽管其中有一门几乎肯定会在第一天就涵盖到谈判。如果你在谈判前没有给自己的底线设定一个价值,你不妨在额头上画上“不知道我在做什么”。这是同一件事,只是名称不同:在默认操作和另一种选择之间确定决策边界。
解决方案是预先设定你的决策标准
事实上,对于谈判者来说,标准的建议是通盘考虑所有可能的报价组合,并事先计划好你对它们的反应,否则,经验丰富的对手很容易占你的便宜。即使没有对方所有的说服策略,一些无关紧要的短期因素,比如你的血糖水平、你的心情、对方微笑的程度,以及阳光是否灿烂,都会对交易产生不成比例的影响。同样,数据分析也是如此——将数据视为与你协商以改变你的想法的商业对手。解决办法就是提前计划好你的反应。例如,下次你在谈薪水的时候,确保你在听到他们的数字之前已经考虑过这个数字。
当你找到窍门,就很简单了
不管你是在看到一个数字之前还是之后思考它对你意味着什么,你仍然需要思考它。事先进行此操作可以帮助你对抗人工编程中的一些bug,从而在决策质量和协商性能方面获得较大的收益。改进这里的操作顺序是一个值得培养的宝贵习惯,如果你想参与数据驱动的决策,这一点至关重要。这里有一些额外的好消息:通过练习,它会让你感觉很自然。