首页 > 业内资讯 > 一秒钟看穿统计陷阱

一秒钟看穿统计陷阱

时间:2016-01-06 | 来源:数据挖掘与数据分析 | 阅读:104

话题: 数据挖掘与数据分析


这样一来,在有些人眼里这幅图表达的明明是美国木匠的收入是罗坦提亚的8倍——这样的印象完全脱离了原始数据所给出的信息,无疑是一次成功的误导。


如何练就火眼金睛


上面说了几个很容易让公众迷惑的统计陷阱,那当我们看到各类统计数字时,应该如何判断它是否客观呢?


首先要细心寻找统计中的偏差。比较明显的是在描述上有意识进行的偏差。比如滥用平均数等带来的问题:“我们工厂 3000 人,月平均工资有 5000 块。”


看起来比较不错的待遇,实际上可能是一个月薪 100 万的老总加上每个月拿着可怜薪水的上千名工人简单平均起来的结果。


同时报道中常常声称的“升高”和“下降”并不一定真的如此。在面对类似“这段时间气温异常升高,热浪持续一周导致城市死亡人数激增至 300 人”这样的标题时,我们往往要小心这里所说的“激增”是否属实。


一个一定规模的城市在一周内有 300 人死亡并不算是异常的数字,而热浪实际上是一个没有多少分量的因素。


半个世纪以前,纽约市的两份报纸上面刊登的犯罪数量一度达到了令人发指的水平,迫于舆论压力,当时的警察联合会主席不得不有所表示。


但是他仅仅采用了一个行动就平息了这场风波——他解雇了两名编辑,因为这场风波是他们在互相竞争着挖掘犯罪事件并搬上台面,导致对民众产生误导。事实上,警察局的统计数据表示这段时间的犯罪事件数量并没有上升。


其次我们要寻找潜伏着的无意识偏差,这种偏差带来的结果往往影响更深远——《文学文摘》就是无意识偏差的受害者。


无意识偏差常常会体现在对样本的选取不注意上。一个超市对50名顾客进行了调查,得出了“ 75% 的人声称喜欢喝茶而不是咖啡”的结论,那么我们大可不必去相信这个结论,因为相比起总数来说, 50 个人实在是微不足道的。


这家超市也发现了这个问题,接着发出 10000 份调查问卷,最后回收了 2300 份,发现“ 64% 的人声称喜欢喝茶而不是咖啡”,这个结论毫无疑问也不能令人信服。

麦轲数据管家V4.02 绿色版

TOP

软件

53
麦轲数据管家运营中
麦轲数据管家:个人数据管理软件。
10.93 MB  10.27  赞(950)
安全无广告  需网络
推荐

最新好玩手游

更多

手游风云榜

更多

资讯阅读

更多


湘ICP备2022002427号-10 湘公网安备:43070202000427号
© 2013~2024 haote.com 好特网