为了得到公正的答案,最好问这两个问题:
- 以 1 到 7 为等级,其中 1 表示非常负面,7 表示非常正面,您如何描述森林砍伐对环境的影响?
现在,这两个问题仍然不够完美,但第二个问题消除了第一个问题的引导性。将一个问题拆分成两个问题,有助于全面、客观地看待答案。
数据不可能错误
我再怎么强调这一点也不为过。研究报告的可接受误差幅度由公司设定,通常在95%的置信水平下 加纳电报数据库 为4%到8%。这最终意味着,研究样本和结果并不能完美地代表总体。实现这样的结果的成本将是天文数字。了解这一点后,我们必须意识到,虽然利用数据驱动商业决策是降低风险的好方法,但每个决策都存在风险。这让我想到了研究和数据分析中另一个常见的错误——偏见。
小心
我可以写一篇甚至更长的博客来阐述研究中的偏见概念。偏见存在于研究过程的各个方面,从最初的设计到最终的分析。我主要想谈谈数据分析中可能存在的偏见。一种名为“数据疏浚”的做法可能对公司和产品造成极大的损害,有时研究人员和公司会无意中这样做。简而言之,数据疏浚就是通过分析数据来证明某些关系具有统计显著性。这种做法极其有害,因为它极有可能产生假阳性结果。
FiveThirtyEight 公司做了一项研究,他们向 54 人发出了一份调查问卷,然后对这些数据进行了大约 27,716 次回归分析。其中一些结果令人啼笑皆非。
以下只是他们发现的具有统计意义的众多相关性中的一小部分:
- 迷你柠檬水与“Crash 应该获得最佳影片”的信念呈正相关
贝类与惯用右手呈正相关。