版主小说网

收藏备用网址www.dier22.com不迷路
繁体版 简体版
版主小说网 > 统计数字会撒谎 > 第三章 没有披露的数据

第三章 没有披露的数据

将“正常的”与“期望的”混为一谈,导致事情变得更糟。格塞尔博士仅仅描述了一些通过观察得到的事实,是那些阅读书和文章的父母错下结论:晚一天或晚一个月学会走路的孩子是低能儿。

由于将正常误解为好的、对的、应该如此的等价物,许多人对阿尔弗雷德?金西博士的那篇著名报告作出了愚蠢的批评,虽然也许他们几乎没有认真读过这篇报告。金西博士被指责有教唆年轻人的嫌疑,因为他向他们灌输某些观念,特别是他将各种普遍存在却未经认可的­性­行为称为正常。实际上,金西博士只是指出他发现这种行为很普遍,因此称之为正常,但是他并没有为这些行为贴上许可的标记,这些行为是否符合规矩并不属于他的研究范围。只是他恰巧涉及了一个使许多人头疼的话题,涉及这样一个高度敏感的话题却不迅速表明你是支持或是反对的态度,看来是十分危险的。

这些没有透露的数据,其欺骗­性­在于:人们经常忽略了它们是否存在。这当然也是它取得成功的奥秘。报界批评家——其作风与现在的批评家一样老练——一直哀叹新闻工作者缺乏严谨的跑新闻的工作作风,并严厉地指责“椅子记者”——那些缺乏批判意识、仅靠重写政府报道混日子的人。从新闻杂志《两星期》(Fortnight)的“新的工业进步”栏目中挑选一条新闻:“来自西屋(Westinghouse)的消息:一种能提高钢材硬度两倍的新冷轧槽已经发明。”从中可一窥报界的无所作为。

听上去真是有了长足的进步,可是直到你要认真研究这到底意味着什么时,才会发现:它实际上像水银球一样令人难以捉摸。是否这种新的冷轧槽使所有种类的钢材硬度达到未处理前的三倍?又或者它能产生一种硬度是以前所有钢材三倍的新钢材?它是如何做到的?看上去,记者仅仅只是写了一行文字,却并没有弄清这些文字的真正含义,同时期待着读者抱着能学到某些东西的快乐幻觉下,毫无批判­精­神地读这些文字。这容易使人联想起对采用讲课方式进行教学指导的古老定义:这是一个将教师书中的内容在没有经过双方大脑的情况下,转化成学生笔记的过程。

没有披露的数据(4)

几分钟之前,当我查阅《时代》杂志关于金西博士的内容时,突然想到了另一则类似的报道,这些报道只要多看一眼,就会像危房一样坍塌。这是1948年一些电力公司联合推出的广告:“今天,超过3/4的美国农场接上了电……”听上去真不错,这些公司真是尽职尽责。当然,如果你是挑剔的人,你还可以这样解释:“将近1/4的美国农场还没接上电。”但真正的把戏却并不在此,而在于使用“接上”这个词。用了这个词,电力公司可以把事情描述成他们所希望的任何效果。很明显,“接上”并不意味着所有这些农场已接通了电,否则,广告上一定会如实报道。据我所知,他们的“接上”只能说明电线从那些农场经过,或铺设在离开农场几十或者上百英里的范围之内。

让我引用一篇文章的标题——《现在就来预测孩子将来长多高》(You Can Tell Now HOW TALL YOUR CHILD WILL GROW),这篇文章刊登在一个大众化的杂志上。文章中的两张表格特别抢眼,一张适用于男孩,另一张适用于女孩,这两张表给出了每个年龄阶段孩子的身高与最终身高的比例。“预测孩子长大后的身高,”标题如是写道,“只需要利用现有的身高,再查表中的比例即可。”

可笑的是,只要你继续往下看,便会发现文章本身就指出了这些表格的致命缺点。所有孩子的生长方式并不是完全一致的。有的一开始长得很慢,却突然长高;有的暂时很高,然后速度趋缓;还有的人在整个过程中相对平稳地成长。这两张表,正如你所疑惑的,是基于进行了大量测量之后所取的平均数。对于随机抽取的100名年轻人,利用这两张表格预测他们未来的总身高或者平均身高,毫无疑问是足够准确的。但是,家长感兴趣的只是一个孩子的具体高度,对于个体,这两张表是没有价值的。如果真的想预测孩子未来的身高,父母及祖父、祖母的身高或许更有用,尽管这种方法和上述表格一样并不科学,也不­精­确,但结果的准确­性­至少相当。

我很高兴地指出,在14岁到高中接受军训时,我站在最小班级的后排,利用当时记录的身高做一个预测,我的最终净身高为5英尺8英寸,但是,现在我已经有5英尺11英寸了。在人类身高中,3英寸的差距足以说明这是个差劲的估计。

在我面前有两盒葡萄坚果薄饼的包装纸。它们来自于不同的生产批次,这一点从产品鉴定上就可以看出。其中一个引用了双枪皮特wo睪un Pete)的形象,而另一个写道:“如果你想像霍皮(Hoppy)一样……你就得像霍皮一样吃。”它们都提供了说明图(“科学家证明是真实的!”)来证实这些薄饼“在2分钟之内开始提供能量!”一张图被大量感叹句所包围,其纵轴标有数据;而另一张图却遗漏了这些数据。既然没有关于这些数据的任何说明,有没有这些图都一样。两张图都有一条急剧攀升的红­色­###,###代表着“能量释放”,但是其中一条###开始于吃葡萄坚果薄饼一分钟后,而另一条却开始于两分钟后。一条###的攀升速度看上去是另一条的两倍,这暗示着连制图者都不清楚这两张图能说明什么问题。

当然,类似愚蠢的数据只会出现在青少年或者早晨疲倦不堪的父母眼前。没有人会用这种统计废话来挑衅一个著名商人的智商……难道有人会这么做?让我给你看一个广告代理机构用于宣传自己的广告(我希望它不会让人感到疑惑不解),它刊登在《财富》(Fortune)杂志的专栏中。图中###意欲向人们显示这家广告公司年复一年惊人的发展趋势。但图中没有一个数字,这样一来,它既可以代表一个骇人的发展速度,每年翻番或增长几百万美金,又可以意味着在年十亿总收入的基础上,增加一美元或两美元相对稳定的蛇状爬行。但仅从图上看,其发展速度让人印象深刻。

当遗漏了上述的重要数据时,我们需要对平均数、图表或者趋势保留一些怀疑。否则,你会和一个仅仅根据平均气温选择野营地点的人一样盲目。也许你会认为,61华氏度是个不错的年平均气温,而在加利福尼亚州,如果仅根据平均气温,却忽略气温的波动范围,你可能会在内陆沙漠或者远离南海岸线的圣?尼古拉斯群岛两者中进行选择,那么,你不是被烤焦就是被冻僵。因为圣?尼古拉斯群岛气温的波动范围是47~87华氏度,而沙漠气温的波动范围是15~104华氏度。根据以往60年的记录,俄克拉荷马城具有十分相似的平均温度:华氏度。但是,正如你从下图所看到的,这个舒适凉爽的数字遮盖了130华氏度的气温波动范围。

本章小结:

◆多少才算够呢?这又是个棘手的问题。它取决于其他的因素,即你采用抽样方式所研究的总体容量有多大、变动程度有多大。值得一提的是,有时样本的规模与看上去的并不一致。

◆这里介绍一个易于理解的显著­性­检验方法。简单地说,它是一种反映检验数据以多大的可能­性­代表实际结论,而不是代表那些由于机遇产生的其他结论的方法。

◆通常情况下,单凭一个平均数来描述事物过于简单,起不到作用,不管这个平均数是均值还是中位数,也不管平均数的具体类型是否已知。

◆当遗漏了上述的重要数据时,我们需要对平均数、图表或者趋势保留一些怀疑。

毫无意义的工作(1)

0 0

『加入书签,方便阅读』