统计数字会撒谎[试读]
目录
Chapter 1内在有偏的样本 我们来看一则以前的新闻报道,"1924级的耶鲁毕业生平均年收入为25111美元。"好家伙,这些人干得真不赖!大家都把孩子送去耶鲁和牛津吧,那就是高薪的代名词,年纪轻轻就能享受幸福的生活。 可是,等一等,在充满怀疑的惊鸿一瞥后,关于该数字的两个疑点凸现出来:它居然惊人的精确,它也大得令人难以置信。 [remark=4] [/remark]Chapter 2精心挑选的平均数 房地产商费尽心思大力宣传,你所居住的小区是高档小区,你邻居的年均收入是10000英镑;而该区域的纳税人委员会却反复向政府强调,这里居民的平均年收入只有2000英镑,是该减减... 查看全部[ 目录 ]
序言
序言: 我的岳父从爱荷华州到加利福尼亚州不久便对我说:"你们这儿治安不好。"在他所阅读的关于加州的报道的确如此。但是,这些报道通常来自一份爱荷华州的报纸。这份报纸不会轻易忽略掉加州发生的任何犯罪行为,虽然它也报道本州的谋杀案,但看起来它更乐意大肆渲染加州出现的同类情况,而且还因此而闻名。 我岳父得出的这个结论是建立在明显有偏样本基础之上的,是一个随意的统计结论。类似于其他更为精致的统计结论,也存在着证据与结果不匹配的问题,因为这些结论都在假定:报纸专栏中对犯罪行为的报道是测量犯罪率的工具。 几年前,十来个调查人员独立地发表了关于抗组织胺药的试验数据。所有的数据都证明,在经过... 查看全部[ 序言 ]
内在有偏的样本
有一个装着红、白两色豆子的桶,如果你想要准确知道这个桶中两种豆子的数量,你惟一能做的只有一颗一颗地数豆子。 用一种更简单的方法也可以揣测红豆的数量:抓一把豆子,假定手中红豆的比例与桶中红豆的比例相同,只要数一数手中的豆子即可。如果你的样本足够大,并且选择方法正确,在大多数情况下它能够很好地代表整体。但是,如果以上两个条件不满足,这样的样本比一个臆想好不到哪儿去,除了能够营造科学精确的假象之外,其他则根本不值一提。不幸的是,我们所看到的,或者我们自以为了解的许多事物,往往都是根据类似样本所得出的结论,这种样本可能变得有偏,由于选择方式的不合理或者容量过小,抑或两种情况同时存在。 通过一个极端的例... 查看全部[ 内在有偏的样本 ]
本章小结
本章小结: ◆为了确保结论有价值,根据抽样得出的结论一定要采用具有代表性的样本,这种样本才能排除各种误差。 ◆无形的误差与有形的误差一样容易破坏样本的可信度。也就是说,即使你找不到任何破坏性的误差来源,但只要有产生误差的可能性,你就有必要对结果保留一定的怀疑。 ◆最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。 ◆随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率被选进样本? 纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯考虑成本就会排除它。分层随机抽样是一... 查看全部[ 本章小结 ]
精心挑选的平均数
我相信你不是一个势利小人,而我也并不做房地产生意。但请让我们作这样的假定,并且假设,此刻你正在一条我熟知的街上看房子。对你的情况进行了初步判断后,我巧舌如簧、费尽心思地让你相信附近居民的平均年收入大约有10000英镑。也许这坚定了你要在此居住的信心,不管怎样,买卖最终成交了,那美妙的数字也被牢记在你的脑海。而且,既然你已经买下了房子--你有那么一点势利,当与朋友聊天时,你就会不经意地流露出你居住的地点:我住在一个相当棒的高收入小区。 一年左右过后,我们又见面了。作为某纳税者委员会的成员,我正在四处奔走,为降低税率、降低财产估价,或降低公共交通费用而呼吁。我的理由很简单,我们支付不起各种上涨的费... 查看全部[ 精心挑选的平均数 ]
没有披露的数据
那么,多少才算够呢?这又是个棘手的问题。它取决于其他的因素,即你采用抽样方式所研究的总体容量有多大、变动程度有多大。值得一提的是,有时样本的规模与看上去的并不一致。 这里有一个典型的案例:几年前,有个小儿麻痹症疫苗实验。一个社区中有450名儿童接种了疫苗,而680名儿童作为对照组没有接种疫苗。看上去,这是个极大规模的医学实验。不久,该区域感染了流行病,在接种疫苗的儿童中,所有人都没有患上小儿麻痹症。对照组的儿童也没有发生。这是怎么了?其实在设计实验时,实验人员忽略了或者没能真正了解到该病的低发生率。一般情况下,这种规模的小组预计只会产生2名患者。因此,实验从一开始便注定是毫无意义的。也许将规模... 查看全部[ 没有披露的数据 ]
毫无意义的工作
乔赛亚·斯坦普爵士(Sir Josiah Stamp)曾经描述过这样一个场景:伦道夫爵士(Lord Randolph)正在检查一份税收报告,私人秘书站在他的身后,当看到与去年同期相比海关税收增加了34%时,伦道夫感到很满意。 秘书马上纠正他,指出增长率只不过才.34%。 "这有什么区别?"伦道夫爵士问道。 当听到一个数值是另一个的100倍时,伦道夫说:"我以前经常可以看到位于数字前的小数点,但是直到现在我才真正知道它们的作用。" 在比较考试成绩时,不单单是小数点,甚至其他一些讨厌的细微差异也会突然冒出来给大家造成困扰。为了举例说明,只要你不介意,我们将赋... 查看全部[ 毫无意义的工作 ]
令人惊奇的图形
人们对于数字似乎有一种天生的畏惧,当汉普蒂·汤普蒂(Humpty Dumpty)译者注:Humpty Dumpty在英语俚语中是指"又矮又胖的人"。充满自信地告诉爱丽斯(Alice),他能熟练地驾驭文字时,恐怕没有多少人能将同样的自信延伸到对数字的掌握上。也许早期的数学经验对我们造成了心灵的创伤。 不管什么原因,当作者渴望自己的书有人读,广告商希望自己的广告能促进商品的销售,出版商希望自己的书或杂志畅销时,数字产生了真正的问题。很多情况下,表格中的数字是禁用的,而文字又不能达到很好的效果,这个时候解决的方法就只有一种:画图。 最简单的统计图形是直线类图形。在显示趋势时,直线... 查看全部[ 令人惊奇的图形 ]
一维图形的滥用
几十年以来,我们一直听到"小人物"这种说法,它其实指的就是我们自己。当人们觉得这个词过于卑微后,就改用"普通人",但很快这个提法也被遗忘了。但是"小人物"仍然跟随着我们,扮演着统计图中的角色。 用一个小人来表示成千上万的人,一个钱袋或一堆硬币表示一千英镑或者百万美金,一片牛肉表示明年牛肉的供应量,这些都是形象的图形表达。由于这种图形非常吸引眼球,所以可以作为一种有用的工具,但同时它也能摇身一变,成为一个老练、狡猾而且成功的骗子。 形象图形,又称为象形图,它的前身是普通的柱状图,在比较两种或两种以上事物某个方面的具体数量时,柱状图是一种... 查看全部[ 一维图形的滥用 ]
书名: 统计数字会撒谎
作者: [美] 达莱尔·哈夫
出版社: 中国城市出版社
原作名: How to Lie with Statistics
译者: 廖颖林
出版年: 2009-3
页数: 154
定价: 28.00
装帧: 精装
ISBN: 9787507420852