统计数字会撒谎——本章小结

本章小结： ◆为了确保结论有价值，根据抽样得出的结论一定要采用具有代表性的样本，这种样本才能排除各种误差。 ◆无形的误差与有形的误差一样容易破坏样本的可信度。也就是说，即使你找不到任何破坏性的误差来源，但只要有产生误差的可能性，你就有必要对结果保留一定的怀疑。 ◆最基本的样本是随机样本，它是指完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。 ◆随机样本的检验方法是：总体中的每个名字或每个事物是否具有相同的几率被选进样本？纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处，在很多情况下，获得这种样本的难度很大并且十分昂贵，以至于单纯考虑成本就会排除它。分层随机抽样是一个更经济的替代品，目前在民意调查和市场研究等领域中得到了广泛的应用。 ◆一般而言，民意调查都带有一定程度的误差。本章小结： ◆所以，当你被告知某个数是平均数时，除非能说出它的具体种类--均值，中位数，还是众数，否则你对它的具体涵义仍知之甚少。 ◆在处理诸如人类特征的数据时，各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点，在你用曲线绘制正态分布时，将看到一根钟形的曲线，均值、中位数和众数都落在相同的点上。 ◆当你看到某个平均收入时，首先问问：是什么的平均？包括了哪些人？ ◆类似的概率和误差范围构成了一个很好的估计。 ◆多少才算够呢？这又是个棘手的问题。它取决于其他的因素，即你采用抽样方式所研究的总体容量有多大、变动程度有多大。值得一提的是，有时样本的规模与看上去的并不一致。 ◆这里介绍一个易于理解的显著性检验方法。简单地说，它是一种反映检验数据以多大的可能性代表实际结论，而不是代表那些由于机遇产生的其他结论的方法。 ◆通常情况下，单凭一个平均数来描述事物过于简单，起不到作用，不管这个平均数是均值还是中位数，也不管平均数的具体类型是否已知。 ◆当遗漏了上述的重要数据时，我们需要对平均数、图表或者趋势保留一些怀疑。本章小结： ◆我们可以定量地衡量你的样本能以多大的精度代表总体，那就是：可能误差和标准误差。 ◆在所有抽样研究中都有误差，忽略这些误差将导致一些愚蠢的举动。 ◆只有当差别有意义时才能称之为差别。

书名：统计数字会撒谎
作者： [美] 达莱尔·哈夫
出版社：中国城市出版社
原作名： How to Lie with Statistics
译者：廖颖林
出版年： 2009-3
页数： 154
定价： 28.00
装帧：精装
ISBN： 9787507420852

统计数字会撒谎——本章小结

《统计数字会撒谎》其他试读目录