本章小结: ◆为了确保结论有价值,根据抽样得出的结论一定要采用具有代表性的样本,这种样本才能排除各种误差。 ◆无形的误差与有形的误差一样容易破坏样本的可信度。也就是说,即使你找不到任何破坏性的误差来源,但只要有产生误差的可能性,你就有必要对结果保留一定的怀疑。 ◆最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。 ◆随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率被选进样本? 纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和市场研究等领域中得到了广泛的应用。 ◆一般而言,民意调查都带有一定程度的误差。 本章小结: ◆所以,当你被告知某个数是平均数时,除非能说出它的具体种类--均值,中位数,还是众数,否则你对它的具体涵义仍知之甚少。 ◆在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点,在你用曲线绘制正态分布时,将看到一根钟形的曲线,均值、中位数和众数都落在相同的点上。 ◆当你看到某个平均收入时,首先问问:是什么的平均?包括了哪些人? ◆类似的概率和误差范围构成了一个很好的估计。 ◆多少才算够呢?这又是个棘手的问题。它取决于其他的因素,即你采用抽样方式所研究的总体容量有多大、变动程度有多大。值得一提的是,有时样本的规模与看上去的并不一致。 ◆这里介绍一个易于理解的显著性检验方法。简单地说,它是一种反映检验数据以多大的可能性代表实际结论,而不是代表那些由于机遇产生的其他结论的方法。 ◆通常情况下,单凭一个平均数来描述事物过于简单,起不到作用,不管这个平均数是均值还是中位数,也不管平均数的具体类型是否已知。 ◆当遗漏了上述的重要数据时,我们需要对平均数、图表或者趋势保留一些怀疑。 本章小结: ◆我们可以定量地衡量你的样本能以多大的精度代表总体,那就是:可能误差和标准误差。 ◆在所有抽样研究中都有误差,忽略这些误差将导致一些愚蠢的举动。 ◆只有当差别有意义时才能称之为差别。
统计数字会撒谎——本章小结
书名: 统计数字会撒谎
作者: [美] 达莱尔·哈夫
出版社: 中国城市出版社
原作名: How to Lie with Statistics
译者: 廖颖林
出版年: 2009-3
页数: 154
定价: 28.00
装帧: 精装
ISBN: 9787507420852