对于数据分析,我完全是门外汉。最近因为一些原因需要短期内对数据分析有大概的了解和掌握,于是在知乎某个答案的推荐下找来本书,断断续续花了一周的时间看完。
总体来说,是不错的入门导读。以案例的方式引出数据分析中常用的种种方法,避免了教科书式的枯燥乏味,趣味性强,令人产生一读到底的冲动。此外,书中主要用到的分析工具是Excel、R语言和数据库。Excel中Solver软件包在最优化方法中得到运用,Data Analysis则可用来绘制直方图,更别提各种函数在数据整理中的灵活调用了。书中后半段开始频频使用R语言进行数据的分析和处理,例如绘制直方图、散点图、回归线及其均方根误差范围,对于没有编程基础的我来说,理解起来颇为吃力。数据库和SQL语句的应用只出现在第12章,我作为一个电脑盲看着“关系数据库管理系统”等专业术语也是醉了,内心不禁泪流满面:为啥大学的时候不好好学习数据库和C++呢?有点基础也不至于现在睁眼瞎。
本书介绍了10种分析方法:实验、最优化、数据图形化、“假设检验”、贝叶斯统计、“主观概率”、“启发法”、直方图、回归、误差。(其中“”表示是我自己掌握得不太好的部分。因为我个人比较喜欢定量而非定性的分析方法。)
①假设检验。通过得到的信息逐条判定它对每个假设是增强还是减弱的作用,进而对假设的可能性大小进行排序,据此得到最后结果。
②主观概率。当不同观点之间冲突较大时,通过将其转化为数字来协调分歧,并使用散点图进行二维表征,直观呈现出某一观点的分歧状况,使用标准偏差则可以对平均值周围的离散程度进行量度。这里,贝叶斯规则可以用来修正主观概率。
③启发法。
待续……(等我有时间再写)
想成为数据分析师,除了专业知识过硬,更重要的是对客户要求的把握和相关信息的全面搜集。有时,信息的变化往往会彻底推翻分析结果。工具和方法是死的,不要沉迷于构造模型和算法,把分析结果拿到实际中考虑,意义远大于一切。
一本数据分析的入门读物
对“一本数据分析的入门读物”的回应
《深入浅出数据分析》热门书评
-
数据分析的入门极品,但真的很入门
41有用 2无用 argent 2011-06-05
读起来的感觉是字大行稀,到处都是图片,说起来,这也是headfirst系列的卖点。这本书,相当容易理解,哗哗哗的,几百页就过去了。如此厚的一本书,最多1,2个小时就能看完。对于之前全都是自己瞎摸瞎撞的搞数据分析的我来说,颇有醍醐灌顶之感。问题是,真的太浅了,浅到了根本没有必要读第二遍的地步,更不用说...
-
很好的书,体现了统计的思想
16有用 0无用 习惯 2013-02-18
看到很多书评说书写的浅,只是简单介绍了一些基本统计的方法。我却不这么认为。虽然和国内的统计学教程比起来,这本书没有那么多公式和理论的完整介绍和推导,但其中对于统计的基本原理以及统计问题的来源场景介绍的非常通透,可以说是国内著作所没有的。我看的是英文版,不知道中文版翻译的如何。但看完之后感觉,作者对于...
-
初学者有钱应该入一本
10有用 0无用 [已注销] 2011-07-14
本来想找点深度一点的书,不过当时到了书店后看了两眼发现书的写法很有意思就买下了。 很多人抱怨书的内容不够深入,这点我不反对。不过在我看来,数据分析与其说是理论...
-
深入不够,浅出做的不错。适合技术人员与业务人员作为统计学入门读物来阅读
9有用 0无用 左其盛 2011-03-06
《深入浅出数据分析》是美国O’REILLY出版社的“深入浅出”系列之一。这个系列的特点是花了不少心思琢磨如何让读者更舒服地阅读、记住书中更多内容,书虽然都比较厚,但是插图非常多。插图与正文经常混在一起,没有明显的界限。读起来确实比较轻松,相对文字多图少的书来说,也确实更容易记住书中的内容。由于图多字...
-
总体来说还可以
8有用 1无用 ShRek 2010-10-27
head first的名头很大, 相信原本应该不错翻译的总体来说还可以, 可以看懂但是翻译过程中存在不少问题, 没有看原版, 从字面上理解的.比如有一段对话:xx提出了第二个问题回答中有一句: 这个最后一个问题是一样的(大概是这样, 原话不记得了, 书没在身边)试想, 你和别人聊天的时候, 你一开始...
书名: 深入浅出数据分析
作者: [美] Michael Milton
出版社: 电子工业出版社
原作名: Head First Data Analysis
译者: 李芳
出版年: 2009
页数: 445
定价: 88.00元
丛书: O'Reilly深入浅出系列
ISBN: 9787121116933