干净的数据:数据清洗入门与实践
内容简介
数据清洗是数据挖掘与分析过程中不可缺少的一个环节,但因为数据类型极其复杂,传统的清洗脏数据工作单调乏味且异常辛苦。如果能利用正确的工具和方法,就可以让数据清洗工作事半功倍。
本书从文件格式、数据类型、字符编码等基本概念讲起,通过真实的示例,探讨如何提取和清洗关系型数据库、网页文件和PDF文档中的数据。最后提供了两个真实的项目,让读者将所有数据清洗技术付诸实践,完成整个数据科学过...
作者简介
作者简介:
Megan Squire
依隆大学计算科学专业教授,主要教授数据库系统、Web开发、数据挖掘和数据科学课程。有二十年的数据收集与清洗经验。她还是FLOSSmole研究项目的领导者,致力于收集与分析数据,以便研究免费软件、自由软件和开源软件的开发。
译者简介:
任政委
辽宁滨城大连现役程序员一枚,长期从事一线软件...
目录
文章试读
数据清洗是如何融入数据科学中的呢?简短的回答就是,清洗工作是关键的一步,它直接影响在它之前和之后的处理工作。 稍微长一些的回答就得围绕数据科学过程的六个步骤来描述了,请看下面的列表。数据清洗正好处于中间的位置,第三步。但是,请不要以纯线性方式看待这些步骤,简单地认为这是一个从头到尾执行的框架,其实在项目的迭代过程中,我们会根据具体情况,反复执行这些步骤。另外还需要指出的是,并不是每一个项目都...
该书热门标签
- 最新
- 热门
-
0
ouc雨革
2017-04-24
挺简单的一本书。。
-
0
wjy
2016-08-19
对于外行人来说,貌似需要有一定编程经验;对于相关从业人员来说,太多共识型内容。感觉两个方向都没有做好。作者貌似想从一个又一个的例子告诉你怎么做数据清洗,但是这个东西应该跟特定数据特定需求有关系,不太好一次性说清楚。如果做过多次数据清洗工作的,这本书价值不是很大。
-
0
漏丸
2017-01-20
验证一下自己的数据清洗方法。证明数据清晰还是一向初级而琐碎的工作,没有通用的方法。基本上是能用就行。
-
0
llang lli
2016-06-14
063. @06142016. 新书,逻辑清晰,但浅尝辄止,略失望,也许是我期望太高了.
-
0
ouc雨革
2017-04-24
挺简单的一本书。。
-
0
wjy
2016-08-19
对于外行人来说,貌似需要有一定编程经验;对于相关从业人员来说,太多共识型内容。感觉两个方向都没有做好。作者貌似想从一个又一个的例子告诉你怎么做数据清洗,但是这个东西应该跟特定数据特定需求有关系,不太好一次性说清楚。如果做过多次数据清洗工作的,这本书价值不是很大。
-
0
漏丸
2017-01-20
验证一下自己的数据清洗方法。证明数据清晰还是一向初级而琐碎的工作,没有通用的方法。基本上是能用就行。
-
0
llang lli
2016-06-14
063. @06142016. 新书,逻辑清晰,但浅尝辄止,略失望,也许是我期望太高了.

评价“干净的数据:数据清洗入门与实践”