当今时代大规模数据爆炸的速度是惊人的,当然,其应用也是越来越广泛的,从传统的零售业到复杂的商业世界,到处都能见到它的身影。那么大数据有什么典型特征呢?即数据类型繁多、数据体量巨大、价值密度低即处理速度快。本书也正是将注意力集中在了极大规模数据上的挖掘,而且是从算法的角度来看待数据挖掘。其主要内容包括分布式文件系统、相似性搜索、搜索引擎技术、频繁项集挖掘、聚类算法、广告管理及推荐系统。在图书章节设置上,每章末尾都有小结,对重点专有名词会给出简要的概况,让大家对全章内容有一个巩固和再认识。更有习帮助大家理解正文所讲解的知识点。
本书是在Anand Rajaraman和Jeff Ullman于斯坦福大学多年所授的一门名为“Web挖掘”季度课程材料基础上总结而成,其含金量已可见一斑。译者是中科院计算技术研究所前瞻研究实验室信息检索课题组组长王斌博士,他同样也是《信息检索导论》的译者,相信大家拿到这本书的时候会被王老师孜孜以求的态度所感染。
转自图灵社区:作者LXL
海量数据挖掘
《大数据》热门书评
-
作为一个从业二十年的屌丝,本屌真心被这本书吓尿了!
78有用 78无用 黑枪王荣格 2013-01-30
麻烦支那猪以后翻译外文书籍,先找个稍微懂行的把书看一遍行吗!鉴于中文翻译缩水不准的情况,本掉千辛万苦找来英文原版,一看到目录,本屌就硬了,尼玛作者太牛逼了!最新补充一句,话说如果这本书的名字叫做类似《数据挖掘基础》的话,本屌绝壁不喷它。本来就是基础的基础,名字介绍扯那么大旗子干嘛,又没那本事。MAP...
-
译者王斌老师对这本书的导读建议
5有用 2无用 小凤 2012-10-17
《大数据:互联网大规模数据挖掘与分布式处理》导读建议:一、此为算法书,需要一定算法基础,非科普书,一般人读起来不会那么顺畅,需要努力啃读。二、此书并非虚幻的大数据概念书,直接关注大数据的规模对算法应用造成的实际问题。三、在应用背景方面,本书也没有完全展开,所以对应用有了解较好。...
-
本书需要配合课程进行学习
5有用 0无用 喜欢晴天的某Z 2015-04-08
看到好多人说这本书是大纲,是目录,没啥内容,讲的浅。那就对了。本书是MIT CS246课程MMDS使用的讲义,还有配套的Slides和HW,所以观看本书请配套课程进行学习,同时coursera上也有配套的课程。See more detail: http://www.mmds.org/...
-
《大数据》读后重整理
5有用 1无用 libisthanks 2012-11-27
读技术书于我而言就像高中物理老师说的那样:一看就懂、一说就糊、一写就错。为了不马上遗忘昨天刚刚看完的这本书,决定写点东西以帮助多少年之后还有那么一点点记忆。好吧,开写。 1. 总体来...
-
希望翻译水平提上去
3有用 0无用 linglongyouzhi 2013-06-14
从总体安排来看,书的结构还是不错的。没看过英文的,但是中文版的行文真的不好,磕磕绊绊看了一半以后实在是没有兴趣看后面的了。之前了解的pagerank看了以后了解了,之前不了解的adwords还是不了解,...
书名: 大数据
作者:
出版社: 人民邮电出版社
原作名: Mining of Massive Datasets
副标题: 互联网大规模数据挖掘与分布式处理
译者: 王斌 | Jeffrey David Ullman
出版年: 2012-9
页数: 258
定价: 59.00元
装帧: 平装
ISBN: 9787115291318