麻烦支那猪以后翻译外文书籍,先找个稍微懂行的把书看一遍行吗!
鉴于中文翻译缩水不准的情况,本掉千辛万苦找来英文原版,一看到目录,本屌就硬了,尼玛作者太牛逼了!
最新补充一句,话说如果这本书的名字叫做类似《数据挖掘基础》的话,本屌绝壁不喷它。本来就是基础的基础,名字介绍扯那么大旗子干嘛,又没那本事。
MAP-REDUCE,30页搞定
相似查找,50页搞定
流式数据挖掘,30页搞定(这尼玛可是流式数据挖掘啊,比MR更新的挖掘技术,居然比MR还少!)
链接分析,30页搞定
频繁项集,40页搞定
聚类,40页搞定
在线广告,20页搞定
推荐系统,30页搞定(尼玛作者你是人才呀,国外的网站为了研究推荐系统,出了无数的PAPER,到你这里就剩15张纸了!)
分析社会化网络,40页搞定
降维,30页搞定(尼玛你当你在玩单机版吗!)
大尺度机器学习,40页搞定(吐血啊,这尼玛尺度真鸡巴大!)
接下来,本屌顶着半身不遂的身躯,内心抵抗者撕烂这本书的诱惑,继续坚持往下翻,本地屌是在是受不了了。
MR,全文一行伪代码不见,例子一个没有,连Word Count都懒得写了,看了这书鬼才知道MR怎么用。
相似查找,话说照这本书上说的做,你绝壁死翘翘了,连GOOGLE最经典的高性能雷同文章查找的算法都不介绍,你这章是在搞毛啊。另外,SOLR,LUCENE可以说是现在比较简单的相似文章查找利器,本文居然不介绍相关内容,你TMD当内存不要钱呀!
流式数据挖掘,作者大姨妈,您老人家知道有个东西叫S4不!
链接分析,看了你这章要是能懂的,GOOGLE的大婶都要给你跪了。
频繁项分析,这大概是数据挖掘当中出现最早的分支了,没想到您老人家居然才达到罗列的地步,倒。。。
聚类,这章真心写得垃圾,基本算法都没写全,高性能聚类P也没讲,尼玛,你会玩个单机玩具就当自己牛逼了啊!
在线广告,话说在先广告是其中一个主要的流式计算的应用方面,并且是现在最前沿的技术(什么MR都已经算是几年前的过失技术了,现在都烂了),作者你TMD好意思啊,看看你都写了啥!照你写的做那还不把内裤都赔光了啊.
推荐系统,尼玛NETFILX都是6-7年前的破事情了,你还当个宝啊,现在推荐系统最大的问题就是实时性的问题,解决办法就是流式计算,话说您老人家对流式计算那可以说是一无所知!
社会化网络,这个懒得吐槽了
降维,现在需要用到降维的,就是大规模数据,而大规模数据又必须通过并行计算才能在比较短的时间内完成庞大的计算,话说您老人家都讲到哪里去了呢,MR实现的并行降维算法呢?
大尺度机器学习,傻逼你自己玩单机区吧!
另外,本书一行代码也没有,最高深的脚本语言就是SQL,不会写代码你玩个球的MR,你玩个球的并行计算,你玩个球的大数据呀!
MLGB的,这本书的作者是个骗子,译者是个傻逼,引进者脑子被门夹了。
作为一个从业二十年的屌丝,本屌真心被这本书吓尿了!
您对该书评有什么想说的?
对“作为一个从业二十年的屌丝,本屌真心被这本书吓尿了!”的回应
傻逼楼主要喷翻译就喷,扯什么支那猪,你父母不是中国人?日本人批评自己会说别的日本人是倭狗吗。20年经验还看这种基础导论书,这水平是了得的。
不理解背景的人不明白书的来源于出处,给书纠错的人不知道网上有个勘误表,翻译的人不清错原著想要表达的思想,阅读的人不明白自己的定位和书的适用范围。有人抱怨整本书没有什么代码,可是这是stanford给学生量身打造的,是cs246的入门课程的配套教材,别人说的很清楚这个课程是理论,一个完整的系列是cs246/cs341。cs341才是focus on project的,这是斯坦福培养学生的系列,不是万能书。是你根据需要选择适合自己的材料,不是别人来适应你。从业20年,也应该有40多了吧,怎么TMD连起码的做人都不明白,你自称屌丝,还真是个屌丝。知识可以再学,可是培养起教养很难。
笑一个,“不写代码玩个球”。每年VLDB,ICDE上多少nb的paper,你见过几个玩“最高深的脚本语言"的,见过几个讲代码的。
MapRuduce在04年OSDI上的paper连带实验也就13页吧。
还有人家的流处理讨论的是算法级的,你偏偏扯个S4这个系统来做反例。风马牛不相及的事情。举个系统做反例也行吧,偏偏举个S4这种太监半成品,怎么不说个Twitter Storm呢?
也真难怪从业20多年,还是屌丝一个
《大数据》热门书评
-
作为一个从业二十年的屌丝,本屌真心被这本书吓尿了!
78有用 78无用 黑枪王荣格 2013-01-30
麻烦支那猪以后翻译外文书籍,先找个稍微懂行的把书看一遍行吗!鉴于中文翻译缩水不准的情况,本掉千辛万苦找来英文原版,一看到目录,本屌就硬了,尼玛作者太牛逼了!最新补充一句,话说如果这本书的名字叫做类似《数据挖掘基础》的话,本屌绝壁不喷它。本来就是基础的基础,名字介绍扯那么大旗子干嘛,又没那本事。MAP...
-
译者王斌老师对这本书的导读建议
5有用 2无用 小凤 2012-10-17
《大数据:互联网大规模数据挖掘与分布式处理》导读建议:一、此为算法书,需要一定算法基础,非科普书,一般人读起来不会那么顺畅,需要努力啃读。二、此书并非虚幻的大数据概念书,直接关注大数据的规模对算法应用造成的实际问题。三、在应用背景方面,本书也没有完全展开,所以对应用有了解较好。...
-
本书需要配合课程进行学习
5有用 0无用 喜欢晴天的某Z 2015-04-08
看到好多人说这本书是大纲,是目录,没啥内容,讲的浅。那就对了。本书是MIT CS246课程MMDS使用的讲义,还有配套的Slides和HW,所以观看本书请配套课程进行学习,同时coursera上也有配套的课程。See more detail: http://www.mmds.org/...
-
《大数据》读后重整理
5有用 1无用 libisthanks 2012-11-27
读技术书于我而言就像高中物理老师说的那样:一看就懂、一说就糊、一写就错。为了不马上遗忘昨天刚刚看完的这本书,决定写点东西以帮助多少年之后还有那么一点点记忆。好吧,开写。 1. 总体来...
-
希望翻译水平提上去
3有用 0无用 linglongyouzhi 2013-06-14
从总体安排来看,书的结构还是不错的。没看过英文的,但是中文版的行文真的不好,磕磕绊绊看了一半以后实在是没有兴趣看后面的了。之前了解的pagerank看了以后了解了,之前不了解的adwords还是不了解,...
书名: 大数据
作者:
出版社: 人民邮电出版社
原作名: Mining of Massive Datasets
副标题: 互联网大规模数据挖掘与分布式处理
译者: 王斌 | Jeffrey David Ullman
出版年: 2012-9
页数: 258
定价: 59.00元
装帧: 平装
ISBN: 9787115291318