其实也不算全部读完了,读它主要是为了技术选型,考虑升级持久层架构、提高系统可扩展性,仔细研读了前几章,对Hadoop、MapReduce、HDFS的模型、机制、使用场景有了一定了解。后面几章及其生态圈内的其他项目抱着了解的心态简单浏览了一下。整体感觉还行,至少从我看过的章节来看,还是满足了我的需求,顺利完成任务了。
第二版基于 0.20系列发行版本,新增了Hive(使用SQL做分析)和Sqoop(在RDBMS和Hadoop之间建立连接,做导入导出)等小部分内容。
翻译质量:
我一向对中译本技术书籍不报太大期望,所以看之前都会备好原版的PDF,但毕竟看中文的进度会快些嘛。整体来说,翻译的还可以,没查过一次英文原版,都能看明白说的是什么,只有为数不多的英文长句翻译的比较拗口(这是英文技术类文章翻译的普遍问题,可以理解)
解决了看之前的几个问题,这里特别提出来,如果你也在技术选型,可以参考一下:
0. 配置简单、扩展性强、容错性强、生态圈健全(搭配项目较多)、Apache顶级项目更新频繁有保障、等等优点;
1. Hadoop是为大文件(百MB~百TB)设计的;
2. 适合写入次数少但量大,读取次数多且量大(几乎全部数据集),所以是以高数据访问延迟换高数据吞吐量;
3. 海量小文件不合适;
4. 文件只能append,不支持多个写入者的操作;
5. 以大数据块换最小化寻址开销;
6. 不支持多数据中心(就是一定要在一个局域网中);
7. 没必要再组RAID,硬件要求不高(但也要是商业级服务器)
总体感觉,适合的应用场景:
1. 为数据提供冗余备份,通过简单的增加设备满足扩展需求,且成本较低;
2. 为搜索引擎做支撑
2. 对已有海量数据做分析,机器学习,推荐算法,等等。
对Hadoop的简单了解
对“对Hadoop的简单了解”的回应
《Hadoop: The Definitive Guide》热门书评
-
期待后的又一次失望
29有用 2无用 ares 2010-06-01
因为翻过原版,对书的内容十分期待,中文版出来第一时间就入手一本。看到今天已经读完一半了,基本每一节都需要对照英文版才能看懂,甚至很多地方都是表述错误的,没有逻辑,混沌的因果关系,失望到了顶点。对于译者,我只有一句话:“别拿google翻译出来骗人了!”...
-
三聚氰胺、瘦肉精和Hadoop
14有用 2无用 量子纠缠 2011-12-23
买了第一版,时间太紧,没来得及看,后来出了个号称修订升级的第二版,毫不犹豫又买了,后来听说第二版比第一版翻译得好,心中窃喜,再后来看了第二版,我震惊了,我TM就是一傻子,放着好好的英文版不看,赶什么时髦买中文版呢。在这个神奇的国度,牛奶里放的是三聚氰胺,火腿肠里放的是瘦肉精,翻译的书里满篇放的都是火...
-
对Hadoop的简单了解
12有用 0无用 真·随机需求 2011-11-06
其实也不算全部读完了,读它主要是为了技术选型,考虑升级持久层架构、提高系统可扩展性,仔细研读了前几章,对Hadoop、MapReduce、HDFS的模型、机制、使用场景有了一定了解。后面几章及其生态圈内的其他项目抱着了解的心态简单浏览了一下。整体感觉还行,至少从我看过的章节来看,还是满足了我的需求,...
-
第二版的翻译质量还行
8有用 1无用 郭大路-Roy 2011-08-12
-- china-pub 赠书活动 --http://www.douban.com/group/topic/20965935/一直比较忙,整本书还没读完,只是粗略翻了个大概,其中有两三章细读了一遍。先做个大体评价吧,有时间全部细读后再评论。从书的内容上来讲,大致上与网上该书的内容介绍一致。简单点概括...
-
压根就在瞎翻译
5有用 0无用 想啊想 2014-05-11
中文版412页:所以理论上,任何东西都可以表示成二进制形式,然后转化成为长整型的字符串或直接对数据结构进行序列化,来作为键值。原文460页:..., so theoretically anything can serve as row key, from strings to binary repr...
书名: Hadoop: The Definitive Guide
作者: [美] Tom White
出版社: O'Reilly Media, Inc.
副标题: MapReduce for the Cloud
出版年: 2009
页数: 250
定价: 44.99
装帧: pap
ISBN: 9780596521998