对大数据的初步感官是使用hive(hadoop SQL接口)查询,等结果等的很焦急 ,然后陆续接触到了NoSQL存储(mongodb http://danqingdani.blog.163.com/blog/static/1860941952014110756412/ http://danqingdani.blog.163.com/blog/static/1860941952014214112153146/ ,redis http://danqingdani.blog.163.com/blog/static/18609419520142196591588/),但基本都只使用了查询功能,再就是与数据团队的合作知道了Spagobi,Pentaho等报表工具,周会上知道了日志传输平台容易出数据丢失不同步机器down掉的Bug——kafka消息系统与flume日志收集系统,然后在察看日志分析相关工具(我总是从工具入手来学习某一领域的知识),知道了elasticsearch 与 sphinx搜索引擎,漂亮的kibana前端web UI,在动手进行日志分析的时候,知道了hadoop取数据,序列化数据的解析(protocolBuffer, PB格式的听说却是三年前来自网游通信协议设计,还愚蠢地抱怨为啥不是标准的json格式,不好进行下一步处理)MapReduce批处理方式与Storm流式处理方式。而这本书正好将我陆续知道的一些零星概念串起来了,并确认了自己在大数据处理中的定位是数据分析(计算),不是数据存储,不是数据通信。
如果你仅仅是想在大数据中书皮学一下,看本书第0章的两幅图就OK了。
最后,作者估计是王菲的粉丝,开章语中有5首王菲的歌,我也很喜欢。
大数据技术索引
《大数据日知录》热门书评
-
又是一本笔记型技术书
7有用 0无用 梁兄 2014-10-07
从覆盖面上看,这本书还是涉及到很广的知识点。但从编排和讲解角度看,除了很多清单图谱也都是直接抓现成的。当然也不能全怪作者,毕竟讲逻辑的东西如果要画图细说那这本书估计再写个几年也完不成。 &nbs...
-
推荐给做数据处理的
3有用 0无用 列纳 2014-10-02
本书在深度和经验上都不错,数据结构部分讲得很细很全面,作者在分布式计算上有很多实践经验,后面图形算法和机器学习上比较概略。整体上偏重技术,如果后面能加二三个应用案例或许会更好。 目前在“大数据”方面我最推荐的一本。...
-
作为大数据学习的搜索引擎不错
2有用 0无用 wyj243 2014-12-10
作为大数据学习的搜索引擎不错。毕竟初学者还是不知道都包含那些的,虽说互联网上类似的内容很多,但一般都不知道怎么整理,有了这些初步的,看起来也比较理论化的入门内容,有助于初学者找到入门的大致需要所学的内容。作者看的出经验丰富,所看过的只是也挺广泛的,存储,架构,平台,工具,算法,无一不涉及。看的出是行...
-
大数据技术索引
2有用 0无用 碳基体 2015-01-12
对大数据的初步感官是使用hive(hadoop SQL接口)查询,等结果等的很焦急 ,然后陆续接触到了NoSQL存储(mongodb http://danqingdani.blog.163.com/blog/static/1860941952014110756412/ http://danqingd...
-
简明扼要的百科全书
2有用 0无用 孤风 2014-10-10
几句话点评1、这是一本百科全书,每一章都能写一本书 2、这是一本大数据的经典文献的集合的论文集,整理到位,少了很多查询的时间 3、这是一本有理论和实践的书,理解到位,不会死啃理论 4、这是一本全景书,只是用来穿针引线的,不能对技术细节有太过于高的期望 总体:很优秀、但缺少一点点细!!!!...