应该说,讲到大数据方面的畅销图书,《大数据时代》排名第一毫无疑问。作者写得好,译者也是相当的认真负责。看完总体来说,还是获益颇多。
虽然我搞过的事情和大数据毫不相干,但是作为一位算是较为好学的读书人,像数据仓库、数据仓库等背后的专业术语还是能够理解。大数据这个词,我大概是从2004年左右在学术会议上就听到过,前两年在各种行业内技术峰会上开始反复出现,起初是那个蓝色公司,后来就慢慢是其他大牌公司,接着就是国内公司,现在是官员、社科学者和我这样准备赚稿费的人也来聊了。记得5年前曾经请教过一个搞数据库的前辈,关于大数据的问题。前辈也算较牛,对于这个领域是哼哧一声,只当是产业界来炒学术界的冷饭,为互联网业务的疲软找到些新的由头,振兴投资和消费。给我的感觉,大数据,说它有也行没有也行,不耽误能赚钱的公司赚钱,只不过为新的投入找到了理由,反正是套了个马甲换到了钱,投资方、经营方、敲边鼓的,各家都皆大欢喜。这和我在当初对云业务的想法基本一致。
但是,随着我也写了篇混稿费的文章之后,似乎对“大数据”、“云计算”“物联网”的认识有了改变。虽然,网格计算、数据挖掘和普适计算都搞了20多年,但是基本都只在学术圈里面玩,玩的再好,也没有产生对社会造成巨变的效益。而产业界通过精心的包装和不懈的推广,就逐渐产生了从量变到质变的成效。能够让公众而不是专业人士理解专业技术,并想办法改变人们的观念,引入到日常工作生活中来,这明显是比技术本身更有意义的事情,也是能够促进技术更好发展的重要方式和手段。从这种角度看,产业界功不可没。我现在认为,“大数据”、“云计算”和“物联网”是三种相互共生的技术,未来用到实际业务中,肯定是相互融合的。而这种由融合技术发展的各种新业务,也将从根本上改变未来社会的商业、政治、经济格局,人类社会将再度升级进化,这种全球统一的进化,也许能够解决很多目前看来很复杂的问题。
话说了这么多,还是把议题引回到《大数据时代》中,其中有个大家讨论最多的问题:
1、大数据更关注的是相关关系,而不是因果关系。我的基本看法同译者相当,因果关系总是促进人类解决问题的最主要手段。首先,大数据搜集到的数据维度肯定超多维的,纯粹由机器寻找其中潜在的相关关系,这是一个非常耗费计算资源的过程,虽然计算资源总体是便宜的,但是鉴于大数据之大,不去缩小计算范围那么也是太浪费资源的事情。而由人的直觉去定义计算范围,其实里面就隐式的包含了因果关系,潜台词是,由于怎么怎么样,所以某某之间可能存在相关性。而且存在相关性之后的解决方案和流程优化,更是需要人去用思想去解决。在这点上,和原作者还是存在着分歧。
当然,获益好处还是很多,比如:
1、在大数据状态下,解决问题的关键不在于算法的优化,而是在于数据的搜集。这个观点还是很认同的。除了翻译这个上面的典型示例外,我们现在要搞的一些项目似乎也是同样的道理,先把海量数据抓出来,然后再来做识别和处理,比直接从识别和处理进行优化,似乎可行性更好。还看过另外一本文章,说的是在大数据状态下,神经网络又变得比SVM更加有效了。当年做的那个行为识别的东西,利用神经网络的识别率只有75%左右,只得计划转移到SVM试试,而幸好那个应用领域数据应该不缺,现在看来,还是能够继续搞下去,就是手下没人了,项目也就搁置了,成为最大的遗憾。
2、大数据时代,对技术的改变明显没有对于社会本身的改变大。有了数据,论据就更有力,有了数据,就会少出好多捣乱的主意,社会总体会变得越来越完善,生活会变得越来越舒适。但是,如果仅仅依赖数据,就会把人类行为模式固定到一种固化的模式,突破性的创新反而会更少。那个时候,最需要打击的是惟数据论的观点了。
3、众多详实的案例,完全是PPT吹牛和赚稿费的资源库。绝对值得好好摘摘,根据自己的需求各取所好。
谈到感想,只想说这些:
1、大数据正在改变我们的生活。
2、大数据会倒逼政府的信息开放。
3、在未来社会,谈隐私可能是个毫无意义的话题。因为大家都是透明的。
《大数据时代》——读后感
《Big Data》热门书评
-
故作惊人语的《大数据时代》
681有用 43无用 阿九 2013-08-01
花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是“迄今为止最好的一本大数据专著”。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这“最好”的专著吧。买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打...
-
未知的information,已知的technology-写给未来的思维范式
132有用 4无用 Miss power 2013-02-11
两年前,还是社会学专业的我最喜欢翘的课叫做”社会统计学”,与其听着传统死板的抽样调查与回归分析,我更喜欢和一个做数据挖掘的数学系同学四处溜达。“数据挖掘(Data mining)是什么?”她跟我举了一个最简单的例子:“沃尔玛通过对超市里人们购买行为的大量数据分析,发现男人们来买啤酒的时候,通常也会买...
-
大数据时代的金融投资
104有用 7无用 eric 2013-02-13
大数据时代的金融投资思维金融数量化投资由于其巨大收益,是大数据最早应用的领域,而其也符合大数据最重要的三大思维变革:1) 不是随机样本,而是全数据。 根据作者的定义, 大数据是指不用随机分析,而采用所有数据的方法。 主要原因有二,一是当前的技术能力让人类可以处理海量的数据, 二是随机样本无法获取某些...
-
一个理工狗眼中的大数据
71有用 3无用 丧心病狂刘老湿 2014-05-10
作为一个学计算机出身的理工狗,我一直忍到自己写完论文才回过头来看这本书。此时距这书出版,已经一年有余,大数据的概念已经甚嚣尘上,无人不知了。 维克托和肯尼思在...
-
你已经体验到的大数据时代
69有用 7无用 星腾 2012-12-19
你认为什么是大数据?如果没有仔细关注过这个领域,也许这是一个很难让人轻松回答的问题,而自己之前也没有那么清晰。但对于数据的直觉和一直以来的理解,告诉自己,如果你能掌握更多的数据,其中会有很多有意思的事情发生。因为我们每个人都有数据在不断产生,而自己也在追踪着数据,习惯性地使用Manictime来记录...
书名: Big Data
作者:
出版社: Eamon Dolan/Houghton Mifflin Harcourt
副标题: A Revolution That Will Transform How We Live, Work, and Think
出版年: 2013-3-5
页数: 256
定价: USD 27.00
装帧: Hardcover
ISBN: 9780544002692