前前后后花了一周的时间读完了这本大数据时代,简单记录一下读书笔记。
大数据有3个特点:第一,大数据不再是抽样的数据而是使用总体数据,样本=总体,启用全数据模式;第二,大数据允许数据不那么精确,可以存在误差和混杂。数据量大本身会带来这样的问题,但不会影响对数据的利用;第三,大数据关注的相关关系而不是因果关系。大数据只告诉是什么而解释为什么。
大数据时代的来临,在于一切都可以量化,不管是人的身体指标,还是数据巨大的图书。数据的价值是巨大的,对数据可以进行多次利用,不断深挖数据的价值。这就要求新型的公司具有大数据的思维,懂得如何搜集数据,用技术手段使用数据,具有大数据思维来利用数据进行创新和指导实践。
当然,大数据也不是必然都是好的,也会带来很多问题。首先大数据时代用户的隐私问题越来越堪忧,其次,大数据可以预测个人的行为,这样的预测有可能会被滥用而影响公平和正义。为此,我们需要新型的大数据管理变革。包括对隐私的保护,数据使用者需要承担相应的责任;用户的将要做而没有做的事情不需要负任何责任;专业的大数据算法师来规范内部和外部的大数据使用,保证对用户隐私保护,和公平正义。
书里的大数据例子很多:
如谷歌通过用户的搜索行为提前预知流感的爆发;
farecast通过对大数据分析预测机票的价格走势为用户决策提供服务;
飓风用品与蛋挞的故事,这个与啤酒喝尿不湿类似;
丹麦通过用户手机数据来研究手机辐射与致癌的关系;
汽车座椅数据,通过坐姿研究来发现问题;
怀孕预测;
纽约大型沙井盖预测模型;
如果本书能以一个具体的例子,详细讲述一下如何利用大数据的话,那就更好了。
大数据影响未来
《Big Data》热门书评
-
故作惊人语的《大数据时代》
681有用 43无用 阿九 2013-08-01
花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是“迄今为止最好的一本大数据专著”。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这“最好”的专著吧。买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打...
-
未知的information,已知的technology-写给未来的思维范式
132有用 4无用 Miss power 2013-02-11
两年前,还是社会学专业的我最喜欢翘的课叫做”社会统计学”,与其听着传统死板的抽样调查与回归分析,我更喜欢和一个做数据挖掘的数学系同学四处溜达。“数据挖掘(Data mining)是什么?”她跟我举了一个最简单的例子:“沃尔玛通过对超市里人们购买行为的大量数据分析,发现男人们来买啤酒的时候,通常也会买...
-
大数据时代的金融投资
104有用 7无用 eric 2013-02-13
大数据时代的金融投资思维金融数量化投资由于其巨大收益,是大数据最早应用的领域,而其也符合大数据最重要的三大思维变革:1) 不是随机样本,而是全数据。 根据作者的定义, 大数据是指不用随机分析,而采用所有数据的方法。 主要原因有二,一是当前的技术能力让人类可以处理海量的数据, 二是随机样本无法获取某些...
-
一个理工狗眼中的大数据
71有用 3无用 丧心病狂刘老湿 2014-05-10
作为一个学计算机出身的理工狗,我一直忍到自己写完论文才回过头来看这本书。此时距这书出版,已经一年有余,大数据的概念已经甚嚣尘上,无人不知了。 维克托和肯尼思在...
-
你已经体验到的大数据时代
69有用 7无用 星腾 2012-12-19
你认为什么是大数据?如果没有仔细关注过这个领域,也许这是一个很难让人轻松回答的问题,而自己之前也没有那么清晰。但对于数据的直觉和一直以来的理解,告诉自己,如果你能掌握更多的数据,其中会有很多有意思的事情发生。因为我们每个人都有数据在不断产生,而自己也在追踪着数据,习惯性地使用Manictime来记录...
书名: Big Data
作者:
出版社: Eamon Dolan/Houghton Mifflin Harcourt
副标题: A Revolution That Will Transform How We Live, Work, and Think
出版年: 2013-3-5
页数: 256
定价: USD 27.00
装帧: Hardcover
ISBN: 9780544002692