“大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现。这也提醒我们在使用这个工具的时候,应当怀有谦恭之心,铭记人性之本。”--《大数据时代》结语
这句话一语道破大数据的作用,如作者所说,大数据提供的仅仅是参考答案。这本书中引用了大量的案例来表达大数据在各个领域所做出的贡献,并且很好地展示了大数据是如何改变我们的思维的,以及大数据的形成和历史先例,在书的后半段又提出了大数据的隐忧以及如何在发挥大数据的作用的同时保护个人隐私,安全地使用大数据,提到的把个人隐私的责任转移到使用大数据的人的身上,是一个不错的建议,也需要法律来完善对于大数据时代个人隐私的保护。
谷歌使用大数据预测了2009年甲流发生之前,利用美国人5000万条最频繁的搜索词条和没过疾控中心在2003年至2008年间季节性流感传播时期的数据进行比较,预测流感的发生,不仅是全美范围的传播,而且可以具体到特定的地区和洲。太震撼了!数据的利用价值再一次被体现。
这本书概述了大数据是如何影响我们的生活的,从亚马逊,谷歌,微软以及其他国外著名的案例中很好地展示了其作用,还向我们展示了像Twitter这样拥有大数据的公司却仅仅是将数据授权给其他的两个公司使用,还向我们展示了在大数据时代,大数据的产业链以及政府使用大数据的案例。
“一个称为MasterCard Advisors的部门收集和分析了来自210个国家的15亿信用卡用户的650亿条交易记录,用来预测商业发展和客户的消费趋势。然后,它把这些分析结果卖给其他公司。它发现,如果一个人在下午四点左右给汽车加油的话,他很可能在接下来的一个小时内要去购物或者去餐馆吃饭,而这一个小时的花费大概在35~50美元之间。商家可能正需要这样的信息,因为这样它们就能在这个时间段的加油小票背面附上加油站附近商店的优惠券。”
大数据拥有小数据无法得到的某些结果,大数据也因为其繁杂而允许某些数据的不精确性,也正是因为大而包容了这样的错误,因为大数据得到的是相关关系,而不是因果关系。
“zynga的首席分析师肯·鲁丁说道,“我们打着游戏公司的幌子,实际上在做的是分析公司的事。我们的运作都是以数据为基础的”,一家游戏公司,从大数据获得用户的购买道具的习惯而做出多个版本的游戏,甚至是100多个版本的游戏。
”随机采样取得了巨大的成功,成为现代社会、现代测量领域的主心骨。但这只是一条捷径,是在不可收集和分析全部数据的情况下的选择,它本身存在许多固有的缺陷。[4]它的成功依赖于采样的绝对随机性,但是实现采样的随机性非常困难。一旦采样过程中存在任何偏见,分析结果就会相去甚远。“还有就是大数据的样本发生了量的变化,从之前的随机抽样变成了”样本=总体“即所有的样本都包含在分析的数据中,这是一个改变,因为大数据获得方式变得容易以及花费变得低廉。
”我们可以用Lytro相机来打一个恰当的比方。Lytro相机是具有革新性的,因为它把大数据运用到了基本的摄影中。与传统相机只可以记录一束光不同,Lytro相机可以记录整个光场里所有的光,达到1100万束之多。具体生成什么样的照片则可以在拍摄之后再根据需要决定。用户没必要在一开始就聚焦,因为该相机可以捕捉到所有的数据,所以之后可以选择聚焦图像中的任一点。整个光场的光束都被记录了,也就是收集了所有的数据,“样本=总体”。因此,与普通照片相比,这些照片就更具“可循环利用性”。如果使用普通相机,摄影师就必须在拍照之前决定好聚焦点。“
”信用卡公司VISA使用Hadoop,能够将处理两年内730亿单交易所需的时间,从一个月缩减至仅仅13分钟。这样大规模处理时间上的缩减足以变革商业了。也许Hadoop不适合正规记账,但是当可以允许少量错误的时候它就非常实用。“虽然大数据有部分的数据不准确,但是当允许少量错误的时候,就变得非常实用。
书中还提到了将现实生活数字化,典型的案例就是在驾驶座位下加上一个传感器,从而得到一些值,将这些值量化为1-256之间的数字,来区分坐在驾驶位置的人是否为车主,如果不是就需要输入密码才能启动汽车。数字化--》数据化,作者也说明了这两者的区别。
太多了,这本书太经典,确实大数据改变了我们的思维方式,给了我们很多不同的角度去思考问题,让我们不再纠结于为什么,而是”是什么“,很多时候,我们并不需要”为什么“,不是吗?虽然大数据能预测很多事情,但是大数据不能作为我们判断的唯一依据,否则就像是侮辱了人类的独立判断思维一样,也让我们失去了选择性。大数据时代来到,换一种思维思考周边的生活。
大数据时代的科普读物
《Big Data》热门书评
-
故作惊人语的《大数据时代》
681有用 43无用 阿九 2013-08-01
花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是“迄今为止最好的一本大数据专著”。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这“最好”的专著吧。买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打...
-
未知的information,已知的technology-写给未来的思维范式
132有用 4无用 Miss power 2013-02-11
两年前,还是社会学专业的我最喜欢翘的课叫做”社会统计学”,与其听着传统死板的抽样调查与回归分析,我更喜欢和一个做数据挖掘的数学系同学四处溜达。“数据挖掘(Data mining)是什么?”她跟我举了一个最简单的例子:“沃尔玛通过对超市里人们购买行为的大量数据分析,发现男人们来买啤酒的时候,通常也会买...
-
大数据时代的金融投资
104有用 7无用 eric 2013-02-13
大数据时代的金融投资思维金融数量化投资由于其巨大收益,是大数据最早应用的领域,而其也符合大数据最重要的三大思维变革:1) 不是随机样本,而是全数据。 根据作者的定义, 大数据是指不用随机分析,而采用所有数据的方法。 主要原因有二,一是当前的技术能力让人类可以处理海量的数据, 二是随机样本无法获取某些...
-
一个理工狗眼中的大数据
71有用 3无用 丧心病狂刘老湿 2014-05-10
作为一个学计算机出身的理工狗,我一直忍到自己写完论文才回过头来看这本书。此时距这书出版,已经一年有余,大数据的概念已经甚嚣尘上,无人不知了。 维克托和肯尼思在...
-
你已经体验到的大数据时代
69有用 7无用 星腾 2012-12-19
你认为什么是大数据?如果没有仔细关注过这个领域,也许这是一个很难让人轻松回答的问题,而自己之前也没有那么清晰。但对于数据的直觉和一直以来的理解,告诉自己,如果你能掌握更多的数据,其中会有很多有意思的事情发生。因为我们每个人都有数据在不断产生,而自己也在追踪着数据,习惯性地使用Manictime来记录...
书名: Big Data
作者:
出版社: Eamon Dolan/Houghton Mifflin Harcourt
副标题: A Revolution That Will Transform How We Live, Work, and Think
出版年: 2013-3-5
页数: 256
定价: USD 27.00
装帧: Hardcover
ISBN: 9780544002692