朋友推荐了一个智能电台,说是会记录我的喜好,播放我喜欢的音乐,刚开始用觉得好,过了一段时间,我感觉对“自己”都厌倦了,但这个电台仍一如既往的播放着属于我的风格,我想听点新鲜的东西,想换个风格尝试一下,但在它的推荐下绝对听不到。
我真的很佩服这个电台对我喜好的分析,它比我自己还要了解自己,它记录了我的全部播放记录,每一次的选择操作,它得出一套“完美”的个人收听方案,并用一首接一首你所熟悉但也熟悉你的旋律印证:这就是一个“音乐”的你。
生活在大数据的时代,也是有点苦恼的。你在互联网上的每一步操作,包括浏览、点击、评论、购买等行为全部被记录下来,甚至你的身体状况、病历史、信用记录等个人信息也被传到网上,对你来说,不只是建立了一份电子档案,而是一个“生存在互联网上的你”被完整的克隆出来。重要的是,这些克隆人全是由一组组详实的、可供分析解读的数据基因组成——这便构成了我们所称之为的大数据。
世界大数据专家维克托•迈尔-舍恩伯格(Viktor Mayer-Schonberger)曾说:“大数据的核心就是预测。”智能电台向我们推荐的音乐、购物网站推荐的图书、新闻平台推荐的每日要闻,这些类似的应用都是一种预测行为,它们对我们的数据基因进行分析,然后预测每个人的兴趣爱好,再从内容库中搜索、呈现相应的内容。这只是一些简单的,看上去对我们的工作和生活比较有利的预测。但是,当它预测我们可能会生病而不让我们买保险,预测我们有可能拖欠还款而无法贷款时,情况就不那么乐观了。
对我们来说,生活在大数据时代,危险性已经不只是隐私被泄露,而是你的行为被预知的可能性。当这个大数据足够庞大时,那个互联网上由一组组数据基因构成的克隆人便基本上代表你的意志。所有关于你的操作完全是按照它的标准去选择,已经由不得你了,正像一开始谈到的那个智能电台,播放的音乐已不再属于我,而是那个克隆体。
可能有点危言耸听,不过现在的数据专家正在尽力解决这个问题,大数据毕竟不能凌驾个人意志之上,终归还是要以人为本。我们人类有一种本能就是忘记,随着时间的消磨,忘记可以冲淡一些伤痛、可以宽恕一些罪行,还可以让我们只记录下最美好的时刻,从而体会到更多回忆的乐趣。但是,大数据显然没有忘记这项功能,每个人的信息,而且是全部的信息都会被记录一生一世,哪怕这个人曾有过一些污点,却像烙印一般,始终不能清除。
因此,舍恩伯格呼吁大数据应该具备“遗忘”的美德,并不是所有的信息都要记录,很多数据需要不客气的删除,这才是真正的大数据安全解决之道。
其实,大数据的工作重点在于预测群体的动向,而非个体的选择;它更多关注的是宏观的走势,而非微观的变化。很多适用于群体的数字和概念,遇到个体便失去意义,例如预测某地区被流感传染的概率是10%(每100人中会有10人被传染),但对于个人来说,他得病的概率要么是0,要么是100%,并没有什么中间值。大数据的采集虽然来自于个体,但它的应用应该远离个体、尊重个体,这也是对个体一种有效的保护方式。
很多时候,我们对大数据的应用也并非那么畅快。大数据的思维方式是相关关系,而非因果关系。由于机器学习的操作,大数据通常告诉我们“是什么”而非“为什么”,通过大数据,我们由A得到B,其背后的逻辑关系是看不到的,我们会看到多个现象、多个结果,却不了解其间的过程。这是对人类思维方式一项挑战。人类思维的重要特点是自动引发联想,从而寻求事物之间的因果关系,这就是思维的乐趣,也是人类拥有智慧、富于创造,不断深入认知世界的原因。
大数据代表的是全部数据,我们能得到的永远只是部分,有限性是人类的一种局限。大数据的便利性在于提供了更多的渠道来源,更多的选择,由于各项资源的有限性,我们只能选取最重要的数据为我所用。我们之所以发现统计学,也是从有限的样本中进行分析统计,得出相对精确的结果。大数据可以增强样本的随机性和客观性,但并不代表我们就要获取全部的数据。
况且,世事无常。大数据的预测性也便带来了它的局限性,它不会算出意外,不会算出运气。而我们这个世间有太多的无法预料,我们会有意想不到的惊喜,会有一见钟情,会有怦然心动,人与人之间的交流会带来各种各样的情意与乐趣,这些自然是大数据体会不到的。
不要太过迷恋大数据
《Big Data》热门书评
-
故作惊人语的《大数据时代》
681有用 43无用 阿九 2013-08-01
花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是“迄今为止最好的一本大数据专著”。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这“最好”的专著吧。买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打...
-
未知的information,已知的technology-写给未来的思维范式
132有用 4无用 Miss power 2013-02-11
两年前,还是社会学专业的我最喜欢翘的课叫做”社会统计学”,与其听着传统死板的抽样调查与回归分析,我更喜欢和一个做数据挖掘的数学系同学四处溜达。“数据挖掘(Data mining)是什么?”她跟我举了一个最简单的例子:“沃尔玛通过对超市里人们购买行为的大量数据分析,发现男人们来买啤酒的时候,通常也会买...
-
大数据时代的金融投资
104有用 7无用 eric 2013-02-13
大数据时代的金融投资思维金融数量化投资由于其巨大收益,是大数据最早应用的领域,而其也符合大数据最重要的三大思维变革:1) 不是随机样本,而是全数据。 根据作者的定义, 大数据是指不用随机分析,而采用所有数据的方法。 主要原因有二,一是当前的技术能力让人类可以处理海量的数据, 二是随机样本无法获取某些...
-
一个理工狗眼中的大数据
71有用 3无用 丧心病狂刘老湿 2014-05-10
作为一个学计算机出身的理工狗,我一直忍到自己写完论文才回过头来看这本书。此时距这书出版,已经一年有余,大数据的概念已经甚嚣尘上,无人不知了。 维克托和肯尼思在...
-
你已经体验到的大数据时代
69有用 7无用 星腾 2012-12-19
你认为什么是大数据?如果没有仔细关注过这个领域,也许这是一个很难让人轻松回答的问题,而自己之前也没有那么清晰。但对于数据的直觉和一直以来的理解,告诉自己,如果你能掌握更多的数据,其中会有很多有意思的事情发生。因为我们每个人都有数据在不断产生,而自己也在追踪着数据,习惯性地使用Manictime来记录...
书名: Big Data
作者:
出版社: Eamon Dolan/Houghton Mifflin Harcourt
副标题: A Revolution That Will Transform How We Live, Work, and Think
出版年: 2013-3-5
页数: 256
定价: USD 27.00
装帧: Hardcover
ISBN: 9780544002692