一个大学生如果说到找工作,你脑海里出现的是什么场景?你首先制作一份个人简历,上面记载了你大学期间的成绩、奖励和实习经历等,当然虽不至于造假,但一定是经过“润色”的,然后你走进一家公司的办公室,对面坐着面试你的HR,你恭恭敬敬地呈上简历后开始自我介绍和交流,把能吹的地方都吹一遍,然后尽量避免谈论自己的短处,经过几分钟的交流后你被告知需要回家等通知。然后,如果幸运的话,你会在几次面试之后拿到一份offer,虽然你并不知道这个行业这个公司或者你即将面临的上司和同事是否合适。经历过几个公司的面试后,你手中一般会握有几个offer,然后再根据薪酬、福利、公司的发展前景等进行一番对比,最终确认自己的第一份工作。
但是等等,能不能有其他的玩法呐?
设想下这个场景,你在选公司之前,有一个非常智慧的人给你列出了几家公司的名单,有些你耳熟能详有些甚至你根本没有听说过,但是他告诉你这几家公司就是最适合你的公司,并且你去的话被录取的几率会非常高。你第一反应会非常怀疑,但是毕竟他是一位“非常智慧”的人,于是你去面试了。你选择了一家看上去不错的公司,简历投过去之后很快便收到了面试通知。当你走进办公室的时候面试官将你迎进了门,倒上了你最喜欢的摩卡咖啡,并且告诉你那个非常智慧的人已经郑重地推荐了你,基于对他的信任,这次面试仅仅是做一些补充了解。你手中的简历递过去之后面试官的目光在上面只停留了几秒钟,然后便开始跟你聊起了你的大学生活,接下来便是让你诧异的事情了。面试官会问你经常翘X老师的课是否只是因为X老师讲课毫无生趣,又会问你在一次活动中与另一个的同学产生的冲突最后解决地怎么样了,甚至会问到你最终会按你爸妈说的回家工作还是坚持在本地就业。你下意识地看了看简历,确认自己没有在简历上写上这些东西之后便明白过来,一定是那位“他”告诉他们的,于是你只能老老实实地作答。经过一些简单但深入的交流之后,你离开了公司,几天之后你获得了offer。
百思不得其解的你决定去打听打听那个神秘的智者的情况,后来被告知,他有另外一个名字叫做“大数据”。
这样的故事我还可以讲很多,比如他会告诉你什么时候订机票能够订到最便宜的价格,你现在的生活习惯如果不做哪些改变你将在多少岁染上某个疾病,甚至于你追求了的很久的姑娘为什么不喜欢你。或许你觉得不可思议,怎么会有人比你自己还了解自己。所以你可能会觉得这些都是扯淡。
如果你觉得这些是扯淡的话,下面几个例子或许会让你相信一些。
2009年甲型H1N1流感爆发之前的几周,谷歌公司的工程师们在《自然》杂志上发表了一篇论文,它令公共卫生官员们和计算机科学家感到震惊,文中解释了为什么谷歌预测到冬季流感的传播,并且具体到特定的地区和州,而这种预测比疾控中心要提前一到两周,这两周的时间意义是极其重大的。
2003年,一名叫奥伦·埃齐奥尼因为觉得自己被航空公司“敲竹杠”了,创办了Farecast公司,通过他建立的预测系统能够预测飞机票的价格,到2012年为止,其预测的准确度已经高达75%,使用其票价预测工具的旅客,平均每张机票可节省50美元。
这两个是大数据应用的经典缩影,而这些真实的案例还有很多很多。那么你或许又要问,大数据究竟是什么,凭什么有这么大的能耐?
概括来讲,是“更多、更杂、更好”,相对于“小数据”时代,大数据追求的是“样本=总体”,而同时产生的问题便是对于精确性的牺牲,不再执着于因果关系而是相关系,即不在深究“为什么”,更多地是揭示“是什么”以及“会怎样”。
当我们的一切行为与生活都可以“数据化”的时候,掌握这些数据的公司便像是拥有了一座蕴藏丰富的金矿山。通过数据的分析可以预测消费趋势,可以了解公共疫情,甚至可以预知犯罪的时间、地点、嫌疑人。没错,大数据的核心即是预测。
因此大数据价值链将有三类角色,即掌握海量数据的公司、提供数据分析能力的技术公司以及提供思维的公司和个人,而谁将成为价值链的链主呐?目前看来应该是掌握数据的公司,因为这类公司可以授权相关的公司来分析数据,而技术分析公司却很难再进行海量数据的收集。这或许也是Facebook和twitter价值被如此高估的原因,当然除了社交网络,前文提到的谷歌类的搜索服务商掌握了我们搜索的关键词、停留的时间、搜索的喜好等等,他们也将拥有巨大的数据信息。
大数据在改变传统的思维、商业和管理的同时,也会带来巨大的安全隐患。凯文·凯利曾预言,未来我们信息的获取是以我们的信息的透明为前提的,但是谁知道这些数据会不会被犯罪分子利用。你习惯把银行密码设置为生日还是手机号码?你家里一般什么时间段没有人?又或者我们会不会被政府以一系列的理由监控仅仅因为我们被预测出“有犯罪的可能”?大数据时代的安全将面临严重的挑战。
当巨变来临时,我们唯一能做的或许只是了解它并张开怀抱拥抱它,最后以作者的结尾语结束本文:“大数据提供的不是最终答案,只是参考答案,为我们提供暂时的帮助,以便等待更好的方法和答案出现。这也提醒我们在使用这个工具的时候,应当怀有谦恭之心,铭记人性之本。”
《大数据时代》 维克托·托尔-舍恩伯格
浙江人民出版社
(欢迎交流——新浪微博:陈忠良_ASE)
《大数据时代》推介
对“《大数据时代》推介”的回应
《Big Data》热门书评
-
故作惊人语的《大数据时代》
681有用 43无用 阿九 2013-08-01
花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是“迄今为止最好的一本大数据专著”。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这“最好”的专著吧。买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打...
-
未知的information,已知的technology-写给未来的思维范式
132有用 4无用 Miss power 2013-02-11
两年前,还是社会学专业的我最喜欢翘的课叫做”社会统计学”,与其听着传统死板的抽样调查与回归分析,我更喜欢和一个做数据挖掘的数学系同学四处溜达。“数据挖掘(Data mining)是什么?”她跟我举了一个最简单的例子:“沃尔玛通过对超市里人们购买行为的大量数据分析,发现男人们来买啤酒的时候,通常也会买...
-
大数据时代的金融投资
104有用 7无用 eric 2013-02-13
大数据时代的金融投资思维金融数量化投资由于其巨大收益,是大数据最早应用的领域,而其也符合大数据最重要的三大思维变革:1) 不是随机样本,而是全数据。 根据作者的定义, 大数据是指不用随机分析,而采用所有数据的方法。 主要原因有二,一是当前的技术能力让人类可以处理海量的数据, 二是随机样本无法获取某些...
-
一个理工狗眼中的大数据
71有用 3无用 丧心病狂刘老湿 2014-05-10
作为一个学计算机出身的理工狗,我一直忍到自己写完论文才回过头来看这本书。此时距这书出版,已经一年有余,大数据的概念已经甚嚣尘上,无人不知了。 维克托和肯尼思在...
-
你已经体验到的大数据时代
69有用 7无用 星腾 2012-12-19
你认为什么是大数据?如果没有仔细关注过这个领域,也许这是一个很难让人轻松回答的问题,而自己之前也没有那么清晰。但对于数据的直觉和一直以来的理解,告诉自己,如果你能掌握更多的数据,其中会有很多有意思的事情发生。因为我们每个人都有数据在不断产生,而自己也在追踪着数据,习惯性地使用Manictime来记录...
书名: Big Data
作者:
出版社: Eamon Dolan/Houghton Mifflin Harcourt
副标题: A Revolution That Will Transform How We Live, Work, and Think
出版年: 2013-3-5
页数: 256
定价: USD 27.00
装帧: Hardcover
ISBN: 9780544002692