谢文算得上是中国互联网的资深从业者了,我们百度一下就能知道,他大学在人民大学修社会科学,1983年赴美留学,就读哥伦比亚大学,应该是主修社会网络相关专业。这使得他对社交网络有一种天然的亲近感,这一点在他的书中也颇有体现。
谢文一直痴迷于WEB2.0和社交媒体,有传言说他在雅虎中国仅就职41天就黯然离开与他向杨致远等人兜售WEB2.0概念未果有关,此言不知真假,但他辗转和讯、雅虎、一起网,始终对社交网络和WEB2.0情有独钟倒是真的。从一起网离职后,谢文索性由经理人转型成了一位互联网观察家,经常在各路媒体上发表一些深度文章。本书就是他近年来文章的一本合集,大多是他近年来关于大数据和国内互联网观察的文章。
本书分为五个部分,分别讲了作者对大数据的认知,作者对大数据时代产业发展的见解,作者对未来互联网产业发展的预见,作者对当下非常热门的“互联网+”概念的解读以及作者眼中的中国互联网业界。不得不说,作者作为资深互联网从业者,对于国内互联网行业发展现状的把握令人折服。作者在本书后半部分中娓娓道来,从监管到个人,从现状到未来,为我们理顺出了一条我国互联网发展的脉络。然而作者前半部分对大数据的认知,却让我无法苟同。
作者开篇先是提出当前计算能力已经大大超过数据规模,“以至于众多企业和机构在面对潮水般涌来的数据不知所措,不知道如何利用,只好定期删除”,“空有充沛的计算能力而不知如何利用手中的数据进行创新”。继而言之凿凿的说道:“A公司拥有一亿用户,但用户在A公司网站上只干一件事,如获取新闻资讯、买卖东西、玩玩游戏,那么有简单数据挖掘基本功就足够了,扯什么大数据就有点故弄玄虚了”。这种言论实在是令我哭笑不得,亚马逊称誉业界的推荐系统、淘宝在双十一期间开发出来的种种先进的数据平衡与负载技术乃至Google里面无数人耗尽心力开发的搜索及广告产品就这样被归结为“有简单数据挖掘基本功就足够了”。
如果说作者在学术领域的肤浅还可以归咎为他已经离学术太远,而近年来学界的步子又迈的太快的话,那么号称“互联网观察家”的作者在业界领域表现出来的无知则让我惊叹。“直到Google+诞生前,谷歌都不能生成自己是个大数据公司,因为他的海量搜索数据虽然规模庞大,但结构简单……在数据挖掘深度、搜索结果个人化、搜索结果与广告之间的相关度上进展有限,只有改良,没有突破。”我实在无法想象,作为一个资深的互联网从业者和观察家,谢文是怎样得到这个结论的。如果说Google翻译这种基于超大规模语料库的概率统计模型打败了有诸多语言学家参与的语义模型,宣告了在自然语言处理领域中概率模型一统天下的时代来临这种事尚且离普通人有些遥远,那么已经被视为大数据典型成功应用案例的Google流感指数(注)也已经足够能说明Google在大数据领域的地位了,更不用说基于海量数据学习模型的Google无人驾驶汽车了。
作为一个半从业者,我想说的是,学界关心的是模型的拟合效果与海量数据的处理能力,Dremel可以在3秒钟内查询一个P的数据,PowerDrill可以在30到40秒内处理7820亿个单元的数据,然而痴迷于此的数据科学家们仍不满足,他们追求的是更快的响应、更多的数据、更小的消耗以及更精准的结论。而业界不关心数据是从何处产生的,他们只关心这些数据能为他们带来的利润,君不见鹅厂狼厂数据分析师的DKP都已经直接与转化率挂钩了么?双十一来临的时候整个微博都变成了淘宝广告肆意轰炸的战场,微信的精准广告投放已经开始试图运用基于用户日常行为与社交圈关系的数据来进行点到点的投放,而这一切的背后,既是数据的整合与重塑,也是各个厂商之间的博弈与暗战。谢文说的没错,中国的互联网与传统行业必将迎来一场大变革,然而这场变革的主角却未必会是互联网企业,在这场变革中,大数据、互联网媒体都将成为传统行业手中更加有力的工具。试想当中国平安这种具备全部金融牌照的大鳄准备踏入互联网金融这个池塘中的时候,整个市场都会为之震动,传统企业可以轻而易举的获得专业的人才、搭建数据中心,但互联网行业却很难进入这些壁垒极高的传统行业。
谢文将大数据视为末班车,认为一旦错过这次机会,中国将又一次被世界丢下。然而我所担心的,却是人们过于放大大数据的意义,忽视了大数据只不过是我们手中的又一项工具这个最基本的事实,踏上一条风雨歧路。
风雨歧路大数据
《大数据经济》热门书评
-
这么多人创业,凭什么他成功?
15有用 1无用 特立独行的猫 2015-12-01
作为国内互联网业第一代创业者,作者谢文的几次创业成功让人艳羡,看完他的《大数据经济》,纵观全书,我个人觉得他的成功跟他早年在外国从事多年互联网行业有关,也与他问题的视角有关。这么多人创业,凭什么他成功?在《大数据经济》里展示了多种分析方法,而我印象最深,最有感触的是:判断风向(高度)和思维逻辑。在“...
-
大数据的意义何在?
11有用 1无用 帝都王大帅 2015-12-07
<图片1>大数据由于各种乱七八糟的解释,都快成为烂大街的词汇了,但这些并不会掩盖大数据那些牛逼闪闪的光芒。作为曾经数据挖掘工作者,刚刚毕业那几年有幸与大量的数据打交道,深知数据可以带来的商业竞争力有里支持,而大数据也几乎覆盖了了传统商业到基因医疗工程的领域。发几个读完之后的联想,明白大数...
-
如何寻找,判断和参与那些具有大数据制造潜质的公司
7有用 0无用 鼹鼠的土豆 2015-11-23
拿到这本《大数据经济》的时候,我本来以为是说经济的书,可是看完前言之后,才发现这是本说大数据生活,大数据时代的书。作者谢文在几年前就明确的指出,大数据时代启动期的三大支柱产业:网络业,新能源业和以3D打印业为代表的新型制造业,它们共同的底层推动力都是大数据的发展。说实话我从来没关注过这方面问题,读《...
-
用数字思考身边的一切事物
6有用 0无用 Hikari 2015-12-01
“用数字思考身边的一切事物。” 是一本教初入职场的人迅速成为公司最需要的人的书籍《准备好了吗?开始工作吧!》中的一个标题,当初看得时候,就特别有感触。特别是书中讲到一个这样的例子: “早上,往公司方向的通勤电车因为事故影响迟了10分钟。这节车厢里粗略估计有200名左右的乘客,15节编组的车总共就有3...
-
一个互联网老兵的预言
6有用 0无用 少则得 2015-11-24
这两年来,“大数据”这个词汇可以说是如雷贯耳,上至朝堂之上的国家战略、下至职场白领,说到未来趋势言必称“大数据”,以至于以癫狂而著称于世的中国资本市场也掀起了一浪又一浪的炒作热潮,一时之间大有“为人不识大数据,要说新潮也枉然”的架势。在噪音与启示交织而成的喧闹背后,人们已经忘记了这一切源自于一个互联...