1.关于抽样。相比过去,必须应用抽样才能解决的问题可能会变少,因为确实数据资源的丰富性能够提供保障。但同时,人工判定等不方便采集到的数据依然需要抽样的方法。大数据并没有在本质上冲击“抽样”的思想,他们依然是在解决具体问题上的可选方法,取决于可获得性、目的和效率。
2.因果与相关。整体来讲,我理解作者对于相关的推崇,但没有那么执着。文中用了亚马逊的相关分析促进销售来说明大数据时代下的相关重于因果。这个例子没有问题,但并非所有商业问题都停留在得到相关关系就能解决的层面上。把大数据带来的相关认识作为一种“启发模式”来看待可能更合适,即我们的理想和目标在于认识因果的关系解决足够复杂的问题,但在一穷二白的现实面前,通过大数据对于相关性的认识,足以将认知和解决向前推进一大步。
3.精确性。我完全同意在大数据下要特别注意平衡精确性的问题。两个含义,一是牢记二八原则,知晓解决的主要问题,即便看起来basecase是如此的“多”,这点与作者同;另外再补充一点,也是从实际工作的感受,大数据下的一个不起眼“badcase”都足以作为一个群体单独研究。所以大数据下也不是一味的二八,而是“认知-细分”,我补充的是“因大而分”。
4.标签。社交网络里的大数据,每个人都会打标签,都有自己的理解和目的,这种非规范性开放式的数据资源是一个现实。“我们再也不能假装活在一个齐整的世界里”,也可以说前面提到的也是因现状而变产生的观点。认识现状解决问题是出发点,这是要牢记的。(完)
对书中观点的理解
《Big Data》热门书评
-
故作惊人语的《大数据时代》
681有用 43无用 阿九 2013-08-01
花了三天的零碎时间大致看完了舍恩伯格的《大数据时代:生活、工作、思维的大变革》。我看推荐说这是“迄今为止最好的一本大数据专著”。目前公司在搞Hadoop、大数据应用,外面各类零碎的资料也非常多,那么想我应该去看一下这“最好”的专著吧。买回来看完的感觉是平平而已。个人看法,在五分制下,大概也就是最多打...
-
未知的information,已知的technology-写给未来的思维范式
132有用 4无用 Miss power 2013-02-11
两年前,还是社会学专业的我最喜欢翘的课叫做”社会统计学”,与其听着传统死板的抽样调查与回归分析,我更喜欢和一个做数据挖掘的数学系同学四处溜达。“数据挖掘(Data mining)是什么?”她跟我举了一个最简单的例子:“沃尔玛通过对超市里人们购买行为的大量数据分析,发现男人们来买啤酒的时候,通常也会买...
-
大数据时代的金融投资
104有用 7无用 eric 2013-02-13
大数据时代的金融投资思维金融数量化投资由于其巨大收益,是大数据最早应用的领域,而其也符合大数据最重要的三大思维变革:1) 不是随机样本,而是全数据。 根据作者的定义, 大数据是指不用随机分析,而采用所有数据的方法。 主要原因有二,一是当前的技术能力让人类可以处理海量的数据, 二是随机样本无法获取某些...
-
一个理工狗眼中的大数据
71有用 3无用 丧心病狂刘老湿 2014-05-10
作为一个学计算机出身的理工狗,我一直忍到自己写完论文才回过头来看这本书。此时距这书出版,已经一年有余,大数据的概念已经甚嚣尘上,无人不知了。 维克托和肯尼思在...
-
你已经体验到的大数据时代
69有用 7无用 星腾 2012-12-19
你认为什么是大数据?如果没有仔细关注过这个领域,也许这是一个很难让人轻松回答的问题,而自己之前也没有那么清晰。但对于数据的直觉和一直以来的理解,告诉自己,如果你能掌握更多的数据,其中会有很多有意思的事情发生。因为我们每个人都有数据在不断产生,而自己也在追踪着数据,习惯性地使用Manictime来记录...
书名: Big Data
作者:
出版社: Eamon Dolan/Houghton Mifflin Harcourt
副标题: A Revolution That Will Transform How We Live, Work, and Think
出版年: 2013-3-5
页数: 256
定价: USD 27.00
装帧: Hardcover
ISBN: 9780544002692

