记得不久前一位教授在课堂上说过一句话:“一切事物,只有抽象成数字,上升到数学研究的层面,才能称之为科学;否则都只是艺术。”
在我看来,数学最神奇之处,在于它几乎可以帮助人们寻找出所有规律的线索。我们需要做的,是将待探索的事物化作数字的形式,输入这个庞大的数字机器王国;让机器在一次次学习与调整的过程中,得出一个个模型,并通过过去与现在的数字,预测出未来。
这正是《当我们变成一堆数字》一书想要告诉我们的。
刚开始读这本书时,给我带来最大的感觉是恐惧。这是一种个人隐私被无情窥视后的恐惧。最近有消息称,北京市将用数千万的北京移动用户信息构建在京人群的活动图谱,这引起了相当多人的反对,最重要的一点莫过于大家感觉自己的隐私受到了侵害。书中所描述的情况也如此。潜伏在网络中的大量的数字科学家每时每刻都在获取着我们的信息,从网络浏览足迹到消费记录,从政治立场到个人情感爱好……他们把我们分为不同的类,再贴上标签。而我们,就好像在一间布满了监视器的房间里生活,一举一动都感觉不舒服。
随着阅读的继续,作者介绍的数字王国开始在我眼前呈现出迷人的一面。虽然,我比较反感将员工变成“数字”的公司——之前在某外资咨询公司的实习经历让我对上司监控下属工作的行为有深刻感受。但不得不承认,拥有海量的人类行为数据,建立起模糊分析模型,对未来行为进行预测和引导,是一件非常诱人的事。
超级市场通过给购物者贴标签,将其分为“寄生虫”到出手大方的有钱人,并分别将他们诱导至不同的购物线路,从而获得最高的利润;公司通过将庞大的消费者群分为不同的“种族”,即细分市场,再有针对性地投放广告,实现自己的营销目的;政客们通过对选区居民的分析,找出最有可能也最有必要进行说服的人群,为自己赢得最多的投票。这一切,都是基于将芸芸众生抽象成了拥有多个元素的集合,通过将相同或相似的元素归于同一类,这些集合也就分散成一个个集合群。不同的群拥有其显著的特征,如何找到最合适的标签来描述,如何找到最合适的特征来分组集合,如何最大程度地区别出某个集合是否拥有某类元素……这一切都依赖数学科学家强大的数据挖掘和分析能力。
关于“病患者”的研究,让我对人类认知行为分析、概率学和统计学产生了无比崇拜的感情。由于自己现在正在做一项与人类认识心理有关的眼动实验项目,这部分内容引起了我的兴趣。人类的行为在一定程度上的确拥有某种趋向性与规律性,如何寻找出这些若隐若现的规律线索,并预测出潜在的危险——无论是内在健康的危险,还是可能引发的外在危害——对人类社会的发展都具有很深刻的意义。尽管每个个体存在必然的差异,但大量的个体行为在宏观下呈现出的规律性令人惊讶。只是,如果将来的某一天,我们真的能构建出人类行为DNA图谱,建立起关于我们的疾病、行为和遗传的数学模型,“对我们将会罹患的疾病进行概率的预测,我们是否能承受这些预测的带来的沉重打击”?
“恋人”这一章,让我看到现阶段计算模型在对个体分析匹配时略显的幼稚——这从另一方面也说明这一领域存在巨大的可挖掘性。基于对个体不同性格与相应爱好的统计,将人群分成不同群体——就好像星座分析,好像中国的生辰八字(人们似乎很爱好谈论自己,因而对这一类的分析也很喜欢“对号入座”——我是金牛座,那么我的性格和金牛座特征似乎挺相似的)。其实现在所有的心理测试题目都是基于大量的统计分析工作的结果,一个个匿名的被测试者同时也是这个测试题目的继续完善者,像滚雪球一样,计算人类心理特点的数学模型被不断完善。也许有一天,我们真的可以获得一个完美的“恋爱公式”,算出谁是谁的百分之百的另一半。但爱情的变量如此之多,不知道理性的数家科学家们是否真的能把握住它变幻莫测的线索?
PS:此篇为某堂课教授要求而写。
寻找规律的线索
对“寻找规律的线索”的回应
《当我们变成一堆数字》热门书评
-
很不错的一本书,值得做统计的人一读
5有用 0无用 豆角 2009-11-28
我们正在做一个电子商务垂直分析工具——小艾分析fenxi001.com从这本书中受益匪浅,强烈推荐。下面这段话是我写在别的地方的,沾到这里。我们每个人其实都可以打上数据的标签,比如你在家乐福的每次购物数据泄露了你是一个雀巢咖啡爱好者或者是浪莎丝袜的品牌粉丝。 这些数据都代表了人的主观意识和爱好,可以...
-
做一个特立独行的人是多么困难
5有用 0无用 秋叶 2010-10-07
斯蒂芬·贝克是位观察家,他注意到我们现代人的每次活动,都被无声无息进入数字统计。比如你从一个网页进入了另一个网页;比如你从一个频道切换到另一个频道;比如你一次又一次掏出银行卡消费时;比如你开车穿过一个又一个收费站时;比如你打开手机拨通一个一个号码时:... ...所有这些行为,都被不同的系统无声...
-
笔记:阅读的价值
4有用 0无用 闲暄 2009-08-04
“因公阅读”么,所有拿到手第一意识就是寻找值得推荐的“阅读的价值”……从封底的推荐词中找到如下:1、“在Google时代领悟生活、洞悉商机”;前半句没感觉,后半句还有点吸引力,但整个图书通篇翻下来,觉得最大的感受也就是惊叹,现在统计、分析做到这么厉害的水平了!2、“了解和预测人类行为”;可惜书里没给...
-
我们目前不缺少数据,缺少的是看得懂数据的人
3有用 0无用 菜农 2010-02-21
数据挖掘,机器学习——作者抛出了一个时髦的话题,描述了各种领域的状况及未来的应用空间。不过可能和作者的背景的局限有关,书中却没有介绍一些可行的实现方式和具体可操作的研究趋势。我们目前不缺数据,缺少的是看得懂数据的人!...
-
数字没有告诉你
1有用 0无用 布鲁斯小猪 2011-03-06
我曾经觉得,二进制的世界是如此单纯。在这个世界里,所有的事情都被0和1绝对地量化着,清晰而明了。精确与理性支配着每一个动作,因为计算机的语言中没有感情,只有是与否的回答。于是我们已经渐渐习惯在心情大好的时候在人人网上发一条状态,在抑郁感伤的时候在qq空间写一篇加密的私人日记,或者在看到明星的时候赶紧...