数学之美[试读]
第2章 自然语言处理 — 从规则到统计
第3 章 统计语言模型
出版说明
“数学之美”最初是从2006年起在Google中国的官方博客 —— 谷歌黑板报上连载的系列博客。当时我写这个系列的原因完全是应原黑板报版主吴丹丹女士(现任职于苹果公司)之请,希望介绍一点Google的技术,盛情难却,便勉为其难接下了这个任务。这个任务的难处在于既要介绍Google的技术,又不能泄密。于是我只好采用了仅介绍基本原理尤其是数学原理的方法来写文章。加上我自己对数学比较感兴趣,博士论文也是以数学为主的题目,因此,便写成了介绍我所从事的信息处理领域的数学基础的系列文章。当初我并没有计划写多少篇,只打算有空就抽时间写一点,写到哪儿算哪儿,没时间写就算了。不想刊登了几篇后,受到IT行业广大从... 查看全部[ 出版说明 ]
序言1
《数学之美》是一本非常值得读的书。这本书展现了吴军博士在他多年的科研经历中对科学问题的深入思考。 我于1991年从美国回到清华大学电子工程系工作,与吴军博士是同事,对他在汉语语音识别方面的深入研究印象非常深刻。后来他到美国工作,出版了一本介绍硅谷的书《浪潮之巅》,使我对他的写作激情和水平有了新的认识。 这些年来我在清华大学教书,一直思考着如何让学生能真正欣赏和热爱科学研究,这将有助于他们深入理解自己所从事的研究的价值,进而能逐渐成长为所在领域的大师和领军人物。在这一过程中,恰好发现了吴军博士在谷歌中国的官方博客 — 谷歌黑板报上连载的“数学之美”系列文章,我非常欣赏这些文章。因此,在很多场... 查看全部[ 序言1 ]
序言2
去年我曾经给吴军的《浪潮之巅》写序,今年很高兴得知他的《数学之美》也即将出版了! 和《浪潮之巅》一样,《数学之美》也是当年作为 Google 资深研究员的吴军在谷歌黑板报上应邀撰写的一系列文章。说实在的,刚开始,黑板报的版主还有点担心这个系列会不会让读者觉得太理论而感到枯燥,但很快这个顾虑就被打消了。《数学之美》用生动形象的语言,结合数学发展的历史和实际的案例,谈古论今,系统地阐述了与现代科技领域相关的重要的数学理论的起源、发展及其作用,深入浅出,受到广大读者尤其是科技界人士的喜爱。 之前就曾说过,在我认识的顶尖研究员和工程师里,吴军是极少数具有强大叙事能力和对科技、信息领域的发展变化有很... 查看全部[ 序言2 ]
前言
数学一词在西方源于古希腊语μάθημα,意思是通过学习获得的知识的意思,因此早期的数学涵盖的范围比我们今天讲的数学要广得多,和人类的生活也更接近些。在古代最重要的知识,除了对世界的认识和了解,就是人之间的互通和交流了,我们把它称为广义上的通信。本书的内容也将从这里开始。 早期的数学远不如今天神秘,它是非常真实的。但是和任何事物一样,数学也在不断地演化,而这个发展过程使得数学变得高深起来。数学演化的过程实际上是将我们生活中遇到的具体物质以及他们运动的规律不断抽象化的过程。经过几千年的抽象化,大家头脑里能想象的数学只剩下数字、符号、公式和定理了。这些东西和我们的生活似乎渐渐疏远了,甚至在表面上毫... 查看全部[ 前言 ]
后记
很多朋友问我,为什么我会想起来写这个系列?虽然谷歌黑板报的本意是希望我从一个Google科学家的角度介绍一下Google的技术,但是我更希望让做工程的年轻人看到在信息技术行业正确的做事情方法。无论是在美国还是在中国,我经常看到大部分软件工程师在一个未知领域都是从直观感觉出发,用“凑”的方法来解决问题,在中国尤其如此。这样的做法说得不好听,就是山寨。我刚到Google时,发现Google早期的一些算法(比如拼写纠错)根本没有系统的模型和理论基础,就是用的词组或者词的二元组凑出来的。这些方法比没有做任何事情是好一些,但是几乎没有完善和提高的可能,而且使得程序的逻辑非常混乱。Google成长壮大后,... 查看全部[ 后记 ]