自从有计算机以来,人们就希望计算机能够学习。然而,机器学习真正取得实质性进展,能够成功地解决一些实际问题,并最终成为一个学科分支还是近20余年的事。 对于许多问题,我们的前人和先行者已经知道如何求解。例如,欧几里德告诉我们可以用辗转相除法求两个整数的最大公约数;Dijkstra告诉我们如何有效地求两点之间的最短路径;Hoare向我们展示了怎样将杂乱无章的对象快速排序……对于这些问题,我们清楚地知道求解步骤。因此,让计算机求解这些问题只需要设计算法和数据结构、进行编程,而不需要让计算机学习。 还有一些事情,人们可以轻而易举地做好,但是却无法解释清楚我们是如何做的。例如,尽管桌子千差万别、用途各异,但是我们一眼就能看出某个物体是否是桌子;尽管不同的人的手写阿拉伯数字大小不一、笔画粗细不同,但是我们还是可以轻易识别一个数字是不是8;尽管声音时大时小、有时可能还有点沙哑,但是我们还是可以不费力气地听出熟人的声音。诸如此类的例子不胜枚举。对于这些问题,我们不知道求解步骤。因此,让计算机来做这些事就需要让计算机学习。 我们知道桌子不是木材和各种材料的随机堆砌,手写数字不是像素的随机分布,熟人的声音也不是各种声波的随机混合。现实世界总是有规律的。机器学习正是从已知实例中自动发现规律,建立对未知实例的预测模型;根据经验不断提高,不断改进预测性能。 这是关于机器学习这一主题全面论述的教科书,适合作为高等院校计算机相关专业高年级本科生和研究生机器学习入门课程的教材。该书涵盖了监督学习、贝叶斯决策理论、参数方法、多元方法、维度归约、聚类、非参数方法、决策树、线性判别式、多层感知器、局部模型、隐马尔可夫模型、分类算法评估和比较、组合多学习器以及增强学习。作者对来自统计学、模式识别、神经网络、人工智能、信号处理、控制和数据挖掘等不同领域的机器学习问题和学习方法进行了统一论述。 现在,学习的本质还不十分清楚。然而,关于学习的理论认识已开始逐步形成,已经建立起来的一些机器学习方法已经成功地解决了许多实际问题。我们能够从这本书中学习机器学习,发现机器学习的新方法,不断提高对学习本质的认识。 全书共分16章和一个附录。昝红英翻译了第1~6章,牛常勇翻译了第13~16章,范明翻译了其余部分,并对全书译文进行了修改和最后定稿。 本书的翻译得到了原作者Ethem Alpaydn教授的支持。Ethem教授不仅为中文版写序,而且还耐心地解释了我们的一些疑问。在此,我们向Ethem教授表示感谢。 译文中的错误和不当之处,敬请读者朋友指正。意见和建议请发至mfan@zzu.edu.cn,我们不胜感激。 译 者 2009年春于郑州大学