图解机器学习[试读]
1.1 学习的种类
近些年来,得益于互联网的普及,我们可以非常轻松地获取大量文本、音乐、图片、视频等各种各样的数据。机器学习,就是让计算机具有像人一样的学习能力的技术,是从堆积如山的数据(也称为大数据)中寻找出有用知识的数据挖掘技术。通过运用机器学习技术,从视频数据库中寻找出自己喜欢的视频资料,或者根据用户的购买记录向用户推荐其他相关产品等成为了现实(图1.1)。本章将从宏观角度对什么是机器学习做相应的介绍,并对机器学习的基本概念进行说明。 1.1 学习的种类 计算机的学习,根据所处理的数据种类的不同,可以分为监督学习、无监督学习和强化学习等几种类型。监督学习,是指有求知欲的学生从老师那里获取知识、信息,... 查看全部[ 1.1 学习的种类 ]
1.2 机器学习任务的例子
有关增强学习的详细解说,读者朋友可以参阅文献[5]。本节将对监督学习和无监督学习中典型的任务,例如回归、分类、异常检测、聚类和降维等做一一介绍。 回归,是指把实函数在样本点附近加以近似的有监督的函数近似问题A(图1.5)。这里,我们来考虑一下以d次方的实数向量x作为输入,实数值y 作为输出的函数y=f(x)的学习问题。在监督学习里,这里的真实函数关系f 是未知的,作为训练集的输入输出样本{(xi, yi)}ni=1 是已知的。但是,一般情况下,在输出样本yi 的真实值f(xi) 中经常会观测到噪声。通过这样的设定,输入样本xi 就是学生向老师请教的问题,输出样本yi 是老师对学生的解答,... 查看全部[ 1.2 机器学习任务的例子 ]
1.3 机器学习的方法
机器学习有多种不同的流派。本节中,以对模式x的类别y 进行预测的分类问题为例,对机器学习中的主要流派,即产生式分类和判别式分类,以及频率派和贝叶斯派的基本方法加以介绍。 1.3.1 生成的分类和识别的分类 在已知模式x的时候,如果能求得使分类类别y 的条件概率p(y|x)达到最大值的类别¬y 的话,就可以进行模式识别了。 在这里,“argmax”是取得最大值时的参数的意思。所以,maxy p(y|x)是指当y 取特定值时p(y|x)的最大值,而argmaxy p(y|x)是指当p(y|x)取最大值时对应的y 的值(图1.10)。在模式识别里,条件概率p(y|x)通常也称为后验概率... 查看全部[ 1.3 机器学习的方法 ]