在零售业,例如超市连锁店,机器学习的一个应用是购物篮分析(basket analysis)。它的任务是发现顾客所购商品之间的关联性:如果人们在购买商品X时也通常购买商品Y,而有一名顾客购买了商品X却没有购买商品Y,则他(或她)即是商品Y的潜在顾客。一旦我们发现这类顾客,我们就能针对他们实行打包销售策略。 为发现关联规则(association rule),我们对学习形如P(YX)的条件概率感兴趣,其中X是我们知道的顾客已经购买的商品或商品集,Y表示在条件X下可能购买的商品。 假定考察已有的数据,计算得到P(chipsbeer)=0.7,那么我们就可以定义规则: 购买啤酒(beer)的顾客中有70%的人也买了薯片(chips)。 我们也许想要区分不同的顾客。针对这个问题,我们需要估计P(YX,D),其中D是顾客的一组属性,如性别、年龄、婚姻状况等,这里假定我们已经得到了这些属性信息。如果是考虑书店而不是超市的销售问题,商品就可能是书或作者等。对于Web门户网站入口问题,项对应着到Web网页的链接,而我们可以估计用户可能点击的链接,并利用这些信息来预先下载这些网页,以取得更快的网页存取速度。