10.3 混合系统
我们已经学习了推荐系统的两种主要形式。但是,需要注意的是,在任何大规模生产环境中,推荐引擎可能同时利用这两项技术。这被称为混合系统,人们喜欢混合系统的原因是,它有助于消除使用单一系统时可能存在的缺点。这两个系统在一起,创建了更强大的解决方案。
让我们检查每种类型的利弊。
协同过滤的优点如下。
•没有必要手动创建特征。
协同过滤的缺点如下。
•如果没有大量的项目和用户,它不能正常工作。
•当项目数量远远超过可能被购买的数量时 ①,效用矩阵会有稀疏性。
基于内容的过滤的优点如下。
•它不需要大量的用户。
基于内容的过滤的缺点如下。
•定义正确的特征可能是一个挑战。
•缺乏“意外的惊喜”②。
当一家公司缺乏大量的用户群,基于内容的过滤是更好的选择,但是随着公司的增长,加入协同过滤可以帮助我们为用户提供更多的“惊喜”。
现在你已经熟悉推荐引擎的类型和内部工作原理了,让我们开始构建自己的引擎吧。
①译者注:推荐引擎一般用于电子商务,所以效用矩阵里的评分通常代表购买。在其他应用场景中,“被购买”等同于“被评分”。
②译者注:推荐引擎有一个重要的评估指标是能否为用户带来意外的惊喜,为其推荐他们没有想到,但确实喜欢的物品。
本书评论