10.0 简介
第9章讨论了如何在尽可能不丢失特征原始信息的情况下,通过创建新特征来降低特征矩阵的维度,这种方法被称为特征提取(feature extraction)。本章将介绍另一种降维方法:特征选择(feature selection)。特征选择会保留信息量较高的特征而丢弃信息量较低的特征。
特征选择的方法可分为三类:过滤器、包装器和嵌入式方法。过滤器方法根据特征的统计信息来选择最优特征。包装器方法通过不断试错,找出一个可以产生高质量预测值的模型的特征子集。嵌入式方法则将选择最优特征子集作为机器学习算法训练过程的一部分。
按理来说,我们应该在本章介绍这三种方法,但是嵌入式方法与特定的机器学习算法密切相关,在深入研究这些算法之前很难把嵌入式方法解释清楚。因此,本章只讲解过滤器和包装器这两种特征选择方法,而把对嵌入式方法的介绍放到深入讨论机器学习算法的章节。
本书评论