4.9 使用聚类的方式将观察值分组
问题描述
对观察值进行聚类操作,使相似的观察值被分为一组。
解决方案
如果你有k个分组,可以使用K-Means(K均值)聚类法将相似的观察值分到一个组,并输出一个新的特征,以标识观察值属于哪一组:
讨论
在这里讨论聚类有点早了,本书在后面会更深入地介绍聚类算法。其实,这么早提到聚类主要是因为它可以作为预处理的一个步骤。明确地说,就是使用类似K-Means的无监督学习算法将观察值聚类成几组。最后得到一个分类特征,相似的观察值会被分到同一组。
如果你还看不懂这些也不要担心,只要记住在数据预处理中能用聚类就行。如果你已经迫不及待要了解聚类,可以先跳到第19章看一看。
本书评论