Python机器学习手册:从数据预处理到深度学习 1 秒前 上一页 | 返回目录 | 下一页10.2 二值特征的方差阈值化问题描述有一组二值特征数据(即只有两个分类),现在要移除其中方差较小的特征。解决方案挑出方差大于给定阈值的二值特征:讨论和数值型特征一样,挑选高信息量的分类特征的方法之一就是查看它们的方差。在二值特征(即伯努利随机变量)中,方差的计算公式如下:Var(x)=p(1-p)其中,p是观察值属于第1个分类的概率。通过设置p的值,我们可以删除大部分观察值都属于同一个类别的特征。上一页 | 返回目录 | 下一页类似书籍Python机器学习——预测分析核心算法机器学习实战Python机器学习实践指南 Author: