安居多伦多
  • 多市生活
    • 多市生活
    • 加国税务
    • 旅游度假
    • 生活安全
    • 行车安全
    • 窍门集锦
  • 多市书苑
    • 热门
    • 小说
    • 教育
  • 家居信息
    • 家居信息
    • 房屋保养
    • 房屋贷款
    • 房屋租赁
    • 房屋建筑
    • 房前屋后
    • 家居风水
  • 健康保健
    • 健康保健
    • 饮食起居
    • 食品安全
    • 健身锻炼
  • 书苑账户
    • 书苑登入
    • 书苑注册
    • 忘记书苑密码
    • 书苑账户信息
    • 关于我们
    • 联系我们
    • 隐私政策
多伦多书苑
在线书籍:随时阅读,随身听书。
所有书籍 | 人文 | 人物 | 人生 | 健康 | 儿童 | 医学 | 历史 | 历史 | 古典 | 哲学宗教 | 商业 | 外国 | 寓言 | 小说 | 教育 | 风水 | 管理 | 语言 |
为使本公益资源网站能继续提供免费阅读,请勿屏蔽广告。谢谢!报告弹出广告被滥用。
  1. 安居多伦多
  2. 网上书苑
  3. IT
  4. Python
  5. Python机器学习手册:从数据预处理到深度学习

Python机器学习手册:从数据预处理到深度学习

2022-02-15 0人点赞 0条评论
点赞
x
语速1.0: 2.0
进度0:

上一页   |   返回目录   |   下一页

10.1 数值型特征方差的阈值化

问题描述

从一组数值型特征中移除方差较小(即可能包含的信息较少)的特征。

解决方案

挑出方差大于给定阈值的特征:

10.1 数值型特征方差的阈值化

讨论

方差阈值化(Variance Thresholding,VT)是最基本的特征选择方法之一。这种方法的依据是小方差的特征可能比大方差的特征的重要性低一些。VT方法的第一步是计算每个特征的方差:

10.1 数值型特征方差的阈值化

其中x是特征向量,xi 代表一个单独的特征值,µ是特征的均值。算出方差后,方差低于阈值的特征会被丢弃。

采用VT方法时需要注意两点。第一,方差不是中心化的(它的单位是特征单位的平方)。因此,如果特征数据集中特征的单位不同(例如,一个特征以年为单位,而另一个特征以美元为单位),那么VT法就无法起作用。第二,方差的阈值是手动选择的,所以必须依靠人工来选择一个合适的阈值(或者使用第12章中的模型选择方法)。可以通过参数variances_来查看每个特征的方差:

10.1 数值型特征方差的阈值化

最后,如果特征已经标准化(即平均值为0,方差为1),方差阈值将起不到筛选的作用(因为这时特征的方差全部为1):

10.1 数值型特征方差的阈值化

上一页   |   返回目录   |   下一页

类似书籍

Python机器学习实践指南
Python机器学习实践指南
Python机器学习——预测分析核心算法
Python机器学习——预测分析核心算法
机器学习实战
机器学习实战
Author:

标签: 暂无
最后更新:2022-02-15
< 上一篇
下一篇 >

本书评论

取消回复

©2021 安居多伦多 - 版权所有

本站由 好事来 Hostlike.com 提供技术支持。