安居多伦多
  • 多市生活
    • 多市生活
    • 加国税务
    • 旅游度假
    • 生活安全
    • 行车安全
    • 窍门集锦
  • 多市书苑
    • 热门
    • 小说
    • 教育
  • 家居信息
    • 家居信息
    • 房屋保养
    • 房屋贷款
    • 房屋租赁
    • 房屋建筑
    • 房前屋后
    • 家居风水
  • 健康保健
    • 健康保健
    • 饮食起居
    • 食品安全
    • 健身锻炼
  • 书苑账户
    • 书苑登入
    • 书苑注册
    • 忘记书苑密码
    • 书苑账户信息
    • 关于我们
    • 联系我们
    • 隐私政策
多伦多书苑
在线书籍:随时阅读,随身听书。
所有书籍 | 人文 | 人物 | 人生 | 健康 | 儿童 | 医学 | 历史 | 历史 | 古典 | 哲学宗教 | 商业 | 外国 | 寓言 | 小说 | 教育 | 风水 | 管理 | 语言 |
为使本公益资源网站能继续提供免费阅读,请勿屏蔽广告。谢谢!报告弹出广告被滥用。
  1. 安居多伦多
  2. 网上书苑
  3. IT
  4. Python
  5. Python机器学习手册:从数据预处理到深度学习

Python机器学习手册:从数据预处理到深度学习

2022-02-15 0人点赞 0条评论
点赞
x
语速1.0: 2.0
进度0:

上一页   |   返回目录   |   下一页

19.4 使用DBSCAN聚类算法

问题描述

要把观察值分组成高密度的聚类。

解决方案

使用DBSCAN聚类算法:

19.4 使用DBSCAN聚类算法

讨论

聚类是很多观察值紧密聚集在一起的区域,DBSCAN算法就是受这一点的启发而来的,它对于聚类的形状没有做任何假设。具体来说,DBSCAN算法有如下几步:

1.先选择一个随机的观察值。

2.如果x i的近邻数为最小限度数量的话,就把它归入一个聚类。

3.对xi的所有邻居重复执行步骤2,对邻居的邻居也如此,以此类推。

这些点就是聚类的核心观察值。

4.一旦步骤3处理完所有邻近的观察值,就选择一个新的随机点(重新开始执行步骤1)。

一旦完成这些步骤,我们就会得到一个聚类的核心观察值的集合。最后,凡是在聚类附近但又不是核心的观察值将被认为属于这个聚类,而那些离聚类很远的观察值将被标记为噪声。

DBSCAN对象需要设置以下3个主要参数。

eps

从一个观察值到另一个观察值的最远距离,超过这个距离将不再认为二者是邻居。

min_samples

最小限度的邻居数量,如果一个观察值在其周围小于eps距离的范围内有超过这个数量的邻居,就被认为是核心观察值。

metric

eps所用的距离度量,比如minkowski(闵可夫斯基距离)或者euclidean(欧氏距离)。注意,如果使用闵可夫斯基距离,就可以用参数p设定闵可夫斯基距离中的幂次。

如果观察训练集数据中的聚类,可以看到有两个聚类被识别出来,被标记为0和1,噪声观察值则被标记为-1:

19.4 使用DBSCAN聚类算法

延伸阅读

● DBSCAN(Wikipedia,https://en.wikipedia.org/wiki/DBSCAN)

上一页   |   返回目录   |   下一页

类似书籍

机器学习实战
机器学习实战
Python机器学习——预测分析核心算法
Python机器学习——预测分析核心算法
Python机器学习实践指南
Python机器学习实践指南
Author:

标签: 暂无
最后更新:2022-02-15
< 上一篇
下一篇 >

本书评论

取消回复

©2021 安居多伦多 - 版权所有

本站由 好事来 Hostlike.com 提供技术支持。