16.1 训练二元分类器-Python机器学习手册：从数据预处理到深度学习在线阅读

语速1.0: 2.0

进度0:

16.1 训练二元分类器

问题描述

训练一个简单的二元分类器模型。

解决方案

使用scikit-learn的LogisticRegression训练一个逻辑回归模型：

16.1 训练二元分类器

讨论

逻辑回归是一种被广泛使用的二元分类器（也就是说，目标向量只能取两种值）。在逻辑回归中，线性模型（比如， β₀ + β₁ x) ）被包含在一个逻辑函数 16.1 训练二元分类器 , （也叫作sigmoid函数）中。比如：

16.1 训练二元分类器

其中，P(y_i=1|X)是第i个观察值的目标值y_i属于分类1的概率，X是训练集的数据，β₀和 β₁是要学习的参数，e是欧拉数（Euler's number）。逻辑函数的作用就是把函数的输出值限定在0到1之间，这样才能被解释为概率。如果P(y_i=1|X)大于0.5，那么y_i的预测分类为分类1，否则就是分类0。

在scikit-learn中，我们可以使用LogisticRegression学习一个逻辑回归模型。一旦被训练出来，这个模型就可以用于预测新观察值的分类：

16.1 训练二元分类器