11.3 创建一个基准分类模型
问题描述
想要一个简单的基准分类模型与其他模型进行对比。
解决方案
使用 scikit-learn的DummyClassifier:
通过比较基准分类模型和我们训练的分类模型的得分,可以看到训练的模型在性能方面的提升:
讨论
一种常用的衡量分类模型(也即分类器)性能的标准是将分类器的准确率与随机猜测的分类结果进行对比。scikit-learn的DummyClassifier可以简化这个比较过程,它的strategy参数提供了一些生成预测值方法的选项,其中有两个非常有用。第一个是stratified方法,它使预测结果与训练集中数据类别的比例相同。例如,训练集中有20%是女性,则DummyClassifier会有20%的概率给出女性作为预测结果;第二个是uniform方法,它随机生成均匀的预测,如果样本中包含20%的女性,80%的男性,那么uniform算法产生的预测结果中50%为女性,50%为男性。
延伸阅读
scikit-learn文档:DummyClassifier(http://bit.ly/2Fr178G)
本书评论