站点图标 多伦多书苑

Python机器学习手册:从数据预处理到深度学习

14.11 使用袋外误差(Out-of-Bag Error)评估随机森林模型

问题描述

在不使用交叉验证的情况下评估随机森林模型。

解决方案

计算模型的袋外误差分数:

讨论

在随机森林中,每个决策树使用自举的样本子集进行训练。这意味着对于每棵树而言,都有未参与训练的样本子集。这些样本被称为袋外(Out-of-Bag,OOB)样本。袋外样本可以用作测试集来评估随机森林的性能。

对于每个样本,算法将其真实值与未使用该样本进行训练的树模型子集产生的预测值进行比较。计算所有样本的总得分,就能得到一个随机森林的性能指标。OOB分数评估法可以作为交叉验证的替代方案。

在RandomForestClassifier中设置参数oob_score = True可以计算OOB分数。该分数可以使用oob_score_来获取。

Author:

退出移动版