11.2 创建一个基准回归模型
问题描述
需要一个简单基准回归模型,用于与算法生成的模型进行对比。
解决方案
使用scikit-learn的DummyRegressor创建一个简单的基准回归模型:
接下来训练自己的模型,计算性能得分,并与基准模型进行比较:
讨论
DummyRegressor允许我们创建一个简单的模型,以此作为基准和实际的模型进行对比。我们通常用这种方法来模拟某个产品或系统中已有的原始预测系统。例如,一个产品将“所有新用户都会在第一个月消费100美元”这条规则硬编码到其预测系统中,而忽视了用户的所有特征。如果我们将这个假设编码到基准模型中,就能将机器学习方法的优势具体地展现出来。
DummyRegressor使用strategy参数设置所使用的预测方法,可选的方法包括训练集的均值或者中位数。此外,如果将strategy设置成constant并使用constant参数,则模型对所有样本的预测结果都会是一个常数:
默认情况下,score方法返回的是决定系数(R-squared,R²得分):
其中,yi是目标样本的真实值,ŷi是预测值,ȳ是目标向量的均值。
R²越接近1,就代表特征对目标向量的解释越好(即相关性越高)。
本书评论