14.3 可视化决策树模型
问题描述
可视化一个决策树模型。
解决方案
将决策树模型导出为DOT格式并可视化:
讨论
可以将整个模型可视化,是决策树分类器的优点之一,这也使决策树成为机器学习中解释性最好的模型之一。在本解决方案中,模型以DOT格式(一种图形描述语言)导出,然后被绘制成图形。
如果查看根节点,可以看到决策规则是,如果花瓣宽度小于或等于0.8就转到左分支,否则就转到右分支。同时,我们还可以看到基尼不纯度指数为0.667,样本数量为150,每个分类中的样本数量分布为[50,50,50],如果在该节点停止,将得到样本的预测分类为setosa。我们还可以知道在该节点处,依靠单个决策规则(petal width (cm) <= 0.8)能够完美地识别所有的setosa类样本。此外,添加一个基于同一个特征的决策规则(petal width (cm) <= 1.75),决策树能够对150个样本中的144个正确分类。这使得花瓣宽度成为一个非常重要的特征!
如果要在其他应用或者报告中使用该决策树,可以将可视化后的决策树导出为PDF格式或PNG格式:
本节的解决方案对决策树分类模型进行了可视化操作,这种方法也可以用于决策树回归模型。
注意:macOS用户可能需要安装GraphViz才能运行上述代码。可以使用Homebrew命令(brew install graphviz)进行安装。有关Homebrew的安装说明,请访问Homebrew的官方网站。
延伸阅读
● Homebrew(https://brew.sh)
本书评论