小结
本章介绍了本书要解决的问题以及构建预测模型的处理流程。本书关注两类算法族。
限定介绍的算法的数量,可以让我们更透彻地解释这些算法的背景知识以及这些算法的运行机理。本章通过性能对比说明了为什么选择这两类算法。讨论了这两类算法族的特性和各自的优势,并且详细描述了各自适合解决的问题。
本章还介绍了构建一个预测模型的步骤,每个步骤的各种选择的权衡,对输出结果的考虑。非模型训练时使用的数据可以用来评估预测模型。
本书的目的是使机器学习知之甚少的程序员通过本书的学习,能够胜任将机器学习技术引入项目的工作。本书并不关注大量的算法。相反,只关注当前一流的算法,这些算法可以满足对性能、灵活性和清晰的要求。一旦了解它们是怎么工作的,并且拥有了使用它们的一些经验,就会发现它们很容易上手。这些算法可以解决广泛的问题,而不需要先做大量的训练,这也帮助读者理解这些算法高性能的原因。
参考文献
1. Caruana, Rich, and Alexandru Niculescu‐Mizil. “An Empirical Comparison of Supervised Learning Algorithms.” Proceedings of the 23rd International Conference on Machine Learning. ACM, 2006.
2. Caruana, Rich, Nikos Karampatziakis, and Ainur Yessenalina. “An Empirical Evaluation of Supervised Learning in High Dimensions.” Proceedings of the 25th International Conference on Machine Learning. ACM, 2008.
本书评论