前言
机器学习正在迅速成为数据驱动型世界的一个必备模块。许多不同的领域如机器人、医学、零售和出版等,都需要依赖这门技术。在这本书中,你将学习如何一步步构建真实的机器学习应用程序。
通过易于理解的项目,你将学习如何处理各种类型的数据,如何以及何时应用不同的机器学习技术,包括监督学习和无监督学习。
本书中的每个项目都同时提供了教学和实践。例如,你将学习如何使用聚类技术来发现低价的机票,以及如何使用线性回归找到一间便宜的公寓。本书以通俗易懂、简洁明了的方式,教你如何使用机器学习来收集、分析并操作大量的数据。
本书涵盖的内容
第 1 章,Python 机器学习的生态系统,深入 Python,它有一个深度活跃的开发者社区,而且许多开发者来自科学社区。这为 Python 提供了丰富的科学计算库。在本章中,我们将讨论这些关键库的特性以及如何准备你的环境,以最好地利用它们。
第 2 章,构建应用程序,发现低价的公寓,指导我们构建第一个机器学习应用程序,我们从一个最小但实际的例子开始:建设应用程序来识别低价的公寓。到本章结束,我们将创建一个应用程序,使得寻找合适的公寓变得更容易点。
第 3 章,构建应用程序,发现低价的机票,演示了如何构建应用程序来不断地监测票价。一旦出现异常价格,应用程序将提醒我们,可以快速采取行动。
第 4 章,使用逻辑回归预测 IPO 市场,展示了我们如何使用机器学习决定哪些 IPO 值得仔细研究,而哪些可以直接跳过。
第 5 章,创建自定义的新闻源,介绍如何构建一个系统,它会了解你对于新闻的品味,而且每天都可以为你提供个性化的新闻资讯。
第 6 章,预测你的内容是否会广为流传,检查一些被大家广泛分享的内容,并试图找到这种内容相对于其他人们不愿分享的内容有哪些特点。
第 7 章,使用机器学习预测股票市场,讨论如何构建和测试交易策略。当你试图设计属于自己的系统时,有无数的陷阱要避免,这是一个几乎不可能完成的任务。但是,这个过程有很多的乐趣,而且有的时候,它甚至可以帮你盈利。
第 8 章,建立图像相似度的引擎,帮助你构建高级的、基于图像的深度学习应用。我们还将涵盖深度学习的算法来了解为什么它们是如此的重要,以及为什么它们成为了最近研究的热点。
第 9 章,打造聊天机器人,演示如何从头构建一个聊天机器人。读完之后,你将了解更多关于该领域的历史及其未来前景。
第 10 章,构建推荐引擎,探讨不同类型的推荐系统。我们将看到它们在商业中是如何实现和运作的。我们还将实现自己的推荐引擎来查找 GitHub 资料库。
阅读本书需要准备什么
你需要的是 Python 3.x 和建立真实机器学习项目的渴望。你可以参考随本书的详细代码列表。
本书适合的读者
本书适合的读者包括了解数据科学的Python程序员、数据科学家、架构师,以及想要构建完整的、基于Python的机器学习系统的人们。
通过阅读本书,你将能够:
■ 了解Python机器学习的生态系统;
■ 了解如何执行线性回归;
■ 机器视觉概念的介绍;
■ 高级数据可视化技术;
■ 如何使用第三方API,部署机器学习模型;
■ 时间序列的建模技术;
■ 如何构建无监督模型。
直观的数据项目,应用高级机器学习方法解决日常问题
约定
在这本书中,你会发现许多文本样式,以区分不同种类的信息。这里是某些样式的例子和它们的含义。
文本中的代码、数据库表名称、文件夹名称、文件名、文件扩展名、路径名、虚构的 URL、用户输入和 Twitter 句柄如下所示:“这点可以通过在我们的数据框上调用.corr()来实现。”
代码块的格式设置如下。
I LIKE TURTLES
I feel like this whole turle thing could be a problem. What do you like about them?
任何命令行输入或输出的写法如下。
sp = pd.read_csv(r'/Users/alexcombs/Downloads/spy.csv')
sp.sort_values('Date', inplace=True)
新术语和重要词语以粗体显示。
读者反馈
我们非常欢迎读者的反馈。让我们知道你对这本书有什么想法——你喜欢哪些内容或不喜欢哪些内容。读者的反馈对我们而言很重要,因为它有助于我们打造各种主题,而且让你获益更多。
对于一般的反馈,通过电子邮件 feedback@packtpub.com 发送,并在消息的主题中提及书的标题。
如果你擅长某个专业的主题,并且你有兴趣撰写或合著一本书,请参阅我们的作者指南 www.packtpub.com/authors。
客户支持
现在你是一名自豪的 Packt 书籍所有者,我们将做一些事情来帮助你从这次购买中获得最大收益。
下载示例代码
在 http://www.packtpub.com,你可以通过自己的账户来下载此书的示例代码文件。如果你在其他地方购买此书,你可以访问 http://www.packtpub.com/support 并注册,我们将文件直接发送给你。
你可以通过以下步骤下载代码文件。
1.使用你的电子邮件地址和密码登录或注册我们的网站。
2.将光标指针悬停在顶部的 SUPPORT 选项卡上。
3.单击 Code Downloads & Errata。
4.在搜索框 Search 中输入书籍的名称。
5.选择你要下载代码文件的图书。
6.在下拉菜单中,选择你在哪里购买的此书。
7.单击 Code Download。
在 Packt Publishing 的网站上,你也可以单击该书主页上的 Code Files 按钮来下载代码文件。可以在搜索框中输入图书的名称来访问其主页。请注意,你需要登录到你的 Packt账户。
一旦文件下载完毕,请确保使用以下软件的最新版本来解压缩或提取文件夹。
■ Windows 版 WinRAR / 7-Zip。
■ Mac 版 Zipeg / iZip / UnRarX。
■ Linux 版 7-Zip / PeaZip。
该 书 的 代 码 包 也 托 管 在 GitHub 上 :
https://github.com/packtpublishing/pythonmachinelearningblueprints。我们还有丰富的来自其他书籍的代码包和视频,位于 https://github.com/PacktPublishing/。去看一下吧!
勘误
虽然我们已经采取一切谨慎的措施,以确保内容的准确性,但错误在所难免。如果你在我们的书中发现一个错误——也许在正文中,也许在代码中——请向我们报告,我们将非常感激。这样,你可以让其他读者避免挫折,并帮助我们改进本书的后续版本。如果你发现任何错误,请访问这个链接进行报告:http://www.packtpub.com/submit-errata,选择你的书,单击 Errata Submission Form 链接,然后输入错误的详细信息。一旦此勘误通过验证,你的提交将被接受,勘误信息将被上传到我们的网站或添加到任何该主题 Errata 部分现有的勘误表。
要查看以前提交的勘误,请访问 https://www.packtpub.com/books/content/support 并在搜索字段中输入书籍的名称。所需信息将出现在 Errata 部分中。
本书评论