3.13 根据值对行分组-Python机器学习手册：从数据预处理到深度学习在线阅读

语速1.0: 2.0

进度0:

3.13 根据值对行分组

问题描述

要根据一些共有的值（shared value）对行分组。

解决方案

groupby是pandas中最强大的功能之一：

3.13 根据值对行分组

讨论

groupby才是数据整理工作的真正起点。经常会遇到这种情况：数据帧的每一行代表的是一个人或者一个事件，而我们需要根据某些标准对这些行分组并计算某个统计量。例如，假设有一个数据帧，其中每一行都是一家国际连锁餐厅分店的一条销售记录。如果想要知道每一家分店的销售总额，可以将销售记录按照分店分组并计算每一组的总和。

不熟悉groupby的用户经常会写一行下面的语句，然后就被返回的值弄晕了：

3.13 根据值对行分组

为什么不返回一些更有用的东西？原因是groupby需要和一些作用于组（group）的操作配合使用，比如计算一个综合统计量（例如，平均值、中位数、总和）。当说到分组时，我们总是用“按照性别分组”这样的简单说法，其实这是不完整的。为了让分组能更有用，我们需要根据某种标准进行分组，然后对每一组应用一个函数：

3.13 根据值对行分组