前言
在数据分析中,分组聚合二者缺一不可。对数据聚合(求和、平均值等)通常是不可避免的。pd.agg()
很方便进行聚合操作。
1. 创建DataFrame对象
1 2 | import pandas as pd df1 = pd.DataFrame({ 'sex' :list( 'FFMFMMF' ), 'smoker' :list( 'YNYYNYY' ), 'age' :[ 21 , 30 , 17 , 37 , 40 , 18 , 26 ], 'weight' :[ 120 , 100 , 132 , 140 , 94 , 89 , 123 ]}) |
1 2 | grouped = df1.groupby([ 'sex' , 'smoker' ]) # sex有 F M 二值,smoker有 Y N 二值,故分成四组。 |
2. 单列聚合
1 | grouped[ 'age' ].agg( 'mean' ) |
1 2 3 4 5 6 | sex smoker F N 30.0 Y 28.0 M N 40.0 Y 17.5 Name: age, dtype: float64 |
3. 多列聚合
1 | grouped.agg( 'mean' ) |
4. 多种聚合运算
1 | grouped[ 'age' ].agg([ 'min' , 'max' ]) |
5. 多种聚合运算并更改列名
1 | grouped[ 'age' ].agg([( 'A' , 'mean' ),( 'B' , 'max' )]) |
6. 不同的列运用不同的聚合函数
1 | grouped.agg({ 'age' :[ 'sum' , 'mean' ], 'weight' :[ 'min' , 'max' ]}) |
7. 使用自定义的聚合函数
1 2 3 4 | def Max_cut_Min(group): return group.max() - group.min() grouped.agg(Max_cut_Min) |
8. 方便的descibe
1 | grouped.describe() |
参考博客:link
到此这篇关于Pandas实现聚合运算agg()的示例代码的文章就介绍到这了,更多相关Pandas 聚合运算agg()内容请搜索自学编程网以前的文章或继续浏览下面的相关文章希望大家以后多多支持自学编程网!
- 本文固定链接: https://zxbcw.cn/post/218459/
- 转载请注明:必须在正文中标注并保留原文链接
- QQ群: PHP高手阵营官方总群(344148542)
- QQ群: Yii2.0开发(304864863)