对比 Excel，学习 pandas 数据透视表

数据分析与开发 2021-10-21

The following article is from 凹凸数据 Author 黄同学

Excel中做数据透视表

① 选中整个数据源；

img

② 依次点击“插入”—“数据透视表”

img

③ 选择在Excel中的哪个位置，插入数据透视表

img

④ 然后根据实际需求，从不同维度展示结果

img

⑤ 结果如下

img

pandas用pivot_table()做数据透视表

1）语法格式

pd.pivot_table(data,index=None,columns=None,
               values=None,aggfunc='mean',
               margins=False,margins_name='All',
               dropna=True,fill_value=None)

2）对比excel，说明上述参数的具体含义

img

参数说明：

data 相当于Excel中的"选中数据源"；
index 相当于上述"数据透视表字段"中的行；
columns 相当于上述"数据透视表字段"中的列；
values 相当于上述"数据透视表字段"中的值；
aggfunc 相当于上述"结果"中的计算类型；
margins 相当于上述"结果"中的总计；
margins_name 相当于修改"总计"名，为其它名称；

下面几个参数，用的较少，记住干嘛的，等以后需要就百度。

dropna 表示是否删除缺失值，如果为True时，则把一整行全作为缺失值删除；
fill_value 表示将缺失值，用某个指定值填充。

案例说明

1）求出不同品牌下，每个月份的销售数量之和

① 在Excel中的操作结果如下

img

② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns="月份",
                     values="销售数量",aggfunc=np.sum)
display(df1)

结果如下：

img

2）求出不同品牌下，每个地区、每个月份的销售数量之和

① 在Excel中的操作结果如下

img

② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns=["销售区域","月份"],
                     values="销售数量",aggfunc=np.sum)
display(df1)

结果如下：

img

3）求出不同品牌不同地区下，每个月份的销售数量之和

① 在Excel中的操作结果如下

img

② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index=["品牌","销售区域"],columns="月份",
                     values="销售数量",aggfunc=np.sum)
display(df1)

结果如下：

img

4）求出不同品牌下的“销售数量之和”与“货号计数”

① 在Excel中的操作结果如下

img

② 在pandas中的操作如下

df = pd.read_excel(r"C:\Users\黄伟\Desktop\pivot_table.xlsx")
display(df.sample(5))

df.insert(1,"月份",df["销售日期"].apply(lambda x:x.month))
display(df.sample(5))

df1 = pd.pivot_table(df,index="品牌",columns="月份",
                     values=["销售数量","货号"],
                     aggfunc={"销售数量":"sum","货号":"count"},
                     margins=True,margins_name="总计")
display(df1)

结果如下：

- EOF -

推荐阅读点击标题可跳转

1、用 pandas 高效清洗文本数据

2、用 pandas-profiling 做出更好的探索性数据分析

3、12 个 Numpy 和 Pandas 函数，提高效率

看完本文有收获？请转发分享给更多人

推荐关注「数据分析与开发」，提升数据技能

点赞和在看就是最大的支持❤️

: ， . Video Mini Program Like ，轻点两下取消赞 Wow ，轻点两下取消在看

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？

对比 Excel，学习 pandas 数据透视表

Excel中做数据透视表

pandas用pivot_table()做数据透视表

案例说明

您可能也对以下帖子感兴趣

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？

生成图片，分享到微信朋友圈

对比 Excel，学习 pandas 数据透视表

Excel中做数据透视表

pandas用pivot_table()做数据透视表

案例说明

您可能也对以下帖子感兴趣