使用pandas怎么去重复行-创新互联

使用pandas怎么去重复行？相信很多没有经验的人对此束手无策，为此本文总结了问题出现的原因和解决方法，通过这篇文章希望你能解决这个问题。

创新互联拥有十余年成都网站建设工作经验,为各大企业提供网站建设、做网站服务，对于网页设计、PC网站建设（电脑版网站建设）、重庆APP开发公司、wap网站建设（手机版网站建设）、程序开发、网站优化（SEO优化）、微网站、域名注册等，凭借多年来在互联网的打拼，我们在互联网网站建设行业积累了很多网站制作、网站设计、网络营销经验，集策划、开发、设计、营销、管理等网站化运作于一体，具备承接各种规模类型的网站建设项目的能力。

数据帧作为一个例子：

import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})

pandas判断dataframe是否含有重复行数据用：df.duplicated()

使用pandas怎么去重复行

第一次出现的数据为False.重复的数据行就被记录为True。

去掉重复行数据使用data.drop_duplicates().

使用pandas怎么去重复行

可以看到索引乱了,我们使用data.reset_index(),里面的参数drop=True，表明要舍掉原来的索引，不然的话原来的索引会保留下来。

使用pandas怎么去重复行

分类汇总主要使用groupby(表明汇总的条件列)以及agg(要汇总的字段/列以及汇总的方式：求和还是大最小值或者计数)。完整代码如下图

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'产品':['A','A','A','A'],'数量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='产品').agg({'数量':sum})
print('数据汇总结果:')
print(dataB)

结果展示如下图：

使用pandas怎么去重复行

看完上述内容，你们掌握使用pandas怎么去重复行的方法了吗？如果还想学到更多技能或想了解更多相关内容，欢迎关注创新互联行业资讯频道，感谢各位的阅读！

当前文章：使用pandas怎么去重复行-创新互联
网页网址：http://hbruida.cn/article/djpjhj.html

使用pandas怎么去重复行-创新互联

其他资讯