2020
10-08
10-08
python pandas dataframe 去重函数的具体使用
今天笔者想对pandas中的行进行去重操作,找了好久,才找到相关的函数先看一个小例子frompandasimportSeries,DataFramedata=DataFrame({'k':[1,1,2,2]})printdataIsDuplicated=data.duplicated()printIsDuplicatedprinttype(IsDuplicated)data=data.drop_duplicates()printdata执行结果是: k0 11 12 23 20 False1 True2&nb...
继续阅读 >
如下所示:DataFrame.drop_duplicates(subset=None,keep='first',inplace=False)subset考虑重复发生在哪一列,默认考虑所有列,就是在任何一列上出现重复都算作是重复数据keep包含三个参数first,last,False,first是指,保留搜索到的第一个重复数据,之后的都删除;last是指,保留搜索到的最后一个重复数据,之前的搜索到的重复数据都删除,False是指,把所有搜索到的重复数据都删除,一个都不保留,即如果有两行数据重复,把...