分类:MERGE
核心思想:“分”与“合”。主体流程先将一个序列分成很多个不能再分割的子序列,将各个子序列分别排序后再将子序列合并。其实就是重复两个步骤:【1】分【2】合并。首先是第一个小问题,怎么分?比如说一个序列:12,23,1,44,233,10,9,8。我们先分成两段:12,23,1,44和233,10,9,8,发现还能再分成4段:12,23和1,44------233,10和9,8。再分成8段:12--23--1--44和233--10--9--8。这时候开始把子序列进行排序合并,一个...
继续阅读 >
cbind:根据列进行合并,即叠加所有列,m列的矩阵与n列的矩阵cbind()最后变成m+n列,合并前提:cbind(a,c)中矩阵a、c的行数必需相符rbind:根据行进行合并,就是行的叠加,m行的矩阵与n行的矩阵rbind()最后变成m+n行,合并前提:rbind(a,c)中矩阵a、c的列数必需相符>a<-matrix(1:12,3,4)>print(a)[,1][,2][,3][,4][1,]14710[2,]25811[3,]36912>>b<-matrix(-1:-12,3,4)>print(b)...
继续阅读 >
2020
12-10
2020
10-08
mergemerge函数通过一个或多个键将数据集的行连接起来。场景:针对同一个主键存在的两张包含不同特征的表,通过主键的链接,将两张表进行合并。合并之后,两张表的行数不增加,列数是两张表的列数之和。defmerge(left,right,how='inner',on=None,left_on=None,right_on=None,left_index=False,right_index=False,sort=False,suffixes=('_x','_y'),copy=True,indicator=False,validate=None):...
继续阅读 >
1.自定义聚合函数,结合agg使用2.同时使用多个聚合函数3.指定某一列使用某些聚合函数4.merge与transform使用importpandasaspdimportnumpyasnpnp.random.seed(1)dict_data={'k1':['a','b','c','d','a','b','c','d'],'k2':['A','B','C','D','A','B','C','D'],'data1':np.random.randint(1,10,8),'data2':np.random.randint(1,10,8)}df=pd.DataFrame(dict_data)print('df=...
继续阅读 >