2020
09-24
09-24
基于python 等频分箱qcut问题的解决
在python较新的版本中,pandas.qcut()这个函数中是有duplicates这个参数的,它能解决在等频分箱中遇到的重复值过多引起报错的问题;在比较旧版本的python中,提供一下解决办法:importpandasaspddefpct_rank_qcut(series,n):'''series:要分箱的列n:箱子数'''edages=pd.series([i/nforiinrange(n)]#转换成百分比func=lambdax:(edages>=x).argmax()#函数:(edages>=x)返回fasle/true列表中第...
继续阅读 >