2021
01-08
01-08
如何用 Python 处理不平衡数据集
1.什么是数据不平衡所谓的数据不平衡(imbalanceddata)是指数据集中各个类别的数量分布不均衡;不平衡数据在现实任务中十分的常见。如信用卡欺诈数据:99%都是正常的数据,1%是欺诈数据贷款逾期数据不平衡数据一般是由于数据产生的原因导致的,类别少的样本通常是发生的频率低,需要很长的周期进行采集。在机器学习任务(如分类问题)中,不平衡数据会导致训练的模型预测的结果会偏向于样本数量多的类别,这个时候除了要选...
继续阅读 >